Was sind die Schritte, um einen Data-Mining-Algorithmus, um das Data-Mining-Blog zu implementieren

In diesem Beitrag werde ich diskutieren, was die Schritte sind, die ich folgen einem Data-Mining-Algorithmus zu implementieren.







Was sind die Schritte, um einen Data-Mining-Algorithmus, um das Data-Mining-Blog zu implementieren

Wenn wir ihm Programmierung zu tun habe ich einen guter Programmierer beobachtet immer ein Flussdiagramm macht, Datenflussdiagramm, Kontextdiagramm etc. die Programmierung fehlerfrei zu machen. (...) In der Implementierung von XXXX-Algorithmus durchgeführt haben Sie alle Verfahren, wie oben erörtert? (...) Können Sie mir erklären, was sind die grundlegenden Verfahren, die Sie sich beworben haben XXXX Algorithmus zu implementieren?

Wenn ich einen Data-Mining-Algorithmus implementieren, mache ich nicht jedes Design Flussdiagramm oder UML, weil ich, dass ein einzelner Data-Mining-Algorithmus betrachte ein kleines Projekt. Wenn ich größere Software-Programmierung, würde ich darüber nachdenken, objektorientiertes Design und UML. Aber für einen einzigen Algorithmus, braucht es nicht ein objektorientiertes Design zu sein. Eigentlich, was ist das wichtigste für einen Data-Mining-Algorithmus ist, dass der Algorithmus das richtige Ergebnis erzeugt, ist schnell und vorzugsweise, dass der Code ist gut dokumentiert und sauber.

Schritt 3: Testen mit anderen Eingabedateien. Wenn meine Implementierung korrekt wird, werde ich mit ein paar Beispiele, versuchen, sicherzustellen, dass es nicht richtig für ein einzelnes Beispiel ist aber, dass es das richtige Ergebnis für andere Eingabedateien zur Verfügung stellen kann.

Schritt 4: den Code zu reinigen. Danach werde ich meinen Code reinigen, weil der erste Entwurf nicht recht wahrscheinlich ist.

Die Wahl Datenstrukturen nach dem, was Sie tun möchten,

Dhwani Dave sagt:

Hallo Herr,
es ist sehr nützliche Informationen in der Tat.
Im Moment bin ich verfolgt Meister in Comp. Sci.
Mein Thema für Dissertation zu finden Ausreißer Patterns in Zeitreihenfolgen.
Da meine Eingabe wird Datenzeitreihen sein.
Ich möchte wissen, welche Werkzeuge sollte ich verwenden und,
Die SPMF Sie hier erwähnt, kann für Zeitreihen-Datenbank oder nicht verwendet werden.
es wäre toll, wenn Sie mich für diese Implementierung führen könnte.
Auf deine Antwort wartend.

Ich möchte auf meine Datenbank Data Mining tun das Verhalten einiger fields.My Daten vorherzusagen, ist der Schwimmer-Typ und der eindeutige Schlüssel, die ich benutze ist von Datum Zeit type.I eine riesige Datenbank ahve.
Mein ganzes Szenario ist so ähnlich

Ich habe vier verschiedene Datenbank nämlich INDUS2_BDS, INDUS_VACUUM, MSIS und RF.All diese Datenbank haben Tabellen, die LOGTIME als eindeutige Schlüssel.von INDUS2_BDS Datenbank habe ich eine Tabelle betrachten, von dem ich die beam_current und seine entsprechenden LOGTIME abzurufen.
Jetzt aus der Ruhe drei Datenbank verschiedenen Spalten Werte oder Parameter an die oben LOGTIME von INDUS2_BDS entsprechenden wird considered.Now I Bergbau Thesen abgerufenen Werte gelten und beam_current zu überprüfen, was die Werte aller Parameter gegen beam_current war und welche Muster folgt und wie Werte verschiedenen Parameter ändern, wenn beam_current Änderungen.

Außerdem möchte ich durch einen Blick auf alle anderen Parameter, auf denen beam_current depends.This Abhängigkeit der beam_current Wert vorherzusagen, auch Bergbautechnik zur Anzeige durch die ich will.
Können Sie mir empfehlen, wenn es gut ist SPMF für diesen Einsatz und welcher Algorithmus ich für den Bergbau verwendet werden soll?

Ich denke, es gibt verschiedene Dinge, die Sie könnten versuchen.

Erstens können Sie einige grundlegende Statistiken beziehen sich auf Ihre Daten besser wissen. Zum Beispiel könnten Sie Korrelation zwischen einem Attribute und Ihrem Zielattribut zu berechnen, um zu sehen, ob es eine Korrelation ist. Sie könnten auch vizualization Techniken wie Streudiagramm mit zwei Attributen wie X- und Y-Achse zu sehen, ob es gibt einige Beziehungen zwischen einigen Paaren von Attributen verwenden.







Außerdem könnten einige mehr oder weniger complciated Data-Mining-Techniken oder Techniken anwenden. Wenn Sie denken, dass die Beziehung zwischen den Attributen linear ist, könnte man so etwas wie multiple lineare Regression mit mehreren Attributen versuchen.

Andere Techniken, die angewandt werden können, sind Klassifizierer wie neuronale Netze, SVM etc. Ein neuronales Netz kann numerische Daten als Eingabe und numerische Daten als Ausgang vorherzusagen, und es kann nicht lineare Beziehungen zwischen Attributen lernen.

Sir, eigentlich bin ich ein Anfänger in Data-Mining-Thema, und ich möchte, dass meine These auf, es zu tun. Ich habe 2-3 Papiere auf sicherheitssensible Data Mining lesen und ich wünsche, die Felder für dieses Thema kennen und die Werkzeuge, die ich verwenden soll. Es wäre toll, wenn man sagen könnte. Warten auf die Antwort.

Hallo, sorry, ich don Gaurav sagt:

Ich tue Meister in Informatik, versuche unter Flussdiagramm zu implementieren, da 2yrs..but niemand in der Lage ist, mir auf diesem zu helfen ... .not auch mein Projekt Führer.

Es wird eine große Hilfe sein, wenn u mich Implementierung oder Code für die gleiche geben kann.

Eine neue Multiobjective Evolutionären Algorithmus für
Bergbau einen reduzierten Satz von Interessante Positive und
Negative Quantitative Association Rules

B (i), wenn rand < δ
Andernfalls.
b) Stellen Sie r1 = i und zufällig ausgewählte r2 von P. Der
Lösungen XR1 und XR2 gekreuzt sind, zwei Erzeugung
Nachkommen g: y1 und y2. Als nächstes wird die Mutation und die Reparatur
Betreiber sind für die beiden Nachkommen angewandt.
c) Beurteilen Sie die neuen Individuen. Für jedes yk, k ∈
.
i) Aktualisierung von z: Für jedes j = 1, ... m, wenn zj <
fj (yk), dann setzen zj = fj (yk).
ii) aktualisieren Lösungen: Set c = 0 und führen Sie dann die
es folgen.
A) Wenn c == & eta; r oder P ist leer gehen zu Schritt 3.
Ansonsten zufällig einen Index l von Pick
P.
B) Wenn g (yk | & lgr; l, z) ≤ g (xl | & lgr; l, z), dann XL = yk und
c = c + 1
C) entfernen l von P und gehen Sie zu a).
Schritt 3: Update von EP: Entfernen aus der EP alle dominiert Vektoren
durch i, i = 1, ..., N, i hinzufügen, dann, wenn keine auf die EP-Vektoren
in EP dominieren sie.
Schritt 4: redundanz aus der EP entfernen.
Schritt 5: Wenn die Differenz zwischen der aktuellen Bevölkerung und
vorherige Bevölkerung ist weniger als% a, neu starten, um die Bevölkerung.
Schritt 6: Wenn die maximale Anzahl von Auswertungen nicht erreicht wird,
Weiter zu Schritt 2.
Schritt 7: redundanz aus der EP entfernen.
Schritt 8: Die EP zurückgeführt wird.

Sir, con't ich für Doktorarbeit ein Problem erstellen, geben pls mir irgendwelche Ideen auf Data-Mining-Techniken.

Hallo Herr
Ich tue mein letztes Jahr Projekteinzel kein Team so brauche ich Hilfe ur schlecht
Durch das Thema ist die Vorhersage Leistung Student durch Data-Mining-Verfahren für die Klassifizierung
Ich verwende KNN-Algorithmus für die Umsetzung
Ich weiß, wie es funktioniert mit Beispielen, die ich gelernt hv
Ich kenne die Strecke zu von euklidischen Abstandsformel zu berechnen
Aber ich muß eine detaillierte Beschreibung, wie in Java implementieren und auf welcher Plattform das Programm auszuführen. Plzzz Ich bitte aufrichtig tobreply dafür bald wie möglich r ur Mail-ID senden Ich werde das Detail s Mail so, dass ich mich bis zu meinem Projektendtermin s berühren kann und weiter, nachdem ich zu beenden

Hallo, ich habe keine Zeit zu implementieren, oder gibt Informationen zu diesem Algorithmus. Ich bin sehr beschäftigt, und da es sich um eine Art von Hausaufgaben / Projekt ist, ist es besser, dass Sie es selbst tun. Es gibt viele Orte, an denen der KNN-Algorithmus beschrieben wird (z wikipedia), so können Sie das lesen. Außerdem, wenn Sie wissen, wie Java zu verwenden, sollte es nicht allzu schwierig sein, eine einfache Version von KNN zu schreiben. Es könnte wahrscheinlich in weniger als 100 Zeilen Code geschrieben werden.

Es ist nicht in Bezug auf mich umsetzen kann. Ich brauche die Schritte und Algorithmus, der es für 500 seya von Studenten funktioniert und was alle Variablen und Attribute ich nehmen soll.
Helfen Sie mir, dass.

Ich bin mir ziemlich sicher, dass einige Papiere bereits zu diesem Thema veröffentlicht wurden. Sie könnten diese Papiere überprüfen und sehen, welche Attribute sie verwendet haben. Das Thema Pass der Vorhersage oder fail vor sicherlich untersucht wurde. Ich erinnere mich immer ein Papier darüber zu lesen, aber es ist vor langer Zeit. Sie können jedoch einige durch die Suche in Google Scholar finden.

Abgesehen davon, wie ich sagte, Sie müssen es versuchen. Sie können nicht vorher wissen, welche Methode oder welches Attribut funktioniert, bevor Sie es versuchen. Sie können den gesunden Menschenverstand Wissen nutzen, um festzustellen, dass einige Attribute relevant sind oder nicht. Aber letztlich müssen Sie immer noch, es versuchen mit realen Daten wirklich zu sehen, welche Arbeiten oder nicht zuschreibt.

Lieber prof. Philippe Fournier-Viger, a),
iam Doktorandin Ich mag würde Ihren Rat zu folgenden vorgeschlagenen Themen erhalten:
1-Internet der Dinge Data Mining. (RFID)
2- sozialen Netzwerken Data Mining
Dies sind allgemeine Idee, ich weiß nicht, welche die beste ist und Data Mining, welche Technologien können diese Daten ist enorm dynamische Echtzeit-Daten (Big Data) in diesem Fall verwendet werden. kann ich gleiche Data-Mining-Algorithmen für i aktualisieren soll.
bester regars

Das sind gute Forschungsbereiche, wie sie jetzt populär sind. Da diese Forschungsbereiche sehr breit sind, denke ich, dass fast jedes Data-Mining-Algorithmen speziell in einer von ihnen je nach angewendet werden könnte, was Sie tun. Aber sicher, sind einige Methoden immer beliebter. Zum Beispiel in sozialen Netzwerken, wenn Sie möchten mit Grafiken arbeiten, als Sie auf algortihms für Daten minin auf Graphen arbeiten können, obwohl in IoT, können Sie auch auf Graphen arbeiten. Ich schlage vor, Papiere zu diesen Themen zu lesen, wirklich zu sehen, was Ihnen gefällt und was die Menschen tun. Sie werden eine bessere Vorstellung davon, was die Menschen tun.







In Verbindung stehende Artikel