Sie sind hier: Startseite Termine Data Mining mit multivariaten Methoden und Support Vector Machines

Data Mining mit multivariaten Methoden und Support Vector Machines

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.
  • Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.
    50.1131757 8.6445451
Wann 14.05.2014 um 10:00 bis
16.05.2014 um 16:00
Veranstaltungsort DECHEMA
Stadt Frankfurt am Main
Kontaktname
Kontakttelefon +49 69 7564-253
Zielgruppe Anwender aus Prozessanalytik, Spektroskopie, Metabolomik und anderen Omics-Technologien, die effizient aus hochdimensionalen Daten die relevanten Informationen extrahieren möchten.
Termin übernehmen vCal
iCal

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. – Aber nutzen Sie auch das volle Potential Ihrer Daten?

Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

Dieser Kurs bietet ein leicht zugängliches, konzeptionelles Verständnis einiger wichtiger Methoden des Data Mining und richtet sich damit auch an Anwender ohne große mathematische oder statistische Vorkenntnisse, deren Hauptaugenmerk auf der praktischen Nutzung dieser Methoden für die eigene Aufgabenstellung liegt.

Der Kurs gliedert sich in drei Teile:

  • Multivariate chemometrische Modelle
  • Flexible Modellierung mit Support Vector Machines (SVMs)
  • Anwendung der Methoden anhand von praxisnahen Beispielen und/oder eigenen Daten


Mit der Hauptkomponentenanalyse (Principal Component Analysis, PCA) erhalten Sie ein Werkzeug zur Datenuntersuchung und zum Datenverständnis (explorative Datenanalyse). Sie lernen, auch große Datenmengen überschaubar darzustellen, Probleme in der Datenqualität zu ermitteln und dabei Ausreißer zu erkennen. Außerdem ermöglicht Ihnen die PCA, Strukturen und deren vielleicht bisher verborgene Ursachen in den Daten zu erkennen. Eine Weiterführung der PCA ist die Modellierung der Daten auf vorgegebene Zielgrößen. Für quantitative Zielgrößen findet hierbei insbesondere die Partial Least Squares Regression (PLS) Verwendung. Qualitative Zielgrößen werden über Klassifizierungsmodelle wie z.B. die Diskriminanzanalyse (Linear Discriminant Analysis, LDA) beschrieben. Sie werden lernen, robuste PLS-Regressionsmodelle sowie LDA-Klassifzierungsmodelle zu erstellen.

SVMs bieten erstmals die Vorteile nichtlinearer Methoden ohne die damit sonst verbundenen Nachteile der komplexen Anwendung und eines hohen Probenbedarfs. Man kann diese Methoden sowohl für Klassenvorhersagen (Mustererkennung), quantitative Vorhersagen (Regression) als auch Ausreißer- und Abweichungserkennung verwenden.

Es wird gezeigt, warum SVMs einen grundsätzlich neuen, leistungsfähigen Ansatz gerade für sehr hochdimensionale Daten oder nichtlineare Probleme darstellen. Sie erlernen die Bedeutung der SVM Parameter und deren systematische Optimierung sowie die Bewertung finaler SVM-Modelle.

Am dritten Tag wird die Möglichkeit geboten, das Gelernte an vorgegebenen realen Daten oder eigenen geeigneten Daten zu üben. Die entsprechende Software wird als Demoversion zur Verfügung gestellt.

Direktbuchung

Weitere Informationen über diesen Termin…

DECHEMA-Forschungsinstitut

Programm

Data_Mining_2014.pdf — PDF document, 439 kB (449,755 bytes)