Data Mining mit multivariaten Methoden und Support Vector Machines

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

Data Mining mit multivariaten Methoden und Support Vector Machines

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

50.1131757 8.6445451

Wann	14.05.2014 um 10:00 bis 16.05.2014 um 16:00
Veranstaltungsort	DECHEMA
Stadt	Frankfurt am Main
Kontaktname	Nicola Gruß
Kontakttelefon	+49 69 7564-253
Zielgruppe	Anwender aus Prozessanalytik, Spektroskopie, Metabolomik und anderen Omics-Technologien, die effizient aus hochdimensionalen Daten die relevanten Informationen extrahieren möchten.
Termin übernehmen	vCal iCal

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. – Aber nutzen Sie auch das volle Potential Ihrer Daten?

Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

Dieser Kurs bietet ein leicht zugängliches, konzeptionelles Verständnis einiger wichtiger Methoden des Data Mining und richtet sich damit auch an Anwender ohne große mathematische oder statistische Vorkenntnisse, deren Hauptaugenmerk auf der praktischen Nutzung dieser Methoden für die eigene Aufgabenstellung liegt.

Der Kurs gliedert sich in drei Teile:

Multivariate chemometrische Modelle

Flexible Modellierung mit Support Vector Machines (SVMs)

Anwendung der Methoden anhand von praxisnahen Beispielen und/oder eigenen Daten

Mit der Hauptkomponentenanalyse (Principal Component Analysis, PCA) erhalten Sie ein Werkzeug zur Datenuntersuchung und zum Datenverständnis (explorative Datenanalyse). Sie lernen, auch große Datenmengen überschaubar darzustellen, Probleme in der Datenqualität zu ermitteln und dabei Ausreißer zu erkennen. Außerdem ermöglicht Ihnen die PCA, Strukturen und deren vielleicht bisher verborgene Ursachen in den Daten zu erkennen. Eine Weiterführung der PCA ist die Modellierung der Daten auf vorgegebene Zielgrößen. Für quantitative Zielgrößen findet hierbei insbesondere die Partial Least Squares Regression (PLS) Verwendung. Qualitative Zielgrößen werden über Klassifizierungsmodelle wie z.B. die Diskriminanzanalyse (Linear Discriminant Analysis, LDA) beschrieben. Sie werden lernen, robuste PLS-Regressionsmodelle sowie LDA-Klassifzierungsmodelle zu erstellen.

SVMs bieten erstmals die Vorteile nichtlinearer Methoden ohne die damit sonst verbundenen Nachteile der komplexen Anwendung und eines hohen Probenbedarfs. Man kann diese Methoden sowohl für Klassenvorhersagen (Mustererkennung), quantitative Vorhersagen (Regression) als auch Ausreißer- und Abweichungserkennung verwenden.

Es wird gezeigt, warum SVMs einen grundsätzlich neuen, leistungsfähigen Ansatz gerade für sehr hochdimensionale Daten oder nichtlineare Probleme darstellen. Sie erlernen die Bedeutung der SVM Parameter und deren systematische Optimierung sowie die Bewertung finaler SVM-Modelle.

Am dritten Tag wird die Möglichkeit geboten, das Gelernte an vorgegebenen realen Daten oder eigenen geeigneten Daten zu üben. Die entsprechende Software wird als Demoversion zur Verfügung gestellt.

Direktbuchung

Weitere Informationen über diesen Termin…

DECHEMA-Forschungsinstitut

Programm

Data_Mining_2014.pdf — PDF document, 439 kB (449,755 bytes)

Benutzerspezifische Werkzeuge

Sektionen

Data Mining mit multivariaten Methoden und Support Vector Machines

Programm