Data Mining mit multivariaten Methoden und Support Vector Machines

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

Data Mining mit multivariaten Methoden und Support Vector Machines

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. - Aber nutzen Sie auch das volle Potential Ihrer Daten? Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

48.77889 9.172903

Wann	10.06.2013 um 10:00 bis 12.06.2013 um 16:00
Veranstaltungsort	Stuttgart Institute of Management and Technology
Stadt	Stuttgart
Kontaktname	Nicola Gruß
Kontakttelefon	+49 69 7564253
Zielgruppe	Anwender aus Prozessanalytik, Spektroskopie, Metabolomik und anderen Omics-Technologien, die effizient aus hochdimensionalen Daten die relevanten Informationen extrahieren möchten.
Termin übernehmen	vCal iCal

Sie haben umfangreiche, komplexe Daten, seien es Prozessdaten, Spektren oder Omics-Daten. – Aber nutzen Sie auch das volle Potential Ihrer Daten?

Data Mining bietet leistungsfähige Methoden, um unbekannte Zusammenhänge in den Daten aufzudecken oder interessierende Abhängigkeiten zu modellieren. Dabei erlauben diese Methoden einen einfacheren und dabei doch umfassenderen Zugang als z.B. klassische statistische Verfahren.

Dieser Kurs bietet ein leicht zugängliches, konzeptionelles Verständnis einiger wichtiger Methoden des Data Mining und richtet sich damit auch an Anwender ohne große mathematische oder statistische Vorkenntnisse, deren Hauptaugenmerk auf der praktischen Nutzung dieser Methoden für die eigene Aufgabenstellung liegt.

Der Kurs gliedert sich in drei Teile:

Multivariate chemometrische Modelle

Flexible Modellierung mit Support Vector Machines (SVMs)
Anwendung der Methoden anhand von praxisnahen Beispielen und/oder eigenen Daten

Mit der Hauptkomponentenanalyse (Principal Component Analysis, PCA) erhalten Sie ein Werkzeug zur Datenuntersuchung und zum Datenverständnis (explorative Datenanalyse). Sie lernen, auch große Datenmengen überschaubar darzustellen, Probleme in der Datenqualität zu ermitteln und dabei Ausreißer zu erkennen. Außerdem ermöglicht Ihnen die PCA, Strukturen und deren vielleicht bisher verborgene Ursachen in den Daten zu erkennen. Eine Weiterführung der PCA ist die Modellierung der Daten auf vorgegebene Zielgrößen. Für quantitative Zielgrößen findet hierbei insbesondere die Partial Least Squares Regression (PLS) Verwendung. Qualitative Zielgrößen werden über Klassifizierungsmodelle wie z.B. die Diskriminanzanalyse (Linear Discriminant Analysis, LDA) beschrieben. Sie werden lernen, robuste PLS-Regressionsmodelle sowie LDA-Klassifzierungsmodelle zu erstellen.

SVMs bieten erstmals die Vorteile nichtlinearer Methoden ohne die damit sonst verbundenen Nachteile der komplexen Anwendung und eines hohen Probenbedarfs. Man kann diese Methoden sowohl für Klassenvorhersagen (Mustererkennung), quantitative Vorhersagen (Regression) als auch Ausreißer- und Abweichungserkennung verwenden.

Es wird gezeigt, warum SVMs einen grundsätzlich neuen, leistungsfähigen Ansatz gerade für sehr hochdimensionale Daten oder nichtlineare Probleme darstellen. Sie erlernen die Bedeutung der SVM Parameter und deren systematische Optimierung sowie die Bewertung finaler SVM-Modelle.

Am dritten Tag wird die Möglichkeit geboten, das Gelernte an vorgegebenen realen Daten oder eigenen geeigneten Daten zu üben. Die entsprechende Software wird als Demoversion zur Verfügung gestellt.

Der Kurs ist Teil des Weiterbildungsangebots des Arbeitskreises Prozessanalytik.

Direktbuchung

Weitere Informationen über diesen Termin…

DECHEMA-Forschungsinstitut

Programm

Data_Mining.pdf — PDF document, 143 kB (146,510 bytes)

Benutzerspezifische Werkzeuge

Sektionen

Data Mining mit multivariaten Methoden und Support Vector Machines

Programm