GSaME C2-020

Methoden zur Spezifikation, Konfiguration und Auswahl von Lösungen des maschinellen Lernens

Projektbeschreibung

Aufgrund des steigenden Bedarfs an Verfahren des maschinellen Lernens (ML) in Unternehmen bilden sich immer mehr Personen autodidaktisch zu Datenwissenschaftlern aus. Diese sogenannten Citizen Data Scientists verfügen im Gegensatz zu ML-Expert*innen nicht über ein tiefgreifendes Verständnis zu Lernalgorithmen, können jedoch eigenverantwortlich aber mit größerem zeitlichen Aufwand Softwaresysteme mit ML-Verfahren (kurz ML-Lösungen) entwickeln. Diese ML-Lösungen umfassen dabei  verschiedene Softwarekomponenten von der Datenvorbereitung bis hin zum ML-Algorithmus und dessen Parametrisierung. Zur Unterstützung der Citizen Data Scientists werden neue Ansätze benötigt, welche die Entwicklung von ML-Lösungen vereinfachen. Die Kernherausforderung ist dabei, dass Citizen Data Scientists eine Kombination an Softwarekomponenten wählen und konfigurieren müssen, sodass am Ende eine nutzbare und hochwertige Gesamtlösung resultiert. Aufgrund der hohen Anzahl an möglichen Kombinationen der Softwarekomponenten gestaltet sich dieser Prozess jedoch als sehr zeitaufwändig und komplex. Bestehende Ansätze wie z. B. AutoML versuchen daher, diesen Prozess zu automatisieren. Diese Ansätze liefern jedoch nur schwer interpretierbare Ergebnisse und sind somit für Citizen Data Scientists ungeeignet. Daher müssen neue für diese Nutzergruppe intuitivere Ansätze entwickelt werden.

Im Rahmen dieses Projektes wurden verschiedene Konzepte entwickelt, die Citizen Data Scientists bei der Spezifikation, Konfiguration und Auswahl von Softwarekomponenten des maschinellen Lernens und der Datenvorbereitung unterstützen. Ein zentrales Konzept ist AssistML, das Metadaten aus einem Repository bestehender ML-Lösungen nutzt, um passende Kombinationen an Softwarekomponenten für einen neuen Anwendungsfall zu empfehlen. Auf diese Weise entlastet AssistML Citizen Data Scientists bei der Aufgabe, sämtliche Kombinationen und Implementierungsdetails von Softwarekomponenten zu kennen und zu bewerten. Darüber hinaus erklärt AssistML die generierten Vorschläge, was ihrer Interpretation und Bewer-tung vereinfacht.

Anwendungskontext von AssistML
Anwendungskontext von AssistML

Förderung

Dieses Projekt wurde von der Deutschen Forschungsgemeinschaft (DFG) und dem Landesministerium für Wissenschaft, Forschungund Kunst Baden-Württemberg im Rahmen der Graduate School of Excellence advanced Manufacturing Engineering (GSaME) gefördert. Zusätzlich bekam es Unterstützung durch die Software-Campus-Initiative, welche vom Bundesministerium für Bildung und Forschung (BMBF) gefördert wird. Das zugehörige Projekt im Software Campus ist GUACAMOLE.

Dieses Bild zeigt Alejandro Gabriel Villanueva Zacarias
M.Sc.

Alejandro Gabriel Villanueva Zacarias

Wissenschaftlicher Angestellter

Dieses Bild zeigt Peter Reimann
Dr. rer. nat.

Peter Reimann

Wissenschaftlicher Angestellter

Dieses Bild zeigt Bernhard Mitschang
Prof. Dr.-Ing. habil.

Bernhard Mitschang

Institutsleiter

Zum Seitenanfang