Direkt zu


Informationen für Studierende

zur Startseite

Bachelorarbeit

Evaluierung verschiedener Technologien zur Speicherung und Verknüpfung von strukturierten und unstrukturierten Daten
Bearbeiter Paul Dieterich
Betreuer M.Sc. Christian Weber
M.Sc. Cornelia Kiefer
Prüfer Prof. Dr.-Ing. habil. Bernhard Mitschang
Ende01.06.2017
Beschreibung

Hintergrund

Hintergrund der Ausschreibung sind zwei Projekte an der Graduiertenschule GSaME, die sich mit (1) der Qualität von Daten und (2) dem Management von Wissen in den Fabriken der Zukunft beschäftigen.

In Unternehmen liegen ca. 70% der Daten in unstrukturierter Form vor. Zur Entscheidungsunterstützung werden jedoch bislang nur strukturierte relationale Daten herangezogen. Es werden daher Technologien benötigt, welche strukturierte und unstrukturierte Daten persistieren, miteinander verknüpfen und durchsuchbar machen. Dadurch können Informationsbedarfe in Unternehmen effizient adressiert werden. Ein konkreter Anwendungsfall ist die Dokumentation von Problemen und zugehörigen Lösungen. Um die Lösung mit technischen Details anzureichern müssen auch z.B. technische Dokumente in Form von PDF-Dateien verknüpft werden oder Videos zu Arbeitsgängen hinterlegt werden. Damit eine Verknüpfung sinnvoll hergestellt werden kann ist Wissen über die Semantik der Datenbank und der zu verknüpfenden Dokumente notwendig. Diese Semantik wurde durch Menschen festgelegt und ist dadurch nur für Domänenexperten interpretierbar. Daher sind nur Domänenexperten in der Lage strukturiert und unstrukturierte Daten sinnvoll zu verknüpfen. Mithilfe eines IT-basierten Recommender Systems, welches im Hintergrund unstrukturierte Daten analysiert können mögliche Verknüpfungen vorgeschlagen werden. Dies erspart dem Domänenexperten wertvolle Zeit bei der Suche nach semantisch äquivalenten Links zwischen relationalen und unstrukturierten Daten. Die Ergebnisse fließen später in den Aufbau einer Wissensdatenbank ein, welche Informationen shop und office floor übergreifend zur Verfügung stellt. Es gibt schon eine Vorarbeit mit einem Konzept, welches eine Integration von relationalen Daten aus einem Datawarehouse mit unstrukturierten Dateien aus einem Content-Management-System vorsieht, auf der aufgebaut werden kann. Die Verknüpfung ermöglicht es auch in einem weiteren Schritt Analysen auf strukturierten und unstrukturierten Daten durchzuführen.

Ziel und Aufgabenstellung

In der Arbeit sollen die momentan am Markt verfügbaren Technologien zur Speicherung von unstrukturierten Daten evaluiert und bewertet werden. Ein Hauptaugenmerk liegt dabei auf der Bewertung der Interoperabilität zwischen Lösungen zum Speichern von unstrukturierten Daten und relationalen Datenbanktechnologien. Weitere Kriterien zur Auswahl einer geeigneten Technologie zur Verknüpfung von strukturierten und unstrukturierten Daten sollen entwickelt werden. Bei der Recherche sollen vorwiegend Open Source Technologien untersucht werden.