Direkt zu


Informationen für Studierende

zur Startseite

Bachelorarbeit

Realisierung von umfassenden Analysetechniken in einer hybriden Datenverarbeitungsarchitektur
Projekt Privacy in Stream Processing
Betreuer M.Sc. Corinna Giebler
Dr. rer. nat. Christoph Stach
Prüfer Prof. Dr.-Ing. habil. Bernhard Mitschang
Ende2018/11/07
Beschreibung

Ausgangssituation

Durch die Zuhilfenahme von Sensoren können große Mengen an Daten in zahlreichen Umfeldern, wie der Industrie 4.0 [1] oder eHealth [2], erfasst und verarbeitet werden. Um daraus möglichst große Vorteile zu ziehen, müssen umfassende Analysen auf historischen und Echtzeitdaten ausgeführt werden. Dies bedeutet, dass z.B. ein Machine Learning Modell, das aus historischen Daten erstellt wurde, direkt auf Echtzeitdaten angewandt werden kann. Umgekehrt können aber auch die Echtzeitdaten das Modell beeinflussen und verfeinern (siehe VFDT [3]). Beispielsweise kann aus historischen Daten ein Vorhersagemodell zur Qualität von Werkstücken erstellt werden, welches mithilfe von Echtzeitdaten verfeinert wird. Eine Architektur, die ein solches Vorgehen ermöglicht, ist BRAID [4].

Ziel und Aufgabenstellung

Im Rahmen dieser Bachelorarbeit soll untersucht werden, inwiefern umfassende Analysen mit BRAID umsetzbar sind. Dafür soll anhand eines Use Cases ein Algorithmus implementiert werden, welcher Machine Learning Modelle auf historischen Daten erlernt und diese dann auf Echtzeitdaten anwendet. Diese Echtzeitdaten sollen gleichzeitig dazu verwendet werden, das erlernte Modell zu verfeinern. Solche umfassenden Analysen stellen allerdings ein Problem bezüglich des Datenschutzes dar, da die Ergebnisse sensible Informationen enthüllen können [5]. Daher soll zudem auf mögliche Mechanismen eingegangen werden, die dieser Problematik entgegenwirken.

Zu bearbeitende Teilaufgaben

  • Vorstellung möglicher Machine Learning Algorithmen, die von BRAID unterstützt werden
  • Implementierung eines Use Cases für umfassende Analysen mit BRAID
  • Vorstellung von Datenschutzansätzen für BRAID
  • Vorstellung der Ergebnisse in einem wissenschaftlichen Vortrag

Organisatorisches

Art der Arbeit

Bachelorarbeit

Titel

Realisierung von umfassenden Analysetechniken in einer hybriden Datenverarbeitungsarchitektur

Englischer Titel

Realizing comprehensive analytics in a hybrid data processing architecture

Betreuer

Corinna Giebler M.Sc. Informatik

Prüfer

Prof. Dr. Bernhard Mitschang

 

Literatur

[1]           C. Gröger, C. Stach, B. Mitschang, and E. Westkämper, “A mobile dashboard for analytics-based information provisioning on the shop floor,” International Journal of Computer Integrated Manufacturing, vol. 29, no. 12, pp. 1335–1354, 2016.

[2]           C. Stach, F. Steimle, and B. Mitschang, “The Privacy Management Platform: An Enabler for Device Interoperability and Information Security in mHealth Applications,” in Proceedings of the 11th International Conference on Health Informatics, ser. HEALTHINF ’18, 2018, pp. 27–38.

[3]           P. Domingos and G. Hulten, “Mining High-speed Data Streams,” in Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ser. KDD ’00, 2000, pp. 71–80.

[4]           C. Giebler, C. Stach, H. Schwarz, and B. Mitschang, “BRAID: A Hybrid Processing Architecture for Big Data,” in Proceedings of the 7th International Conference on Data Science, Technology and Applications, ser. DATA ’18, 2018, submitted.