Forschungsprojekt in Kooperation mit der Robert Bosch GmbH

DLArchitektur

Design einer umfassenden Data Lake Architektur

Projektbeschreibung

Initiativen wie die Industrie 4.0 sind darauf ausgerichtet, datengetriebene Entscheidungsunterstützung in Unternehmen voranzubringen. Im Rahmen dieser Initiativen werden große Mengen heterogener Daten erzeugt, die gespeichert und verwaltet werden wollen. Dabei ist nicht immer klar, welchen Nutzen diese Daten dem Unternehmen später bringen. Dadurch ist es meist nicht möglich bereits bei der Erfassung der Daten zu entscheiden, ob und welchen Wert die Daten haben. Um keine potentiell wichtigen Informationen zu verlieren, werden die gesammelten Daten darum in Rohform in einem unternehmensweiten Data Lake abgelegt.
Zwar existieren bereits Konzepte rund um das Thema Data Lake, allerdings fehlt eine umfassende Betrachtung der einzelnen Teilaspekte. Es bleibt dadurch unklar, wie Unternehmen einen erfolgreichen Data Lake konzipieren und realisieren können. Zusammenhänge zwischen existierenden Konzepten sind bislang meist unerforscht. Ziel des Projektes ist es daher, ein Rahmenwerk für eine implementierbare Data Lake Architektur zu schaffen.

Gefördert durch: Robert Bosch GmbH

Publikationen

[GGHE21] Giebler, C. et al.: The Data Lake Architecture Framework: A Foundation for Building a Comprehensive Data Lake Architecture. In: Proceedings der 19. Fachtagung Datenbanksysteme für Business, Technologie und Web (BTW 2021) (2021).

[GGHS20] Giebler, Corinna; Gröger, Christoph; Hoos, Eva; Schwarz, Holger; Mitschang, Bernhard: A Zone Reference Model for Enterprise-Grade Data Lake Management. In: Proceedings of the 24th IEEE Enterprise Computing Conference (EDOC 2020) (2020).

[GGHE20] Giebler, Corinna; Gröger, Christoph; Hoos, Eva; Eichler, Rebecca; Schwarz, Holger; Mitschang, Bernhard: Data Lakes auf den Grund gegangen. Datenbank-Spektrum. 20 (1), 57–69 (2020).

[GGHS19] Giebler, Corinna; Gröger, Christoph; Hoos, Eva; Schwarz, Holger: Modeling Data Lakes with Data Vault: Practical Experiences, Assessment, and Lessons Learned. In: Proceedings of the 38th Conference on Conceptual Modeling (ER 2019) (2019).

[GGHS19] Giebler, Corinna; Gröger, Christoph; Hoos, Eva; Schwarz, Holger; Mitschang, Bernhard: Leveraging the Data Lake - Current State and Challenges. In: Proceedings of the 21st International Conference on Big Data Analytics and Knowledge Discovery (DaWaK 2019) (2019).

Dieses Bild zeigt  Holger Schwarz
PD Dr. rer. nat. habil.

Holger Schwarz

Privatdozent

Zum Seitenanfang