Projektbeschreibung
Datenanalysen ermöglichen einen tiefgreifenden Einblick in den Inhalt und die innere Struktur von Datenbeständen. Dabei werden Algorithmen aus dem Bereich des maschinellen Lernens angewandt, um aus existierenden Daten Wissen abzuleiten, welches anschließend wertschöpfend verwendet werden kann.
Häufig ist vor dem Beginn der Analyse nicht klar, welche Algorithmen zu stabilen und belastbaren Ergebnissen einer Datenanalyse führen. Deshalb werden häufig verschiedene Algorithmen mit diversen Parametrisierungen in mehreren Iterationen ausgeführt und anschließend das vielversprechendste Ergebnis gewählt. Dieses Verfahren stößt jedoch – gerade in der heutigen Zeit – auf große Probleme: Durch die immer weiterwachsende Menge an Daten, welche analysiert werden, nimmt folglich auch die Ausführungszeit einer jeden Iteration mehr Zeit in Anspruch.
Im Rahmen des Projektes INTERACT werden folglich ausgewählte Dimensionen untersucht, welche die Ausführungszeit reduzieren und gleichzeitig zu belastbaren Ergebnissen führen können. Insbesondere werden hier die Dimensionen (1) der auszuführenden Mining-Algorithmen, (2) der Strategien zur Reduktion der Datenmenge und (3) der Ausführungsumgebungen für einen Analyseprozess genauer betrachtet.
Das Mikroprojekt INTERACT wurde im Rahmen des Software Campus vom 01.01.2018 bis zum 30.11.2020 durchgeführt.
Publikationen
- Fritz, M., Gang, S., Schwarz, H. 2021. “Automatic Selection of Analytic Platforms with ASAP-DM,” in Proceedings of the International Conference on Scientific and Statistical Database Management (SSDBM 2021).
- Fritz, M., Tschechlov, D., and Schwarz, H. 2021. “Efficient Exploratory Clustering Analyses with Qualitative Approximations,” in Proceedings of the International Conference on Extending Database Technology (EDBT 2021).
- Fritz, M., Behringer, M., and Schwarz, H. 2020. “LOG-Means: Efficiently Estimating the Number of Clusters in Large Datasets,” in Proceedings of 46th International Conference on Very Large Data Bases (VLDB 2020).
- Fritz, M., Tschechlov, D., and Schwarz, H. 2020. “Learning from past observations: Meta-Learning for Efficient Clustering Analyses,” in Proceedings of 22nd International Conference on Big Data Analytics and Knowledge Discovery (DaWaK 2020). Lecture Notes in Computer Science (Vol. 12393 LNCS), Springer, Cham, pp. 364-379.
- Fritz, M., and Schwarz, H. 2019. “Initializing k-means efficiently: Benefits for exploratory cluster analysis,” in Proceedings of 27th International Conference on Cooperative Information Systems (CoopIS 2019). Lecture Notes in Computer Science (Vol. 11877 LNCS), Springer, Cham, pp. 146–163.
- Fritz, M., Muazzen, O., Behringer, M., and Schwarz, H. 2019. “ASAP-DM: a framework for automatic selection of analytic platforms for data mining,” in Proceedings of 13th Symposium and Summer School On Service-Oriented Computing (SummerSoC 2019). SICS Software-Intensive Cyber-Physical Systems, Springer Berlin Heidelberg, pp. 1–13.
- Fritz, M., Behringer, M., and Schwarz, H. 2019. “Quality-driven early stopping for explorative cluster analysis for big data,” in Proceedings of 12th Symposium and Summer School On Service-Oriented Computing (SummerSoC 2018). SICS Software-Intensive Cyber-Physical Systems (34:2–3), pp. 129–140.

Manuel Fritz
Dr. rer. nat.Wissenschaftlicher Angestellter
- Profile page
- Weitere Informationen

Holger Schwarz
Prof. Dr. rer. nat. habil.Apl. Professor