Fachbereich Informatik

Prof. Dr. R. Manthey

(Universität Bonn)

"Datenbankgestützte Analyse großer Datenströme mit regelbasierten Methoden"

Das Monitoring von Datenströmen, die durch Sensornetze erzeugt werden, stellt die DB-Welt vor neue Herausforderungen, da viele der „klassischen“ DB-Konzepte und -Methoden durch die schiere Größe und die hohe Frequenz der Datenströme bis über die Grenzen ihrer Leistungsfähigkeit gefordert werden. Die rechnergestützte Analyse dieser Datenmengen – die für die Anwender der Monitoring-Systeme den eigentlich interessanten Teil ihrer Arbeit darstellen – findet jedoch nach wie vor fast ausschließlich mittels Algorithmen statt, die in Softwaresystemen ausserhalb des DBMS realisiert sind und es nur als passiven Zulieferer protokollierter Stromdaten nutzen. Die Analysealgorithmen kommunizieren mit dem DBMS zwar mittels deklarativer DB-Sprachen (in der Regel SQL), nutzen diese Sprachen aber meist nur zum Zugreifen auf semantisch primitive Sensordaten. Die Interpretation der Daten und deren Verknüpfung mit Domänenwissen bis hin zur Entdeckung anwendungsspezifisch interessanter Ereignisse und Zusammenhänge erfolgt jedoch separat mit den imperativen Mitteln traditioneller Programmiersprachen. DB-Techniken tragen hierzu aktuell kaum etwas Nennenswertes bei!

In diesem Vortrag vertreten wir die These, dass deklarative Anfragesprachen wie SQL und die mit ihnen verbundenen effizienten Auswertungsmethoden für die wissensbasierte Analyse von Datenströmen sehr wohl einen wichtigen Beitrag liefern können, insbesondere wenn sie zur konstruktiven Definition von Begriffshierarchien mittels Sichten (d.h. deduktiven Regeln) genutzt werden. Wir beobachten, dass das durch enorme Änderungshäufigkeit geprägte Sensordatenszenario zumindest bezogen auf „Zeitfenster“, in denen Analyse neuer Daten betrieben wird, in mancher Hinsicht dem gewohnten Transaktionskontext weiterhin ähnelt. Die neuen Aufgaben Ereigniserkennung und Bestim-mung im Zeitfenster veränderter abgeleiteter Datenmengen ähneln den Transaktionsmanagementaufgaben der Integritätsprüfung und der Anpassung materialisierter Sichten. Moderne Methoden zur effizienten Behandlung dieser „klassischen“ DBMS-Probleme, hier insbesondere die inkrementelle Änderungspropagierung, lassen sich analog auf die neuen Monitoring-Aufgaben übertragen, vorausgesetzt ein Teil des Analyseprozesses ist eben durch Kodierung in deklarativen Regelformalismen solchen DB-spezifischen Methoden zugänglich gemacht worden. Trotz dieser prinzipiellen Anwendbarkeit regelbasierter DB-Methoden für die Sensordatenanalyse gibt es derzeit noch keine überzeugende kommerziell verfügbare Realisierung dieser Methoden, da viele grundsätzliche Erkenntnisse den Weg in die kommerzielle Welt noch nicht gefunden haben und viele Detailprobleme noch ungelöst sind.



Zeit: Termin: Mo, 24.01.2005, 17.15 Uhr
Ort: Gebäude 46, Raum 280