Distributed FoodBroker: Skalierbare Generierung graphbasierter Geschäftsprozessdaten.
|
Weitere Informationen: http://btw2017.informatik.uni-stuttgart.de/slidesandpapers/E1-13/paper_web.pdf
Beschreibung
Graphen eignen sich im besonderen Maße für die Modellierung und Analyse komplexer Zusammenhänge zwischen beliebigen Objekten. Neben bekannten Anwendungen, wie der Analyse sozialer Netzwerke, eignen sich Graphen ebenfalls für die Analyse komplexer Geschäftsprozesse. Knoten repräsentieren hier die Geschäftsobjekte, Kanten die Beziehungen zwischen ihnen. Diese Art der Modellierung ermöglicht den Einsatz graphbasierter Analyseverfahren, zum Beispiel zur Erkennung komplexer Muster zwischen Geschäftsobjekten und deren Auswirkung auf den Erfolg oder Misserfolg eines Prozesses. Um entsprechende Analyseverfahren entwickeln und testen zu können, ist es notwendig, Daten realer Geschäftsprozesse zu evaluieren. Aus Datenschutz- und Wettbewerbsgründen ist es jedoch schwer bis unmöglich reale Daten für die wissenschaftliche Nutzung zu erhalten. Daher ist es sinnvoll Datengeneratoren wie zum Beispiel FoodBroker zu entwickeln. FoodBroker simuliert Geschäftsprozesse und erstellt Graphdaten, die wiederum verwendet werden können, um Benchmarks für neue graphbasierte Analyseverfahren zu erstellen. In diesem Beitrag zeigen wir, wie FoodBroker mit Hilfe der Open-Source-Frameworks \textsc{Gradoop} und Apache Flink auf verteilten Systemen umgesetzt werden kann. Distributed FoodBroker eignet sich für die Erzeugung von Graphen beliebiger Größe und skaliert dabei annähernd linear sowohl mit den zur Verfügung stehenden Ressourcen als auch mit den zu generierenden Datenmengen.