German English

Big Data - Streaming

Überblick

  • Einführungsveranstaltung mit Themenvergabe am 21.10.2016 um 13:30 Uhr im Big Data Kompetenzzentrum ScaDS, Ritterstraße 9-13 2.OG (Standort/Lagebschreibung).
  • Um an dem Seminar teilzunehmen, müssen Sie sich in AlmaWeb für die entsprechende Veranstaltung eintragen und bei der Einführungsveranstaltung anwesend sein.
  • Teilnehmerkreis: Informatiker (Masterstudium, Bachelor ab 5. Semester)
  • Anrechenbar als Seminar-Modul (“Forschungsseminar Datenbanken”), im Rahmen von Modulen der Abteilung im Bachelor-/Masterstudium, als Bachelor-/Master-Seminar
  • Erwartete Vorkenntnisse: DBS1, Algorithmen und Datenstrukturen
  • Folien zur Einführungsveranstaltung am 21.10.2016 (Prof. Rahm)
  • Bei Fragen und Problemen zur An- und Abmeldung (AlmaWeb) wenden Sie sich bitte an das Studienbüro via einschreibung(at)math.uni-leipzig.de

Leistungsbewertung

Ein erfolgreiches Seminar setzt die Teilnahme an allen Seminarterminen voraus, die selbständige Erarbeitung eines Themas sowie einen Vortrag und eine schriftliche Ausarbeitung (15-20 Seiten) über das Thema. Die Benotung setzt sich aus der Note zu Vortrag und Diskussion sowie der Note für die Ausarbeitung zusammen. Einige Hinweise zum Verfassen der schriftlichen Ausarbeitung finden Sie hier.

Themen und Betreuer

NrThemaBetreuer#StudentenStudentQuellenTermin Vortrag
Introduction
Introduction to big data streaming (terminologies, algorithmic issues) Nentwig1[redacted][1],[2]06.01.
Querying in Data Stream Management Systems Lin1[redacted][1],[2]06.01.
The 8 Requirements of Real-Time Stream Processing Kricke1[redacted][1]06.01.
Systems
S-Store: Streaming Meets Transaction ProcessingGroß1[redacted][1],[2]13.01.
MillWheel: Fault-Tolerant Stream Processing at Internet ScaleNentwig1[1]
Kineograph: taking the pulse of a fast-changing and connected worldGrimmer1[redacted][1]13.01.
Twitter Heron: Stream Processing at ScalePeukert1[redacted][1]13.01.
An Introduction to Apache Beam Kricke1[redacted][1] [2] [3]13.01.
Data Stream Mining and Processing
A single pass algorithm for clustering evolving data streams based on swarm intelligenceChristen1[redacted][1],[2]20.01.
Streaming Similarity Search over one Billion Tweets using Parallel Locality-Sensitive HashingGroß1[redacted][1]20.01.
Efficient and flexible algorithms for monitoring distance-based outliers over data streamsSehili1[redacted][1]20.01.
Predicting taxi–passenger demand using streaming dataChristen1[1]
Streaming Similarity Self-JoinSehili1[redacted][1]20.01.
Elastic Scaling for Data Stream ProcessingPeukert1[1]
Graph Algorithms on Streams/Dynamic Graphs
LEOPARD: Lightweight Edge-Oriented Partitioning and Replication for Dynamic GraphsJunghanns1[redacted][1]27.01.
Event pattern matching over graph streamsJunghanns1[redacted][1]27.01.
Frequent Subgraph Mining from Streams of Linked Graph Structured DataPetermann1[redacted][1]27.01.
Frequent Subgraph Mining from Streams of Uncertain DataPetermann1[1]27.01.
Time-evolving graph processing at scale + use case mobile networkNentwig1[1][2]
Identifying Anomalies in Graph Streams Using Change DetectionGrimmer1[1]
Seminar