- Team
- Research
- Study
- Klausurtermine
- M.Sc. Data Science
- SS 2022
- SS 2023
- WS 2022/23
- WS 2023/24
- LOTS-Nutzung
- Previous terms
- Module der Abteilung
- Theses
- Top-Studenten
- Erasmus
- Service
Seminar Large-scale Data Analytics (WS 2012/13)
Überblick
- Dozent: Prof. Dr. Erhard Rahm
- Ort/Zeit: Raum Paulinum P-701, montags im Jan. 2013, ab 9:15 Uhr.
- Einführungsveranstaltung mit Themenvergabe war am Montag, 15.10.2012
- Teilnehmerkreis: Informatiker (Masterstudium, Bachelor ab 5. Semester)
- Anrechenbar als Seminar-Modul, Bachelor-Seminar, Master-Seminar oder im Rahmen von Modulen der Abteilung im Masterstudium
- Erwartete Vorkenntnisse: DBS1
Anmeldung
- Anmeldung (nach Registrierung) über Mein Konto > Gruppen in Gruppe Seminar Large-scale data analysis-Datenbanken.
Die aktive Seminarteilnahme ist auf maximal 20 Studierende begrenzt.
In der Einführungsveranstaltung erfolgt die Vergabe der Themen unter den angemeldeten und anwesenden Studierenden. Wenn erforderlich, erfolgt dabei auch eine Auswahl unter den angemeldeten Interessenten.
Themen und Betreuer
Das Seminar behandelt aktuelle Entwicklungen im Bereich Large-Scale Data Analytics, insbesondere in den Bereichen Business Intellegence / Data Warehousing, sozialen Netzwerken und Big Data / Cloud. Eine besondere Rolle spielen Performance-Techniken wie Column Stores, Hauptspeicher-Architekturen sowie die parallele Bearbeitung ressourcen-intensiver Graph- und Data Mining-Verfahren.
Vorläufige Themenübersicht:
Nr | Thema | Termin | Studenten | Links zu Papieren |
---|---|---|---|---|
0 | Seminar-Einführung (PDF) | 15.10. | Prof. Rahm | |
1,2 | Einführung Column Stores | 7.1 | [redacted] | |
3,4,5 | Data Warehouse Appliances (IBM Netezza, SAP BI Software) | 7.1/14.1 | [redacted] | |
6,7,8 | In-Memory BI Architectures (SAP Hana, SanssouciDB, QlikView) | 14.1 | [redacted] | |
9,10 | Recommendations in sozialen Netzwerken (Facebook, Twitter) | 21.1 | [redacted] | |
11,12 | Graph-Mining in sozialen Netzwerken (Zugriffsanalysen), Pegasus-System | 21.1 | [redacted] | |
13,14 | Cloud-basierte Datenanalyse (Hive, Stratosphere, Pig/PigLatin …) | 21.1 | [redacted] | |
15,16 | Data Mining und Machine Learning in der Cloud | 28.1 | [redacted] | |
17,18,19,20 | Large-scale Data Analysis in speziellen Domänen (Life Sciences, Scientific Impact Analysis, Datenströme, …) | 28.1 | [redacted] |
Leistungsbewertung
Ein erfolgreiches Seminar setzt die Teilnahme an allen Seminarterminen voraus, die selbständige Erarbeitung eines Themas sowie einen Vortrag und eine schriftliche Ausarbeitung (15-25 Seiten) über das Thema. Die Benotung setzt sich aus der Note zu Vortrag und Diskussion sowie der Note für die Ausarbeitung zusammen.