- Team
- Forschung
- Studium
- Klausurtermine
- M.Sc. Data Science
- SS 2022
- SS 2023
- WS 2022/23
- WS 2023/24
- LOTS-Nutzung
- Vergangene Semester
- Module der Abteilung
- Abschlussarbeiten
- Top-Studenten
- Erasmus
- Service
Data Warehouse und Data Mining Praktikum
Betreuer: Victor Christen, Martin Franke, Ziad Sehili, Johannes Zschache
Einführungsveranstaltung: 18.10.2019 15:15 Uhr Raum SG 214
Teilnehmerkreis
Master-Studierende der Informatik sowie Interessierte. Die Vergabe der Plätze erfolgt in der Einführungsveranstaltung.
Teilnehmer
[redacted]
Organisatorische Hinweise
Schwerpunkt
Je nach persönlichen Interessen und Vorkenntnissen bieten wir zwei Schwerpunkte für das Praktikum an:
- Data Warehousing
- Realisierung aller Phasen eines Data-Warehouse-Projektes
- Schwerpunkte: Datenextraktion, Data Cleaning, MDX-Anfragen
- Framework: Microsoft SQL Server
- Data Mining
- Implementierung von Algorithmen aus der Vorlesung “Data Mining”
- Schwerpunkte: Clustering, Empfehlungssysteme, PageRank, Streams
- Framework: Apache Spark + MLlib
- Data Mining in der Praxis
- Kooperationsprojekt mit dem Masterstudiengang Datenjournalismus
- Realisierung einer Webapplikation zum Thema “Deutschland-Doppel”
- Analyse deutscher Städte basierend auf statistischen Daten über die Zeit
- Schwerpunkte: Realisierung eines ETL-Prozesses, Anwendung von Data Mining Verfahren, wie z.B. Clustering, Web-App Entwicklung
Vorkenntnisse
- Voraussetzung für die Teilnahme am Praktikum ist die Teilnahme an der Vorlesung “Data Warehousing” bzw. der Besuch der Vorlesung “Data Mining” oder adäquate Kenntnisse.
- Eine erfolgreiche Absolvierung des Datenbank-Praktikums ist von Vorteil.
- Kenntnisse der Programmiersprache Java sind obligatorisch.
Ablauf
- Das Praktikum findet in Gruppen zu je 2 Studierenden statt.
- Jeder Gruppe bearbeitet die Aufgaben des Praktikums jeweils selbständig.
- Insgesamt enthält das Praktikum vier Präsenztermin und zwar zur Einführungsveranstaltung sowie zu den drei Testat-Terminen.
- Das Praktikum setzt sich aus mehreren Teilaufgaben zusammen, welche jeweils mit einem Testat (60 min) abgeschlossen und bewertet werden. Insgesamt gibt es drei Testate.
Testate
Die Testate sind spätestens bis zu folgenden Fristen abzulegen:
- Testat 1: 29. November 2019
- Testat 2: 31. Januar 2020
- Testat 3: 31. März 2020
- Der Termin für das dritte Testat ist bis spätestens Ende Februar zu vereinbaren!
Die Testat-Termine sind mit Ihrem jeweiligen Betreuer eine Woche im Voraus per E-Mail (oder ggfs. Moodle) zu vereinbaren. Wird ein Termin nicht eingehalten, verfallen die bereits erbrachten Teilleistungen!
Die Gruppen mit dem Schwerpunkt “Data Mining” müssen spätestens 24 Stunden vor Ihrem Testat-Termin Ihre Lösung Ihrem Betreuer per E-Mail zusenden.
Bitte geben Sie im Betreff der E-Mail dmprak sowie Ihre Gruppennummer an. Nehmen Sie dabei Ihren Gruppenpartner mit ins CC.
Die Gruppen mit dem Schwerpunkt “Data Mining” müssen spätestens 24 Stunden vor Ihrem Testat-Termin Ihre Lösung Ihrem Betreuer per E-Mail zusenden.
Bitte geben Sie im Betreff der E-Mail dmprak sowie Ihre Gruppennummer an. Nehmen Sie dabei Ihren Gruppenpartner mit ins CC.
Anmeldung
Das Praktikum ist kein eigenständiges Modul, sondern es kann als Bestandteil des Vertiefungsmoduls “Moderne Datenbanktechnologien” (10-202-2216) eingebracht werden (siehe auch Modulangebot). Bei Interesse an einer Teilnahme tragen Sie sich dazu in die entsprechende Veranstaltung im Almaweb ein. Bei Fragen und Problemen zur Anmeldung wenden Sie sich bitte immer an das Studienbüro via einschreibung(at)math.uni-leipzig.de. Bitte beachten Sie, dass zur Teilnahme am Praktikum die Anwesenheit zur Einführungsveranstaltung verpflichtend ist.
Vergabe von Leistungspunkten
Zur Erzielung der Leistungspunkte müssen alle drei Testate erfolgreich abgelegt werden. Dabei ist die Anwesenheit beim Testat für alle Gruppenmitglieder verpflichtend. Die Endnote ergibt sich aus dem Durchschnitt der drei Testat-Noten.