Big-Data-Praktikum
Übersicht
Das Praktikum beinhaltet den Entwurf und die Realisierung einer Anwendung oder eines Algorithmus im Big-Data-Umfeld. In der Regel erfolgt die Implementierung unter Verwendung eines Big-Data-Frameworks, wie z. B. Hadoop, Apache Spark, Apache Flink oder Gradoop erstellt werden soll.
Im einzelnen sind folgende Teilaufgaben zu lösen:
- Konzeptioneller Entwurf. Es ist ein Entwurfsdokument anzufertigen, welches konzeptionell den Ablauf und die Architektur ihrer Anwendung darstellt. Im Dokument muss ersichtlich werden, welches Ziel verfolgt wird und welche Aufgaben dafür zu bewältigen sind. Das Dokument soll sich vom Umfang auf ca. 4 Seiten beschränken.
- Implementierung. Basierend auf ihrem Entwurf soll die Anwendung realisiert werden. Das Resultat dieser Phase ist ein dokumentiertes, ausführbares Programm.
- Abschlusspräsentation Am Ende des Praktikums stellt jede Gruppe ihr Projekt vor, wobei sie ihre Anwendung beschreibt sowie die Resultate präsentiert. Die Dauer der Präsentation soll ca. 15 Minuten betragen.
Anmeldung und Präsenzveranstaltungen
Die Anmeldung zum Praktikum erfolgt vordergründig über das Alma Web. Weitere Anmeldungen werden über unsere Webseite erfasst, indem Sie sich in die entsprechende Gruppe (Mein Konto > Gruppen) auf unserer Seite einschreiben bis zum 19.04.2020. Dies ist eine Warteliste, so dass Studenten nachrücken können, falls freie Plätze verfügbar werden oder die Kapazität geringfügig erhöht werden kann.
Die endgültige Anmeldung und Themenzuordnung findet im Moodle unter folgender Adresse statt: Anmeldung Moodle Der Anmeldezeitraum ist vom 20.04-24.04. Dabei werden die Anmeldelisten aus dem AlmaWeb und der Anmeldung im Moodle abgeglichen, so dass Studenten, die angemeldet sind, garantiert ein Thema bekommen.
Vorbesprechung Erste Mailkommunikation für die Konkretisierung des Themas und die ersten Schritte werden mit dem Betreuer per Mail abgehalten.
Testate
Das Praktikum gliedert sich in drei Teile. Nach jeder der drei Teilaufgaben wird ein Testat durchgeführt. Zum erfolgreichen Absolvieren des Praktikums müssen alle drei Testate erfolgreich abgelegt werden. Wird ein Termin nicht eingehalten, verfallen die bereits erbrachten Teilleistungen. Die konkreten Termine für die ersten zwei Testate sind mit dem Betreuer per E-Mail zu vereinbaren. Alle Gruppenmitglieder müssen zu den Testaten anwesend sein und Fragen zum Thema beantworten können. Es gelten die nachfolgenden Fristen:
- Testat 1 (Entwurf): Ende Mai
- Testat 2 (Realisierung): Mitte-Ende Juli
- Testat 3 (Präsentation): 17.08-22.08
Themen
Bitte vereinbaren Sie zeitnah einen Termin mit Ihrem Betreuer zur Besprechung der ersten Schritte!
Die Übersicht über die Themen finden Sie im GitLab: Big-Data-Praktikum
Teilnehmerkreis
Master-Studiengänge Data Science und Informatik. Die Teilnahme erfolgt in 2er-Gruppen, die Teilnehmerzahl ist auf ca. 22 Studierende beschränkt!. Zu beachten ist, dass Studenten, die das Big-Data-Praktikum noch nicht belegt haben, bevorzugt werden.
Erwartete Vorkenntnisse
- Java-Kentnisse
- Vorlesung Cloud Data Management und NoSQL-Datenbanken hilfreich
- Linux-Kenntnisse von Vorteil
- Git-Kenntnisse von Vorteil