- Team
- Forschung
- Studium
- Klausurtermine
- M.Sc. Data Science
- SS 2022
- SS 2023
- WS 2022/23
- WS 2023/24
- LOTS-Nutzung
- Vergangene Semester
- Module der Abteilung
- Abschlussarbeiten
- Top-Studenten
- Erasmus
- Service
Cloud Data Management WS 2016 (CDM)
- Vorlesung: Donnerstag 9:15 Uhr im HS 19
- Beginn: 13.10.2016
- Die Ergebnisse der Klausur sind jetzt in AlmaWeb verfügbar. Melden Sie sich bitte, falls Sie Ihr Ergebnis nicht einsehen können.
- Gastvortrag (Folien): Am 26.1. besucht uns Henning Kropp von der Firma Hortonworks und berichtet u.a. zu deren Einsatz von Hadoop, Hive und Spark sowie realen Use Cases.
Übersicht
In den letzten Jahren hat sich mit dem Begriff Cloud Computing ein Paradigma herausgebildet, welches eine Vielzahl von Diensten (u.a. Rechenkapazität, Speicherplatz, Laufzeitumgebung und Endnutzer-Software) über das Internet verfügbar macht. Dadurch wird eine ökonomische Verarbeitung großer Datenmengen ermöglicht, da Cloud-Dienste flexibel an den Bedarf von Nutzern und Anwendungen angepasst werden können. Die Vorlesung Cloud Data Management gibt einen systematischen Überblick über die Techniken zur effizienten Verarbeitung großer Datenmengen in der Cloud.
- Erwartete Vorkenntnisse: DBS1
Gliederung / Skript
Kapitel | Thema |
---|---|
0 | Organisation |
1 | Einführung: Cloud Computing |
2 | Infrastrukturen und Dienste (Teil1), (Teil2) |
3 | Verteilte Dateisysteme |
4 | MapReduce (update 17.11., ab Folie 26) |
5 | MapReduce und Datenbanken (Teil1), (Teil2) |
6 | Optimierungstechniken |
7 | Large-scale Datenanalyse |
Praktische Übungen
Online-Übungen
- Begleitende Übung im E-Learning-System LOTS
- Kennung
cdm#ws2016
zum Eintragen in die entsprechende Gruppe
Literatur
- Literaturangaben jeweils am Ende eines Kapitels
- Tom White: Hadoop: The Definitive Guide, Second Edition, O’Reilly Media, September 2010