- Team
- Research
- Study
- Klausurtermine
- M.Sc. Data Science
- SS 2022
- SS 2023
- WS 2022/23
- WS 2023/24
- LOTS-Nutzung
- Previous terms
- Module der Abteilung
- Theses
- Top-Studenten
- Erasmus
- Service
NoSQL-Datenbanken
- Dozent: Johannes Zschache
- Termin: Donnerstag 09:15 - 10:45 im HS 19
- Vorlesungsbeginn: 04.04.2019
- Termin Abschlussklausur: 1.8.2019, 10:00 Uhr, Hörsaal 9
- Die Anmeldung zur NoSQL-Vorlesung und Klausur erfolgt über AlmaWeb.
Übersicht
NoSQL-Datenbanksysteme dienen der effiziente Verwaltung von teilweise sehr großen Mengen nicht-relationaler Daten. Die Vorlesung betrachtet Unterschiede zu klassischen relationalen Datenbanksystemen und gibt einen Überblick über verschiedene Kategorien von NoSQL-Systemen.
Erwartete Vorkenntnisse: DBS1
Literatur
- L. Wiese: Advanced data management, 2015 (E-Book aus Uni-Netz zugänglich)
- L. Perkins, Redmond, E. and Wilson, J. R.: Seven Databases in Seven Weeks, 2nd edition, 2018 (E-Book über UB zugänglich)
Yelp Dataset
Yelp in Neo4j
- Installation Neo4j
- Installation APOC (manuell oder mit Docker)
- Empfohlen: Arbeit mit reduziertem Datensatz
- Snapshot aus dem Jahr 2006 (Daten im AlmaWeb)
- Import über Cypher und APOC: Beispiel
- Anpassung der Befehle um zusätzlich die Beziehungen Business-City und City-State hinzuzufügen (siehe Folie 52 in Kapitel “Graphdatenbanken”)
- Entfernen der Nutzer ohne Namen:
MATCH (n:User) WHERE n.name is null OPTIONAL MATCH (n)-[r]-() DELETE n,r;
- Optional: Import des gesamten Datensatzes
- Download der Daten
- Datenvorverarbeitung: Verwendung der Skripte
lat_long_expansion.py
undjson_to_csv.py
(AlmaWeb; siehe auch Quelle der Skripte)- Evtl. müssen Sie noch einige Python-Packete installieren (z.B. reverse_geocoder)
- Die über die Skripte erstellten CSV-Dateien befinden sich im Ordner
data
.
- Import der CSV-Dateien über Skript
import.sh
(AlmaWeb)- Öffnen Sie das Skript
import.sh
und passen Sie den Pfad hinter ‘export DATA=’ an. - Führen Sie das Skript aus.
- Öffnen Sie das Skript
- Anschließend muss die Konfiguration von Neo4j (
neo4j.conf
) angepasst werden:dbms.active_database=yelp.db
- (Neu)Start von Neo4j
- Anmerkung: In dieser Variante werden anstatt der Beziehung City-State die Beziehungen City-Area und Area-Country eingefügt. Die Cypher-Anfragen müssen dementsprechend angepasst werden.
Ergebnisse Wiederholungsklausur (6.12.2019)
Insgesamt waren 20 Punkte zu erreichen. Zum Bestehen der Klausur sind mindestens 10 Punkte notwendig.
Der Termin für die Klausureinsicht findet zu Beginn des Sommersemesters 2020 statt. Der genaue Termin wird auf der Startseite unter News rechtzeitig vorher bekannt gegeben.
Matrikelnr | Note |
---|---|
3705682 | 2,7 |
3727883 | 3 |
3263866 | 3,3 |
3742778 | 3,3 |
3739186 | 3,7 |
3737847 | 5 |
Ergebnisse Abschlussklausur (1.8.2019)
Insgesamt waren 22 Punkte zu erreichen. Zum Bestehen der Klausur sind mindestens 11 Punkte notwendig.
Der Termin für die Klausureinsicht findet zu Beginn des Wintersemesters 2019/2020 statt. Der genaue Termin wird auf der Startseite unter News rechtzeitig vorher bekannt gegeben.
Die Wiederholungsklausur findet voraussichtlich Ende November / Anfang Dezember statt.
Matrikelnr | Note |
---|---|
3740164 | 1 |
3704254 | 1 |
3722627 | 1 |
3755568 | 1,3 |
3749090 | 1,3 |
3758169 | 1,7 |
3685000 | 2 |
3701042 | 2 |
1181986 | 2 |
3712160 | 2,3 |
3716752 | 2,3 |
3341134 | 2,3 |
3704488 | 2,3 |
3728224 | 2,3 |
3741599 | 2,7 |
3743138 | 2,7 |
3719195 | 2,7 |
3739061 | 3 |
3709269 | 3 |
3713674 | 3 |
3704022 | 3,7 |
3709089 | 3,7 |
2521660 | 4 |
3746165 | 4 |
3732219 | 4 |
3713541 | 4 |
3749496 | 4 |
3742889 | 4 |
3727600 | 5 |
3737847 | 5 |
3739186 | 5 |
3755323 | 5 |
3755198 | 5 |
3754527 | 5 |
3263866 | 5 |
3721255 | 5 |
2863311 | 5 |
3742778 | 5 |