German English

NoSQL-Datenbanken

  • Dozent: Johannes Zschache
  • Termin: Donnerstag 09:15 - 10:45 im HS 19
  • Vorlesungsbeginn: 04.04.2019
  • Termin Abschlussklausur: 1.8.2019, 10:00 Uhr, Hörsaal 9
  • Die Anmeldung zur NoSQL-Vorlesung und Klausur erfolgt über AlmaWeb.

Übersicht

NoSQL-Datenbanksysteme dienen der effiziente Verwaltung von teilweise sehr großen Mengen nicht-relationaler Daten. Die Vorlesung betrachtet Unterschiede zu klassischen relationalen Datenbanksystemen und gibt einen Überblick über verschiedene Kategorien von NoSQL-Systemen.

Erwartete Vorkenntnisse: DBS1

KapitelThema/Dateien
1Einführung, Teil 2, Hörsaalübungen
2Graphdatenbanken, Teil 2, Hörsaalübungen
3Key-Value Stores, Teil 2, Hörsaalübungen
4Dokumentenorientierte Datenbanken, Teil 2
5Wide Column Stores
xKlausurthemen

Literatur

Yelp Dataset

Yelp in Neo4j

  • Installation Neo4j
  • Installation APOC (manuell oder mit Docker)
  • Empfohlen: Arbeit mit reduziertem Datensatz
    • Snapshot aus dem Jahr 2006 (Daten im AlmaWeb)
    • Import über Cypher und APOC: Beispiel
    • Anpassung der Befehle um zusätzlich die Beziehungen Business-City und City-State hinzuzufügen (siehe Folie 52 in Kapitel “Graphdatenbanken”)
    • Entfernen der Nutzer ohne Namen: MATCH (n:User) WHERE n.name is null OPTIONAL MATCH (n)-[r]-() DELETE n,r;
  • Optional: Import des gesamten Datensatzes
    • Download der Daten
    • Datenvorverarbeitung: Verwendung der Skripte lat_long_expansion.py und json_to_csv.py (AlmaWeb; siehe auch Quelle der Skripte)
      • Evtl. müssen Sie noch einige Python-Packete installieren (z.B. reverse_geocoder)
      • Die über die Skripte erstellten CSV-Dateien befinden sich im Ordner data.
    • Import der CSV-Dateien über Skript import.sh (AlmaWeb)
      • Öffnen Sie das Skript import.sh und passen Sie den Pfad hinter ‘export DATA=’ an.
      • Führen Sie das Skript aus.
    • Anschließend muss die Konfiguration von Neo4j (neo4j.conf) angepasst werden: dbms.active_database=yelp.db
    • (Neu)Start von Neo4j
    • Anmerkung: In dieser Variante werden anstatt der Beziehung City-State die Beziehungen City-Area und Area-Country eingefügt. Die Cypher-Anfragen müssen dementsprechend angepasst werden.

Ergebnisse Wiederholungsklausur (6.12.2019)

Insgesamt waren 20 Punkte zu erreichen. Zum Bestehen der Klausur sind mindestens 10 Punkte notwendig.

Der Termin für die Klausureinsicht findet zu Beginn des Sommersemesters 2020 statt. Der genaue Termin wird auf der Startseite unter News rechtzeitig vorher bekannt gegeben.

MatrikelnrNote
37056822,7
37278833
32638663,3
37427783,3
37391863,7
37378475

Ergebnisse Abschlussklausur (1.8.2019)

Insgesamt waren 22 Punkte zu erreichen. Zum Bestehen der Klausur sind mindestens 11 Punkte notwendig.

Der Termin für die Klausureinsicht findet zu Beginn des Wintersemesters 2019/2020 statt. Der genaue Termin wird auf der Startseite unter News rechtzeitig vorher bekannt gegeben.

Die Wiederholungsklausur findet voraussichtlich Ende November / Anfang Dezember statt.

MatrikelnrNote
37401641
37042541
37226271
37555681,3
37490901,3
37581691,7
36850002
37010422
11819862
37121602,3
37167522,3
33411342,3
37044882,3
37282242,3
37415992,7
37431382,7
37191952,7
37390613
37092693
37136743
37040223,7
37090893,7
25216604
37461654
37322194
37135414
37494964
37428894
37276005
37378475
37391865
37553235
37551985
37545275
32638665
37212555
28633115
37427785
Vorlesung