- Team
- Forschung
- Studium
- Klausurtermine
- M.Sc. Data Science
- SS 2022
- SS 2023
- WS 2022/23
- WS 2023/24
- LOTS-Nutzung
- Vergangene Semester
- Module der Abteilung
- Abschlussarbeiten
- Top-Studenten
- Erasmus
- Service
Teil 2
Aufgabenstellung
In diesem Teil sollen zunächst Anfragen auf der in Teil 1 erstellten Datenbank formuliert werden. Anschließend sollen Änderungsoperationen auf der geladenen Datenbank durchgeführt werden, wobei auf die Wahrung der Datenkonsistenz zu achten ist. Im dritten Teil soll eine Prozedur formuliert und in einer Anfrage verwendet werden.
2a. Sichtenerstellung
Die Freundschaftsbeziehung ist als gerichtete Beziehung gespeichert, um Anfragen bzgl. der Freundschaftsbeziehung komfortabel zu lösen sollen die Beziehungen ungerichtet gespeichert werden. Diesbezüglich sollen Sie eine Sicht “pkp_symmetric” erstellen, die beide Richtungen enthält.
2b. Anfragen auf der Datenbank
Formulieren Sie SQL-Anfragen, um folgende Fragen zu beantworten.
- In wie vielen verschiedenen afrikanischen Städten gibt es eine Universität?
- Wie viele Forenbeiträge (Posts) hat die älteste Person verfasst (Ausgabe: Name, #Forenbeiträge)?
- Wie viele Kommentare zu Posts gibt es aus jedem Land (Ausgabe aufsteigend sortiert nach Kommentaranzahl)? Die Liste soll auch Länder enthalten, für die keine Post-Kommentare existieren, d.h. die Kommentaranzahl = 0 ist! (Funktion Coalesce)
- Aus welchen Städten stammen die meisten Nutzer (Ausgabe Name + Einwohnerzahl)?
- Mit wem ist ‘Hans Johansson’ befreundet?
- Wer sind die “echten” Freundesfreunde von ‘Hans Johansson’? “Echte” Freundesfreunde dürfen nicht gleichzeitig direkte Freunde von ‘Hans Johansson’ sein. Sortieren Sie die Ausgabe alphabetisch nach dem Nachnamen.
- Welche Nutzer sind Mitglied in allen Foren, in denen auch ‘Mehmet Koksal’ Mitglied ist (Angabe Name)?
- Geben Sie die prozentuale Verteilung der Nutzer bzgl. ihrer Herkunft aus verschiedenen Kontinenten an!
- Zu welchen Themen (‘tag classes’) gibt es die meisten Posts? Geben Sie die Namen der Top 10 ‘tag classes’ mit ihrer Häufigkeit aus!
- Welche Personen haben noch nie ein “Like” für einen Kommentar oder Post bekommen? Sortieren Sie die Ausgabe alphabetisch nach dem Nachnamen.
- Welche Foren enthalten mehr Posts als die durchschnittliche Anzahl von Posts in Foren (Ausgabe alphabetisch sortiert nach Forumtitel)?
- Welche Personen sind mit der Person befreundet, die die meisten Likes auf einen Post bekommen hat? Sortieren Sie die Ausgabe alphabetisch nach dem Nachnamen.
- Welche Personen sind direkt oder indirekt mit ‘Jun Hu’ (id 94) verbunden (befreundet)? Geben Sie für jede Person die Distanz zu Jun an.
- Erweitern Sie die Anfrage zu Aufgabe 13 indem Sie zusätzlich zur Distanz den Pfad zwischen den Nutzern ausgeben.
2c. Änderungen in der erzeugten Datenbank
Es soll ein Mechanismus umgesetzt werden, um die Beendigung eines Arbeitsverhältnisses zu dokumentieren.
Der entsprechende Eintrag in person_workAt_company
soll mittels SQL-Anweisung gelöscht werden. Um die Datenmanipulation nachvollziehen zu können, soll der Löschvorgang in einer separaten Tabelle protokolliert werden. Dabei soll zusätzlich hinterlegt werden, wann das Arbeitsverhältnis beendet wurde (orientieren Sie sich am Löschzeitpunkt). Die Protokollierung soll automatisch erfolgen, wenn ein Mitarbeiter sein Arbeitsverhältnis bei einem Unternehmen beendet (Löschung in person_workAt_company
).
Abgabe vor dem Testat
Bitte setzen Sie sich per E-Mail mit einem Terminvorschlag für Ihr Testat mit Ihrem Betreuer in Verbindung. Bitte geben Sie im Betreff der E-Mail dbprak sowie die Gruppennummer an. Nehmen Sie dabei ihren Gruppenpartner mit ins CC, damit wir mit Reply-All beiden antworten können. Spätestens 24h vor dem 2. Testat müssen Sie Ihrem Betreuer die nachfolgend beschriebenen Dateien zur Verfügung stellen. Melden Sie sich rechtzeitig per Email! Die Datenbank soll den Status nach der Durchführung von Teil 1 haben.
Für Teil 2a
- Eine Datei, die die SQL-Anweisung für die Sichtdefinition enthält.
Für Teil 2b
- Eine Datei, die die SQL-Anfragen, Ergebnisdatensätze (ggf. gekürzt) und die jeweilige Anzahl der Ergebnistupel enthält. Die Anfragen sind zu nummerieren und gut lesbar zu formatieren.
Für Teil 2c
- Eine Datei, mit den entsprechenden SQL-Statements. Der Protokollierungsmechanismus wird während des Testats ausgeführt und getestet.