[Next] [Previous] [Up] [Top] [Contents] [Index]

Entwurf des Data Warehouse

 

2.2. Mehrdimensionale Modellierung auf relationalen Datenbanken

2.2.1. Das Star-Schema

Als ein Ansatz für MD Datenstrukturen in DWs wird häufig das Star-Schema benutzt. Prämisse ist die Klassifikation von Daten in zwei Gruppen: Fakt- und Dimensionsdaten. Fakten sind numerische Daten, sie stellen die Kerndatenelemente mit meist quantitativer Natur dar und stehen deshalb im Mittelpunkt der Datenanalyse. Beispiele dafür sind Verkaufstransaktionen, Telephonanrufe und Kontenbewegungen. Demgegenüber sind Dimensionen Geschäftsparameter, die jede Transaktionen definieren, sie stellen deshalb die Attribute zu den Fakten dar. Falls die Fakten Verkaufstransaktionen sind, können die Dimensionen z.B. Verkäufer, Kunde, Produkt, Ort und Zeit sein.

Sowohl Fakten als auch Dimensionen werden in Tabellenform - der sog. Faktentabelle und Dimensionstabelle - gehalten. Die Unterschiede der beiden Datengruppen werden in der Tabelle 3 kurz zusammengefaßt .

FaktentabelleDimensionstabelle
Millionen oder Milliarden von ZeilenBis zu einigen Millionen Zeilen
Mehrere FremdschlüsselEin Primärschlüssel
NumerischTextbeschreibung
Nicht zu verändernHäufig verändert
Table 3: Faktentabelle vs. Dimensionstabelle ( aus [AM97] )

Ein einfaches Star-Schema besteht also aus einer Faktentabelle im Zentrum eines "Sterns" und mehreren Dimensionstabellen, die über Schlüssel mit der Faktentabelle verbunden sind. Ein Charakteristikum des Star-Schemas besteht darin, daß die Dimensionstabellen denormalisiert sind.

2.2.2 Das Snowflake-Schema

Die Denormalisierung der Dimensionstabellen führt zu redundanter Datenspeicherung: zu große Dimensionstabellen bringen geringere Performanz mit sich. Außerdem repräsentiert das Star-Schema nicht explixit die Attributehierarchie der Dimensionen. Im Snowflake-Schema wird diese Schwäche überwunden, indem die Dimensionstabellen normalisiert werden.

Die MD Datenmodellierung erweist sich als ein leistungsstarkes Mittel für DSS: erstens erlaubt sie, eine komplexe MD Datenstruktur mit einem sehr einfachen Datenmodell zu definieren. Dadurch werden die hierarchischen Beziehungen innerhalb einer Dimension leicht definiert und auch der Verknüpfungsprozeß durch mehrere Tabellen wird vereinfacht. Zweitens reduziert sie die Anzahl der zu manipulierenden physikalischen Verknüpfungen und verbessert deshalb die Performanz. Schließlich unterstützt sie die Erweiterung und Weiterentwicklung des DW mit relativ geringer Verwaltung.


05.06.98

[Next] [Previous] [Up] [Top] [Contents] [Index]