[Next] [Previous] [Up] [Top] [Contents] [Index]

Entwurf des Data Warehouse

 

2.1. Gründe für ein mehrdimensionales Modell

Um flexibler und konkurrenzfähiger zu werden, benötigen viele Unternehmen heute ein Informationssystem, mit dem sie wichtige Geschäftsentscheidungen treffen können. Online Transaction Processing- (OLTP-)Anwendungen unterstützen die täglichen Geschäftsprozesse und sind deshalb nur geeignet für operationale Berechnungen. Die OLAP-Technologie dagegen ist geeignet zur Geschäftsanalyse und gerichtet auf Entscheidungsunterstützung.

Im folgenden werden die OLTP- und OLAP-Funktionalität verglichen:

 OLTPOLAP
ZweckUnterstützung u. Abwicklung der GeschäftsprozesseInformationssystem für Entscheidungsunterstützung
Inhaltdetaillierte, aktuelle Datendetaillierte, verdichtete, historische u. aktuelle Daten
Daten- strukturkomplex, geeignet für operationale Berechnungen

kleine Datenmenge pro Prozeß

einfach, geeignet für Geschäftsanalyse

große Datenmenge pro Prozeß

AbfrageZugriff nur wenige Datensätze

 

strukturiert im Programmcode

Zugriff große Anzahl von Datensätzen

komplexe, wechselnde Fragestellungen

Behandlungstrukturierte, konkurierende Prozesse bestehend aus kurzen, atomaren, isolierten Transaktionenunstrukturierte analytische Prozesse
Modellierungprozeß- oder funktionsorientiertsubjektorientiert, standardisiert

Table 1: OLTP vs. OLAP ( aus [Foc98] u. [Inf96] )

Die OLTP-Technik arbeitet auf relationalen Datenbanksystemen, die ihrereseits auf Tabellen basieren. Jedes Tupel der Tabelle ist genau einem Objekt der Miniwelt zugeordnet. Die Spalten repräsentieren die Attribute dieser Objekte.

Neben ihrer Stärke bei der transaktionsorientierten Bearbeitung weniger Tabellen hat die traditionelle RDB noch viele Einschränkungen nachgewiesen. Sie unterstützt keine zwischenrelationale Semantik. Die Aggregation von Daten wird nur mangelhaft unterstützt. Es fehlen - neben den vorhandenen relationalen Operationen ( Selektion, Projektion, Join...) - weitere wichtige Operationen.

Die Schwächen von OLTP und traditionellen RDBs erfordern eine mehrdimensionale Sicht auf die Daten, also eine mehrdimensionale (MD-) Datenstruktur. Dabei muß zwischen MD-Datensicht und physikalischer MD-Datenhaltung (MDDBS) unterschieden werden. Die MD-Datensicht erfolgt auf der Basis eines Würfels (Cube). Jede "Scheibe" des Würfels repräsentiert eine Betrachtungssicht der Daten, also eine Datendimension. Durch die MD Datenstruktur wird auch die Dimensionshierarchie veranschaulicht. Daher unterstützt sie weitere wichtige Operationen: Drill-Down (Herunterbewegen in einer Dimensionshierarchie zu Elementen mit niedrigerem Verdichtungsniveau), Roll-Up (Aggregation der Daten auf die nächsthöhere Hierarchieebene), Slice (Isolierung einzelner Schichten), Dice (Eingrenzung der Daten eines Würfels auf eine Teilmenge) und Pivoting (Rotation einer 2D Kreuztabellendarstellung durch Vertauschen von Zeilen- und Spaltendimension).

Man unterscheidet zwei Ansätze: den Hypercube-Ansatz (ein Würfel mit mehr als drei Dimensionen) und den Multicube-Ansatz (mehrere 3D-Würfel). Bei der Nutzung des Hypercube-Ansatzes stellt sich das Problem der dünn besiedelten Matrizen, d.h. nicht alle Zellen der Matrix besitzen einen Wert. In diesem Fall ist die relationale Struktur günstiger, weil weniger Suchzugriffe benötigt werden. Der Multicube-Ansatz ist besser nutzbar, für ihn ergibt sich trotzdem das Problem einer Verknüpfung von unterschiedlichen Matrizen.

Innerhalb der OLAP-Technologie gibt es wiederum zwei Richtungen: mehrdimensionale OLAP (MOLAP) und relationale OLAP (ROLAP). Tabelle 2 vergleicht die Charakterisika beider Konzepte.

MOLAPROLAP
speichert Daten direkt in speziellen Datenstrukturen (Arrays,...)speichert Daten in relationaler DB
implementiert OLAP-Operationen auf o.g. Datenstrukturermöglicht mit Hilfe von sog. OLAP-Engines eine virtuelle MD-Datenhaltung
erfolgt in einer proprietären MDDB, häufig ohne eine SQL-Schnittstelleunterstützt SQL-Erweiterungen

Table 2: MOLAP vs. ROLAP

Obwohl beide Konzepte noch in der Diskussion stehen, kann festgehalten werden, daß ein gutes konzeptionelles MD- Modell in einer relationalen DB, einer mehrdimensionalen DB und sogar einer objektorientierten DB implementiert werden kann.


05.06.98

[Next] [Previous] [Up] [Top] [Contents] [Index]