Slowly Changing Dimensions

Slowly Changing Dimensions

Unter dem Begriff Slowly Changing Dimensions (deutsch: sich langsam verändernde Dimensionen) werden im Data-Warehousing Methoden zusammengefasst, um Änderungen in Dimensionstabellen zu erfassen und ggf. historisch zu dokumentieren. Im Wesentlichen unterscheidet man drei Verfahren, die nach Kimball (Lit.: Kimball, 2002) in Typen unterteilt werden. Allen gemein ist, dass vorhandene Datensätze über den Primärschlüssel mit neuen Datensätzen verbunden werden, um Änderungen in der Tabelle zu speichern. Technische Schlüssel sind aktuell nicht Gegenstand des Artikels.

Inhaltsverzeichnis

Typ 1

Der Typ 1 ist die trivialste Methode. Auf eine Historisierung wird verzichtet. Über den fachlichen Primärschlüssel (PK für Primary Key) wird in der Dimensionstabelle nachgeschlagen, ob der PK des neuen Datensatzes bereits vorhanden ist. Ist dies der Fall, wird der entsprechende Satz mit den neuen Daten überschrieben. Ansonsten wird, wie auch bei den beiden anderen Typen, ein neuer Datensatz angefügt.

Typ 2

Typ 2 ist ein komplexes Verfahren, Dimensionstabellen oder einzelne Attribute der Tabelle zu historisieren, um zu jedem Zeitpunkt die dann gültigen Ausprägungen der Tabelle ermitteln zu können. Dies wird erreicht, indem zu jedem Datensatz ein Gültigkeitsintervall abgelegt wird. Um die Eindeutigkeit des PK zu gewährleisten, ist dieser um zumindest eines der Intervallattribute zu erweitern. In der Regel wird ein geschlossenes Intervall verwendet, indem der aktuell gültige Satz als unendlich gültig gekennzeichnet ist. Grundlage ist der Vergleich der vorhandenen Datensätze mit den neuen Datensätzen aus einer vollständigen und periodischen Extraktion über den fachlichen Primärschlüssel ohne das / die Gültigkeitsattribut/e. Hierbei sind drei Fälle zu unterscheiden:

  • Der neue Datensatz ist noch nicht in der Dimension vorhanden.
Vorgehen: Der Datensatz wird angefügt.
  • Der in der Dimension vorhandene Datensatz ist nicht in der gültigen Extraktion vorhanden.
Vorgehen: Der Datensatz wird von unendlich gültig auf gültig bis gestern gesetzt.
  • Der neue Datensatz kann über den PK einem Datensatz aus der Dimensionstabelle zugeordnet werden.
Vorgehen: Die zu historisierenden Attribute werden miteinander verglichen.
  • Es werden keine Änderungen festgestellt: Der Vorgang ist beendet. Der nächste Datensatz wird bearbeitet.
  • Es werden Änderungen festgestellt: Der aktuell gültige Dimensionsdatensatz wird auf gültig bis gestern gesetzt. Der neue Datensatz wird mit gültig ab heute und unendlich gültig eingefügt.

Typ 3

Bei Typ 3 wird die Tabelle verbreitert. Das heißt, es wird ein neues Attribut angefügt. Dieses Verfahren kann zum Beispiel bei Umschlüsselungen von Vertriebsregionen oder Produktgruppen eingesetzt werden. Der Einsatz dieser Methode ist nur bei sehr spezifischen Änderungen ratsam.

Beispiele

Zum besseren Verständnis soll folgendes Beispiel die unterschiedlichen Verfahrensweisen verdeutlichen. Gegeben sei eine Dimensionstabelle Produkt. Die Attribute GueltVon und GueltBis sind nur für Typ 2 relevant und mindestens eines auch Teil des PK.

PNummer (PK) PName PGruppe GueltVon GueltBis
1 Glenfarclas Whisky 01.01.2002 31.12.9999
2 Jim Beam Whisky 01.01.2002 31.12.9999
3 Krombacher Bier 01.01.2002 31.12.9999

aus dem operativen System wird am 10.08.2005 folgender Datensatz extrahiert:

PNummer (PK) PName PGruppe
2 Jim Beam Whiskey


nach Typ 1 wird der zweite Datensatz überschrieben:

PNummer (PK) PName PGruppe GueltVon GueltBis
1 Glenfarclas Whisky 01.01.2002 31.12.9999
2 Jim Beam Whiskey 01.01.2002 31.12.9999
3 Krombacher Bier 01.01.2002 31.12.9999


nach Typ 2 wird der zweite Datensatz historisiert:

PNummer (PK) PName PGruppe GueltVon (PK) GueltBis
1 Glenfarclas Whisky 01.01.2002 31.12.9999
2 Jim Beam Whisky 01.01.2002 09.08.2005
2 Jim Beam Whiskey 10.08.2005 31.12.9999
3 Krombacher Bier 01.01.2002 31.12.9999


nach Typ 3 wird ein neues Attribut neuePGruppe eingepflegt:

PNummer (PK) PName PGruppe neuePGruppe GueltVon GueltBis
1 Glenfarclas Whisky Whisky 01.01.2002 31.12.9999
2 Jim Beam Whisky Whiskey 01.01.2002 31.12.9999
3 Krombacher Bier Bier 01.01.2002 31.12.9999

Literatur

  • Ralph Kimball, Mary Ross: The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. 2. Auflage. John Wiley & Sons, New York u. A. 2002, ISBN 0-471-20024-7

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Slowly changing dimension — Dimension is a term in data management and data warehousing that refers to logical groupings of data such as geographical location, customer information, or product information. Slowly Changing Dimensions (SCD) are dimensions that have data that… …   Wikipedia

  • Dimensionstabelle — Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP Anwendungen. Die Bezeichnung… …   Deutsch Wikipedia

  • Faktentabelle — Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP Anwendungen. Die Bezeichnung… …   Deutsch Wikipedia

  • Star-Schema — Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP Anwendungen. Die Bezeichnung… …   Deutsch Wikipedia

  • Starschema — Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP Anwendungen. Die Bezeichnung… …   Deutsch Wikipedia

  • Sternschema — Star Schema: Die Faktentabelle besitzt als Primärschlüssel einen zusammengesetzten Schlüssel aus den Primärschlüsseln der einzelnen Dimensionstabellen Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die… …   Deutsch Wikipedia

  • Dimension table — In data warehousing, a dimension table is one of the set of companion tables to a fact table. The fact table contains business facts or measures and foreign keys which refer to candidate keys (normally primary keys) in the dimension tables.… …   Wikipedia

  • Extract, transform, load — Extract, transform and load (ETL) is a process in database usage and especially in data warehousing that involves: Extracting data from outside sources Transforming it to fit operational needs (which can include quality levels) Loading it into… …   Wikipedia

  • ETL-Prozess — ETL: Datenfluss und unterstützende Programme Extract, Transform, Load (ETL) ist ein Prozess, bei dem Daten aus mehreren ggf. unterschiedlich strukturierten Datenquellen in einer Zieldatenbank vereinigt werden. Extraktion der relevanten Daten aus… …   Deutsch Wikipedia

  • SCD — Die Abkürzung SCD steht für Satélite de Coleta de Dados, einen brasilianischen Satelliten Scottish Country Dance, einen schottischen Gesellschaftstanz Slowly Changing Dimensions, einen Begriff aus dem Data Warehousing, einem EDV Teilgebiet.… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”