Slowly Changing Dimensions (SCD)
Slowly Changing Dimensions (SCD) sind eine Technik im Data-Warehouse- und BI-Umfeld, um historische Änderungen in Stammdaten (Dimensionen) wie Kunde, Produkt oder Standort nachvollziehbar zu speichern. Statt alte Werte einfach zu überschreiben, werden Änderungen so abgelegt, dass Reports auch rückwirkend „damals“ korrekt bleiben (z. B. Umsatz nach damaliger Kundensegmentierung).
Was bedeutet „Slowly Changing“?
„Slowly changing“ heißt: Diese Daten ändern sich nicht ständig wie Transaktionen (Bestellungen), aber eben gelegentlich – z. B. wenn ein Kunde umzieht, ein Produkt die Kategorie wechselt oder ein Vertriebsgebiet neu zugeschnitten wird. Genau diese Änderungen sind für Analysen kritisch: Wenn Sie heute die Adresse eines Kunden überschreiben, sind ältere Umsätze plötzlich einer neuen Region zugeordnet – und Trends wirken verfälscht.
Wie funktioniert SCD in der Praxis?
SCD wird meist beim Laden von Daten ins DWH (ETL/ELT) umgesetzt. Je nach gewünschter Historie gibt es verschiedene „SCD-Typen“:
- SCD Typ 1 (Überschreiben): Der alte Wert wird ersetzt. Keine Historie. Beispiel: Tippfehler in der Kunden-E-Mail wird korrigiert – historisch egal.
- SCD Typ 2 (Historisieren mit neuen Zeilen): Bei Änderung wird ein neuer Datensatz angelegt. Üblich sind Felder wie ValidFrom, ValidTo und ein IsCurrent-Flag. Beispiel: Kundensegment wechselt von „SMB“ zu „Enterprise“ – historische Auswertungen sollen das alte Segment behalten.
- SCD Typ 3 (begrenzte Historie): Es wird zusätzlich ein „Vorher“-Feld gespeichert (z. B. Segment_Previous). Gut für wenige Rückblicke, aber nicht für lange Historien.
Warum ist SCD wichtig für KMU-Geschäftsführer?
Für datenbasierte Entscheidungen ist Vergleichbarkeit über Zeit entscheidend. SCD verhindert, dass Kennzahlen „wandern“, nur weil Stammdaten sich geändert haben. Das ist besonders relevant bei:
- Gebiets- und Filialsteuerung: Umsätze nach Region müssen zur damaligen Gebietslogik passen.
- Segmentierung & Pricing: Wenn Segmente sich ändern, sollen historische Margen-Analysen nicht nachträglich umetikettiert werden.
- Compliance & Nachvollziehbarkeit: Sie können erklären, warum ein Report letztes Jahr anders aussah als heute.
Konkretes Beispiel (Kunde zieht um)
Ein Kunde zieht am 01.10. von „München“ nach „Hamburg“. Ohne SCD würden alle früheren Verkäufe plötzlich Hamburg zugeordnet. Mit SCD Typ 2 bleibt der alte Datensatz bis 30.09. gültig, und ab 01.10. gibt es eine neue Version. So sehen Sie korrekt: „Wie war der Umsatz in Bayern damals?“ und „Wie ist er heute?“
Was kostet SCD (als Aufwand) – und wovon hängt es ab?
SCD verursacht vor allem Implementierungs- und Betriebsaufwand: zusätzliche Logik im ETL/ELT, mehr Speicher (bei Typ 2 potenziell viele Zeilen) und klar definierte Regeln, welche Felder historisiert werden. Für KMU lohnt sich oft ein pragmatischer Ansatz: Typ 2 nur für wirklich entscheidungsrelevante Attribute (z. B. Segment, Region, Account-Owner), Typ 1 für reine Korrekturen.