DAllgemein

Data Catalog (Datenkatalog)

Verzeichnis: welche Daten es gibt, Bedeutung, Owner, Qualität, Zugriff.

Ein Data Catalog (Datenkatalog) ist ein zentrales Verzeichnis, das zeigt, welche Daten es im Unternehmen gibt, was sie bedeuten, wer verantwortlich ist (Owner), wie gut die Daten sind (Qualität) und wie man darauf zugreifen darf. Für KMU ist er der schnellste Weg, Reporting und Analysen zu beschleunigen, weil weniger Zeit mit Suchen, Nachfragen und Missverständnissen verloren geht.

Was bedeutet „Data Catalog“ konkret?

Stellen Sie sich einen Data Catalog wie den „Katalog“ Ihrer Unternehmensdaten vor – ähnlich einem Produktkatalog, nur eben für Daten: Tabellen, Reports, Dashboards, Dateien, KPIs und manchmal auch APIs. Zu jedem Dateneintrag stehen Metadaten: Definition (z. B. „Umsatz“), Datenquelle (z. B. ERP), Aktualität, Verantwortliche, Zugriffsregeln sowie Hinweise zur korrekten Nutzung. Ziel ist, dass Mitarbeitende Daten finden, verstehen und sicher verwenden können – ohne Data Scientist.

Wie funktioniert ein Data Catalog in der Praxis?

  • 1) Datenquellen anbinden: Der Katalog scannt z. B. Data Warehouse, BI-Tools oder Datenbanken und sammelt technische Metadaten (Tabellen, Spalten, Datentypen).
  • 2) Geschäftliche Bedeutung ergänzen: Fachbereiche pflegen verständliche Definitionen, Synonyme und Beispiele (z. B. „Aktiver Kunde = Kunde mit Kauf in den letzten 90 Tagen“).
  • 3) Ownership & Verantwortlichkeiten klären: Pro Datensatz wird ein Owner/Steward hinterlegt (wer entscheidet über Definition, Qualität, Freigaben).
  • 4) Qualität sichtbar machen: Regeln/Checks (z. B. Vollständigkeit, Dubletten, Plausibilität) werden dokumentiert; idealerweise mit Status („grün/gelb/rot“).
  • 5) Zugriff & Sicherheit steuern: Der Katalog zeigt, wer welche Daten sehen darf (z. B. HR-Daten nur für HR). Er ersetzt nicht zwingend die Berechtigungen, macht sie aber transparent.
  • 6) Suchen, finden, wiederverwenden: Nutzer suchen nach Begriffen wie „Deckungsbeitrag“ oder „Retourenquote“ und sehen passende Datensätze, Reports und Ansprechpartner.

Warum ist ein Data Catalog wichtig – gerade für KMU?

In vielen KMU sind Daten über Tools verteilt (ERP, CRM, Shop, Excel, BI). Ohne gemeinsamen Katalog entstehen typische Probleme: gleiche KPI mit unterschiedlichen Definitionen, unklare Datenherkunft, doppelte Auswertungen und riskante Schatten-Reports. Ein Data Catalog reduziert diese Reibung, schafft Vertrauen in Zahlen und macht Entscheidungen schneller. Besonders wertvoll ist er, wenn mehrere Personen Reports erstellen oder wenn Wachstum/Standorte die Komplexität erhöhen.

Beispiele aus dem Alltag

  • Controlling: Im Katalog steht, dass „Umsatz“ im Monatsreport Netto ohne Versand ist – und woher die Zahl kommt. Keine Diskussionen mehr im Meeting.
  • Vertrieb: Ein neuer Mitarbeiter findet sofort, welche Tabelle „Leads“ enthält, wie „SQL“ definiert ist und wer Fragen beantwortet.
  • Datenschutz: Sensible Felder (z. B. E-Mail, Telefonnummer) sind gekennzeichnet; Zugriff und Zweck sind dokumentiert.

Data Catalog und moderne KI-Workflows

Ein Data Catalog wird noch wertvoller, wenn Sie KI einsetzen: Für RAG (Retrieval-Augmented Generation) kann der Katalog als „Landkarte“ dienen, um verlässliche Datenquellen zu finden. In Kombination mit AI Governance hilft er, Regeln, Verantwortlichkeiten und erlaubte Datennutzung nachvollziehbar zu machen – ein wichtiger Baustein für sichere, skalierbare Analytics.

Was kostet ein Data Catalog?

Die Kosten hängen weniger vom Tool als von Aufwand für Definitionen, Ownership und Datenqualität ab. Für KMU starten einfache Ansätze oft mit vorhandenen BI-/DWH-Funktionen oder leichten Katalog-Tools; entscheidend ist ein klarer Scope (z. B. Top-20 KPIs + wichtigste Tabellen) und ein Prozess, wer Änderungen freigibt.