Connectors (Daten-Connectoren)
Connectors (Daten-Connectoren) sind technische Anbindungen, die Daten aus Systemen wie SharePoint, Confluence oder Google Drive sicher abrufen, synchronisieren und für Anwendungen – z. B. KI-Chatbots oder Automationen – nutzbar machen. Sie übersetzen Authentifizierung, Berechtigungen und Datenformate in eine einheitliche Schnittstelle, damit Informationen zuverlässig gefunden, verarbeitet und aktualisiert werden können.
Was bedeutet „Daten-Connector“?
Ein Daten-Connector ist ein Integrationsbaustein, der eine Quelle (z. B. ein DMS, Wiki oder Cloud-Speicher) mit einer Zielanwendung verbindet. Praktisch heißt das: Der Connector „spricht“ die API des Quellsystems, holt Inhalte (Dateien, Seiten, Metadaten) ab, normalisiert sie und stellt sie strukturiert bereit – oft inklusive Delta-Updates, Fehlerhandling und Protokollierung.
Wie funktionieren Connectors in KI-Setups?
In KI-Anwendungen – insbesondere bei RAG (Retrieval-Augmented Generation) – sind Connectors der erste Schritt, um internes Wissen in eine such- und zitierfähige Wissensbasis zu überführen. Typischer Ablauf:
- 1) Authentifizieren: Zugriff via OAuth, API-Token oder SSO; idealerweise mit service accounts und klaren Rollen.
- 2) Inhalte extrahieren: Abruf von Seiten, Dateien, Kommentaren, Anhängen sowie Metadaten (Owner, Zeitstempel, Tags).
- 3) Berechtigungen abbilden: Übernahme von ACLs/Groups, damit Nutzer nur sehen, was sie sehen dürfen (wichtig für Datenschutz (DSGVO/GDPR) & KI).
- 4) Aufbereiten: Parsing (PDF/Office/HTML), Chunking, Entfernen von Duplikaten, Sprache erkennen.
- 5) Indexieren: Erzeugen von Embeddings und Speichern in einer Vektordatenbank (Vector Database), damit semantische Suche möglich wird.
- 6) Aktualisieren: Regelmäßige Syncs/Webhooks, Delta-Imports und Monitoring, damit der Index aktuell bleibt.
Wofür braucht man Connectors? (Use Cases)
- KI-Wissenschatbot: Ein Chatbot beantwortet Fragen zu internen Richtlinien, SOPs oder Projektdokumenten, indem er relevante Passagen aus SharePoint/Confluence findet und zitiert (typisch: ChatGPT + RAG (Retrieval-Augmented Generation)).
- Automatisierung: Workflows mit n8n oder Automatisierung (Automation): z. B. neue Confluence-Seiten erkennen, zusammenfassen und als Slack-/E-Mail-Update versenden.
- Agenten & Tools: AI Agents (KI-Agenten) nutzen Connectors als „Werkzeuge“, um Informationen nachzuschlagen oder Dateien zu erstellen/zu aktualisieren (z. B. via Function Calling / Tool Use).
Warum sind Connectors wichtig?
Ohne Connectors bleibt KI oft auf öffentliches Wissen oder manuelle Uploads beschränkt. Gute Connectoren reduzieren Halluzinationen, weil sie aktuelle, verifizierbare Quellen liefern (siehe Halluzinationen (Hallucinations)). Gleichzeitig sind sie zentral für Sicherheit und Compliance: Berechtigungen, Audit-Logs und Datenminimierung sind häufig entscheidender als das Modell selbst (Stichworte: AI Governance, EU AI Act).
Was kostet ein Connector (Daten-Connector)?
Die Kosten hängen stark vom Szenario ab: Anzahl der Datenquellen, Datenvolumen, Update-Frequenz, Berechtigungsmodell (einfach vs. feingranular), sowie Betrieb (Cloud/On-Prem). In der Praxis entstehen Kosten durch Lizenzierung (z. B. Integrationsplattform), Implementierung/Mapping, laufendes Monitoring und ggf. Infrastruktur für Index/Vektorsuche. Besonders aufwändig sind robuste ACL-Übernahmen und hochwertige Dokumenten-Extraktion (PDF/OCR).
Merksatz: Connectors sind die „Zubringer“ zwischen Unternehmenswissen und KI – sie entscheiden maßgeblich darüber, ob Antworten relevant, aktuell und regelkonform sind.