Air-gapped Deployment (Air-Gap Betrieb)
Air-gapped Deployment (Air-Gap Betrieb) bezeichnet den Betrieb eines KI-Systems in einer Umgebung, die physisch oder logisch vollständig vom Internet und oft auch von anderen Unternehmensnetzwerken getrennt ist. Ziel ist maximale Sicherheit: Daten, Modelle und Systeme können nicht „nach außen“ kommunizieren, wodurch das Risiko von Datenabfluss, Supply-Chain-Angriffen oder Remote-Exploits deutlich sinkt.
Was bedeutet „Air-Gap“ im KI-Kontext?
Ein „Air Gap“ ist eine Sicherheitsmaßnahme, bei der zwischen einem System und externen Netzen „Luft“ ist – also keine direkte Netzwerkverbindung besteht. Im KI-Umfeld betrifft das typischerweise den gesamten Stack: Inferenz-Server, Datenbanken, Vektorspeicher, Orchestrierung und Monitoring. Häufig wird Air-Gap genutzt, wenn besonders schützenswerte Informationen verarbeitet werden (z. B. Geheimhaltungsstufen, kritische Infrastrukturen, sensible Kunden- oder Gesundheitsdaten) oder wenn strenge Compliance-Anforderungen gelten.
Wie funktioniert ein Air-gapped Deployment?
- 1) Isolierte Infrastruktur: KI-Workloads laufen on-premises oder in einer streng abgeschotteten Zone (z. B. separates VLAN/Netzsegment ohne Internet-Routing).
- 2) Offline-Bereitstellung von Modellen & Updates: Modelle (z. B. Large Language Model (LLM)) und Abhängigkeiten werden über kontrollierte Wege eingespielt (z. B. signierte Pakete, „sneakernet“ via Datenträger, interne Artefakt-Repositories).
- 3) Lokale Datenhaltung & Retrieval: Unternehmensdokumente bleiben intern; für Wissenszugriff werden oft RAG (Retrieval-Augmented Generation), Embeddings und eine Vektordatenbank (Vector Database) innerhalb der Air-Gap-Zone betrieben.
- 4) Strenge Zugriffskontrollen: Rollen, Netzwerkregeln, Härtung, Secrets-Handling und Audit-Logs sind zentral, oft ergänzt durch AI Governance.
- 5) Betrieb & Überwachung ohne Cloud-Abhängigkeit: Telemetrie und Logs bleiben intern (z. B. für MLOps/Observability), externe SaaS-Dienste werden vermieden oder nur über kontrollierte Übergabepunkte genutzt.
Typische Einsatzfälle (mit Beispielen)
- Behörden/Verteidigung: Analyse vertraulicher Dokumente mit einem lokalen Chat-Interface statt ChatGPT in der Cloud.
- Industrie & IP-Schutz: KI-Assistent für Konstruktionsunterlagen, Stücklisten oder Prozesswissen – inklusive internem RAG über Betriebsdokumentation.
- Gesundheitswesen: Zusammenfassung von Arztbriefen oder Kodierhilfe, ohne dass Patientendaten das Netzwerk verlassen.
- Automation ohne Internet: Workflows mit n8n können in einer isolierten Umgebung laufen und interne Systeme automatisieren (z. B. Ticketsystem, DMS, ERP) – ohne externe Webhooks oder Cloud-Tools.
Vorteile und Grenzen
Vorteile: Minimiertes Exfiltrationsrisiko, bessere Kontrolle über Datenresidenz (siehe Data Residency (Datenresidenz)) und oft leichteres Argumentieren gegenüber Datenschutz/Compliance (z. B. Datenschutz (DSGVO/GDPR) & KI).
Grenzen: Höherer Betriebsaufwand (Patch- und Update-Prozesse, Modell-Distribution), weniger Komfort (keine „always-on“ Cloud-APIs), und die Sicherheit hängt stark von Prozessdisziplin ab (z. B. signierte Artefakte, Härtung, interne Supply-Chain). Zudem brauchen leistungsfähige Modelle lokale Rechenressourcen; Kosten und Kapazitätsplanung (GPU/Storage) sind entscheidend.
In der Praxis ist Air-Gap Betrieb eine bewusste Architekturentscheidung: maximale Isolation gegen maximale Betriebsverantwortung. Für Organisationen mit hohen Schutzanforderungen kann er jedoch der zuverlässigste Weg sein, generative KI sicher produktiv einzusetzen.