FAllgemein

Fallback Strategy (Fallback-Strategie)

Regeln für Ausweichmodelle/Workflows bei Fehlern oder Risiko

Eine Fallback Strategy (Fallback-Strategie) ist ein Satz definierter Regeln und Ausweich-Workflows, die greifen, wenn ein KI-System (z. B. ein Large Language Model (LLM)) fehlschlägt, unsicher ist oder ein Risiko erkannt wird. Ziel ist, die Qualität, Sicherheit und Verfügbarkeit von KI-gestützten Prozessen zu sichern – etwa in Chatbots, Agenten oder Automationen.

Was bedeutet Fallback Strategy?

„Fallback“ bedeutet „Rückfallebene“. In KI- und Automations-Setups ist damit gemeint: Wenn das bevorzugte Modell, Tool oder der geplante Ablauf nicht zuverlässig funktioniert (z. B. Timeout, Halluzination, fehlende Daten, Policy-Verstoß), wird automatisch auf eine alternative Option umgeschaltet. Das kann ein anderes Modell, ein anderer Prompt, ein abgespeckter Workflow oder ein Mensch sein.

Wie funktioniert eine Fallback-Strategie?

Typische Fallback-Auslöser in KI-Systemen

Beispiele aus der Praxis (LLM, RAG, Automation)

  • Chatbot-Support: Wenn das Modell keine belastbaren Infos findet, schaltet es von „Generierung“ auf RAG (Retrieval-Augmented Generation) mit Quellen um – oder sagt kontrolliert „Ich weiß es nicht“ und erstellt ein Ticket.
  • Agentic Workflow: Ein AI Agents (KI-Agenten)-Workflow versucht zuerst Tool-Calls. Scheitert ein Tool, wird ein alternativer Daten-Connector genutzt oder ein Read-only-Modus aktiviert.
  • n8n-Automation: Bei Rate-Limits wird der Workflow gedrosselt (Retry mit Backoff), wechselt auf einen zweiten Provider oder nutzt einen Cache (z. B. Prompt Caching (Antwort-/Prompt-Cache)).
  • Strukturierte Extraktion: Wenn JSON ungültig ist, wird eine Reparatur-Prompt-Stufe ausgeführt; bei erneutem Fehler erfolgt Eskalation an einen Menschen (HITL).

Warum ist eine Fallback Strategy wichtig?

KI ist probabilistisch: Antworten können variieren, Modelle können ausfallen, und Risiken entstehen durch falsche Inhalte oder Datenabfluss. Eine Fallback-Strategie reduziert operative Ausfälle, senkt Fehlerraten, schützt vor Sicherheitsproblemen und verbessert die Nutzererfahrung – besonders in produktiven Systemen mit SLA-/SLO-Anforderungen.