MAllgemein

Model Routing (Intelligent Routing)

Automatische Auswahl des besten Modells je Anfrage nach Kosten, Latenz oder Qualität.

Model Routing (Intelligent Routing) ist die automatische Auswahl des am besten passenden KI-Modells pro Anfrage – basierend auf Kriterien wie Kosten, Latenz, Kontextlänge, Genauigkeit oder Sicherheitsanforderungen. Statt immer dasselbe Large Language Model (LLM) zu nutzen, entscheidet ein „Router“ dynamisch, welches Modell (oder welche Modellkette) die Aufgabe am effizientesten erfüllt.

Was bedeutet Model Routing?

Der Begriff beschreibt eine Routing-Logik, die eingehende Prompts klassifiziert und an ein geeignetes Modell weiterleitet. „Intelligent“ heißt: Die Entscheidung ist daten- oder regelbasiert (oder beides) und berücksichtigt Zielwerte wie Budget, Antwortqualität, Ausfallsicherheit und Compliance (z. B. Datenresidenz).

Wie funktioniert Model Routing?

Warum ist Model Routing wichtig?

In der Praxis unterscheiden sich Modelle stark: manche sind günstig und schnell, andere liefern bessere Ergebnisse, benötigen aber mehr Tokens oder sind langsamer. Model Routing optimiert diese Trade-offs automatisch. Das senkt Kosten (siehe Cost Optimization (Token-Kostenoptimierung)) und hält gleichzeitig SLAs ein (siehe SLA & SLO (Service Level Objectives)) – besonders in produktiven Chatbots, Support-Automationen oder Agenten-Workflows (siehe AI Agents (KI-Agenten), Agentic Workflow (Agenten-Workflow)).

Beispiele aus der Praxis (LLM, Automation, n8n)

Was kostet Model Routing?

Die Routing-Logik selbst ist meist „günstig“ (Regeln, kleiner Klassifikator), die Einsparung entsteht durch weniger Nutzung teurer Modelle. Kostenfaktoren sind: Anzahl Requests, Tokenvolumen, Routing-Komplexität (z. B. mehrstufige Ketten), Monitoring/Evals sowie mögliche Mehrkosten durch Fallbacks. Typisch ist ein Setup, das ein Premium-Modell nur für einen kleinen Prozentsatz der Anfragen nutzt, aber die Gesamtqualität stabil hält.

Als verwandter Begriff wird oft Model Router (Modell-Routing) verwendet: Das ist die konkrete Komponente (Service/Layer), die Model Routing technisch umsetzt – ähnlich einem API-Gateway, nur spezialisiert auf KI-Modelle.