PAllgemein

Prompt Routing (Prompt-Routing)

Automatische Auswahl von Prompt/Chain je Anfrage und Risiko

Prompt Routing (Prompt-Routing) ist die automatische Auswahl des passenden Prompts, Modells oder einer Prompt-Kette pro Nutzeranfrage – basierend auf Intent (z. B. „FAQ“, „Code“, „Support“), Kontext, Kosten-/Latenzzielen und vor allem Risiko (z. B. PII, Compliance, Safety). Ziel ist, Antworten zuverlässiger, günstiger und sicherer zu machen, ohne dass Nutzer manuell „den richtigen Prompt“ wählen müssen.

Was bedeutet Prompt Routing?

„Routing“ heißt hier: Eine Anfrage wird zuerst klassifiziert (z. B. Thema, Komplexität, Sensitivität) und dann an die beste „Route“ geschickt. Eine Route kann sein: ein bestimmtes Large Language Model (LLM), ein spezielles Prompt Template (Prompt-Vorlage), eine Prompt Chaining (Prompt-Ketten)-Logik, ein RAG (Retrieval-Augmented Generation)-Flow oder ein Agenten-Workflow mit Tools (z. B. Function Calling / Tool Use).

Wie funktioniert Prompt Routing?

Warum ist Prompt Routing wichtig?

Beispiele aus der Praxis

Was kostet Prompt Routing?

Die direkten Kosten hängen meist nicht vom „Routing“ selbst ab, sondern von den gewählten Modellen/Tools und der Implementierung. Typische Kostentreiber sind: zusätzlicher Klassifikationsschritt (extra Inferenz), Retrieval/Vector Search (siehe Vector Search (Vektorsuche) / Semantic Search), Tool-Aufrufe sowie Monitoring/Evals. In vielen Setups spart Routing dennoch Geld, weil teure Modelle nur bei komplexen oder riskanten Fällen genutzt werden.