Agentic RAG (Agentisches RAG)
Agentic RAG (agentisches RAG) ist eine Weiterentwicklung von RAG (Retrieval-Augmented Generation), bei der ein oder mehrere AI Agents (KI-Agenten) die Informationssuche nicht nur einmal ausführen, sondern iterativ planen, recherchieren, Ergebnisse prüfen und bei Bedarf gezielt nachrecherchieren. Dadurch entstehen robustere, besser belegte Antworten – besonders bei komplexen Fragen, unvollständigen Dokumentenlagen oder wenn mehrere Quellen abgeglichen werden müssen.
Was bedeutet „Agentic“ bei RAG?
„Agentic“ beschreibt, dass das System nicht strikt einer festen Pipeline folgt (Retrieve → Generate), sondern wie ein Agent handelt: Es setzt Teilziele, wählt Tools, bewertet Zwischenergebnisse und entscheidet, ob weitere Schritte nötig sind. Technisch passiert das meist über Function Calling / Tool Use und einen Agenten-Workflow, der Suchanfragen, Filter, Re-Ranking und Validierungsschritte orchestriert.
Wie funktioniert Agentic RAG? (Ablauf in Schritten)
- 1) Ziel klären: Der Agent präzisiert die Nutzerfrage (z. B. Zeitraum, System, Definitionen) und erkennt Wissenslücken.
- 2) Plan erstellen: Er zerlegt die Aufgabe in Teilfragen (z. B. „Definition“, „Vorteile“, „Risiken“, „Beispielprozess“).
- 3) Iteratives Retrieval: Der Agent fragt eine Vektordatenbank (Vector Database) über Embeddings an, nutzt ggf. Hybrid Search (BM25 + Vektor) oder BM25 (Keyword Retrieval) und erweitert/ändert Suchbegriffe, wenn Treffer zu schwach sind.
- 4) Auswahl & Qualitätscheck: Treffer werden per Re-Ranking (Neu-Rangordnung) priorisiert, Duplikate entfernt, und die Passung wird bewertet (z. B. Aktualität, Autorität, Abdeckung).
- 5) Synthese & Grounding: Das Large Language Model (LLM) formuliert eine Antwort, die eng an den Quellen bleibt (siehe Grounding (Faktenverankerung)), idealerweise mit Citations (Quellenangaben) in LLMs.
- 6) Selbstprüfung & Nachrecherche: Der Agent sucht gezielt nach Gegenbelegen, fehlenden Details oder widersprüchlichen Aussagen – und wiederholt Schritte 3–5, bis die Qualitätskriterien erfüllt sind.
Beispiel aus der Praxis (Automation/Tooling)
In einem Support-Chat kann Agentic RAG bei einer Fehlermeldung nicht nur „das passende Dokument“ abrufen, sondern auch automatisch: Logs/Runbooks durchsuchen, die genaue Produktversion identifizieren, mehrere interne Wissensartikel vergleichen und bei widersprüchlichen Anweisungen eine Klärungsrecherche starten. In Automationen mit n8n kann der Agent z. B. erst die interne Doku abfragen, dann bei fehlenden Informationen ein Ticket-System oder ein Wiki-Connector ansteuern und am Ende eine strukturierte Handlungsanleitung ausgeben.
Warum ist Agentic RAG wichtig?
- Weniger Halluzinationen: Durch iterative Prüfung sinkt das Risiko von Halluzinationen (Hallucinations), weil der Agent Unsicherheiten erkennt und nachbelegt.
- Bessere Abdeckung komplexer Fragen: Mehrstufige Recherche liefert oft vollständigere Antworten als „Single-Shot“-RAG.
- Höhere Zuverlässigkeit in Unternehmen: Validierung, Quellenangaben und Regeln (z. B. Guardrails (KI-Leitplanken)) erhöhen die Compliance-Tauglichkeit.
Grenzen und typische Herausforderungen
Agentic RAG kostet mehr Zeit und Rechenbudget (mehr Tool-Aufrufe, mehr Tokens) und braucht gutes Monitoring. Außerdem steigt die Angriffsfläche für Prompt Injection und Tool-Missbrauch, weshalb Sandboxen, Rechtekonzepte und Governance (z. B. AI Governance) wichtig sind. Kurz: Agentic RAG ist mächtiger als klassisches RAG – aber nur dann wirklich besser, wenn Retrieval-Qualität, Evaluierung und Sicherheitsmaßnahmen sauber umgesetzt sind.