Wir bauen seit Tag eins Hallucination-Guardrails in Aidocr, in Vestrix.ai und in alle internen AI-basierten Prozesse.
Das ist weder eine nachträgliche Entscheidung noch ein Reflex auf irgendeinen unbequemen Vorfall. Es war von Anfang an klar, dass die Verlässlichkeit von AI die Grundvoraussetzung ist, bevor irgendjemand ein Produkt in einem business-kritischen Kontext einsetzt.
Was wirklich schwer ist
Bevor wir unzählige Integrationen, komplexe Workflows oder eine shiny UI gebaut haben, war unser Hauptfokus auf der Limitation von LLMs mit heterogenen oder großen Datenmengen und wie wir das Problem erst einmal angehen und lösen können.
Das ist nicht sexy und füllt keine Konferenz-Bühnen. Aber es ist die Voraussetzung dafür, dass ernsthafte Kunden überhaupt mit uns telefonieren.
Die AI-Bubble um Agentic AI
Exakt das ist der Punkt, der mich in der AI-Bubble rund um Agentic AI beschäftigt. Die unzähligen, täglichen, teils unwahren Narrative, die eine Welt suggerieren, in der KI-Agenten einfach „loslaufen“.
Marketing-Co-Piloten, Trading-Superbots, Multi-Step-Reasoning-Engines, die den ganzen Tag im Hintergrund arbeiten und ganze Value-Streams End-to-End übernehmen sollen. Alles schon auf dem Niveau einer generellen KI?
Denn nur eine generelle KI lässt den Enduser nicht bemerken, dass die Antwort von einer KI kommt. Sie agiert so menschlich, dass kein Text den Rhythmus eines LLMs verrät, und arbeitet fehlerfrei, prozessübergreifend und crossfunktional, aber Seite an Seite mit dem Menschen.
Ich frage mich ehrlich, ob die vielen Experten hier wirklich täglich mit diesen Modellen arbeiten oder ob sie einfach beschreiben, was sie sich wünschen.
Was wir tatsächlich tun
Wir schreiben mit den besten Modellen Code, justiert um unsere Guardrails, bauen komplexe Datenextraktionen in Aidocr und testen Signal-Logiken in Vestrix.ai, alles mit enormer Komplexität.
Und doch glauben wir, dass ein Baukastensystem aus LLM und Co. uns produktiv auf ein Niveau bringt, das vorher schlicht nicht erreichbar war. Vorausgesetzt, man baut es richtig.
Was der Enduser zu Recht erwartet
Für den normalen User ist das abstrakt. Dem ist es egal, wie das Modell funktioniert. Er will, dass das Ergebnis stimmt. Und das ist vollkommen legitim.
Deshalb tragen wir als Technologie-Anbieter, Educator und Berater die Verantwortung, sicherzustellen, dass AI funktioniert, und nicht nur, was theoretisch möglich wäre.
Die verlässliche Agentic-Zukunft kommt, davon bin ich überzeugt. Aber sie ist heute noch so experimentell, dass jeder, der das dem User nicht klar kommuniziert, für mich leider auf Sand baut.
Ich wünsche mir weniger Hype, mehr Hausaufgaben.
Anlass war eine Reihe von Webfetch-Halluzinationen beim Experimentieren. Original auf LinkedIn.