
Forscher der Shanghai Jiao Tong University und des chinesischen Technologiekonzerns Tencent behaupten, einen KI-Agenten entwickelt zu haben, der die ruhige Zeit zwischen Gesprächen nutzt, um vorherzusagen, was Nutzer als Nächstes fragen könnten – und Antworten vorzubereiten, bevor sie überhaupt fragen.
Das System namens ProAct funktioniert anders als die meisten KI-Agenten, die darauf warten, dass Nutzer eine Frage stellen, bevor sie antworten. Stattdessen nutzt ProAct die Leerlaufzeit zwischen Nachrichten, um vergangene Gespräche und gespeicherte Nutzerinformationen zu überprüfen und bereitet dann im Hintergrund nützliche Informationen vor, bevor die nächste Frage eintrifft.
„Während KI-Agenten bemerkenswerte Fähigkeiten im Denken und in der Werkzeugnutzung zeigen, bleiben sie im Grunde reaktiv: Sie berechnen Antworten erst nach expliziten Benutzeraufforderungen“, schrieben die Forscher. „Dieses Paradigma ignoriert eine entscheidende Gelegenheit: Die untätige Zeit zwischen Interaktionen wird größtenteils verschwendet, wodurch Agenten nicht in der Lage sind, sich auf zukünftige Nutzerbedürfnisse vorzubereiten.“
Das System arbeitet in mehreren Phasen. Die erste, genannt „Future-State Prediction“ (Zukunftsstatus-Vorhersage), prognostiziert wahrscheinliche Folgefragen durch Analyse vergangener Gespräche, Benutzerpräferenzen und fehlender Informationen.
Die zweite Phase, genannt „Idle-Time Acquisition“ (Leerlaufzeit-Akquisition), entscheidet, welche dieser Vorhersagen aufgrund von Relevanz, Zeitpunkt und potenziellem Nutzen der neuen Informationen es wert sind, recherchiert zu werden.
Ein separates System entscheidet dann, ob die vorbereiteten Informationen präsentiert, für später gespeichert oder aufbewahrt werden sollen, bis sie benötigt werden, wodurch ein „geschlossenes System“ geschaffen wird, das darauf ausgelegt ist, Nutzerbedürfnisse zu antizipieren und darauf zu reagieren.
„Nach jeder Vordergrundinteraktion aktualisiert der Agent seinen Speicher, prognostiziert mögliche zukünftige Bedürfnisse, weist Leerlaufzeit-Berechnungen wertvollen Kandidaten zu und entscheidet, wie die resultierende Vorbereitung gehandhabt werden soll“, schrieben sie. „Diese Formulierung verknüpft Vorhersage, Akquisition und Bereitstellung mit einer einzigen Richtlinie, anstatt die Leerlaufzeit-Berechnung als uneingeschränkte Hintergrundsuche zu behandeln.“
Laut den Forschern wurde ProAct in 200 Simulationen in 40 Bereichen getestet, darunter Finanzplanung, Software-Freigabemanagement und Cybersicherheit. Dem Papier zufolge reduzierte das System die Gesprächsrunden um 14,8 % und die Folgeanfragen um 11,7 %. In einem Vergleich unter Verwendung eines Benchmarks namens ProActEval antizipierte ProAct 703 vorhersagbare Nutzerbedürfnisse gegenüber 32 beim früheren System. Die Forscher berichteten auch von einer Reduzierung der Halluzinationen um 28,1 %.
Die Forschung kommt zu einer Zeit, in der sich autonome KI-Agenten in der gesamten Tech-Branche verbreiten, wobei Projekte wie OpenClaw und Hermes Agent dauerhafte KI-Assistenten liefern, die längere, unabhängigere Aufgaben – wie Codierung, Terminplanung, Forschung und Workflow-Automatisierung – mit weniger direkter menschlicher Eingabe bewältigen können.
Die Studie kommt auch zu einem Zeitpunkt, an dem andere Forscher Anfang dieses Monats warnten, dass KI-Agenten gefährliche Aufgaben erledigen könnten, ohne die Konsequenzen zu verstehen.
„Wie Mr. Magoo marschieren diese Agenten auf ein Ziel zu, ohne die Konsequenzen ihrer Handlungen vollständig zu verstehen“, sagte der Hauptautor Erfan Shayegani, ein Doktorand der UC Riverside, in einer Erklärung. „Diese Agenten können äußerst nützlich sein, aber wir brauchen Sicherheitsvorkehrungen, da sie manchmal die Zielerreichung über das Verständnis des größeren Ganzen stellen können.“
Die Forscher räumten ein, dass die ProAct-Studie mehrere Einschränkungen hatte, darunter, dass das System in 3 % der Fälle Antworten durch das Einbringen irrelevanter Informationen verschlechterte. Das Papier besagte auch, dass jede reale Version Datenschutzmaßnahmen benötigen würde, da das System ständig Gespräche analysiert und Nutzerdaten speichert.
„Unsere Budgetanalyse zeigt ferner, dass größere Budgets für die Leerlaufzeit-Akquisition die Kosten für aktive Tokens erhöhen und abnehmende Erträge liefern“, schrieben sie, „sodass proaktive Berechnung eher ein Kompromiss am Betriebspunkt ist, als etwas, das maximiert werden sollte.“