
Cercetătorii de la Universitatea Shanghai Jiao Tong și conglomeratul chinez de tehnologie Tencent susțin că au construit un agent AI care folosește timpul de inactivitate dintre conversații pentru a prezice ce ar putea întreba utilizatorii în continuare—și a pregăti răspunsuri înainte ca aceștia să le solicite.
Sistemul, denumit ProAct, funcționează diferit față de majoritatea agenților AI care așteaptă ca utilizatorii să pună o întrebare înainte de a răspunde. În schimb, ProAct folosește timpul de inactivitate dintre mesaje pentru a revizui conversațiile anterioare și informațiile salvate ale utilizatorilor, apoi pregătește informații utile în fundal înainte de a sosi următoarea întrebare.
„Deși agenții AI demonstrează capacități remarcabile în raționament și utilizarea instrumentelor, ei rămân fundamental reactivi: calculează răspunsuri doar după solicitări explicite ale utilizatorilor”, au scris cercetătorii. „Această paradigmă ignoră o oportunitate critică: timpul de inactivitate dintre interacțiuni este în mare parte irosit, lăsând agenții incapabili să se pregătească pentru nevoile viitoare ale utilizatorilor.”
Sistemul funcționează în mai multe etape. Prima, numită Predicția Stării Viitoare (Future-State Prediction), prezice întrebările de urmărire probabile prin analizarea conversațiilor anterioare, a preferințelor utilizatorilor și a informațiilor lipsă.
A doua etapă, numită Achiziția Timpului de Inactivitate (Idle-Time Acquisition), decide care dintre aceste predicții merită cercetate pe baza relevanței, momentului și a cât de utile ar putea fi noile informații.
Un sistem separat decide apoi dacă să prezinte informațiile pregătite, să le salveze pentru mai târziu sau să le stocheze până la nevoie, creând un sistem „în buclă închisă” conceput pentru a anticipa și a răspunde nevoilor utilizatorilor.
„După fiecare interacțiune de prim-plan, agentul își actualizează memoria, prezice posibile nevoi viitoare, alocă calculul din timpul de inactivitate candidaților valoroși și decide cum ar trebui gestionată pregătirea rezultată”, au scris aceștia. „Această formulare leagă predicția, achiziția și livrarea de o singură politică, mai degrabă decât să trateze calculul din timpul de inactivitate ca o căutare de fundal nelimitată.”
Potrivit cercetătorilor, ProAct a fost testat în 200 de simulări în 40 de domenii, inclusiv planificare financiară, gestionarea lansărilor de software și securitate cibernetică. Conform lucrării, sistemul a redus numărul de rânduri de conversație cu 14,8% și a tăiat solicitările ulterioare cu 11,7%. Într-o comparație folosind un reper numit ProActEval, ProAct a anticipat 703 nevoi previzibile ale utilizatorilor față de 32 pentru sistemul anterior. Cercetătorii au raportat, de asemenea, o reducere de 28,1% a halucinațiilor.
Cercetarea vine pe măsură ce agenții AI autonomi se răspândesc în industria tehnologică, cu proiecte precum OpenClaw și Hermes Agent oferind asistenți AI persistenți care pot gestiona sarcini mai lungi și mai independente – cum ar fi codificarea, programarea, cercetarea și automatizarea fluxurilor de lucru – cu mai puțină contribuție umană directă.
Studiul vine, de asemenea, în contextul în care alți cercetători au avertizat la începutul acestei luni că agenții AI ar putea îndeplini sarcini periculoase fără a înțelege consecințele.
„La fel ca domnul Magoo, acești agenți înaintează spre un obiectiv fără a înțelege pe deplin consecințele acțiunilor lor”, a declarat într-o declarație autorul principal Erfan Shayegani, doctorand la UC Riverside. „Acești agenți pot fi extrem de utili, dar avem nevoie de măsuri de siguranță, deoarece uneori pot prioritiza atingerea obiectivului în detrimentul înțelegerii imaginii de ansamblu.”
Cercetătorii au recunoscut că studiul ProAct a avut mai multe limitări, inclusiv faptul că în 3% din cazuri, sistemul a înrăutățit răspunsurile prin aducerea în discuție a unor informații irelevante. Lucrarea a menționat, de asemenea, că orice versiune din lumea reală ar necesita protecția confidențialității, deoarece sistemul analizează constant conversațiile și stochează datele utilizatorilor.
„Analiza noastră bugetară arată, de asemenea, că bugetele mai mari pentru Achiziția Timpului de Inactivitate (Idle-Time Acquisition) cresc costul jetonului activ și generează randamente în scădere”, au scris aceștia, „astfel încât calculul proactiv este un compromis al punctului de operare, mai degrabă decât ceva de maximizat.”