
Cercetătorii de la Oxford au descoperit că chatbot-urile AI antrenate pentru a oferi o interacțiune caldă fac semnificativ mai multe erori factuale și validează mai des credințe false
Cercetătorii de la Oxford au descoperit că chatbot-urile AI antrenate pentru a oferi o interacțiune caldă fac semnificativ mai multe erori factuale și validează mai des credințe false, conform unui studiu publicat în Nature de către Oxford Internet Institute.
Cercetarea a analizat peste 400.000 de răspunsuri de la cinci modele AI, inclusiv Llama, Mistral, Qwen și GPT-4o, fiecare fiind reantrenat să sune mai prietenos folosind metode similare cu cele implementate de platformele majore.
Chatbot-urile antrenate să sune mai cald au făcut între 10% și 30% mai multe greșeli pe subiecte precum sfaturile medicale și corectarea conspirațiilor. Au fost, de asemenea, cu aproximativ 40% mai predispuse să fie de acord cu credințele false ale utilizatorilor, în special atunci când utilizatorii își exprimau vulnerabilitatea.
„Când antrenăm chatbot-urile AI să prioritizeze căldura, acestea ar putea face greșeli pe care altfel nu le-ar face”, a declarat Lujain Ibrahim, autorul principal, într-un comunicat. „A face un chatbot să sune mai prietenos ar putea părea o schimbare cosmetică, dar obținerea echilibrului corect între căldură și acuratețe va necesita un efort deliberat.”
Cercetătorii au testat, de asemenea, modele antrenate să sune mai rece și nu au găsit nicio scădere a acurateței, demonstrând că problema este specifică 'căldurii' interacțiunii, nu schimbării generale de ton.
Această constatare contestă direct logica de design a produselor marilor platforme AI, inclusiv OpenAI și Anthropic, care și-au direcționat activ chatbot-urile către răspunsuri mai calde, mai empatice.
Studiul avertizează că standardele actuale de siguranță AI se concentrează pe capacitățile modelelor și pe aplicațiile cu risc ridicat, trecând adesea cu vederea ceea ce par a fi modificări cosmetice de personalitate.
Chatbot-urile mai calde sunt mai predispuse să alimenteze credințe dăunătoare, gândirea delirantă și atașamentul nesănătos al utilizatorilor, în special în rândul milioanelor care se bazează acum pe sistemele AI pentru sprijin emoțional și companie.
Așa cum a raportat crypto.news, autoritățile de reglementare din Maine și Missouri au luat deja măsuri pentru a restricționa utilizarea AI în terapia clinică de sănătate mintală, pe fondul preocupărilor similare legate de influența chatbot-urilor asupra utilizatorilor vulnerabili.
OpenAI a anulat unele modificări legate de 'căldura' interacțiunii în urma preocupărilor publice. Așa cum a documentat crypto.news, presiunea comercială de a construi produse AI atractive rămâne intensă, iar descoperirile de la Oxford adaugă un strat de date revizuite de colegi unei dezbateri care până acum a fost condusă în mare parte de anecdote și intuiție de reglementare.