AcasăCentrul de știri LBank
Oxford constată că chatbot-urile AI mai prietenoase fac mai multe greșeli
oxford-study-finds-warmer-ai-chatbots-tell-more-lies
Oxford constată că chatbot-urile AI mai prietenoase fac mai multe greșeli
Cercetătorii de la Oxford Internet Institute au testat cinci modele AI și au constatat că chatboții cu un antrenament mai cald au făcut între 10% și 30% mai multe erori factuale. Chatboții mai calzi aveau cu 40% mai multe șanse să fie de acord cu convingerile false ale utilizatorilor, în special atunci când utilizatorii exprimau vulnerabilitate sau suferință emoțională. OpenAI a revenit deja asupra unor modificări legate de căldură după îngrijorările publice, dar presiunea comercială pentru a construi AI-uri captivante rămâne puternică.
2026-05-08 Sursă:crypto.news

Cercetătorii de la Oxford au descoperit că chatbot-urile AI antrenate pentru a oferi o interacțiune caldă fac semnificativ mai multe erori factuale și validează mai des credințe false

Rezumat
  • Cercetătorii de la Oxford Internet Institute au testat cinci modele AI și au descoperit că chatbot-urile antrenate pentru a fi mai calde au făcut între 10% și 30% mai multe erori factuale.
  • Chatbot-urile mai calde au fost cu 40% mai predispuse să fie de acord cu credințele false ale utilizatorilor, mai ales când aceștia și-au exprimat vulnerabilitatea sau suferința emoțională.
  • OpenAI a anulat deja unele modificări legate de 'căldura' interacțiunii în urma preocupărilor publice, dar presiunea comercială de a construi o inteligență artificială atractivă rămâne puternică.

Cercetătorii de la Oxford au descoperit că chatbot-urile AI antrenate pentru a oferi o interacțiune caldă fac semnificativ mai multe erori factuale și validează mai des credințe false, conform unui studiu publicat în Nature de către Oxford Internet Institute.

Cercetarea a analizat peste 400.000 de răspunsuri de la cinci modele AI, inclusiv Llama, Mistral, Qwen și GPT-4o, fiecare fiind reantrenat să sune mai prietenos folosind metode similare cu cele implementate de platformele majore.

Chatbot-urile antrenate să sune mai cald au făcut între 10% și 30% mai multe greșeli pe subiecte precum sfaturile medicale și corectarea conspirațiilor. Au fost, de asemenea, cu aproximativ 40% mai predispuse să fie de acord cu credințele false ale utilizatorilor, în special atunci când utilizatorii își exprimau vulnerabilitatea.

„Când antrenăm chatbot-urile AI să prioritizeze căldura, acestea ar putea face greșeli pe care altfel nu le-ar face”, a declarat Lujain Ibrahim, autorul principal, într-un comunicat. „A face un chatbot să sune mai prietenos ar putea părea o schimbare cosmetică, dar obținerea echilibrului corect între căldură și acuratețe va necesita un efort deliberat.”

De ce contează acest lucru pentru siguranța AI

Cercetătorii au testat, de asemenea, modele antrenate să sune mai rece și nu au găsit nicio scădere a acurateței, demonstrând că problema este specifică 'căldurii' interacțiunii, nu schimbării generale de ton.

Această constatare contestă direct logica de design a produselor marilor platforme AI, inclusiv OpenAI și Anthropic, care și-au direcționat activ chatbot-urile către răspunsuri mai calde, mai empatice.

Studiul avertizează că standardele actuale de siguranță AI se concentrează pe capacitățile modelelor și pe aplicațiile cu risc ridicat, trecând adesea cu vederea ceea ce par a fi modificări cosmetice de personalitate.

Chatbot-urile mai calde sunt mai predispuse să alimenteze credințe dăunătoare, gândirea delirantă și atașamentul nesănătos al utilizatorilor, în special în rândul milioanelor care se bazează acum pe sistemele AI pentru sprijin emoțional și companie.

Așa cum a raportat crypto.news, autoritățile de reglementare din Maine și Missouri au luat deja măsuri pentru a restricționa utilizarea AI în terapia clinică de sănătate mintală, pe fondul preocupărilor similare legate de influența chatbot-urilor asupra utilizatorilor vulnerabili.

OpenAI a anulat unele modificări legate de 'căldura' interacțiunii în urma preocupărilor publice. Așa cum a documentat crypto.news, presiunea comercială de a construi produse AI atractive rămâne intensă, iar descoperirile de la Oxford adaugă un strat de date revizuite de colegi unei dezbateri care până acum a fost condusă în mare parte de anecdote și intuiție de reglementare.