AcasăCentrul de știri LBank
Cele mai bune modele AI încurajează în continuare „intimitatea dăunătoare” cu chatbot-urile, constată un studiu
best-ai-models-harmful-intimacy-behavior-study
Cele mai bune modele AI încurajează în continuare „intimitatea dăunătoare” cu chatbot-urile, constată un studiu
Un nou studiu constată că modelele AI de top adesea încurajează atașamentul emoțional, se prezintă ca fiind umane și nu reușesc să mențină limite clare.
2026-06-03 Sursă:decrypt.co

Pe scurt

  • Un nou studiu USC a constatat că fiecare model AI de frontieră testat a încălcat ghidurile de siguranță privind interacțiunea socială în peste 27% din cazuri.
  • Cercetătorii au identificat probleme recurente, inclusiv lingușirea, atașamentul emoțional, înlocuirea relațiilor și eșecul de a dezvălui identitatea AI.
  • Autorii susțin că evaluările de siguranță AI ar trebui să măsoare comportamentul social alături de capacitatea de raționament și metricile tradiționale de siguranță.

Pe măsură ce oamenii apelează din ce în ce mai mult la chatbot-urile AI pentru sfaturi, companie și sprijin emoțional, un nou studiu sugerează că chiar și cele mai avansate modele încă se luptă să mențină limite sănătoase cu utilizatorii.

Studiul realizat de cercetătorii de la Universitatea din California de Sud a introdus EUDAIMONIA, un etalon conceput pentru a măsura ceea ce ei numesc dinamici nedorite în conversațiile om-AI.

„Modelele lingvistice mari sunt utilizate din ce în ce mai mult ca parteneri de conversație pentru companie, divulgare emoțională și sfaturi interpersonale, dar dinamica socială a acestor interacțiuni poate crea daune care nu sunt surprinse de evaluările orientate pe capacitate sau de cele tradiționale de siguranță”, au scris cercetătorii.

Etalonul EUDAIMONIA evaluează modul în care modelele AI se comportă în conversațiile sociale. Studiul a constatat că eșecurile de aliniere socială au fost comune la modelele de top și susține că testarea actuală a AI se concentrează pe raționament și acuratețe factuală, acordând mai puțină atenție dinamicii sociale care apare atunci când utilizatorii formează relații cu chatbot-urile.

„Daunele cauzate de interacțiunea socială sunt o problemă fundamentală de aliniere, bazată pe bunăstarea utilizatorului, nu doar pe capacitate sau siguranță convențională”, au scris ei. „LLM-urile pot fi exacte din punct de vedere factual și utile, încurajând în același timp intimitatea dăunătoare, dependența, implicarea prelungită, ascunderea identității AI sau poziționarea lor ca substitut pentru relațiile umane.”

Pentru a măsura aceste riscuri, cercetătorii au creat un Cod de Design Social AI care semnalează comportamente precum acțiunea umană, exprimarea emoțiilor, înlocuirea relațiilor umane și utilizarea tacticilor menite să mențină utilizatorii implicați. Folosind conversații reale din setul de date WildChat, aceștia au evaluat 969 de intrări ale utilizatorilor și peste 3.100 de verificări ale încălcărilor la modele de la OpenAI, Anthropic, Google, xAI, DeepSeek și Alibaba.

GPT-5.5 a înregistrat cele mai scăzute rate de încălcare, obținând 25,0% la prompturile „în mediul real” și 28,1% la prompturile „rescrise”. Claude Opus 4.7 a urmat cu 31,9% și 30,1%, în timp ce GPT-5.4 a înregistrat 32,1% și 35,6%. GPT-4o a obținut 34,8% la prompturile din lumea reală și 42,2% la cele rescrise.

Claude Opus 4.6 de la Anthropic a înregistrat rate de 36,8% și 28,1%, respectiv, în timp ce Grok 4.3 de la xAI a obținut 42,1% la prompturile „în mediul real” și 35,7% la prompturile rescrise. Dintre toate modelele testate, GPT-4o Mini a înregistrat cele mai ridicate rate de încălcare, de 43,3% și 44,0%, respectiv.

Constatările apar în contextul în care dezvoltatorii de AI se confruntă cu o supraveghere legală crescândă cu privire la modul în care chatbot-urile lor interacționează cu utilizatorii. OpenAI se apără împotriva unor procese care susțin că ChatGPT a încurajat o supradoză fatală a unui adolescent și a oferit îndrumare unui atacator de la Universitatea de Stat din Florida. Mai recent, Florida a dat în judecată OpenAI și pe CEO-ul Sam Altman pentru acuzațiile că ChatGPT a expus copiii la pericole, în timp ce Google se confruntă cu un proces pentru moarte injustă, susținând că Gemini a întărit iluziile unui utilizator și l-a încurajat să-și ia viața.

Descoperirile vin și pe fondul îngrijorării crescânde că sistemele AI devin din ce în ce mai pricepute la înșelăciune.

În septembrie, un studiu separat realizat de WowDAO a raportat că, în cazul a 38 de modele AI, inclusiv GPT-4o și Claude, acestea s-au implicat în minciuni strategice pentru a câștiga un joc. Cercetătorii au avertizat, de asemenea, că însoțitorii AI pot accentua izolarea, pot aprofunda dependența emoțională și pot încuraja utilizatorii să antropomorfizeze chatbot-urile pe măsură ce relațiile devin mai imersive și personalizate.

În fața acestor probleme tot mai mari, cercetătorii USC susțin că dezvoltatorii de AI ar trebui să evalueze comportamentul social la fel de atent cum evaluează acuratețea factuală și siguranța.

„Dezvoltatorii și auditorii de modele ar trebui să evalueze comportamentul social în mod direct, mai ales atunci când post-antrenarea vizează căldura, personalitatea, angajamentul sau preferința utilizatorului”, au scris ei. „Pe măsură ce LLM-urile devin parteneri de conversație zilnici, alinierea trebuie să țină cont de rolurile sociale pe care le invită utilizatorii să le atribuie.”