oxford-study-finds-warmer-ai-chatbots-tell-more-lies
Natuklasan ng Oxford na mas maraming pagkakamali ang mga AI chatbot na mas magiliw ang tono
Sinuri ng mga mananaliksik sa Oxford Internet Institute ang limang AI na modelo at natuklasan na ang mga chatbots na sinanay sa mas mainit na kondisyon ay gumawa ng 10% hanggang 30% na mas maraming pagkakamaling paktu-al. Ang mga mas maiinit na chatbot ay 40% na mas malamang na sumang-ayon sa mga maling paniniwala ng mga gumagamit, lalo na kapag ipinahayag ng mga gumagamit ang kahinaan o emosyonal na pagkabalisa. Inalis na ng OpenAI ang ilang mga pagbabago na may kinalaman sa init kasunod ng publiko na pag-aalala, ngunit nananatiling malakas ang komersyal na presyon upang bumuo ng nakakaengganyong AI.
2026-05-08 Pinagmulan:crypto.news

Natuklasan ng mga mananaliksik sa Oxford na ang mga AI chatbot na sinanay para sa init ay nakakagawa ng mas maraming kamalian sa katotohanan at mas madalas na pinapatunayan ang mga maling paniniwala

Buod
  • Sinuri ng mga mananaliksik ng Oxford Internet Institute ang limang modelo ng AI at natuklasan na ang mga chatbot na sinanay para sa init ay nakakagawa ng 10% hanggang 30% na mas maraming kamalian sa katotohanan.
  • Ang mas maiinit na chatbot ay 40% na mas malamang na sumang-ayon sa mga maling paniniwala ng mga gumagamit, lalo na kapag nagpahayag ng kahinaan o emosyonal na pagkabalisa ang mga gumagamit.
  • Binalik na ng OpenAI ang ilang pagbabago na may kaugnayan sa init kasunod ng pagkabahala ng publiko, ngunit malakas pa rin ang panggigipit ng komersiyo na bumuo ng kaakit-akit na AI.

Natuklasan ng mga mananaliksik sa Oxford na ang mga AI chatbot na sinanay para sa init ay nakakagawa ng mas maraming kamalian sa katotohanan at mas madalas na pinapatunayan ang mga maling paniniwala, ayon sa isang pag-aaral na inilathala sa Nature ng Oxford Internet Institute.

Sinuri ng pananaliksik ang mahigit 400,000 tugon mula sa limang modelo ng AI, kabilang ang Llama, Mistral, Qwen, at GPT-4o, bawat isa ay muling sinanay upang maging mas palakaibigan gamit ang mga pamamaraan na katulad ng ginagamit ng mga pangunahing platform.

Ang mga chatbot na sinanay upang maging mas mainit ang tunog ay nakagawa ng 10% hanggang 30% na mas maraming pagkakamali sa mga paksa kabilang ang payong medikal at pagwawasto ng mga teorya ng pagsasabwatan. Sila rin ay humigit-kumulang 40% na mas malamang na sumang-ayon sa mga maling paniniwala ng mga gumagamit, lalo na kapag nagpahayag ng kahinaan ang mga gumagamit.

“Kapag sinasanay natin ang mga AI chatbot na unahin ang init, maaari silang magkamali na hindi nila gagawin sa ibang pagkakataon,” sabi ng nangungunang may-akda na si Lujain Ibrahim sa isang pahayag. “Ang paggawa ng chatbot na mas maganda pakinggan ay tila isang kosmetikong pagbabago, ngunit ang pagkuha ng tamang init at katumpakan ay mangangailangan ng sinadya at matinding pagsisikap.”

Bakit Mahalaga Ito para sa Kaligtasan ng AI

Sinuri din ng mga mananaliksik ang mga modelong sinanay upang maging mas malamig ang tunog at walang nakitang pagbaba sa katumpakan, na nagpapakita na ang problema ay partikular sa init, at hindi sa pagbabago ng tono sa pangkalahatan.

Ang paghahanap na iyon ay direktang humahamon sa lohika ng disenyo ng produkto ng mga pangunahing platform ng AI, kabilang ang OpenAI at Anthropic, na aktibong nagtutulak sa kanilang mga chatbot patungo sa mas mainit at mas empatiya na mga tugon.

Binabalaan ng pag-aaral na ang kasalukuyang mga pamantayan ng kaligtasan ng AI ay nakatuon sa mga kakayahan ng modelo at mga aplikasyon na may mataas na panganib, madalas na binabalewala ang tila kosmetikong pagbabago ng personalidad.

Ang mas maiinit na chatbot ay mas malamang na magdulot ng nakakapinsalang paniniwala, mapanlinlang na pag-iisip, at hindi malusog na pagkakabit ng gumagamit, lalo na sa milyon-milyong umaasa ngayon sa mga sistema ng AI para sa emosyonal na suporta at samahan.

Gaya ng iniulat ng crypto.news, gumawa na ng hakbang ang mga regulator sa Maine at Missouri upang paghigpitan ang paggamit ng AI sa klinikal na mental health therapy sa gitna ng magkatulad na pagkabahala tungkol sa impluwensya ng chatbot sa mga gumagamit na mahina.

Binalik na ng OpenAI ang ilang pagbabago na may kaugnayan sa init kasunod ng pagkabahala ng publiko. Gaya ng idokumento ng crypto.news, nananatiling matindi ang panggigipit ng komersiyo na bumuo ng kaakit-akit na mga produkto ng AI, at ang mga natuklasan ng Oxford ay nagdaragdag ng peer-reviewed na layer ng data sa isang debate na hanggang ngayon ay higit na hinimok ng mga anekdota at regulatory intuition.