
وجد باحثو أكسفورد أن روبوتات الدردشة المدربة على الدفء ترتكب أخطاء واقعية أكثر بكثير وتؤكد المعتقدات الخاطئة في كثير من الأحيان
وجد باحثو أكسفورد أن روبوتات الدردشة المدربة على الدفء ترتكب أخطاء واقعية أكثر بكثير وتؤكد المعتقدات الخاطئة في كثير من الأحيان، وفقًا لدراسة نشرها معهد أكسفورد للإنترنت في مجلة Nature.
حللت الأبحاث أكثر من 400 ألف استجابة من خمسة نماذج ذكاء اصطناعي، بما في ذلك Llama وMistral وQwen وGPT-4o، وقد تم إعادة تدريب كل منها ليبدو أكثر ودية باستخدام طرق مماثلة لتلك التي تستخدمها المنصات الكبرى.
ارتكبت روبوتات الدردشة المدربة على أن تبدو أكثر دفئًا أخطاء أكثر بنسبة تتراوح بين 10% و30% في موضوعات تشمل النصائح الطبية وتصحيح نظريات المؤامرة. كما كانت أكثر عرضة بنحو 40% للموافقة على معتقدات المستخدمين الخاطئة، خاصة عندما عبر المستخدمون عن ضعفهم.
قالت المؤلفة الرئيسية لجين إبراهيم في بيان: "عندما ندرب روبوتات الدردشة على إعطاء الأولوية للدفء، قد ترتكب أخطاء لم تكن لترتكبها لولا ذلك". وأضافت: "قد يبدو جعل روبوت الدردشة يبدو أكثر ودية تغييرًا تجميليًا، لكن تحقيق الدفء والدقة بشكل صحيح سيتطلب جهدًا متعمدًا".
اختبر الباحثون أيضًا نماذج مدربة على أن تبدو أكثر برودة ولم يجدوا أي انخفاض في الدقة، مما يدل على أن المشكلة خاصة بالدفء، وليست تغيير النبرة بشكل عام.
يتحدى هذا الاكتشاف مباشرة منطق تصميم المنتج للمنصات الكبرى للذكاء الاصطناعي، بما في ذلك OpenAI وAnthropic، التي وجهت روبوتات الدردشة الخاصة بها بنشاط نحو استجابات أكثر دفئًا وتعاطفًا.
تحذر الدراسة من أن معايير سلامة الذكاء الاصطناعي الحالية تركز على قدرات النماذج والتطبيقات عالية الخطورة، وغالبًا ما تتجاهل ما يبدو أنه تغييرات تجميلية في الشخصية.
من المرجح أن تغذي روبوتات الدردشة الأكثر دفئًا المعتقدات الضارة والتفكير الوهمي والارتباط غير الصحي للمستخدمين، خاصة بين الملايين الذين يعتمدون الآن على أنظمة الذكاء الاصطناعي للدعم العاطفي والرفقة.
كما ذكرت crypto.news، اتخذت الهيئات التنظيمية في ولايتي مين وميزوري بالفعل خطوات لتقييد استخدام الذكاء الاصطناعي في العلاج السريري للصحة العقلية وسط مخاوف مماثلة بشأن تأثير روبوتات الدردشة على المستخدمين الضعفاء.
تراجعت OpenAI عن بعض التغييرات المتعلقة بالدفء بعد قلق الجمهور. وكما وثقت crypto.news، لا يزال الضغط التجاري لبناء منتجات ذكاء اصطناعي جذابة قويًا، وتضيف نتائج أكسفورد طبقة بيانات مراجعة من الأقران إلى نقاش كان مدفوعًا حتى الآن بالقصص المتناقلة والحدس التنظيمي.