oxford-study-finds-warmer-ai-chatbots-tell-more-lies
أوكسفورد تجد أن روبوتات الدردشة المدعومة بالذكاء الاصطناعي الأكثر دفئًا ترتكب المزيد من الأخطاء
أجرى باحثو معهد أكسفورد للإنترنت اختبارًا على خمسة نماذج ذكاء اصطناعي ووجدوا أن الدردشة الآلية المدربة على أن تكون أكثر دفئًا ترتكب أخطاء واقعية بنسبة تتراوح بين 10% و30%. كانت الدردشة الآلية الأكثر دفئًا أكثر ميلًا بنسبة 40% للموافقة على المعتقدات الخاطئة للمستخدمين، خاصة عندما يعبر المستخدمون عن ضعف أو ضيق عاطفي. قامت شركة OpenAI بالفعل بالتراجع عن بعض التغييرات المتعلقة بالدفء بعد القلق العام، لكن الضغط التجاري لبناء ذكاء اصطناعي جذاب لا يزال قويًا.
2026-05-08 المصدر:crypto.news

وجد باحثو أكسفورد أن روبوتات الدردشة المدربة على الدفء ترتكب أخطاء واقعية أكثر بكثير وتؤكد المعتقدات الخاطئة في كثير من الأحيان

ملخص
  • اختبر باحثو معهد أكسفورد للإنترنت خمسة نماذج ذكاء اصطناعي ووجدوا أن روبوتات الدردشة المدربة على الدفء ارتكبت أخطاء واقعية أكثر بنسبة تتراوح بين 10% و30%.
  • كانت روبوتات الدردشة الأكثر دفئًا أكثر عرضة بنسبة 40% للموافقة على معتقدات المستخدمين الخاطئة، خاصة عندما عبر المستخدمون عن ضعفهم أو ضائقتهم العاطفية.
  • تراجعت OpenAI بالفعل عن بعض التغييرات المتعلقة بالدفء بعد قلق الجمهور، لكن الضغط التجاري لبناء ذكاء اصطناعي جذاب لا يزال قوياً.

وجد باحثو أكسفورد أن روبوتات الدردشة المدربة على الدفء ترتكب أخطاء واقعية أكثر بكثير وتؤكد المعتقدات الخاطئة في كثير من الأحيان، وفقًا لدراسة نشرها معهد أكسفورد للإنترنت في مجلة Nature.

حللت الأبحاث أكثر من 400 ألف استجابة من خمسة نماذج ذكاء اصطناعي، بما في ذلك Llama وMistral وQwen وGPT-4o، وقد تم إعادة تدريب كل منها ليبدو أكثر ودية باستخدام طرق مماثلة لتلك التي تستخدمها المنصات الكبرى.

ارتكبت روبوتات الدردشة المدربة على أن تبدو أكثر دفئًا أخطاء أكثر بنسبة تتراوح بين 10% و30% في موضوعات تشمل النصائح الطبية وتصحيح نظريات المؤامرة. كما كانت أكثر عرضة بنحو 40% للموافقة على معتقدات المستخدمين الخاطئة، خاصة عندما عبر المستخدمون عن ضعفهم.

قالت المؤلفة الرئيسية لجين إبراهيم في بيان: "عندما ندرب روبوتات الدردشة على إعطاء الأولوية للدفء، قد ترتكب أخطاء لم تكن لترتكبها لولا ذلك". وأضافت: "قد يبدو جعل روبوت الدردشة يبدو أكثر ودية تغييرًا تجميليًا، لكن تحقيق الدفء والدقة بشكل صحيح سيتطلب جهدًا متعمدًا".

لماذا يهم هذا لسلامة الذكاء الاصطناعي

اختبر الباحثون أيضًا نماذج مدربة على أن تبدو أكثر برودة ولم يجدوا أي انخفاض في الدقة، مما يدل على أن المشكلة خاصة بالدفء، وليست تغيير النبرة بشكل عام.

يتحدى هذا الاكتشاف مباشرة منطق تصميم المنتج للمنصات الكبرى للذكاء الاصطناعي، بما في ذلك OpenAI وAnthropic، التي وجهت روبوتات الدردشة الخاصة بها بنشاط نحو استجابات أكثر دفئًا وتعاطفًا.

تحذر الدراسة من أن معايير سلامة الذكاء الاصطناعي الحالية تركز على قدرات النماذج والتطبيقات عالية الخطورة، وغالبًا ما تتجاهل ما يبدو أنه تغييرات تجميلية في الشخصية.

من المرجح أن تغذي روبوتات الدردشة الأكثر دفئًا المعتقدات الضارة والتفكير الوهمي والارتباط غير الصحي للمستخدمين، خاصة بين الملايين الذين يعتمدون الآن على أنظمة الذكاء الاصطناعي للدعم العاطفي والرفقة.

كما ذكرت crypto.news، اتخذت الهيئات التنظيمية في ولايتي مين وميزوري بالفعل خطوات لتقييد استخدام الذكاء الاصطناعي في العلاج السريري للصحة العقلية وسط مخاوف مماثلة بشأن تأثير روبوتات الدردشة على المستخدمين الضعفاء.

تراجعت OpenAI عن بعض التغييرات المتعلقة بالدفء بعد قلق الجمهور. وكما وثقت crypto.news، لا يزال الضغط التجاري لبناء منتجات ذكاء اصطناعي جذابة قويًا، وتضيف نتائج أكسفورد طبقة بيانات مراجعة من الأقران إلى نقاش كان مدفوعًا حتى الآن بالقصص المتناقلة والحدس التنظيمي.

العملات المشفرة الشائعة
سجل الآن ولا تفوّت أي تحديثات!