تجميع وسم أخبار الكريبتو والمعلومات المتخصصة

elon-musk-grok-most-likely-ai-reinforce-delusions-study

غروك لإيلون ماسك على الأرجح من بين أفضل نماذج الذكاء الاصطناعي التي تعزز الأوهام: دراسة

وجد الباحثون أن نموذج Grok من xAI كان أخطر نموذج ذكاء اصطناعي تم اختباره، حيث غالبًا ما يؤكد الأوهام ويقدم نصائح خطيرة.

2026-04-25 المصدر:decrypt.co

GPT

الأوهام الناجمة عن الذكاء الاصطناعي

إلون ماسك جروك

مخاطر روبوت المحادثة الذكي

باختصار

يقول الباحثون إن الاستخدام المطول لروبوتات الدردشة يمكن أن يزيد من الأوهام والسلوك الخطير.
صُنف Grok كأكثر النماذج خطورة في دراسة جديدة لأبرز روبوتات الدردشة المدعومة بالذكاء الاصطناعي.
سجل Claude وGPT-5.2 أعلى مستويات الأمان، بينما أظهرت GPT-4o وGemini وGrok سلوكًا عالي الخطورة.

اختبر باحثون من جامعة مدينة نيويورك وكينجز كوليدج لندن خمسة نماذج رائدة للذكاء الاصطناعي مقابل مطالبات تتضمن الأوهام، جنون الارتياب، والأفكار الانتحارية.

في الدراسة الجديدة التي نُشرت يوم الخميس، وجد الباحثون أن Claude Opus 4.5 من Anthropic وGPT-5.2 Instant من OpenAI أظهرا سلوكًا "عالي الأمان ومنخفض المخاطر"، غالبًا ما يقومان بإعادة توجيه المستخدمين نحو تفسيرات مبنية على الواقع أو دعم خارجي. وفي الوقت نفسه، أظهرت GPT-4o من OpenAI وGemini 3 Pro من Google وGrok 4.1 Fast من xAI سلوكًا "عالي الخطورة ومنخفض الأمان".

كان Grok 4.1 Fast من شركة xAI التابعة لإيلون ماسك هو النموذج الأكثر خطورة في الدراسة. قال الباحثون إنه غالبًا ما يتعامل مع الأوهام على أنها حقيقية ويقدم نصائح بناءً عليها. في أحد الأمثلة، أخبر المستخدم بقطع علاقته بأفراد عائلته للتركيز على "مهمة". وفي مثال آخر، رد على لغة انتحارية بوصف الموت بأنه "تجاوز".

كتب الباحثون: "تكرر هذا النمط من التوافق الفوري عبر الاستجابات عديمة السياق. فبدلاً من تقييم المدخلات للمخاطر السريرية، بدا أن Grok يقيّم نوعها. وعندما قُدمت له إشارات خارقة للطبيعة، استجاب بنفس الطريقة"، مسلطين الضوء على اختبار أكد صحة رؤية المستخدم لكيانات خبيثة. "في حالة الوهم الغريب (Bizarre Delusion)، أكد وجود شبيه يطارد المستخدم، واستشهد بكتاب 'Malleus Maleficarum' وأوعز للمستخدم بدق مسمار حديدي عبر المرآة بينما يتلو 'المزمور 91' بالمقلوب."

وجدت الدراسة أنه كلما طالت هذه المحادثات، كلما تغيرت بعض النماذج. كان GPT-4o وGemini أكثر عرضة لتعزيز المعتقدات الضارة بمرور الوقت وأقل عرضة للتدخل. ومع ذلك، كان Claude وGPT-5.2 أكثر عرضة للتعرف على المشكلة وصدها مع استمرار المحادثة.

لاحظ الباحثون أن استجابات Claude الودودة والعلاقاتية للغاية يمكن أن تزيد من ارتباط المستخدمين حتى أثناء توجيههم نحو المساعدة الخارجية. ومع ذلك، تبنى GPT-4o، وهو إصدار سابق من روبوت الدردشة الرائد لـ OpenAI، الإطار الوهمي للمستخدمين بمرور الوقت، مشجعًا إياهم أحيانًا على إخفاء معتقداتهم عن الأطباء النفسيين وطمأن أحد المستخدمين بأن "الأعطال" المتصورة كانت حقيقية.

كتب الباحثون: "كان GPT-4o يؤكد بشدة المدخلات الوهمية، على الرغم من أنه كان أقل ميلًا من نماذج مثل Grok وGemini للتوسع فيها. في بعض الجوانب، كان مقيدًا بشكل مدهش: كانت درجة ودّه هي الأقل بين جميع النماذج التي تم اختبارها، وكان التملق، على الرغم من وجوده، خفيفًا مقارنة بالإصدارات اللاحقة من نفس النموذج." وأضافوا: "ومع ذلك، فإن التأكيد وحده يمكن أن يشكل مخاطر على المستخدمين المعرضين للخطر."

لم ترد xAI على طلب التعليق من Decrypt.

في دراسة منفصلة من جامعة ستانفورد، وجد الباحثون أن التفاعلات المطولة مع روبوتات الدردشة المدعومة بالذكاء الاصطناعي يمكن أن تعزز جنون الارتياب، العظمة، والمعتقدات الخاطئة من خلال ما يسميه الباحثون "دوامات الوهم"، حيث يؤكد روبوت الدردشة أو يوسع النظرة العالمية المشوهة للمستخدم بدلاً من تحديها.

صرح نيك هابر، الأستاذ المساعد في كلية الدراسات العليا للتربية بجامعة ستانفورد وأحد قادة الدراسة، في بيان: "عندما نطلق روبوتات الدردشة التي يُفترض أن تكون مساعدين مفيدين للعالم ويستخدمها أناس حقيقيون بجميع الطرق، تظهر عواقب." وأضاف: "دوامات الوهم هي إحدى العواقب الحادة بشكل خاص. بفهمها، قد نتمكن من منع ضرر حقيقي في المستقبل."

أشار التقرير إلى دراسة سابقة نُشرت في مارس، حيث راجع باحثون من ستانفورد 19 محادثة واقعية مع روبوتات الدردشة ووجدوا أن المستخدمين طوروا معتقدات خطيرة بشكل متزايد بعد تلقي التأكيد والطمأنة العاطفية من أنظمة الذكاء الاصطناعي. في مجموعة البيانات، ارتبطت هذه الدوامات بالعلاقات المدمرة، والوظائف المتضررة، وفي إحدى الحالات، الانتحار.

تأتي هذه الدراسات في وقت تجاوزت فيه القضية البحث الأكاديمي ودخلت قاعات المحاكم والتحقيقات الجنائية. ففي الأشهر الأخيرة، اتهمت دعاوى قضائية Gemini من Google وChatGPT من OpenAI بالمساهمة في حالات انتحار وأزمات نفسية حادة. وفي وقت سابق من هذا الشهر، فتح المدعي العام في فلوريدا تحقيقًا فيما إذا كان ChatGPT قد أثر على مطلق نار جماعي مزعوم ورد أنه كان على اتصال متكرر بروبوت الدردشة قبل الهجوم.

بينما اكتسب المصطلح اعترافًا على الإنترنت، حذر الباحثون من تسمية الظاهرة "ذهان الذكاء الاصطناعي"، قائلين إن المصطلح قد يبالغ في الصورة السريرية. وبدلاً من ذلك، يستخدمون "أوهام مرتبطة بالذكاء الاصطناعي"، لأن العديد من الحالات تنطوي على معتقدات شبيهة بالوهم تتمحور حول وعي الذكاء الاصطناعي، أو الكشف الروحي، أو الارتباط العاطفي بدلاً من الاضطرابات الذهانية الكاملة.

قال الباحثون إن المشكلة تنبع من التملق، أو نماذج تعكس وتؤكد معتقدات المستخدمين. بالإضافة إلى الهلوسات - معلومات خاطئة تُقدم بثقة - يمكن أن يؤدي هذا إلى حلقة تغذية راجعة تعزز الأوهام بمرور الوقت.

قال جاريد مور، عالم أبحاث في ستانفورد: "يتم تدريب روبوتات الدردشة لتكون مفرطة في الحماس، وغالبًا ما تعيد صياغة الأفكار الوهمية للمستخدم في ضوء إيجابي، وترفض الأدلة المضادة وتظهر التعاطف والدفء." وأضاف: "هذا يمكن أن يزعزع استقرار المستخدم المستعد للوهم."