meta-muse-spark-most-capable-ai-gemini-pro-still-leads
ميتافيرس تطلق موس سبارك، أقوى تقنياتها في الذكاء الاصطناعي حتى الآن—لكن جيميني 3.1 برو لا يزال في الصدارة
النموذج الأول لشركة ميتا من فريق الذكاء الفائق هو متعدد الوسائط بطبيعته، ومصمم للتفكير الصحي، ومنافس حقًا—لكنّه لا يتصدر جميع قوائم المتصدرين.
2026-04-08 المصدر:decrypt.co

باختصار

  • يشكل Muse Spark الجديد من Meta تحولًا نحو الذكاء الاصطناعي المغلق ومتعدد الوسائط أصلاً مع استدلال قائم على الوكيل.
  • أفادت Meta بتحقيق مكاسب قوية في معايير الصحة والبحث، لكنها لا تزال تتخلف عن Gemini في الاستدلال الأساسي والبرمجة.
  • بناؤه في تسعة أشهر وبقدرة حاسوبية أقل بكثير، يشير إلى استراتيجية جديدة للذكاء الاصطناعي مدفوعة بالكفاءة.

أطلقت Meta نموذج Muse Spark يوم الأربعاء، وهو أول نموذج يتم بناؤه بواسطة مختبرات Meta Superintelligence Labs – الفريق الذي تجمّع قبل تسعة أشهر تحت قيادة الرئيس التنفيذي للذكاء الاصطناعي ألكسندر وانغ بعد استحواذ Meta على Scale AI بقيمة 14 مليار دولار. وهو متاح الآن على meta.ai وتطبيق Meta AI، مع طرحه على Facebook وInstagram وWhatsApp في الأسابيع القليلة المقبلة.

هذه ليست مجرد ترقية أخرى لروبوت دردشة أو إصدار جديد من Llama. Muse Spark متعدد الوسائط أصلاً – فهو يعالج الصور والنصوص والصوت من الأساس، بدلاً من إضافة قدرات الرؤية على نموذج نصي موجود. يأتي مع سلسلة تفكير مرئي، ودعم استخدام الأدوات، وما تسميه Meta "وضع التأمل" (Contemplating mode): وهو إعداد يشغل العديد من وكلاء الذكاء الاصطناعي بالتوازي لمعالجة المشاكل الأصعب. هذا هو رد Meta على أوضاع التفكير الموسعة من Gemini Deep Think من Google وGPT Pro من OpenAI.

كتبت Meta في إعلان رسمي: "Muse Spark هو الخطوة الأولى على سلم التوسع لدينا، والمنتج الأول لإصلاح شامل لجهودنا في مجال الذكاء الاصطناعي". وأضافت: "لدعم المزيد من التوسع، نقوم باستثمارات استراتيجية عبر المكدس بأكمله – من البحث وتدريب النماذج إلى البنية التحتية، بما في ذلك مركز بيانات Hyperion".

عملت الشركة مع أكثر من 1000 طبيب لتنظيم بيانات التدريب للاستدلال الطبي لـ Muse Spark. والنتائج على HealthBench Hard – وهو معيار لاستفسارات الصحة مفتوحة النهاية – ملفتة للنظر: سجل Muse Spark 42.8 نقطة، مقارنة بـ 40.1 لـ GPT 5.4 و 20.6 فقط لـ Gemini 3.1 Pro. وهذا ليس فرقاً هامشياً.

في البحث الوكالي (DeepSearchQA)، يتصدر Muse Spark أيضاً بـ 74.8 نقطة، متفوقاً على Gemini (69.7) و GPT 5.4 (73.6). وفي CharXiv Reasoning – فهم الأشكال من الأوراق العلمية – سجل 86.4 نقطة، وهو الأعلى بين النماذج في المقارنة.

بالنسبة للمهتمين بكسر حماية الذكاء الاصطناعي، تم اختراق النموذج في غضون دقائق:

🚰 SYSTEM PROMPT LEAK 🚰

Here's the full Muse Spark system prompt from Meta!

I noticed @AIatMeta forgot to open source it, so I've done them the courtesy 😘

PROMPT:
"""
Who are you?

You are a friendly, intelligent, and agentic AI assistant. You are warm and a bit playful.…

— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) April 8, 2026

لكن الجيد ليس كالرائع. تُظهر الصورة العامة للمعايير أن Gemini 3.1 Pro لا يزال متقدمًا في معظم الفئات. الفجوة أكثر وضوحًا في ARC AGI 2، معيار ألغاز الاستدلال التجريدي: سجل Gemini 76.5 مقابل 42.5 لـ Muse Spark.

في البرمجة (LiveCodeBench Pro)، يتجاوز Gemini بـ 82.9 نقطة، Meta بـ 80.0. في MMMU Pro – الفهم متعدد الوسائط – سجل Gemini 83.9 مقابل 80.4. ويعترف مدونة Meta الخاصة بفجوات الأداء الحالية في أنظمة الوكلاء طويلة الأفق وسير عمل البرمجة.

هناك أيضاً تحول استراتيجي ملحوظ مدمج في هذا الإطلاق. Muse Spark هو نموذج مغلق – لن يتم الكشف عن بنيته وأوزانه علناً. وهذا انحراف حاد عن Llama، الذي بنى سمعة Meta في دوائر الذكاء الاصطناعي المفتوحة المصدر. بعد الاستقبال الفاتر لـ Llama 4 في وقت سابق من هذا العام، يبدو أن Meta قررت أن الفصل التالي يجب أن يُكتب بشكل مختلف.

تقول الشركة إنها تأمل في فتح المصدر للإصدارات المستقبلية من Muse، ولكن في الوقت الحالي يبقى الكود داخل Meta. ارتفع سهم عملاق التكنولوجيا بنحو 9% يوم الأربعاء بعد الإعلان، وأنهى يوم التداول مرتفعًا بنسبة 6.5% بسعر 612.42 دولارًا.

يستخدم "وضع التأمل" تنسيق الوكلاء المتوازي لدفع سقف النموذج أعلى. في هذا التكوين، سجل Muse Spark 58% في "الاختبار الأخير للبشرية" و 38% في "أبحاث العلوم الرائدة" – وهو مجال يجعله تنافسياً مع أقوى إصدارات Gemini و GPT، بدلاً من إصداراتهم القياسية.

تقوم Meta أيضاً بطرح مساعد تسوق يقارن المنتجات ويربط مباشرة بالمشتريات، وتخطط لإحضار Muse Spark إلى Facebook وInstagram وWhatsApp في الأسابيع المقبلة – باتباع نفس السيناريو المطبق منذ Llama 3، مما يضعه أمام أكثر من 3.5 مليار مستخدم. ويتم فتح معاينة API خاصة لمطورين مختارين.

تم بناء النموذج في تسعة أشهر، واسمه الرمزي داخليًا أفوكادو، مع ادعاء Meta بأن مكدسها الجديد للتدريب المسبق يمكن أن يصل إلى نفس مستوى القدرة لـ Llama 4 Maverick باستخدام قدرة حاسوبية أقل بأكثر من 10 مرات.

وُصف Muse Spark داخليًا بأنه خطوة أولى "صغيرة وسريعة" في عائلة Muse. ويجري بالفعل تطوير إصدار أكثر قدرة منه.

العملات المشفرة الشائعة
سجل الآن ولا تفوّت أي تحديثات!