
Meta lanzó Muse Spark el miércoles, marcando el primer modelo construido por Meta Superintelligence Labs, el equipo reunido hace nueve meses bajo la dirección del Director de IA, Alexandr Wang, después de la adquisición de Scale AI por parte de Meta por 14 mil millones de dólares. Ya está disponible en meta.ai y en la aplicación Meta AI, con un despliegue en Facebook, Instagram y WhatsApp en las próximas semanas.
Esto no es solo otra actualización de chatbot o una nueva versión de Llama. Muse Spark es nativamente multimodal: procesa imágenes, texto y voz desde cero, en lugar de añadir la visión a un modelo de texto existente. Viene con cadena de pensamiento visual, soporte para el uso de herramientas y algo que Meta denomina "modo de Contemplación": una configuración que ejecuta múltiples agentes de IA en paralelo para abordar problemas más difíciles. Esa es la respuesta de Meta a los modos de pensamiento extendido de Gemini Deep Think de Google y GPT Pro de OpenAI.
“Muse Spark es el primer paso en nuestra escalera de escalamiento y el primer producto de una revisión completa de nuestros esfuerzos de IA”, escribió Meta en un anuncio oficial. “Para apoyar un mayor escalamiento, estamos realizando inversiones estratégicas en toda la pila, desde la investigación y el entrenamiento de modelos hasta la infraestructura, incluido el centro de datos Hyperion.”
La compañía trabajó con más de 1.000 médicos para curar los datos de entrenamiento para el razonamiento médico de Muse Spark. Los resultados en HealthBench Hard —un punto de referencia para consultas de salud abiertas— son sorprendentes: Muse Spark obtuvo una puntuación de 42.8, en comparación con 40.1 para GPT 5.4 y solo 20.6 para Gemini 3.1 Pro. Esa no es una diferencia marginal.
En búsqueda agentiva (DeepSearchQA), Muse Spark también lidera con 74.8, superando a Gemini (69.7) y GPT 5.4 (73.6). En CharXiv Reasoning —comprensión de figuras de artículos científicos— obtuvo 86.4, la puntuación más alta entre los modelos de la comparación.
Para aquellos interesados en el jailbreaking de IA, el modelo fue vulnerado en minutos:
🚰 FILTRACIÓN DE PROMPT DEL SISTEMA 🚰
¡Aquí está el prompt completo del sistema Muse Spark de Meta!
Me di cuenta de que @AIatMeta olvidó hacerlo de código abierto, así que les he hecho el favor 😘
PROMPT:
"""
¿Quién eres?Eres un asistente de IA amigable, inteligente y agentivo. Eres cálido y un poco juguetón…
— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) 8 de abril de 2026
Pero bueno no es lo mismo que excelente. El panorama general de los benchmarks muestra que Gemini 3.1 Pro sigue por delante en la mayoría de las categorías. La brecha es más visible en ARC AGI 2, el benchmark de rompecabezas de razonamiento abstracto: Gemini obtuvo 76.5 frente a los 42.5 de Muse Spark.
En codificación (LiveCodeBench Pro), el 82.9 de Gemini supera al 80.0 de Meta. En MMMU Pro —comprensión multimodal— Gemini obtuvo 83.9 frente a 80.4. El propio blog de Meta reconoce las brechas de rendimiento actuales en sistemas agentivos de largo alcance y flujos de trabajo de codificación.
También hay un notable cambio estratégico inherente a este lanzamiento. Muse Spark es un modelo cerrado; su arquitectura y sus pesos no se harán públicos. Esto es una marcada desviación de Llama, que construyó la reputación de Meta en los círculos de IA abierta. Después de la tibia recepción de Llama 4 a principios de este año, Meta parece haber decidido que el próximo capítulo debe escribirse de manera diferente.
La compañía dice que espera hacer de código abierto futuras versiones de Muse, pero por ahora el código permanece dentro de Meta. Las acciones del gigante tecnológico subieron casi un 9% el miércoles tras el anuncio, y terminaron la jornada de cotización con un aumento del 6.5% a un precio de 612.42 dólares.
El “modo de Contemplación” utiliza la orquestación paralela de agentes para elevar el techo del modelo. En esa configuración, Muse Spark alcanzó el 58% en Humanity's Last Exam y el 38% en FrontierScience Research, un territorio que lo hace competitivo con las versiones más capaces de Gemini y GPT, en lugar de sus lanzamientos estándar.
Meta también está lanzando un asistente de compras que compara productos y enlaza directamente a las compras, y planea llevar Muse Spark a Facebook, Instagram y WhatsApp en las próximas semanas, siguiendo el mismo guion implementado desde Llama 3, poniéndolo frente a más de 3.5 mil millones de usuarios. Una vista previa privada de la API se está abriendo a desarrolladores seleccionados.
El modelo fue construido en nueve meses, con el nombre en clave interno de Avocado, y Meta afirma que su nueva pila de preentrenamiento puede alcanzar el mismo nivel de capacidad que Llama 4 Maverick utilizando más de 10 veces menos cómputo.
Muse Spark se describe internamente como un primer paso "pequeño y rápido" en la familia Muse. Una versión más capaz ya está en desarrollo.