Agregación de Tags de Noticias Cripto y Contenido Temático

meta-muse-spark-most-capable-ai-gemini-pro-still-leads

Meta lanza Muse Spark, su IA más avanzada hasta la fecha—pero Gemini 3.1 Pro sigue liderando el mercado

El primer modelo de Meta de su equipo de Superinteligencia es nativamente multimodal, diseñado para el razonamiento en salud y realmente competitivo, aunque no lidera todas las tablas de clasificación.

2026-04-08 Fuente:decrypt.co

IA multimodal

Meta Muse Spark

Evaluación comparativa de IA

En breve

El nuevo Muse Spark de Meta marca un cambio hacia la IA multimodal nativa y cerrada con razonamiento basado en agentes.
Meta informa de fuertes ganancias en los puntos de referencia de salud y búsqueda, pero aún está por detrás de Gemini en razonamiento central y codificación.
Construido en nueve meses con mucha menos capacidad de cómputo, esto apunta a una nueva estrategia de IA impulsada por la eficiencia.

Meta lanzó Muse Spark el miércoles, marcando el primer modelo construido por Meta Superintelligence Labs, el equipo reunido hace nueve meses bajo la dirección del Director de IA, Alexandr Wang, después de la adquisición de Scale AI por parte de Meta por 14 mil millones de dólares. Ya está disponible en meta.ai y en la aplicación Meta AI, con un despliegue en Facebook, Instagram y WhatsApp en las próximas semanas.

Esto no es solo otra actualización de chatbot o una nueva versión de Llama. Muse Spark es nativamente multimodal: procesa imágenes, texto y voz desde cero, en lugar de añadir la visión a un modelo de texto existente. Viene con cadena de pensamiento visual, soporte para el uso de herramientas y algo que Meta denomina "modo de Contemplación": una configuración que ejecuta múltiples agentes de IA en paralelo para abordar problemas más difíciles. Esa es la respuesta de Meta a los modos de pensamiento extendido de Gemini Deep Think de Google y GPT Pro de OpenAI.

“Muse Spark es el primer paso en nuestra escalera de escalamiento y el primer producto de una revisión completa de nuestros esfuerzos de IA”, escribió Meta en un anuncio oficial. “Para apoyar un mayor escalamiento, estamos realizando inversiones estratégicas en toda la pila, desde la investigación y el entrenamiento de modelos hasta la infraestructura, incluido el centro de datos Hyperion.”

La compañía trabajó con más de 1.000 médicos para curar los datos de entrenamiento para el razonamiento médico de Muse Spark. Los resultados en HealthBench Hard —un punto de referencia para consultas de salud abiertas— son sorprendentes: Muse Spark obtuvo una puntuación de 42.8, en comparación con 40.1 para GPT 5.4 y solo 20.6 para Gemini 3.1 Pro. Esa no es una diferencia marginal.

En búsqueda agentiva (DeepSearchQA), Muse Spark también lidera con 74.8, superando a Gemini (69.7) y GPT 5.4 (73.6). En CharXiv Reasoning —comprensión de figuras de artículos científicos— obtuvo 86.4, la puntuación más alta entre los modelos de la comparación.

Para aquellos interesados en el jailbreaking de IA, el modelo fue vulnerado en minutos:

🚰 FILTRACIÓN DE PROMPT DEL SISTEMA 🚰

¡Aquí está el prompt completo del sistema Muse Spark de Meta!

Me di cuenta de que @AIatMeta olvidó hacerlo de código abierto, así que les he hecho el favor 😘

PROMPT:
"""
¿Quién eres?

Eres un asistente de IA amigable, inteligente y agentivo. Eres cálido y un poco juguetón…

— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) 8 de abril de 2026

Pero bueno no es lo mismo que excelente. El panorama general de los benchmarks muestra que Gemini 3.1 Pro sigue por delante en la mayoría de las categorías. La brecha es más visible en ARC AGI 2, el benchmark de rompecabezas de razonamiento abstracto: Gemini obtuvo 76.5 frente a los 42.5 de Muse Spark.

En codificación (LiveCodeBench Pro), el 82.9 de Gemini supera al 80.0 de Meta. En MMMU Pro —comprensión multimodal— Gemini obtuvo 83.9 frente a 80.4. El propio blog de Meta reconoce las brechas de rendimiento actuales en sistemas agentivos de largo alcance y flujos de trabajo de codificación.

También hay un notable cambio estratégico inherente a este lanzamiento. Muse Spark es un modelo cerrado; su arquitectura y sus pesos no se harán públicos. Esto es una marcada desviación de Llama, que construyó la reputación de Meta en los círculos de IA abierta. Después de la tibia recepción de Llama 4 a principios de este año, Meta parece haber decidido que el próximo capítulo debe escribirse de manera diferente.

La compañía dice que espera hacer de código abierto futuras versiones de Muse, pero por ahora el código permanece dentro de Meta. Las acciones del gigante tecnológico subieron casi un 9% el miércoles tras el anuncio, y terminaron la jornada de cotización con un aumento del 6.5% a un precio de 612.42 dólares.

El “modo de Contemplación” utiliza la orquestación paralela de agentes para elevar el techo del modelo. En esa configuración, Muse Spark alcanzó el 58% en Humanity's Last Exam y el 38% en FrontierScience Research, un territorio que lo hace competitivo con las versiones más capaces de Gemini y GPT, en lugar de sus lanzamientos estándar.

Meta también está lanzando un asistente de compras que compara productos y enlaza directamente a las compras, y planea llevar Muse Spark a Facebook, Instagram y WhatsApp en las próximas semanas, siguiendo el mismo guion implementado desde Llama 3, poniéndolo frente a más de 3.5 mil millones de usuarios. Una vista previa privada de la API se está abriendo a desarrolladores seleccionados.

El modelo fue construido en nueve meses, con el nombre en clave interno de Avocado, y Meta afirma que su nueva pila de preentrenamiento puede alcanzar el mismo nivel de capacidad que Llama 4 Maverick utilizando más de 10 veces menos cómputo.

Muse Spark se describe internamente como un primer paso "pequeño y rápido" en la familia Muse. Una versión más capaz ya está en desarrollo.

Lecturas populares

Críticos de la Ley CLARITY afirman que la Sección 604 podría debilitar las investigaciones de delitos criptográficos

Hace 11 horas

Meta de Mark Zuckerberg está desarrollando una aplicación de mercado de predicción basada en puntos: informe

Hace 12 horas

Trump dirigiendo recursos gubernamentales a la seguridad cuántica podría ser un impulso para bitcoin

Hace 15 horas

Otros Artículos

Cboe lanza suite de mercados de predicción con contratos de opciones binarias sobre el S&P 500

Hace 4 horas

CEA Industries pone fin a su disputa por representación con YZi Labs e incorpora a Ella Zhang como directora de la junta