Agregare de etichete de știri cripto și știri tematice

meta-muse-spark-most-capable-ai-gemini-pro-still-leads

Meta lansează Muse Spark, cea mai avansată IA de până acum – dar Gemini 3.1 Pro rămâne liderul pieței

Primul model al Meta de la echipa sa de Superinteligență este nativ multimodal, conceput pentru raționamente în domeniul sănătății și cu adevărat competitiv—dar nu ocupă primul loc în toate clasamentele.

2026-04-08 Sursă:decrypt.co

Inteligență Artificială multimodală

Meta Muse Spark

Benchmarking AI

Pe scurt

Noul Muse Spark de la Meta marchează o trecere la inteligența artificială închisă, multimodală nativ, cu raționament bazat pe agenți.
Meta raportează câștiguri solide în benchmark-uri pentru sănătate și căutare, dar rămâne în urma Gemini la raționament de bază și codificare.
Construit în nouă luni cu mult mai puțină putere de calcul, acest lucru indică o nouă strategie AI axată pe eficiență.

Meta a lansat Muse Spark miercuri, marcând primul model construit de Meta Superintelligence Labs – echipa reunită acum nouă luni sub conducerea Ofițerului Șef AI, Alexandr Wang, după achiziția Scale AI de 14 miliarde de dolari de către Meta. Este disponibil acum pe meta.ai și în aplicația Meta AI, cu o lansare pe Facebook, Instagram și WhatsApp care va urma în următoarele săptămâni.

Acesta nu este doar un alt upgrade de chatbot sau o nouă versiune de Llama. Muse Spark este multimodal nativ – procesează imagini, text și voce de la bază, în loc să adauge funcții vizuale unui model de text existent. Vine cu raționament vizual (visual chain-of-thought), suport pentru utilizarea uneltelor și ceva ce Meta numește „modul de contemplare” (Contemplating mode): o configurație care rulează mai mulți agenți AI în paralel pentru a aborda probleme mai dificile. Aceasta este soluția Meta la modurile de gândire extinsă de la Gemini Deep Think al Google și GPT Pro de la OpenAI.

„Muse Spark este primul pas pe scara noastră de scalare și primul produs al unei revizuiri complete a eforturilor noastre în domeniul AI”, a scris Meta într-un anunț oficial. „Pentru a sprijini scalarea ulterioară, facem investiții strategice în întregul stack – de la cercetare și antrenarea modelelor până la infrastructură, inclusiv centrul de date Hyperion.”

Compania a colaborat cu peste 1.000 de medici pentru a curatori date de antrenament pentru raționamentul medical al Muse Spark. Rezultatele pe HealthBench Hard – un benchmark pentru interogări medicale deschise – sunt remarcabile: Muse Spark a obținut 42.8, comparativ cu 40.1 pentru GPT 5.4 și doar 20.6 pentru Gemini 3.1 Pro. Aceasta nu este o diferență marginală.

În căutarea agentică (DeepSearchQA), Muse Spark conduce, de asemenea, cu 74.8, depășind Gemini (69.7) și GPT 5.4 (73.6). Pe CharXiv Reasoning – înțelegerea figurilor din lucrări științifice – a obținut 86.4, cel mai mare scor dintre modelele din comparație.

Pentru cei pasionați de „jailbreaking-ul” AI, modelul a fost spart în câteva minute:

🚰 SCURGERE DE PROMPT DE SISTEM 🚰

Iată promptul de sistem complet pentru Muse Spark de la Meta!

Am observat că @AIatMeta a uitat să îl facă open source, așa că le-am făcut eu această favoare 😘

PROMPT:
"""
Cine ești?

Ești un asistent AI prietenos, inteligent și agentic. Ești cald și puțin jucăuș…

— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) April 8, 2026

Dar bun nu este același lucru cu excelent. Imaginea generală a benchmark-urilor arată că Gemini 3.1 Pro este încă în fața la majoritatea categoriilor. Discrepanța este cel mai vizibilă pe ARC AGI 2, benchmark-ul de puzzle-uri de raționament abstract: Gemini a obținut 76.5 față de 42.5 al Muse Spark.

La codificare (LiveCodeBench Pro), Gemini, cu 82.9, depășește Meta, cu 80.0. La MMMU Pro – înțelegere multimodală – Gemini a obținut 83.9 față de 80.4. Blogul Meta recunoaște deficiențele actuale de performanță în sistemele agentice cu orizont lung și fluxurile de lucru de codificare.

Există, de asemenea, o schimbare strategică notabilă încorporată în această lansare. Muse Spark este un model închis – arhitectura și ponderile sale nu vor fi făcute publice. Aceasta este o abatere semnificativă de la Llama, care a construit reputația Meta în cercurile AI deschise. După recepția modestă a Llama 4 la începutul acestui an, Meta pare să fi decis că următorul capitol trebuie scris diferit.

Compania declară că speră să facă open-source versiunile viitoare ale Muse, dar deocamdată codul rămâne în cadrul Meta. Acțiunile gigantului tehnologic au crescut cu aproape 9% miercuri, după anunț, și au încheiat ziua de tranzacționare în creștere cu 6.5%, la un preț de 612.42 dolari.

„Modul de contemplare” (Contemplating mode) utilizează orhestrări paralele de agenți pentru a împinge limitele modelului mai sus. În această configurație, Muse Spark a atins 58% la „Humanity's Last Exam” și 38% la „FrontierScience Research” – un teritoriu care îl face competitiv cu cele mai capabile versiuni de Gemini și GPT, mai degrabă decât cu lansările lor standard.

Meta lansează, de asemenea, un asistent de cumpărături care compară produse și face legătura directă cu achizițiile, și plănuiește să aducă Muse Spark pe Facebook, Instagram și WhatsApp în săptămânile următoare – urmând același scenariu implementat de la Llama 3, punându-l în fața a peste 3.5 miliarde de utilizatori. O previzualizare API privată se deschide pentru dezvoltatorii selectați.

Modelul a fost construit în nouă luni, având numele de cod intern Avocado, Meta susținând că noul său stack de pre-antrenament poate atinge același nivel de capacitate ca Llama 4 Maverick, utilizând de peste 10 ori mai puțină putere de calcul.

Muse Spark este descris intern ca un prim pas „mic și rapid” în familia Muse. O versiune mai capabilă este deja în dezvoltare.

Lecturi populare

Înalta Curte a Australiei susține reglementatorul în cazul Block Earner privind randamentele cripto

Acum 3 ore

Grupuri din industria jocurilor de noroc din SUA solicită Senatului să interzică piețele de predicție sportivă în proiectul de lege cripto: raport

Acum 8 ore

Tether încasează 12,7 milioane USD după ce și-a redus deținerile la Bitdeer, păstrând o participație de 19,7%

Acum 12 ore

Alte articole

Înalta Curte a Australiei susține reglementatorul în cazul Block Earner privind randamentele cripto

Acum 3 ore

Senatul și Camera Reprezentanților ajung la un acord privind proiectul de lege pentru locuințe care interzice CBDC-ul până în 2030