Strona głównaCentrum wiadomości LBank
Fuzja OpenRoutera Obiecuje AI na Poziomie Claude Fable Niskim Kosztem — Akurat Gdy Fable 5 Zostaje Wyłączone
openrouter-fusion-claude-fable-level-ai-cheap
Fuzja OpenRoutera Obiecuje AI na Poziomie Claude Fable Niskim Kosztem — Akurat Gdy Fable 5 Zostaje Wyłączone
API modeli złożonych OpenRoutera łączy w sobie budżetowe modele AI — i bezapelacyjnie zdeklasowało GPT-5.5 oraz Claude Opus 4.8 w testach porównawczych.
2026-06-20 Źródło:decrypt.co

W skrócie

  • OpenRouter uruchomił 12 czerwca Fusion, API po stronie serwera, które przekazuje prompt do panelu modeli, a następnie wykorzystuje sędziego i syntezator do połączenia najlepszej odpowiedzi.
  • W teście porównawczym DRACO firmy Perplexity, budżetowy panel różnych SI osiągnął wyniki w granicach 1% Fable 5 przy około połowie kosztów.
  • Technika ta pojawiła się w momencie, gdy dyrektywa kontroli eksportu z USA zmusiła Anthropic do zawieszenia Fable 5 i Mythos 5.

OpenRouter uruchomił API oparte na prostym założeniu: że panel tanich modeli AI, odpowiednio połączonych, może dorównać pojedynczemu, drogiemu. A mówiąc „drogi”, mają na myśli Claude Fable 5.

Produkt nazywa się Fusion. Wysyła on prompt do wielu modeli równolegle, a następnie używa modelu sędziowskiego i syntezatora do połączenia wyników w jedną ugruntowaną odpowiedź.

Moment jest sprzyjający. Krótko po wydaniu Fable 5 i Mythos 5 w zeszłym tygodniu, dyrektywa kontroli eksportu z USA zmusiła Anthropic do zawieszenia tych modeli dla wszystkich zagranicznych obywateli na całym świecie, powołując się na kwestionowane odkrycie dotyczące „jailbreaku”. OpenRouter poinformował o tym na X następnego dnia, wkraczając w lukę z obietnicą „inteligencji na poziomie Fable za połowę ceny”.

Introducing the Fusion API, the smartest compound model in the market.

Fusion achieves Fable-level intelligence at half the price.

How it works 👇 pic.twitter.com/OTUQAdTQjU

— OpenRouter (@OpenRouter) June 13, 2026

Jak uzyskać tanie Fable

Kiedy wysyłasz prompt do Fusion, OpenRouter przekazuje go równolegle do panelu modeli. Każdy z nich otrzymuje narzędzia do wyszukiwania w sieci i bash.

Następnie model sędziowski wydobywa punkty konsensusu, sprzeczności i martwe punkty z każdej odpowiedzi. Po zakończeniu tej fazy, syntezator — domyślnie Claude Opus 4.8 — tworzy ostateczną odpowiedź, opartą na tej analizie.

Całość odbywa się po stronie serwera. Możesz zmienić swój ciąg znaków modelu na "openrouter/fusion" dla domyślnego panelu, dodać narzędzie fusion, aby Twój własny model wywoływał je selektywnie, lub zbudować niestandardowy panel w czacie Fusion bez użycia kodu.

OpenRouter przetestował to na DRACO, benchmarku Perplexity zbudowanym na podstawie rzeczywistych, złożonych zapytań badawczych użytkowników. Fable 5 w połączeniu z GPT-5.5 OpenAI i syntezowany przez Opus zajął pierwsze miejsce z wynikiem 69%. Samodzielny Fable uzyskał 65.3%, choć siedem z jego 100 zadań nigdy się nie uruchomiło, ponieważ jego własne filtry treści je zablokowały.

Tańsza kombinacja to ta, którą OpenRouter chce, aby zapamiętano: Tani Gemini 3 Flash w połączeniu z chińskimi modelami open-source Kimi K2.6 i DeepSeek V4 Pro, połączone i zsyntezowane przez Opus, osiągnęły 64,7% – pokonując bezpośrednio samodzielne GPT-5.5 (60%) i Opus 4.8 (58.8%) i plasując się w granicach jednego punktu od Fable przy około połowie kosztów.

Nawet połączenie Opus 4.8 z jego oddzielną instancją dało wynik 65,5%, co stanowi skok o 6,7 punktu w porównaniu do samodzielnego Opusa; OpenRouter twierdzi, że około trzy czwarte tego wzrostu pochodzi z samego etapu syntezy, reszta z prawdziwej różnorodności modeli.

Jedna uwaga: udostępnienie panelowi dostępu do sieci w czasie rzeczywistym pozwala modelom na ujawnienie własnego systemu oceniania DRACO w wynikach wyszukiwania, co jest ryzykiem zanieczyszczenia, które OpenRouter nazywa przypadkowym, a nie celowym. Naprawa wymagała jednej linii konfiguracji, aby wykluczyć domeny hostingowe benchmarku z narzędzi wyszukiwania, a każda opublikowana liczba odzwierciedla ten oczyszczony przebieg.

Warto spróbować?

OpenRouter otwarcie przyznaje, że Fusion nie jest pełnym zamiennikiem Fable. DRACO pomija pracę wymagającą długiego horyzontu, gdzie Fable podobno wciąż prowadzi, a w przypadku kodowania, Fusion działa jako narzędzie, które model kodujący wywołuje selektywnie, a nie jako całkowita zamiana – zastrzeżenie to odzwierciedla to, co Decrypt odkrył testując DeepClaude, tańszą zamianę zaplecza, która zachowuje pętlę agenta Claude Code, ale nadal ustępuje Opusowi w najtrudniejszych zadaniach rozumowania.

Zwykły model nadal zajmuje się codziennymi zadaniami. Fusion jest przeznaczony do pytań, w których jeden model może przeoczyć coś ważnego, a posiadanie kilku perspektyw wzajemnie się weryfikujących faktycznie robi różnicę.

W przypadku dogłębnych badań, złożonego planowania lub czegokolwiek, gdzie sprzeczności mają znaczenie, konsultacja wydaje się pomagać.

Wykresy jasno przedstawiają podstawową kwestię: w tego rodzaju pracy drogi samodzielny model nie jest już jedynym sposobem na uzyskanie silnej syntezy. Grupa modeli, które są nadal łatwo dostępne i połączone, może plasować się tuż obok niego pod względem wyników, generując jednocześnie znacznie mniejszy rachunek.

Wątek startowy podzielił się na mniej więcej dwie trzecie pozytywnych opinii. Badacz AI Andrew Trask nazwał to „o wiele większą sprawą, niż się wydaje”, twierdząc, że laboratoria graniczne nigdy więcej nie będą same panować na granicy (technologii). Sceptycy jednak skrytykowali to ujęcie, wskazując na słabe wyniki w kodowaniu, kiepskie wywoływanie narzędzi i brak przejrzystości, ponieważ Fable 5 nie jest już dostępny do porównania wyników.

Fusion działa w całości na modelach przekierowywanych przez własną infrastrukturę OpenRouter, więc nie rozwiązuje problemu kontroli eksportu u źródła. Każdy, kto został zablokowany z Fable 5, ma teraz opcje: panel Fusion, zamiana zaplecza jak DeepClaude lub alternatywy o otwartej wadze, takie jak GLM-5.2, które być może nie są lepsze, ale są wystarczająco dobrej jakości za tę cenę.