anthropic-opus-47-full-stack-ai-studio-mythos
Anthropic 準備推出 Opus 4.7 與全方位 AI Studio——同時掌握更令人畏懼的技術
洩漏的模型、一個新的設計工具,以及一個無法發佈的網路武器進入了新聞周期。
2026-04-15 來源:decrypt.co

簡要

  • Anthropic 正在準備推出 Claude Opus 4.7 和一款用於網站及簡報的 AI 設計工具
  • Claude Mythos 仍是 Anthropic 真正的尖端模型,公司不會公開發布。
  • 業界仍無法可靠地衡量 AI 的改進,這使得關於 Opus 4.7 進展的說法難以驗證。


Anthropic 正準備推出 Claude Opus 4.7,同時還有一款新的 AI 驅動設計工具,讓用戶可以透過簡單的英文提示詞來建構網站、簡報和登陸頁面——根據《The Information》報導,這項消息導致 Adobe、Wix 和 Figma 的股價週一應聲下跌。

一位知情人士向《The Information》透露,這些產品最快可能在本週推出。這款設計工具同時針對開發者和非技術用戶,使其與 Gamma 和 Google 的 Stitch 等新創公司正面競爭。

Anthropic 未回應《Decrypt》的評論請求。

Opus 4.7 甚至還不是 Anthropic 最強大的模型。這個頭銜屬於 Claude Mythos——一個專注於網路安全的強大模型,該公司正悄悄地將其提供給特定的安全公司,同時不對公眾開放。

英國 AI 安全研究所最近評估了 Mythos 預覽版,發現它能夠自主執行其他模型無法比擬的複雜網路攻擊。它成為第一個完成「The Last Ones」的 AI,這是一個通常需要人類紅隊 20 小時才能完成的 32 步驟企業網路攻擊模擬。Mythos 在十次嘗試中成功了三次,平均完成 32 個步驟中的 22 個——而 Opus 4.6 則只完成了 16 個。

這不僅僅關乎企業安全。衡量 AI 的實際能力已成為一個業界難題。OpenAI 最近稱領先的編碼基準測試「受到污染」,然而模型仍繼續使用相同的測試進行比較。另一個 ARC-AGI-3 評估顯示,Gemini 得分 0.37%,GPT-5.4 達到 0.26%——而人類則達到 100%。結果是,基準測試既有爭議又仍被用作證據,這使得在 Anthropic 發布詳細的模型卡之前,難以將關於 Opus 4.7 進展的說法置於正確的背景中。

Opus 和 Mythos 之間的關係比大多數人意識到的更為緊密。Anthropic 透過在 Opus 系列基礎上進行微調來建構其尖端模型——為公開版 Claude 產品提供動力的相同骨幹,經過壓力測試和強化後成為 Mythos。Opus 4.7 是最終被灌輸網路安全能力的基礎。

此外,Anthropic 的努力已更多地轉向開發/企業應用案例。Claude 程式碼的洩漏、技能系統和 MCP 協議的發布、對代理式 AI 的關注以及對編碼基準測試的重視,都使得這一點更加明顯。雖然 Anthropic 尚未正式宣布,但這些洩漏強化了從大型語言模型(LLM)供應商向類似於全棧「AI 工作室」模型的更廣泛轉變,在這種模式下,Claude 不僅生成文本,還能建構和部署完整的產品。