google-deepmind-veteran-raises-1-1-billion-ai-isnt-trained-human-data
谷歌DeepMind資深專家籌資11億美元打造非人類數據訓練的AI
Ineffable Intelligence 賭注於強化學習是通往超智慧的道路,而非人工智慧的大型語言模型。
2026-04-28 來源:decrypt.co

簡要

  • DeepMind 資深科學家 David Silver 為其新創公司 Ineffable Intelligence 募資 11 億美元,估值達 51 億美元。
  • Silver 表示,強化學習而非大型語言模型,才是通往超級智慧的最佳途徑。
  • 該新創公司旨在建立透過模擬和自我對弈學習的 AI「超級學習者」。

DeepMind 科學家 David Silver 是 AlphaGo 在 2016 年歷史性擊敗世界圍棋冠軍李世石的幕後推手,他已籌集 11 億美元創辦一家新創公司,押注下一波 AI 時代不會來自當今主流技術。

Silver 的公司 Ineffable Intelligence 於一月成立,估值 51 億美元,並將重心放在強化學習上,這是一種透過試錯來改進 AI 系統的方法。Silver 認為,相較於目前主導該領域的大型語言模型,這種方法為通往超級智慧提供了更可靠的途徑。

「我認為我們的使命是首次接觸超級智慧,」Silver 告訴《Wired》。「我所說的超級智慧,指的是某種不可思議的事物。它應該能夠自行發現新的科學、技術、政府或經濟形式。」

「超級智慧」一詞由哲學家 Nick Bostrom 在其 2014 年出版的《超級智慧》一書中普及,指的是在幾乎所有領域超越人類智慧的 AI,而「通用人工智慧」(AGI)則描述了能夠在廣泛任務中達到人類水平推理能力的系統。

Silver 認為,大型語言模型存在根本限制,因為它們是從人類生成的數據中學習,而不是透過經驗建立自己的理解。

「人類數據就像一種化石燃料,提供了一條驚人的捷徑,」他說。「你可以將自行學習的系統視為一種可再生燃料—一種可以永遠、無限地學習的事物。」

Silver 的職業生涯大部分時間都致力於推動這一論點。AlphaGo 結合了人類訓練數據、強化學習和自我對弈,開發出令頂尖人類玩家都感到驚訝的策略,並展示了 AI 如何在特定領域超越人類先例。

「我認為擁有一個真正百分之百專注於這種方法的頂尖 AI 實驗室非常重要,」他告訴《Wired》。「而不是只在另一個專注於大型語言模型的地方佔有一席之地。」

Ineffable Intelligence 計劃建立 Silver 所稱的「超級學習者」(superlearners)— 將 AI 代理置於模擬環境中,讓它們可以在沒有靜態人類數據集限制的情況下追求目標、失敗、適應和改進。Silver 拒絕描述這些模擬會是什麼樣子,但他表示這種方法將允許代理協作並自主開發能力。

Silver 認為大型語言模型受限於其訓練數據,並補充說,一個在所有人相信地球是平坦的世界中訓練的模型,很可能會一直保持這種信念,除非它能夠自行驗證現實。他表示,透過經驗學習的系統,可能會發現不同的結果。

Ineffable Intelligence 沒有立即回應《Decrypt》的置評請求。