
DeepMind 科學家 David Silver 是 AlphaGo 在 2016 年歷史性擊敗世界圍棋冠軍李世石的幕後推手,他已籌集 11 億美元創辦一家新創公司,押注下一波 AI 時代不會來自當今主流技術。
Silver 的公司 Ineffable Intelligence 於一月成立,估值 51 億美元,並將重心放在強化學習上,這是一種透過試錯來改進 AI 系統的方法。Silver 認為,相較於目前主導該領域的大型語言模型,這種方法為通往超級智慧提供了更可靠的途徑。
「我認為我們的使命是首次接觸超級智慧,」Silver 告訴《Wired》。「我所說的超級智慧,指的是某種不可思議的事物。它應該能夠自行發現新的科學、技術、政府或經濟形式。」
「超級智慧」一詞由哲學家 Nick Bostrom 在其 2014 年出版的《超級智慧》一書中普及,指的是在幾乎所有領域超越人類智慧的 AI,而「通用人工智慧」(AGI)則描述了能夠在廣泛任務中達到人類水平推理能力的系統。
Silver 認為,大型語言模型存在根本限制,因為它們是從人類生成的數據中學習,而不是透過經驗建立自己的理解。
「人類數據就像一種化石燃料,提供了一條驚人的捷徑,」他說。「你可以將自行學習的系統視為一種可再生燃料—一種可以永遠、無限地學習的事物。」
Silver 的職業生涯大部分時間都致力於推動這一論點。AlphaGo 結合了人類訓練數據、強化學習和自我對弈,開發出令頂尖人類玩家都感到驚訝的策略,並展示了 AI 如何在特定領域超越人類先例。
「我認為擁有一個真正百分之百專注於這種方法的頂尖 AI 實驗室非常重要,」他告訴《Wired》。「而不是只在另一個專注於大型語言模型的地方佔有一席之地。」
Ineffable Intelligence 計劃建立 Silver 所稱的「超級學習者」(superlearners)— 將 AI 代理置於模擬環境中,讓它們可以在沒有靜態人類數據集限制的情況下追求目標、失敗、適應和改進。Silver 拒絕描述這些模擬會是什麼樣子,但他表示這種方法將允許代理協作並自主開發能力。
Silver 認為大型語言模型受限於其訓練數據,並補充說,一個在所有人相信地球是平坦的世界中訓練的模型,很可能會一直保持這種信念,除非它能夠自行驗證現實。他表示,透過經驗學習的系統,可能會發現不同的結果。
Ineffable Intelligence 沒有立即回應《Decrypt》的置評請求。