網易首頁 > 網易號 > 正文申請入駐

30萬被引的AlphaGo之父，創業4個月融資近百億元！篤信RL實現ASI

2026-04-28 17:11:10　來源: 新智元

北京舉報

分享至

新智元報道

編輯：艾倫

【新智元導讀】AlphaGo 之父 David Silver 創辦的 Ineffable Intelligence 獲 11 億美元種子輪，創歐洲融資紀錄，估值達 51 億美元。這家公司押注強化學習和自我經驗學習，試圖挑戰依賴 Scaling Law 的大模型主線。

4 月 27 日，前谷歌 DeepMind 頂級研究員、UCL 教授 David Silver 創辦的倫敦 AI 實驗室 Ineffable Intelligence 宣布完成 11 億美元種子輪融資，投后估值 51 億美元。

https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

這是歐洲迄今最大規模種子輪。

Sequoia Capital 和 Lightspeed Venture Partners 共同領投，Nvidia、谷歌、Index、DST Global、英國 Sovereign AI Fund 等參與。

Ineffable 的目標是，做一個從自身經驗中發現知識的「superlearner」，繼續把強化學習推向 ASI。

這筆錢的特別之處在于階段。

Ineffable 成立時間只有數月，公開產品、收入、路線圖都還有限，但一上來就拿到 51 億美元估值。

AI 投資已經進入一個新階段，頂尖研究員的個人信用，正在替代傳統意義上的商業驗證，成為早期融資最稀缺的抵押物。

這筆巨款，投向了強化學習

過去三年，AI 行業的主線是大語言模型。

更大的語料、更大的集群、更強的推理，幾乎構成了所有頭部公司的共同劇本。

Silver 選擇的是另一條路，強化學習。

強化學習的核心，是讓模型在環境里行動，通過反饋修正策略。

圍棋、國際象棋、星際爭霸這些封閉系統，是它最早打出聲量的地方。

游戲《星際爭霸 2》

Silver 的新公司想把這套方法放大，讓系統從基本動作技能一路學到科學、數學、技術層面的突破。

公司公開表述里，Ineffable 的使命是「與超級智能進行第一次接觸」。

Silver 對大模型路線的分歧也在這里。

大語言模型主要從人類已經寫下的文本和代碼中學習，能力邊界很大程度上受制于人類數據。

Silver 在接受 Wired 采訪時把人類數據比作化石燃料，把自我學習比作可再生能源。

這個比喻也解釋了為什么投資人愿意給一個沒有完全展開商業模式的實驗室開出巨額支票。

強化學習

是Scaling Law撞墻后的出路嗎？

依賴海量人類數據的傳統 Scaling Law 沒有失效，但邊際收益正在變差。

繼續堆參數、堆語料、堆訓練算力仍會帶來提升，只是高質量人類文本正在變成瓶頸。

Epoch AI 估算，公開高質量人類文本的有效庫存約為 300 萬億 Token，按趨勢可能最早在今年，最晚在 2032 年，被徹底用光。

https://epoch.ai/blog/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data

也就是說，舊范式這條路還能走，但越來越貴、越來越慢。

純強化學習確實提供了一條更接近 AGI / ASI 的路線，因為它讓模型從「模仿人類文本」轉向「通過行動和反饋獲得經驗」。

AlphaGo Zero 已經證明，在規則清晰、反饋明確的環境里，系統可以不依賴人類棋譜，通過自我對弈達到超人水平。

OpenAI o1 也顯示，大規模強化學習和測試時更多思考時間，能顯著增強復雜推理能力。

但純強化學習短期很難單獨承擔 AGI 路線。

圍棋、數學、代碼這類任務有明確驗證器，強化學習很強；

現實世界的問題沒有穩定獎勵函數，探索成本高，安全和對齊也更難。

谷歌 DeepMind 的 AlphaProof 更像是現實方向的樣板，它結合預訓練語言模型、Lean 形式化驗證和 AlphaZero 式強化學習，在 IMO 上達到銀牌水平。

所以更靠譜的判斷是，未來不是大模型預訓練和強化學習二選一，而是混合路線。

預訓練提供知識和語言底座，強化學習提供行動反饋和目標壓力，搜索、驗證器、工具調用、仿真環境提供可持續的新經驗。

ASI 的關鍵，是讓它能持續試錯、驗證、發現，并把經驗重新變成能力。

大廠人，正在變成新的公司

Ineffable 趕上了一個窗口期。

OpenAI、DeepMind、Anthropic、xAI 等公司在上一輪 AI 競賽中聚集了最稀缺的人才，也開始向創業市場外溢。

大模型公司繼續用巨額算力和產品分發打仗，離開的人帶著新路線、新組織和更高上行空間，去拿另一張桌子的籌碼。

類似案例正在增多。

TechCrunch 提到，前 DeepMind 研究員 Tim Rockt?schel 創辦的 Recursive Superintelligence 曾被報道融資需求可能上探 10 億美元；

Yann LeCun 離開 Meta AI 負責人崗位后，其參與的 AMI Labs 在 3 月宣布 10.3 億美元融資。

Ineffable 不是孤例，它是頂尖研究員創業潮里，金額最夸張的其中一筆。

這也解釋了英國政府為何入場。

英國 Sovereign AI Fund 和 British Business Bank 參與了這輪融資，后者確認投資 2000 萬美元，并稱過去 12 個月已做出 9 筆 AI 投資，包括 Wayve、PolyAI 等公司。

對英國來說，DeepMind 被谷歌收購之后，倫敦長期擁有頂級 AI 人才密度，但缺少能留在本土、繼續擴張的前沿實驗室。

Ineffable 提供了一個重新下注的機會。

最大的問題，是從游戲走向世界

Ineffable 的技術敘事很干凈，也有可見的風險。

圍棋、象棋、星際爭霸有規則、邊界和可計算的反饋。

真實世界的科學發現、技術發明和社會系統，沒有這么穩定的獎勵函數。

一個智能體在模擬環境中學到的策略，如何遷移到開放世界，是強化學習走向通用智能繞不開的問題。

Silver 的答案仍然是模擬。

Wired 報道稱，他希望把 Agent 放進模擬環境，讓它們學習達成目標、相互協作，并觀察它們如何對待其他智能體。

這種方法有一個優點，系統行為在更可控的空間里被觀察；

也有一個難點，模擬世界必須足夠豐富，才可能訓練出對真實世界有用的能力。

安全問題也會隨之被放大。

一個從經驗中學習、持續尋找更優策略的系統，可能會發現人類沒有預設過的路徑。

強化學習的魅力正在這里，風險也正在這里。

投資人押注的，其實是 Silver 能不能把 AlphaGo 時代那套「從經驗中學習」的方法，從游戲房間帶到更大的世界。

David Silver 的第二次開局

David Silver 的履歷是這個估值的最重要支柱。

UCL 官網資料顯示，他曾任 DeepMind 強化學習研究組負責人，主導 AlphaGo，并參與 AlphaZero，后者通過自我對弈在圍棋、國際象棋、日本將棋中達到超人類水平。

同時，他還通過國際象棋比賽認識了 DeepMind CEO Demis Hassabis，并成為終生好友。

即便離開了 DeepMind，二人仍保持親密關系——David Silver 自述「離開只是因為想開辟一條全新的道路」。

https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

ACM 在 2020 年授予他 2019 ACM Prize in Computing，理由是其在計算機博弈上的突破性貢獻。

英國皇家學會資料還列出，他參與過從 Atari、AlphaGo、AlphaZero 到 AlphaStar 的多項關鍵工作。

其谷歌學術主頁及公開資料顯示，Silver 的學術引用量已達 30 萬，H-index 達到 103，是強化學習領域少數同時擁有學術影響力和產業戰績的人。

https://scholar.google.com/citations?user=-8DNE4UAAAAJ&hl=zh-CN&oi=ao

Ineffable 的 11 億美元種子輪，表面是又一個 AI 融資紀錄，核心是一次路線投票。

大模型仍在主賽道狂奔，Silver 試圖證明，ASI 還可以從行動、反饋和自我經驗里長出來。

過去，AlphaGo 讓強化學習第一次走到大眾面前；

現在，Ineffable 想讓它從棋盤走向一整套新的智能系統。

參考資料：

https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

https://davidstarsilver.wordpress.com/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

紅杉領投、英偉達參投 DeepMind老將掀“超級學習者”新戰局

財聯社 2026-04-28 04:32:18
0 跟貼 0
小象電動獲超億元新一輪融資上汽金控旗下CVC恒旭資本領投

財聯社 2026-04-28 18:56:06
0 跟貼 0

山姆前操盤手，出山“轉戰”麥德龍

財天COVER 2026-04-28 17:27:33
0 跟貼 0

月薪3000富養貓狗，寵物經濟有多瘋狂

華商韜略 2026-04-07 16:02:11
0 跟貼 0
光輪智能CEO謝晨：具身數據金字塔的本質是以仿真為中心的閉環

量子位 2026-04-15 07:59:18
0 跟貼 0

任佳：創業孵化器一定要有投資功能否則價值大打折扣

財聯社 2026-02-05 16:35:02
0 跟貼 0

馬拉松之神代言，這家乳企什么來頭？

華商韜略 2026-04-01 10:56:40
0 跟貼 0
Manus收購案被叫停

北京商報 2026-04-28 00:12:08
123 跟貼 123

一杯好奶的“全球合伙人”

經濟觀察報 2026-04-28 18:05:03
0 跟貼 0
匠心傳承三十載榮耀再續新篇章——伊利集團累計榮獲全國五一勞動獎14項側記

經濟觀察報 2026-04-28 17:19:13
0 跟貼 0
【美股盤前】OpenAI被曝營收未達目標，半導體股集體下跌；油價觸及110美元/桶，英國石油Q1調整后凈利潤同比激增132%；谷歌被曝與五角大樓簽署機密AI協議

每日經濟新聞 2026-04-28 18:16:07
0 跟貼 0
拒買新聞就交稅澳洲擬向科技巨頭征約2%營收稅

財聯社 2026-04-28 17:17:03
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
妻子賣房助老公創業，如今翻身卻嫌她丑找2+1，官官怒懟大快人心

搞笑桔子 2026-04-25 00:23:02
0 跟貼 0
大山在老撾省城創業，大舅哥來孟塞看病，大山決定明天開工打水井

大財新鮮事 2026-04-28 10:10:48
0 跟貼 0
ACL 2026 | 中科大&上海AILab揭示強化學習后訓練的Scaling Law

機器之心Pro 2026-04-27 21:13:39
0 跟貼 0
伊朗轉變談判策略，自信占據主導地位，美方面臨更高要價

李紹先觀察 2026-04-28 13:11:35
1 跟貼 1
這事你們怎么看？

老閆大實話 2026-04-28 08:22:04
0 跟貼 0
ICLR 2026｜MathForge：用難題驅動強化學習，提升大模型數學推理

機器之心Pro 2026-04-27 12:16:24
0 跟貼 0
報道稱OpenAI未達銷售目標相關股票大跌

財聯社 2026-04-28 17:46:15
0 跟貼 0
Momenta量產車輛規模超80萬臺，R7強化學習世界模型實現量產首發

文匯報 2026-04-26 21:24:41
0 跟貼 0
男子在沙漠創業，竟然在塔克拉瑪干沙漠，種上了綠植！

爆笑社姐姐誒 2026-04-27 09:44:12
1 跟貼 1
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15170 跟貼 15170
比亞迪一季度營業收入1502億元凈利潤40.85億元

財聯社 2026-04-28 18:40:07
0 跟貼 0
山東后小伙歲獨身一人去青島學習廚師年時間打拼如今返鄉創業

派大星超行吖 2026-04-26 11:39:52
0 跟貼 0
逼我上絕路?無一個人看好我創業?

俄羅斯安娜 2026-04-28 01:08:55
0 跟貼 0
從“解渴管用”到“合作破億” 北京未來企業家實訓營三期清華開營

人民資訊 2026-04-28 17:19:32
0 跟貼 0
一部爛尾片拖垮公司：500萬美元債務背后的融資羅生門

影視情報室 2026-04-28 17:00:23
0 跟貼 0
90后小伙返鄉創業養雞，單只售價300元

江西都市現場 2026-04-28 09:32:49
0 跟貼 0
武安：打出“組合拳” 破解就業難

新浪財經 2026-04-28 17:42:31
0 跟貼 0
男人辭掉省長工作帶著女友來窮山溝創業不了女友第二天就跑了

快樂追劇吧 2026-04-27 08:00:36
1 跟貼 1
德國人為何不愿意創業？寧愿當一輩子員工

馬克呀CN 2026-04-24 16:32:42
0 跟貼 0
董明珠是逆行者，大家贊賞的是本分的企業家

葉檀財經 2025-12-17 19:14:36
47 跟貼 47
寶媽為女兒做芭蕾頭飾，意外創業純賺七八萬，還把生意做向國外

掌聞視訊 2026-04-26 17:27:57
0 跟貼 0
Xbox將與Discord合作，推出“更靈活的”XGP訂閱

三易生活 2026-04-28 18:50:09
0 跟貼 0
過度融資沒完沒了,寧德時代的“吃相”!賬上現金儲備超過4123億

水皮M0RE 2026-04-28 16:41:30
3 跟貼 3
中科曙光超智融合集群接入全國一體化算力網，AI4S駛入普惠快車道

每日經濟新聞 2026-04-28 19:00:21
0 跟貼 0
芬姐創業風波：三哥怒火中燒，金哥揭秘真相

心如止水o 2026-04-28 12:40:58
0 跟貼 0

牛！中國制造，已經強到如此可怕了！火遍全球的越野跑鞋竟是made in china ！

新智元

AI產業主平臺領航智能+時代

15084文章數 66818關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

房產

藝術

教育

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

30萬被引的AlphaGo之父，創業4個月融資近百億元！篤信RL實現ASI

政治局會議：加強算力網等規劃建設

《奇葩說》辯手稱淘寶上賣毒品前體 有人留言"能吃嗎"

《奇葩說》辯手稱淘寶上賣毒品前體 有人留言"能吃嗎"

季后賽最新局勢：雷霆4-0晉級首隊 4隊3-1

蔡卓妍官宣結婚，老公比她小10歲

10億周活目標落空！傳OpenAI爆發內部分歧

拒絕瘋狂套娃！現代艾尼氪金星長在未來審美點上

態度原創

用青花瓷的方式，打開西溪濕地

紅利爆發！海南，沖到全國人口增量第4省！

深圳極具未來感的“外星”建筑亮相

湖北城市建設職業技術學院人工智能學院“崗課賽證創”打通就業路

《奇葩說》辯手稱淘寶上賣毒品前體有人留言"能吃嗎"

《奇葩說》辯手稱淘寶上賣毒品前體有人留言"能吃嗎"