網易首頁 > 網易號 > 正文申請入駐

Google AI掌門人Demis Hassabis：比爽文更爽的開掛人生

2025-12-20 08:13:41　來源: AI進化論花生

北京舉報

分享至

你現在17歲，有人給了你提供了兩個選擇：

選項A：拿下1000萬，別去讀大學

選項B：去劍橋念書

你怎么選擇？給你10秒鐘時間思考。

你可能常常在小紅書、公眾號、虎撲看到這樣的選擇題，大多數人只會想問：我該去哪領錢？

但...這個極端不現實的場景，確實Google AI的負責人在31年前真實面臨的選擇。

1993年，16歲的Demis Hassabis被劍橋大學錄取了，但因為年紀太小，還不滿足入學的條件，所以需要等一年再去讀大學。

怎么利用這一年的Gap Year呢？

環游世界？還是在家玩游戲？

都不是，從小愛玩游戲的Demis Hassabis選擇去一家游戲公司打「黑工」。

也就是在這一年時間內，他主導設計了一款史上十大最暢銷游戲之一——《主題公園》（Theme Park），這款游戲累計賣出了超過1500萬份。

Peter Molyneux是全歐洲最好的游戲公司創始人。他提出了一個條件：

給Demis 100萬英鎊，但他不能去讀大學。

那在20世紀90年代是一大筆錢。對于一個17歲的窮小子來說，這是改變命運的機會。

但Demis拒絕了。

他說："我從一開始就有個計劃。我的計劃一直都是要去劍橋大學讀書。"

Peter至今依然記得送Demis去火車站的那天："他就如同一粒即將破土而出的小種子，但在牛蛙制作公司，他是無法做到的。我至今依然記得這個小精靈角色消失在那條隧道里的畫面。那是個令人極其傷感的時刻。"

為什么？

一個17歲的天才少年，怎么會有魄力拒絕100萬英鎊？

他在追求什么？

答案要從6年前說起。

1988年，列支敦士登的一個山間教堂里，12歲的Demis正在參加一場國際象棋錦標賽。

對手是前丹麥冠軍，三十幾歲。比賽持續了10個小時。

到了最后，Demis明明可以逼成平局——只需要放棄皇后，棋局就會陷入僵局。但他太累了，誤以為被將軍是無可避免的，于是認輸了。

對手跳了起來，開始大笑。他問："你為什么要認輸？這是平局。"然后他立刻用夸張的動作，給Demis演示平局該怎么走棋。

Demis感到很不舒服。但真正讓他開始思考的，不是這次挫敗本身，而是他環顧四周時看到的景象：

教堂里坐著數百名國際象棋棋手。所有人都在全神貫注地對弈，消耗著巨大的腦力。

他突然想到一個問題：

"我們是在浪費頭腦嗎？這就是腦力最好的用武之地嗎？如果可以把那300個大腦連接到一個系統上，那種腦力水平也許能夠用于根治癌癥。"

那一刻，即便熱愛國際象棋，Demis也決定：這不該是他一生的事業。

這個12歲時的問題，成為了他一生的追問：智力的最好用處是什么？

6年后，當Peter Molyneux提出100萬英鎊時，Demis拒絕的原因很簡單：

做游戲不是答案。錢也不是。

他要去找那個答案。

30年后，2024年10月，Demis Hassabis因為用AI解決了50年未解的蛋白質折疊問題，獲得了諾貝爾化學獎。

這篇文章想講的，不只是他怎么拿到諾貝爾獎，而是他怎么找到了那個12歲時的問題的答案。

答案就是一個詞：Simulation（模擬）。

這個詞貫穿了他整個人生。

一、17歲：第一次模擬一個世界

要理解Demis為什么拒絕100萬英鎊，得先知道他是怎么走到那一步的。

Demis 4歲學國際象棋，幾周后就擊敗了父親和叔叔。13歲時達到大師級別（Elo 2300），Under-14年齡組的世界第二。

列支敦士登的那次挫折，讓他開始思考國際象棋之外的可能性。

1990年，他看到雜志上的一個比賽廣告：創作《太空侵略者》的原創版本，獲勝者能去牛蛙制作公司（Bullfrog Productions）工作。

Demis做了一款叫《國際象棋入侵者》的游戲，贏得了比賽。

創始人Peter Molyneux至今記得他第一次見到Demis的場景："他走進門，看上去大概12歲上下。我心想：'天啊，我們該拿他怎么辦？'"

因為太小不能合法雇用，Demis的薪水都是裝在棕色紙信封里發的。

1994年，17歲的Demis和Peter Molyneux一起設計了那款改變他命運的游戲：《主題公園》。

玩家可以建造主題公園，設計過山車，給炸魚薯條店的東西定價。

但最重要的是：游戲里的游客有自主行為。

Demis設計的AI模擬了真實的人類行為：

如果離驚險的過山車距離太近，過山車上剛吃過東西的人就會嘔吐
當其他人看到地上的嘔吐物時，他們也會嘔吐
這樣就得有很多清掃人員，以便趕在被人們看到前快速清掃干凈

這些細微的模擬動作，Peter Molyneux說，是"前所未有的發明，獨一無二"。

這是Demis第一次用代碼模擬一個世界。他發現了一件事：模擬不只是娛樂，模擬是理解世界的方式。

游戲大獲成功。1500萬份。

Peter看到了Demis的天賦，于是提出了那個100萬英鎊的條件。

但Demis拒絕了。

同學都覺得他瘋了："你為什么不拿錢？100萬英鎊可是一大筆錢！"

Demis心里很清楚：做游戲很有趣，也能賺錢。但那不是12歲時那個問題的答案。

他要去劍橋，去理解什么是智能，什么是理解。

Demis去了劍橋，學Computer Science。但真正改變他軌跡的，是1997年發生的一件事。

二、劍橋：模擬不是計算，理解才是智能

1997年5月，IBM的"深藍"擊敗了國際象棋世界冠軍卡斯帕羅夫。

全世界都在歡呼人工智能的勝利，但Demis的反應很不一樣。

他說："我對'深藍'的印象并不深，卡斯帕羅夫的思維讓我印象更深。"

為什么？

"卡斯帕羅夫在國際象棋上的造詣跟野獸般的機器不分伯仲，但卡斯帕羅夫還能做到人類能做到的其他所有事。這是一項巨大的成就，而'深藍'只會下象棋。它的系統里缺少了我們所認為的智能，即通用性和學習的想法。"

深藍是暴力計算。它每秒評估2億個棋局，靠窮舉，不是理解。

Demis意識到：真正的智能不是計算，是理解。

而理解的核心能力，是模擬。

在劍橋，他接觸到不同學科的人——生物學家、哲學家、藝術家。有人不斷跟他講一個問題："蛋白質折疊"。

蛋白質是生命的機器。由氨基酸鏈構成，折疊形成特定結構。如果能從氨基酸序列預測蛋白質結構，就能設計出治愈癌癥或分解塑料的新型蛋白質。

這個問題從20世紀60年代起就有人研究，但沒人解決。

Demis當時想："人類是否真的智慧到能夠折疊蛋白質？我覺得它是可以解決的，但我認為需要人工智能來解決。"

但在創辦AI公司之前，他決定先去理解人類大腦本身是如何工作的。

2005年，他去了UCL（倫敦大學學院），攻讀神經科學PhD。

三、神經科學：大腦如何模擬未來？

Demis在UCL的研究主題是：想象、記憶和失憶癥。

他想搞清楚的核心問題是：人類大腦是如何模擬未來場景的？

他的第一篇論文發表在PNAS上，是個里程碑式的發現：

海馬體****受損的患者，既有失憶癥（無法記憶過去），也無法想象新體驗（無法模擬未來）。

這證明了：記憶和想象是同一個系統。

換句話說，大腦模擬未來的能力，依賴于它存儲過去經驗的能力。

這篇論文被Science雜志評為"2007年度十大科學突破"之一。

但對Demis來說，這個發現的意義遠不止于此。它回答了一個更深層的問題：

什么是智能？

Demis的答案是：智能就是模擬的能力。

一個智能系統，不只是記住過去發生了什么，還要能模擬未來可能發生什么，然后基于這些模擬做決策。

這讓人想起物理學家Richard Feynman說過的一句話：

**"What I cannot create, I do not understand."**（凡是我不能創造的，說明我還不夠理解。）

Demis想明白了：要理解智能，就要能創造智能系統。而創造的方式，就是模擬。

DeepMind后來做的所有事，都是這個思路。

2007年，在UCL的一次演講上，Demis遇到了Shane Legg。

Shane當時在講："機器真的變得更智能了嗎？有人說是，有人說不是。它們現在的計算速度變得快多了，但在通用智能方面，我們真的在進步嗎？"

兩個人聊完后，Demis感覺："我們倆守護著一個不為人知的秘密。"

那個秘密是：通用人工智能（AGI）是可能的，而且需要用模擬的方式去實現，而不是深藍那樣的暴力計算。

但在學術界，這個想法是不被接受的。

Demis說："學術界沒人會支持我們所做的事。幾乎可以說在學術界，'人工智能'一詞是個令人尷尬的詞。如果你說自己在研究人工智能，那顯然你不是一個真正的科學家。"

所以，他說服Shane：正確的做法是創辦一家公司。

四、DeepMind：在模擬中自我進化

2010年，DeepMind成立。前兩年完全隱身，辦公室在秘密地點，沒有網站。

去面試的人會說："我剛剛給我妻子發了短信告訴她我要去的具體地方，以防這是個可怕的騙局，我會遭到綁架。"

他們在做什么？

Demis的目標很清楚：建造世界上第一臺通用學習機器。

他們的方法是：讓AI在模擬環境中自我學習。

第一個測試是雅達利游戲。

他們創建了一種叫DQN的算法，結合了強化學習和深度學習。目標是：用同一個系統，玩幾十款不同的游戲。

第一個游戲是Pong（乓）。

開始時，AI根本不知道要做什么。它只知道得分是好事，其他什么都不知道——不知道自己在控制什么，不知道規則，不知道目標。

Demis當時對Shane說："也許我們錯了，我們甚至連《乓》都玩不好。"

但突然，它拿到了第一分。

"這是偶然嗎？不，不是。它真的得分了。"

接著它得了一些分，然后贏了第一場比賽。3個月后，沒有人類能擊敗它。

從像素到動作，完全自學。這在當時是第一次有人做到。

然后他們試了《Breakout》（打磚塊）。

300場比賽后，它的水平幾乎和任何人類一樣出色。但他們讓系統又玩了200場比賽，它做了一件很驚人的事：

它發現最佳策略是在一側打通一條通道，把球打到墻后面。

這不是人類教它的。這是它自己在模擬中發現的。

50個游戲之后，DQN可以從頭開始自我訓練，達到人類水平甚至超過。

2014年，Google以4億英鎊收購了DeepMind。

但真正讓全世界震驚的，是2016年發生的事。

五、AlphaGo：模擬出人類從未走過的棋

圍棋被認為是人工智能的圣杯。它的潛在棋譜比宇宙中的原子還多。

多年來，所有用AI試驗圍棋的嘗試都失敗了。

2016年3月，韓國首爾，AlphaGo對戰李世石——過去十年里最偉大的棋手之一，"圍棋界的羅杰·費德勒"。

第37步棋，AlphaGo走了一步沒有哪個人類棋手會走的棋。

專業評論員說：AlphaGo認為，這步棋只有萬分之一的概率是人類會走的。

但它走了。而且是對的。

一位棋手說："我原以為AlphaGo是基于概率計算的，而且它只是一臺機器。但AlphaGo肯定很有創意。圍棋已經被研究了幾千年，AlphaGo發現了一些全新的東西。"

AlphaGo贏了。李世石投子認輸。

這一刻，全世界意識到：地球上誕生了新事物。

對中國來說，這是"斯普特尼克時刻"——像1957年蘇聯發射人造衛星一樣，引發了全球AI競賽。

但Demis沒有停下來。

2017年，DeepMind發布了AlphaZero。

AlphaGo是基于人類數據訓練的——它先觀看了10萬場厲害的業余棋手的比賽，然后通過強化學習與自己對弈數百萬次。

但AlphaZero完全不需要人類數據。

它剝離了所有人類的知識，完全從零開始，在模擬中與不同版本的自己對弈，從錯誤中學習。

訓練速度有多快？

AlphaGo需要幾個月。

AlphaZero早上開始訓練，完全隨機對弈。到茶歇時達到超人類水平。到晚餐時，成為有史以來最強大的象棋實體。

它成了自己的老師。

Demis一直相信的事得到了證明：真正的智能不是學習人類的經驗，而是在模擬中自我進化。

但他想做的，遠不止游戲。

六、AlphaFold：模擬生命的基礎

2018年，DeepMind參加了CASP——蛋白質結構預測關鍵評估，每兩年舉行一次，被稱為"蛋白質折疊的奧運會"。

評分標準：超過90分算成功。

CASP13的結果出來了：DeepMind以50%的優勢擊敗了第二名。

但約翰·穆特（CASP的聯合創始人）說了一句話，讓Demis很失望：

"阿爾法折疊沒有獲得足以讓其切實得以被利用的數據。"

諾貝爾獎得主Paul Nurse也說："比如說像我這樣的人查驗我自己的生理問題——阿爾法折疊做不到。"

Demis后來回憶："那個時刻讓人感覺有些慚愧。我們覺得自己非常努力，也成功了，而且在一個難住了全世界的問題上我們的表現是最好的。我們知道我們很爛。"

團隊里有人開始質疑："這在某種程度上是一場愚蠢的冒險。也許考慮人工智能的現狀，那還是太難了。"

有人說了一句話："最長的梯子并不能幫你登上月球。"

什么意思？用現有的方法優化，可能永遠也到不了目標。需要完全不同的思路。

2019年，Demis做了一個決定：

"從這里開始，我們需要加倍努力并盡快實現。我覺得我們不能再浪費時間了。"

他組建了一個突擊小組，約翰·江珀（John Jumper）擔任組長，加入了生物學專家。

關鍵是：他們重寫了整個數據管道，而不是在原有系統上修修補補。

有人說："你必須給那些花朵綻放的空間，不能在創作階段強迫它。"

4個月后，進展出現了。

速度突破：CASP13期間1-2天折疊1個蛋白質，現在1秒折疊數十萬個。

質量突破：許多結構達到高精度水平。

2020年11月，CASP14的結果公布了。

約翰·穆特發來郵件：

"你們團隊在CASP14中表現得非常出色，不論是相對于其他組還是在模型的絕對準確性方面。恭喜你們完成了這項工作，真的非常出色。"

約翰·江珀說："半個世紀之后，我們終于找到了蛋白質折疊問題的解決方案。"

Demis給父母打電話："嘿，媽媽，我有事要告訴你。我們做了一件事，可能是件大事。"

接下來，Demis做了一個決定：

"我們想將這個公開，不僅確保代碼是公開的，我們還要讓所有人都能便利地獲得這些預測結果。"

他們在一個月內預測了所有已知的序列，公開了2億個蛋白質結構。

發布當天，從655個用戶暴漲到10萬個并發用戶。

Demis說："這些是饋贈給人類的禮物。"

2024年，Demis Hassabis和John Jumper因為這項工作，獲得了諾貝爾化學獎。

但故事還沒有結束。

七、World Models：模擬世界，才能理解世界

2025年12月，在一次年終訪談中，Demis談到了DeepMind現在在做的事：World Models（世界模型）。

他說了一段很關鍵的話：

"LLM理解語言，但缺少空間感知。World Models理解物理世界的因果關系。"

這是DeepMind和大多數AI公司的差異。

大多數公司在做什么？

Scaling LLM——讓模型更大，數據更多，訓練更久。LLM學的是語言的統計規律。

但Demis認為，這還不夠。

費曼說過："凡是我不能創造的，說明我還不夠理解。"

Demis現在要做的，就是創造（模擬）整個物理世界，來真正理解世界。

真正的智能，需要模擬物理世界。

DeepMind現在有兩個系統：Genie和Simma。

Genie生成可交互的虛擬世界，Simma在虛擬世界中探索。

把它們組合起來：Simma在Genie生成的世界中學習，Genie按需生成無限的訓練場景，AI可能實現"自我進化"。

這就像當年的AlphaZero：不需要人類數據，在模擬中自我學習。

但這次模擬的不是圍棋，而是整個物理世界。

Demis說：

"我的夢想是在模擬中重新運行生命進化，觀察意識、社會結構如何涌現，理解我們從哪里來。"

這讓人想起他在劍橋時的那個直覺：蛋白質折疊可以用AI解決。

現在他在追問更大的問題：意識、創造力、情感…這些是可計算的嗎？

他說：

"這是我人生的核心問題：圖靈機的極限在哪里？到目前為止，宇宙中沒有發現任何不可計算的事物。"

"如果我們造出AGI，然后用它模擬人類心智，對比真實心智，就能看出差異在哪里。也許差異是creativity？emotions？dreaming？consciousness？這將回答'人之為人'的本質。"

當AlphaGo擊敗李世石時，Demis說他的感受很復雜：

"我既興奮又有點失落。圍棋是美麗的神秘，我們破解了它。這有點苦樂參半。"

科學家的宿命是：解開謎題的同時，失去神秘感。

但Demis還是選擇了這條路。

尾聲：智力的最好用處

從12歲在列支敦士登的教堂里問出那個問題，到48歲獲得諾貝爾獎，Demis花了36年。

回過頭看，他的整個人生都在圍繞一個核心理念：Simulation（模擬）。

17歲，他模擬了一個主題公園。神經科學PhD，他研究大腦如何模擬想象和記憶。AlphaGo/AlphaZero，在模擬對弈中自我進化。AlphaFold，模擬蛋白質折疊。World Models，模擬整個物理世界。

而他一直在追問的，是那個12歲時的問題：智力的最好用處是什么？

答案是：

用最好的頭腦，去模擬和理解整個世界。

不是為了下好一盤棋，不是為了贏一場比賽，而是為了解決癌癥、阿爾茨海默病、能源危機、氣候變化——那些真正能改變人類命運的問題。

在2025年的那次訪談里，Demis說：

"我的使命是幫助全人類安全地跨越AGI這條線。完成這個任務后，我會好好休個假。"

"我為這個時刻準備了一生。從下棋、做游戲、研究神經科學…都是為了這個時刻。"

"這是我一生一直為之奮斗的時刻。"

也許，這就是智力的最好用處。

主要參考信源：

Demis最近一期播客訪談（The future of intelligence）：https://www.youtube.com/watch?v=PqVbypvxDto

DeepMind和Demis的紀錄片（The Thinking Game）：https://www.youtube.com/watch?v=d95J8yzvjbQ

非常建議找個下午或者晚上的時間，沐浴更衣，花三個小時時間把這兩個視頻看完。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

AI進化論花生

AI博主，AppStore付費榜第一的小貓補光燈app開發者

182文章數 109關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

手機

數碼

旅游

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Google AI掌門人Demis Hassabis：比爽文更爽的開掛人生

Meta凌晨首發閉源大模型 扎克伯格又行了？

以色列總理：同意與黎巴嫩直接談判

以色列總理：同意與黎巴嫩直接談判

8萬人面前心臟驟停 現在他還站在球場上

金莎官宣結婚 與老公孫丞瀟相差18歲

停火又懸了，最糟糕的情況要來了？

文飛掌舵，給神行者帶來了什么？

態度原創

戰亂中趕工？阿聯酋首個賭場度假村?，明年建成！

榮耀600系列再次曝光：AI兩億主攝+AI按鍵，電池超大！

華為多款新品在路上：Pura 90、闊折疊、AI眼鏡、平板耳機全都有

溫州園博會來了！下高鐵10分鐘入園，100天免費逛

Meta凌晨首發閉源大模型扎克伯格又行了？

8萬人面前心臟驟停現在他還站在球場上

金莎官宣結婚與老公孫丞瀟相差18歲