你現(xiàn)在17歲,有人給了你提供了兩個選擇:
選項A:拿下1000萬,別去讀大學(xué)
選項B:去劍橋念書
你怎么選擇?給你10秒鐘時間思考。
你可能常常在小紅書、公眾號、虎撲看到這樣的選擇題,大多數(shù)人只會想問:我該去哪領(lǐng)錢?
但...這個極端不現(xiàn)實的場景,確實Google AI的負(fù)責(zé)人在31年前真實面臨的選擇。
![]()
1993年,16歲的Demis Hassabis被劍橋大學(xué)錄取了,但因為年紀(jì)太小,還不滿足入學(xué)的條件,所以需要等一年再去讀大學(xué)。
怎么利用這一年的Gap Year呢?
環(huán)游世界?還是在家玩游戲?
都不是,從小愛玩游戲的Demis Hassabis選擇去一家游戲公司打「黑工」。
也就是在這一年時間內(nèi),他主導(dǎo)設(shè)計了一款史上十大最暢銷游戲之一——《主題公園》(Theme Park),這款游戲累計賣出了超過1500萬份。
![]()
Peter Molyneux是全歐洲最好的游戲公司創(chuàng)始人。他提出了一個條件:
給Demis 100萬英鎊,但他不能去讀大學(xué)。
那在20世紀(jì)90年代是一大筆錢。對于一個17歲的窮小子來說,這是改變命運的機(jī)會。
但Demis拒絕了。
他說:"我從一開始就有個計劃。我的計劃一直都是要去劍橋大學(xué)讀書。"
Peter至今依然記得送Demis去火車站的那天:"他就如同一粒即將破土而出的小種子,但在牛蛙制作公司,他是無法做到的。我至今依然記得這個小精靈角色消失在那條隧道里的畫面。那是個令人極其傷感的時刻。"
為什么?
一個17歲的天才少年,怎么會有魄力拒絕100萬英鎊?
他在追求什么?
答案要從6年前說起。
![]()
1988年,列支敦士登的一個山間教堂里,12歲的Demis正在參加一場國際象棋錦標(biāo)賽。
對手是前丹麥冠軍,三十幾歲。比賽持續(xù)了10個小時。
到了最后,Demis明明可以逼成平局——只需要放棄皇后,棋局就會陷入僵局。但他太累了,誤以為被將軍是無可避免的,于是認(rèn)輸了。
對手跳了起來,開始大笑。他問:"你為什么要認(rèn)輸?這是平局。"然后他立刻用夸張的動作,給Demis演示平局該怎么走棋。
Demis感到很不舒服。但真正讓他開始思考的,不是這次挫敗本身,而是他環(huán)顧四周時看到的景象:
教堂里坐著數(shù)百名國際象棋棋手。所有人都在全神貫注地對弈,消耗著巨大的腦力。
他突然想到一個問題:
"我們是在浪費頭腦嗎?這就是腦力最好的用武之地嗎?如果可以把那300個大腦連接到一個系統(tǒng)上,那種腦力水平也許能夠用于根治癌癥。"
那一刻,即便熱愛國際象棋,Demis也決定:這不該是他一生的事業(yè)。
這個12歲時的問題,成為了他一生的追問:智力的最好用處是什么?
6年后,當(dāng)Peter Molyneux提出100萬英鎊時,Demis拒絕的原因很簡單:
做游戲不是答案。錢也不是。
他要去找那個答案。
30年后,2024年10月,Demis Hassabis因為用AI解決了50年未解的蛋白質(zhì)折疊問題,獲得了諾貝爾化學(xué)獎。
這篇文章想講的,不只是他怎么拿到諾貝爾獎,而是他怎么找到了那個12歲時的問題的答案。
答案就是一個詞:Simulation(模擬)。
這個詞貫穿了他整個人生。
一、17歲:第一次模擬一個世界
要理解Demis為什么拒絕100萬英鎊,得先知道他是怎么走到那一步的。
Demis 4歲學(xué)國際象棋,幾周后就擊敗了父親和叔叔。13歲時達(dá)到大師級別(Elo 2300),Under-14年齡組的世界第二。
列支敦士登的那次挫折,讓他開始思考國際象棋之外的可能性。
1990年,他看到雜志上的一個比賽廣告:創(chuàng)作《太空侵略者》的原創(chuàng)版本,獲勝者能去牛蛙制作公司(Bullfrog Productions)工作。
Demis做了一款叫《國際象棋入侵者》的游戲,贏得了比賽。
創(chuàng)始人Peter Molyneux至今記得他第一次見到Demis的場景:"他走進(jìn)門,看上去大概12歲上下。我心想:'天啊,我們該拿他怎么辦?'"
因為太小不能合法雇用,Demis的薪水都是裝在棕色紙信封里發(fā)的。
1994年,17歲的Demis和Peter Molyneux一起設(shè)計了那款改變他命運的游戲:《主題公園》。
玩家可以建造主題公園,設(shè)計過山車,給炸魚薯條店的東西定價。
但最重要的是:游戲里的游客有自主行為。
Demis設(shè)計的AI模擬了真實的人類行為:
如果離驚險的過山車距離太近,過山車上剛吃過東西的人就會嘔吐
當(dāng)其他人看到地上的嘔吐物時,他們也會嘔吐
這樣就得有很多清掃人員,以便趕在被人們看到前快速清掃干凈
這些細(xì)微的模擬動作,Peter Molyneux說,是"前所未有的發(fā)明,獨一無二"。
這是Demis第一次用代碼模擬一個世界。他發(fā)現(xiàn)了一件事:模擬不只是娛樂,模擬是理解世界的方式。
游戲大獲成功。1500萬份。
Peter看到了Demis的天賦,于是提出了那個100萬英鎊的條件。
但Demis拒絕了。
同學(xué)都覺得他瘋了:"你為什么不拿錢?100萬英鎊可是一大筆錢!"
Demis心里很清楚:做游戲很有趣,也能賺錢。但那不是12歲時那個問題的答案。
他要去劍橋,去理解什么是智能,什么是理解。
Demis去了劍橋,學(xué)Computer Science。但真正改變他軌跡的,是1997年發(fā)生的一件事。
二、劍橋:模擬不是計算,理解才是智能
1997年5月,IBM的"深藍(lán)"擊敗了國際象棋世界冠軍卡斯帕羅夫。
![]()
全世界都在歡呼人工智能的勝利,但Demis的反應(yīng)很不一樣。
他說:"我對'深藍(lán)'的印象并不深,卡斯帕羅夫的思維讓我印象更深。"
為什么?
"卡斯帕羅夫在國際象棋上的造詣跟野獸般的機(jī)器不分伯仲,但卡斯帕羅夫還能做到人類能做到的其他所有事。這是一項巨大的成就,而'深藍(lán)'只會下象棋。它的系統(tǒng)里缺少了我們所認(rèn)為的智能,即通用性和學(xué)習(xí)的想法。"
深藍(lán)是暴力計算。它每秒評估2億個棋局,靠窮舉,不是理解。
Demis意識到:真正的智能不是計算,是理解。
而理解的核心能力,是模擬。
在劍橋,他接觸到不同學(xué)科的人——生物學(xué)家、哲學(xué)家、藝術(shù)家。有人不斷跟他講一個問題:"蛋白質(zhì)折疊"。
蛋白質(zhì)是生命的機(jī)器。由氨基酸鏈構(gòu)成,折疊形成特定結(jié)構(gòu)。如果能從氨基酸序列預(yù)測蛋白質(zhì)結(jié)構(gòu),就能設(shè)計出治愈癌癥或分解塑料的新型蛋白質(zhì)。
這個問題從20世紀(jì)60年代起就有人研究,但沒人解決。
Demis當(dāng)時想:"人類是否真的智慧到能夠折疊蛋白質(zhì)?我覺得它是可以解決的,但我認(rèn)為需要人工智能來解決。"
但在創(chuàng)辦AI公司之前,他決定先去理解人類大腦本身是如何工作的。
2005年,他去了UCL(倫敦大學(xué)學(xué)院),攻讀神經(jīng)科學(xué)PhD。
三、神經(jīng)科學(xué):大腦如何模擬未來?
Demis在UCL的研究主題是:想象、記憶和失憶癥。
他想搞清楚的核心問題是:人類大腦是如何模擬未來場景的?
他的第一篇論文發(fā)表在PNAS上,是個里程碑式的發(fā)現(xiàn):
海馬體****受損的患者,既有失憶癥(無法記憶過去),也無法想象新體驗(無法模擬未來)。
這證明了:記憶和想象是同一個系統(tǒng)。
換句話說,大腦模擬未來的能力,依賴于它存儲過去經(jīng)驗的能力。
這篇論文被Science雜志評為"2007年度十大科學(xué)突破"之一。
但對Demis來說,這個發(fā)現(xiàn)的意義遠(yuǎn)不止于此。它回答了一個更深層的問題:
什么是智能?
Demis的答案是:智能就是模擬的能力。
一個智能系統(tǒng),不只是記住過去發(fā)生了什么,還要能模擬未來可能發(fā)生什么,然后基于這些模擬做決策。
這讓人想起物理學(xué)家Richard Feynman說過的一句話:
**"What I cannot create, I do not understand."**(凡是我不能創(chuàng)造的,說明我還不夠理解。)
Demis想明白了:要理解智能,就要能創(chuàng)造智能系統(tǒng)。而創(chuàng)造的方式,就是模擬。
DeepMind后來做的所有事,都是這個思路。
2007年,在UCL的一次演講上,Demis遇到了Shane Legg。
Shane當(dāng)時在講:"機(jī)器真的變得更智能了嗎?有人說是,有人說不是。它們現(xiàn)在的計算速度變得快多了,但在通用智能方面,我們真的在進(jìn)步嗎?"
兩個人聊完后,Demis感覺:"我們倆守護(hù)著一個不為人知的秘密。"
那個秘密是:通用人工智能(AGI)是可能的,而且需要用模擬的方式去實現(xiàn),而不是深藍(lán)那樣的暴力計算。
但在學(xué)術(shù)界,這個想法是不被接受的。
Demis說:"學(xué)術(shù)界沒人會支持我們所做的事。幾乎可以說在學(xué)術(shù)界,'人工智能'一詞是個令人尷尬的詞。如果你說自己在研究人工智能,那顯然你不是一個真正的科學(xué)家。"
所以,他說服Shane:正確的做法是創(chuàng)辦一家公司。
四、DeepMind:在模擬中自我進(jìn)化
2010年,DeepMind成立。前兩年完全隱身,辦公室在秘密地點,沒有網(wǎng)站。
![]()
去面試的人會說:"我剛剛給我妻子發(fā)了短信告訴她我要去的具體地方,以防這是個可怕的騙局,我會遭到綁架。"
他們在做什么?
Demis的目標(biāo)很清楚:建造世界上第一臺通用學(xué)習(xí)機(jī)器。
他們的方法是:讓AI在模擬環(huán)境中自我學(xué)習(xí)。
第一個測試是雅達(dá)利游戲。
他們創(chuàng)建了一種叫DQN的算法,結(jié)合了強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)。目標(biāo)是:用同一個系統(tǒng),玩幾十款不同的游戲。
第一個游戲是Pong(乓)。
![]()
開始時,AI根本不知道要做什么。它只知道得分是好事,其他什么都不知道——不知道自己在控制什么,不知道規(guī)則,不知道目標(biāo)。
Demis當(dāng)時對Shane說:"也許我們錯了,我們甚至連《乓》都玩不好。"
但突然,它拿到了第一分。
"這是偶然嗎?不,不是。它真的得分了。"
接著它得了一些分,然后贏了第一場比賽。3個月后,沒有人類能擊敗它。
從像素到動作,完全自學(xué)。這在當(dāng)時是第一次有人做到。
然后他們試了《Breakout》(打磚塊)。
300場比賽后,它的水平幾乎和任何人類一樣出色。但他們讓系統(tǒng)又玩了200場比賽,它做了一件很驚人的事:
它發(fā)現(xiàn)最佳策略是在一側(cè)打通一條通道,把球打到墻后面。
這不是人類教它的。這是它自己在模擬中發(fā)現(xiàn)的。
50個游戲之后,DQN可以從頭開始自我訓(xùn)練,達(dá)到人類水平甚至超過。
2014年,Google以4億英鎊收購了DeepMind。
但真正讓全世界震驚的,是2016年發(fā)生的事。
五、AlphaGo:模擬出人類從未走過的棋
圍棋被認(rèn)為是人工智能的圣杯。它的潛在棋譜比宇宙中的原子還多。
多年來,所有用AI試驗圍棋的嘗試都失敗了。
2016年3月,韓國首爾,AlphaGo對戰(zhàn)李世石——過去十年里最偉大的棋手之一,"圍棋界的羅杰·費德勒"。
第37步棋,AlphaGo走了一步?jīng)]有哪個人類棋手會走的棋。
專業(yè)評論員說:AlphaGo認(rèn)為,這步棋只有萬分之一的概率是人類會走的。
但它走了。而且是對的。
一位棋手說:"我原以為AlphaGo是基于概率計算的,而且它只是一臺機(jī)器。但AlphaGo肯定很有創(chuàng)意。圍棋已經(jīng)被研究了幾千年,AlphaGo發(fā)現(xiàn)了一些全新的東西。"
AlphaGo贏了。李世石投子認(rèn)輸。
這一刻,全世界意識到:地球上誕生了新事物。
對中國來說,這是"斯普特尼克時刻"——像1957年蘇聯(lián)發(fā)射人造衛(wèi)星一樣,引發(fā)了全球AI競賽。
但Demis沒有停下來。
2017年,DeepMind發(fā)布了AlphaZero。
AlphaGo是基于人類數(shù)據(jù)訓(xùn)練的——它先觀看了10萬場厲害的業(yè)余棋手的比賽,然后通過強(qiáng)化學(xué)習(xí)與自己對弈數(shù)百萬次。
但AlphaZero完全不需要人類數(shù)據(jù)。
它剝離了所有人類的知識,完全從零開始,在模擬中與不同版本的自己對弈,從錯誤中學(xué)習(xí)。
訓(xùn)練速度有多快?
AlphaGo需要幾個月。
AlphaZero早上開始訓(xùn)練,完全隨機(jī)對弈。到茶歇時達(dá)到超人類水平。到晚餐時,成為有史以來最強(qiáng)大的象棋實體。
它成了自己的老師。
Demis一直相信的事得到了證明:真正的智能不是學(xué)習(xí)人類的經(jīng)驗,而是在模擬中自我進(jìn)化。
但他想做的,遠(yuǎn)不止游戲。
六、AlphaFold:模擬生命的基礎(chǔ)
![]()
2018年,DeepMind參加了CASP——蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估,每兩年舉行一次,被稱為"蛋白質(zhì)折疊的奧運會"。
評分標(biāo)準(zhǔn):超過90分算成功。
CASP13的結(jié)果出來了:DeepMind以50%的優(yōu)勢擊敗了第二名。
但約翰·穆特(CASP的聯(lián)合創(chuàng)始人)說了一句話,讓Demis很失望:
"阿爾法折疊沒有獲得足以讓其切實得以被利用的數(shù)據(jù)。"
諾貝爾獎得主Paul Nurse也說:"比如說像我這樣的人查驗我自己的生理問題——阿爾法折疊做不到。"
Demis后來回憶:"那個時刻讓人感覺有些慚愧。我們覺得自己非常努力,也成功了,而且在一個難住了全世界的問題上我們的表現(xiàn)是最好的。我們知道我們很爛。"
團(tuán)隊里有人開始質(zhì)疑:"這在某種程度上是一場愚蠢的冒險。也許考慮人工智能的現(xiàn)狀,那還是太難了。"
有人說了一句話:"最長的梯子并不能幫你登上月球。"
什么意思?用現(xiàn)有的方法優(yōu)化,可能永遠(yuǎn)也到不了目標(biāo)。需要完全不同的思路。
2019年,Demis做了一個決定:
"從這里開始,我們需要加倍努力并盡快實現(xiàn)。我覺得我們不能再浪費時間了。"
他組建了一個突擊小組,約翰·江珀(John Jumper)擔(dān)任組長,加入了生物學(xué)專家。
關(guān)鍵是:他們重寫了整個數(shù)據(jù)管道,而不是在原有系統(tǒng)上修修補(bǔ)補(bǔ)。
有人說:"你必須給那些花朵綻放的空間,不能在創(chuàng)作階段強(qiáng)迫它。"
4個月后,進(jìn)展出現(xiàn)了。
速度突破:CASP13期間1-2天折疊1個蛋白質(zhì),現(xiàn)在1秒折疊數(shù)十萬個。
質(zhì)量突破:許多結(jié)構(gòu)達(dá)到高精度水平。
2020年11月,CASP14的結(jié)果公布了。
約翰·穆特發(fā)來郵件:
"你們團(tuán)隊在CASP14中表現(xiàn)得非常出色,不論是相對于其他組還是在模型的絕對準(zhǔn)確性方面。恭喜你們完成了這項工作,真的非常出色。"
約翰·江珀說:"半個世紀(jì)之后,我們終于找到了蛋白質(zhì)折疊問題的解決方案。"
Demis給父母打電話:"嘿,媽媽,我有事要告訴你。我們做了一件事,可能是件大事。"
接下來,Demis做了一個決定:
"我們想將這個公開,不僅確保代碼是公開的,我們還要讓所有人都能便利地獲得這些預(yù)測結(jié)果。"
他們在一個月內(nèi)預(yù)測了所有已知的序列,公開了2億個蛋白質(zhì)結(jié)構(gòu)。
發(fā)布當(dāng)天,從655個用戶暴漲到10萬個并發(fā)用戶。
Demis說:"這些是饋贈給人類的禮物。"
2024年,Demis Hassabis和John Jumper因為這項工作,獲得了諾貝爾化學(xué)獎。
但故事還沒有結(jié)束。
七、World Models:模擬世界,才能理解世界
2025年12月,在一次年終訪談中,Demis談到了DeepMind現(xiàn)在在做的事:World Models(世界模型)。
![]()
他說了一段很關(guān)鍵的話:
"LLM理解語言,但缺少空間感知。World Models理解物理世界的因果關(guān)系。"
這是DeepMind和大多數(shù)AI公司的差異。
大多數(shù)公司在做什么?
Scaling LLM——讓模型更大,數(shù)據(jù)更多,訓(xùn)練更久。LLM學(xué)的是語言的統(tǒng)計規(guī)律。
但Demis認(rèn)為,這還不夠。
費曼說過:"凡是我不能創(chuàng)造的,說明我還不夠理解。"
Demis現(xiàn)在要做的,就是創(chuàng)造(模擬)整個物理世界,來真正理解世界。
真正的智能,需要模擬物理世界。
DeepMind現(xiàn)在有兩個系統(tǒng):Genie和Simma。
Genie生成可交互的虛擬世界,Simma在虛擬世界中探索。
把它們組合起來:Simma在Genie生成的世界中學(xué)習(xí),Genie按需生成無限的訓(xùn)練場景,AI可能實現(xiàn)"自我進(jìn)化"。
這就像當(dāng)年的AlphaZero:不需要人類數(shù)據(jù),在模擬中自我學(xué)習(xí)。
但這次模擬的不是圍棋,而是整個物理世界。
Demis說:
"我的夢想是在模擬中重新運行生命進(jìn)化,觀察意識、社會結(jié)構(gòu)如何涌現(xiàn),理解我們從哪里來。"
這讓人想起他在劍橋時的那個直覺:蛋白質(zhì)折疊可以用AI解決。
現(xiàn)在他在追問更大的問題:意識、創(chuàng)造力、情感…這些是可計算的嗎?
他說:
"這是我人生的核心問題:圖靈機(jī)的極限在哪里?到目前為止,宇宙中沒有發(fā)現(xiàn)任何不可計算的事物。"
"如果我們造出AGI,然后用它模擬人類心智,對比真實心智,就能看出差異在哪里。也許差異是creativity?emotions?dreaming?consciousness?這將回答'人之為人'的本質(zhì)。"
當(dāng)AlphaGo擊敗李世石時,Demis說他的感受很復(fù)雜:
"我既興奮又有點失落。圍棋是美麗的神秘,我們破解了它。這有點苦樂參半。"
科學(xué)家的宿命是:解開謎題的同時,失去神秘感。
但Demis還是選擇了這條路。
尾聲:智力的最好用處
從12歲在列支敦士登的教堂里問出那個問題,到48歲獲得諾貝爾獎,Demis花了36年。
回過頭看,他的整個人生都在圍繞一個核心理念:Simulation(模擬)。
17歲,他模擬了一個主題公園。神經(jīng)科學(xué)PhD,他研究大腦如何模擬想象和記憶。AlphaGo/AlphaZero,在模擬對弈中自我進(jìn)化。AlphaFold,模擬蛋白質(zhì)折疊。World Models,模擬整個物理世界。
而他一直在追問的,是那個12歲時的問題:智力的最好用處是什么?
答案是:
用最好的頭腦,去模擬和理解整個世界。
不是為了下好一盤棋,不是為了贏一場比賽,而是為了解決癌癥、阿爾茨海默病、能源危機(jī)、氣候變化——那些真正能改變?nèi)祟惷\的問題。
在2025年的那次訪談里,Demis說:
"我的使命是幫助全人類安全地跨越AGI這條線。完成這個任務(wù)后,我會好好休個假。"
"我為這個時刻準(zhǔn)備了一生。從下棋、做游戲、研究神經(jīng)科學(xué)…都是為了這個時刻。"
"這是我一生一直為之奮斗的時刻。"
也許,這就是智力的最好用處。
主要參考信源:
Demis最近一期播客訪談(The future of intelligence):https://www.youtube.com/watch?v=PqVbypvxDto
DeepMind和Demis的紀(jì)錄片(The Thinking Game):https://www.youtube.com/watch?v=d95J8yzvjbQ
非常建議找個下午或者晚上的時間,沐浴更衣,花三個小時時間把這兩個視頻看完。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.