作者 | 辰辰
出品 | 網(wǎng)易科技
李飛飛、楊立昆、馬斯克,這三位頂級(jí)大腦正在“合謀”一件大事。
他們不再執(zhí)著于卷大模型,而是開啟了AI的下半場:世界模型(World Models)。
![]()
(圖片由AI生成)
他們的野心早已超越了寫詩或敲代碼,而是試圖通過這項(xiàng)黑科技,在數(shù)字空間里徹底“重造”一個(gè)符合物理規(guī)律的真實(shí)世界。而那個(gè)產(chǎn)值1900億美元的電子游戲產(chǎn)業(yè),不過是這場宏大造物實(shí)驗(yàn)的第一個(gè)“試驗(yàn)田”。
1. “空間智能”:李飛飛的降維打擊
長期以來,AI一直被困在文字和像素的“扁平世界”里。ChatGPT懂語言邏輯,但不理解重力;Sora能生成視頻,卻經(jīng)常讓視頻里的吸管穿透杯子。
![]()
曾憑借ImageNet開啟深度學(xué)習(xí)時(shí)代的“AI教母”李飛飛正試圖打破這道墻。她新近創(chuàng)立的獨(dú)角獸公司World Labs估值已超10億美元,在今年11月份亮出了首張王牌:名為 Marble 的商用世界模型平臺(tái)。
Marble不只是生成視頻。它可以根據(jù)你的一句話、一張照片,瞬間生成一個(gè)可實(shí)時(shí)進(jìn)入、自由探索、符合物理邏輯的3D世界。

李飛飛在最新宣言中直言:“這超越了語言的邊界。”她將這種能力稱為“空間智能(Spatial Intelligence)”。在Marble平臺(tái)上,用戶輸入“一個(gè)賽博朋克風(fēng)格的小巷”,AI給出的不再是一張畫,而是一個(gè)可以像玩《賽博朋克2077》一樣走進(jìn)去、回頭看、甚至導(dǎo)出的三維關(guān)卡。
![]()
(圖片由AI生成,不代表實(shí)際效果)
李飛飛直言不諱地將矛頭對(duì)準(zhǔn)了業(yè)界霸主:“Unity和Epic的Unreal(虛幻引擎)都到了該被‘顛覆’的時(shí)候了。”傳統(tǒng)的模擬游戲引擎將迎來改進(jìn),而世界模型可能會(huì)徹底顛覆這一領(lǐng)域。
2. 楊立昆的“反擊”:為什么LLM只是“復(fù)讀機(jī)”?
就在李飛飛發(fā)力的同時(shí),AI界另一位泰斗楊立昆也坐不住了。
![]()
上月底,他正式宣布創(chuàng)辦AMI Labs(高級(jí)機(jī)器智能實(shí)驗(yàn)室),并開出了驚人的價(jià)碼。據(jù)報(bào)道,公司正尋求以30億歐元(約35億美元)的估值融資5億歐元(約5.86億美元)。
楊立昆一直是“大語言模型(LLM)”最激烈的批評(píng)者。他認(rèn)為現(xiàn)在的聊天機(jī)器人只是在玩概率游戲,根本沒有真正的常識(shí)。“世界模型”則是他的終極方案。
![]()
(圖片由AI生成)
與LLM不同,楊立昆的世界模型試圖讓AI像人類一樣通過觀察和感官數(shù)據(jù)(視頻、聲音、傳感器)來學(xué)習(xí):如果我推一下杯子,它會(huì)倒嗎?如果我松手,球會(huì)掉嗎?這種對(duì)因果律和物理規(guī)律的理解,將從根本上解決AI的“幻覺”問題。
有趣的是,AMI Labs挖來了明星醫(yī)療AI初創(chuàng)公司Nabla的聯(lián)合創(chuàng)始人亞歷克斯·勒布倫(Alex LeBrun)擔(dān)任CEO。勒布倫是一個(gè)深諳商業(yè)化的狠角色,他曾將自己的初創(chuàng)公司賣給Facebook。這意味著楊立昆不再滿足于實(shí)驗(yàn)室里的學(xué)術(shù)研究,他要直接切入醫(yī)療和游戲等實(shí)戰(zhàn)賽道。
3. 谷歌DeepMind Genie 3:實(shí)時(shí)生成的“頭號(hào)玩家”
如果說楊立昆是在為世界模型勾勒邏輯藍(lán)圖,那么谷歌DeepMind則直接端出了“造物主”的原型機(jī)。
就在李飛飛與楊立昆相繼亮劍時(shí),DeepMind也祭出了技術(shù)“大殺器” Genie 3。這不再是一個(gè)只能看、不能碰的視頻生成器,而是一個(gè)能夠實(shí)時(shí)生成、實(shí)時(shí)交互的動(dòng)態(tài)世界模型。
![]()
“這可能是通往AGI(通用人工智能)最關(guān)鍵的拼圖。”DeepMind研究科學(xué)家杰克·帕克-霍爾德(Jack Parker-Holder)這樣評(píng)價(jià)。
![]()
(圖片由AI生成,不代表實(shí)際效果)
Genie 3的驚人之處在于它對(duì)“交互”的定義。它能以每秒24幀的速度、720p的分辨率,實(shí)時(shí)響應(yīng)用戶的文本指令。當(dāng)你輸入一段指令,它不是給你一張靜態(tài)圖,而是瞬間“渲染”出一個(gè)數(shù)字世界。
但最令內(nèi)部團(tuán)隊(duì)感到不可思議的,是它展現(xiàn)出的“物理記憶”功能。在傳統(tǒng)的AI生成畫面中,物體往往是“轉(zhuǎn)瞬即逝”的——你轉(zhuǎn)個(gè)身,身后的樹可能就變成了電線桿。但Genie 3擁有物理一致性:
· 墻上的油漆: 如果你在虛擬世界里給一面墻刷了紅漆,即便你走開去探索森林再回來,那抹紅漆依然會(huì)留在原地。
· 真實(shí)反饋: 無論是走過沙地的阻力、滑雪時(shí)的慣性,還是游泳時(shí)的浮力,Genie 3都能給出準(zhǔn)確的反饋。
![]()
(圖片由AI生成)
最令人細(xì)思極恐的是: Genie 3的這些物理常識(shí),并非由程序員手工編寫的代碼定義的。 DeepMind研究總監(jiān)施洛米·弗魯克特(Shlomi Fruchter)透露,模型從未被告知什么是“水”,什么是“摩擦力”。這種模擬現(xiàn)實(shí)的能力,完全是在海量數(shù)據(jù)訓(xùn)練中“自發(fā)涌現(xiàn)”的。這意味著,AI正在通過觀察人類世界的影像,自己推導(dǎo)出了牛頓力學(xué)。
研究團(tuán)隊(duì)堅(jiān)信,Genie 3將成為具身智能的最佳練兵場。在昂貴的原型機(jī)器人踏入現(xiàn)實(shí)世界之前,它們可以在Genie 3創(chuàng)造的無限個(gè)、高保真的模擬環(huán)境中訓(xùn)練數(shù)百萬次。盡管DeepMind謙遜地承認(rèn),目前的模型距離“完美模擬現(xiàn)實(shí)”還有一段路要走,但他們已經(jīng)計(jì)劃開放這一模型。顯然,谷歌不甘心只做旁觀者,它要直接定義未來3D交互的標(biāo)準(zhǔn)。
4. 馬斯克與xAI:我也來造一個(gè)
如果說從實(shí)驗(yàn)室走出來的AI科學(xué)家們還在談?wù)摗翱臻g智能”、“因果律”和“物理涌現(xiàn)”,馬斯克的風(fēng)格則是一貫的“暴力美學(xué)”:招最貴的人,做最狂的事。
![]()
今年夏天,馬斯克的xAI就從英偉達(dá)挖走了Zeeshan Patel和Ethan He等多位頂級(jí)研究員,組建“Omni團(tuán)隊(duì)”。這些專家的年薪最高達(dá)44萬美元(約合人民幣320萬元)。不僅如此,馬斯克的xAI還在社交媒體平臺(tái)X上公開招聘“游戲?qū)煛保瑫r(shí)薪高達(dá)100美元,專門教他的AI模型Grok如何“打游戲”和設(shè)計(jì)游戲。
![]()
馬斯克的賭約是:在2026年底前,推出一款完全由AI生成的偉大游戲。
![]()
(圖片由AI生成)
對(duì)于馬斯克而言,游戲只是練兵場。世界模型在3D環(huán)境中的表現(xiàn),將直接關(guān)乎他的人形機(jī)器人Optimus能否在現(xiàn)實(shí)中熟練疊衣,以及特斯拉的FSD(完全自動(dòng)駕駛)能否處理復(fù)雜的物理突發(fā)狀況。正如英偉達(dá)所言:世界模型的潛在市場規(guī)模,幾乎等同于現(xiàn)有的全球經(jīng)濟(jì)規(guī)模。
5. 1900億美元的誘惑與10億美元的豪賭
為什么巨頭們都盯上了游戲?
根據(jù)Newzoo的數(shù)據(jù),全球視頻游戲產(chǎn)業(yè)今年預(yù)計(jì)將產(chǎn)生近1900億美元的營收。但在光鮮的數(shù)據(jù)背后,是日益難以為繼的成本危機(jī):
· 一款3A大作的開發(fā)周期已經(jīng)延長至5到7年。
· 制作成本動(dòng)輒超過10億美元。
· 成千上萬的藝術(shù)家在機(jī)械地進(jìn)行“磨皮”和“搬磚”等枯燥工作。
![]()
(圖片由AI生成)
Genie 3項(xiàng)目負(fù)責(zé)人弗魯克特預(yù)測:“游戲創(chuàng)作將在未來幾年內(nèi)發(fā)生徹底改變。”
目前的AI已經(jīng)能幫開發(fā)者把視頻游戲的開發(fā)速度提升4倍。今年谷歌云的一項(xiàng)調(diào)查顯示,將近90% 的視頻游戲開發(fā)者都在使用AI智能體來提高效率。有用戶預(yù)測,2026年用戶可直接提示AI創(chuàng)建類似《上古卷軸》的RPG游戲。
![]()
以開發(fā)手游《異形大戰(zhàn)僵尸:入侵》(Aliens vs Zombies: Invasion)的Game Gears工作室為例,其CEO亞歷山大·瓦先科(Alexander Vaschenko)斷言:“很快,電影和游戲行業(yè)如果不靠AI,將一天也轉(zhuǎn)不下去。”
有用戶更是認(rèn)為,傳統(tǒng)3A游戲開發(fā)模式已死。現(xiàn)在,AI允許工作室先生成預(yù)告片和玩法來測試玩家興趣,再?zèng)Q定是否投入開發(fā),從而極大降低風(fēng)險(xiǎn)。AI將讓游戲行業(yè)從動(dòng)輒數(shù)年、數(shù)億美元的開發(fā)周期,轉(zhuǎn)向高效的原型測試。
![]()
在不久的將來,所謂的“3D建模”和“復(fù)雜的開發(fā)軟件”將成為歷史。一個(gè)普通玩家坐在電腦前,對(duì)著麥克風(fēng)說:“給我創(chuàng)造一個(gè)《指環(huán)王》風(fēng)格的開放世界,但我想要它是粉紅色的,”AI就能實(shí)時(shí)為你構(gòu)建一個(gè)獨(dú)一無二的游樂場。
![]()
(圖片由AI生成)
6. 前進(jìn)的代價(jià)?“內(nèi)容垃圾”與工會(huì)的怒火
然而,每一個(gè)技術(shù)奇點(diǎn)的背后,都投射著陰影。
本月,六個(gè)歐洲視頻游戲工會(huì)發(fā)出了憤怒的集體抗議,譴責(zé)AI的過度使用。他們認(rèn)為,公司正在強(qiáng)迫員工使用這些工具,而代價(jià)是工作條件的惡化和大規(guī)模的裁員。
更大的沖突在于藝術(shù)的完整性。批評(píng)者擔(dān)心,當(dāng)AI世界模型可以無限量產(chǎn)3D環(huán)境時(shí),玩家將面對(duì)海量的“內(nèi)容垃圾”——那些看起來精美、符合邏輯,卻毫無靈魂、缺乏人類審美溫度的平庸之作。
![]()
(圖片由AI生成)
《博德之門3》開發(fā)商Larian Studios的負(fù)責(zé)人邁克爾·多斯(Michael Douse)就在X上潑了一盆冷水:“游戲行業(yè)缺的不是工具,而是領(lǐng)導(dǎo)力和愿景。” 他認(rèn)為,行業(yè)不需要更多“數(shù)學(xué)生成的、心理學(xué)訓(xùn)練的玩法循環(huán)”,而是需要人類的情感表達(dá)。
7. 結(jié)語:在數(shù)字世界里“尋找樂趣”
面對(duì)爭議,DeepMind專家、前育碧制作人亞歷山大·穆法雷克(Alexandre Moufarek)給出了一個(gè)更溫情的視角。
![]()
(圖片由AI生成)
他回憶起在傳統(tǒng)大廠開發(fā)游戲的日子:圣誕節(jié)臨近,由于工期太緊,開發(fā)者根本沒時(shí)間去打磨細(xì)節(jié)、去Debug,更沒時(shí)間去實(shí)驗(yàn)?zāi)切┋偪竦男曼c(diǎn)子。
“我希望世界模型能把時(shí)間還給開發(fā)者,” 穆法雷克說,“讓他們重新去‘尋找樂趣’,去冒險(xiǎn)嘗試,而不是被重復(fù)的體力勞動(dòng)壓垮。”
這番話道出了變革的初衷:讓AI承擔(dān)物理世界的繁重,讓人類回歸精神世界的創(chuàng)造。
![]()
(圖片由AI生成)
李飛飛、楊立昆和馬斯克殊途同歸的背后,是AI進(jìn)化邏輯的根本性躍遷。從LLM的“鸚鵡學(xué)舌”到世界模型的“洞察物理”,AI正在補(bǔ)全它認(rèn)知拼圖中最關(guān)鍵的一塊。
在這場豪賭中,游戲產(chǎn)業(yè)只是被選中的第一個(gè)“幸運(yùn)兒”。我們正在見證的,不只是游戲開發(fā)方式的顛覆,而是AI從“觀察者”向“造物者”的驚人蛻變。
