![]()
新智元報道
編輯:KingHZ
【新智元導讀】當全世界都在給大模型添柴加火時,AI教父卻拎包出走,暗示要跑去巴黎造「懂現實世界的機器」。
小扎口頭說支持,卻不愿真金白銀投資!
在Meta工作了12年后,圖靈獎得主Yann LeCun將在年底離職。
上個月,65歲的LeCun宣布今年年底將離開Meta,開始創業。
在離職信中,他表示,正是由于同事持續的關注與支持,Meta將成為這家新公司的合作伙伴,但沒有更多的細節。
在昨日的巴黎AI-Pulse活動上,LeCun表示Meta不是投資者。
![]()
LeCun神秘初創公司不做ChatGPT,要教AI理解物理世界,專注于LeCun所描述的高級機器智能,一種基于視覺等感官信息訓練的AI,用于預測物理世界。
LLM是AI黑洞
全球最大的科技巨頭們一擲千金,將數十億美元砸向AI領域,尤其是那些驅動了ChatGPT、谷歌Gemini和Meta Llama的「大語言模型」(LLM)。
這些AI巨頭相信,Scaling Law足以支持LLM通向AGI。
![]()
但幾個月來,Yann LeCun逆勢而為,擲地有聲:大語言模型(LLM)已觸及天花板。在文本生成上,它們表現出色,但不懂物理世界,缺乏記憶,而且在多步推理上舉步維艱。
博士生不要做LLM。
LLM幾乎過時了。
LLM只是token生成器,屬于System 1,沒有真正推理。
自回歸LLM不具備的、達到人類(甚至是狗類)智能水平所需的四項能力。 ……
總之,他對LLM似乎毫無興趣了,棄之如敝履。
![]()
直到最近,Yann LeCun仍堅信,LLM是AI研究界的「毒瘤」。
上月在布魯克林,Yann LeCun直言不諱:「確實,LLM很棒,也很有用。很多人都會用到它,我們理應投資」。
但問題在于:「眼下,LLM就像個黑洞,把所有的資源和關注都吸干了,導致其他領域幾乎寸草不生。為了下一場革命,我們必須退一步,冷靜思考當前的路徑到底缺失了什么。」
這番言論顯得格外耐人尋味。
幾個月來,Meta豪擲數十億美元,重金招攬全明星陣容的LLM專家。
據OpenAI的首席研究官透露,Meta已經超越純砸錢行為。為了挖走人才,小扎親自端湯送給OpenAI員工:利益和情感,雙管齊下,堪稱硅谷版「三顧茅廬」。
![]()
本質上,這是對Yann LeCun技術路線的一種否定。
作為Meta的首席AI科學家,Yann LeCun卻公開和小扎「唱反調」。
如此劍拔弩張,兩人理念沖突可見一斑。這也難怪,LeCun在加入12年后離開Meta。
LeCun:我做世界模型快10年了
多年來,Yann LeCun一直是 LLM 的堅定批評者。
他始終認為,僅僅依靠從互聯網上「鯨吞」文本,無法產生真正的機器智能。
他認為,自主的機器智能,需要另辟蹊徑:世界模型(World Models)。
在法國AI研究的重點平臺ai-Pulse的全體大會上,Yann LeCun將與世界模型領域的先鋒公司General Intuition的創始人Pim de Witte共同闡述這一愿景,解析世界模型如何成為明日AI的基石,以及下一個重大的技術突破。
![]()
Meta首席AI科學家Yann LeCun、General Intuition首席執行官Pim de Witte、Kyutai首席建模官Neil Zeghidour,以及iliad Group創始人Xavier Niel同臺論道
其實,「世界模型」非常古老。
早在1943年,「人工智能」一詞出現的十二年前,29歲的蘇格蘭心理學家Kenneth Craik在專著中就深思道:
如果生物體能在其頭腦中攜帶外部現實的「小規模模型」……
它就能嘗試多種可能性,推斷出其中最佳的方案……
并以一種更全面、更安全、更得體的方式做出反應。
![]()
他關于心理模型或模擬的概念,預見了在20世紀50年代改變心理學、并至今仍主導認知科學的「認知革命」。
更重要的是,它直接將認知與計算聯系起來:Craik認為,「并行或模擬外部事件的能力」是「神經系統」和「計算機器」兩者共同的根本特征。
大概10年前,LeCun就開始不斷「安利」大家:這才是推動AI進步的道路。
其實,在這件事他思考更久。但直到NeurIPS 2016大會上,他做了個主題報告,那次算是第一次系統公開講:「這就是我們接下來需要攻克的方向」。
![]()
然后,又過了大概5年,他才逐漸意識到:不能只靠生成式模型來做這件事,于是開始發展一種新的、非生成式(non-generative)方法,稱之為JEPA(Joint Embedding Predictive Architecture,聯合嵌入預測架構)。
后來,大語言模型(LLMs)來了,它們是生成式的。
當時, LeCun反應是:「好,這很有趣,用它來做語言非常好用,我們當然應該去研究,能有大量應用。」
但他堅信,這并不是通向人類級智能(或者你愿意怎么叫它都行)的那條路。
也就是說,早在LLM爆發之前,他就得出結論:「僅靠把語言模型Scaling,并不能帶來真正的智能。」
機器人不如狗智能
作為人類,我們傾向于覺得語言對智能是必不可少的,但并非如此。
而事實正好有點反直覺:理解物理世界,比理解語言難得多。
這聽上去可能有點讓人驚訝,但它確實是這樣。
在機器人學里,人們很早就意識到這一點。
上世紀80年代后期,著名的機器人學家Hans Moravec就指出:
要讓電腦如成人般地下棋,相對容易;
但是要讓電腦有如一歲小孩般的感知和行動能力,卻相當困難甚至不可能。
這后來被稱為「莫拉維克悖論」(Moravec's paradox)。
LeCun舉了最新的例子:目前最好的AI可以通過律師資格考試,編寫代碼。但我們仍然沒有一個機器人工人,能像五歲孩子一樣行動。
顯而易見,當前的AI缺少一些真正重要的東西。
他認為,當我們思考現實中的場景時,其實是依靠「心理模型」(mental models),也就是我們在腦中操縱的場景表征,我們有物理直覺。而這些東西,絕大部分是我們后天學來的。人類還是嬰兒、只有幾個月大的時候,主要就是通過觀察世界來學習,也伴隨著一些交互。
過去10年里,LeCun一直嘗試去復制人類這種學習方式:
前5年,基本都在踩坑;
后5年,開始取得比較實質的進展,而依靠的是 非生成式架構 。
這些系統能學習現實世界的結構,預判演變,并模擬可能的場景。
如果說LLM只是在「預測」,那么世界模型則是在「理解」;
如果說LLM只是在「反應」,那么世界模型則是在「規劃」。
它們構建連貫內部表征的能力,打開了AI在復雜環境中進行推理、行動和交互大門。
世界模型怎么做?
一開始,很多人都認為,語言模型之后下一步,自然而然就是先加音頻,再加視頻。
但有趣的是,LeCun并不是純做「視頻模型」,還在用電子游戲數據集來做世界模型。
LeCun解釋了:為什么光有視頻還不夠,我們還需要其它什么東西?
首先,他承認視頻對理解世界非常重要。基本上,視頻是我們能獲得的最接近現實的表征之一。
但他更喜歡把視頻比作夢境:很多時候,在夢里你其實沒法真正「和看到的東西互動」,你就像一個旁觀者,而不是參與者。
但從根本上來說,人類的學習是高度交互式(interactive)的。
世界模型,不僅僅預測下一幀視頻,還要預測「在不同動作下所有可能結果的分布」。
這就意味著:在視頻表征之外,你還需要大量的動作(action)和交互數據,來真正構建這些世界模型。
LeCun喜歡一個更直觀的比喻:
LLM有點像雪球:從山坡上滾下來,一路滾一路粘上更多的雪。
它們是自回歸的(auto-regressive):把自己的輸出再喂回模型,再預測下一個token。

它們沒有「感知」,它們整個世界就是自己,所以會一直滾、一直滾,到山底都不知道自己快要撞到什么東西了。
而真正的智能,更像《冰雪奇緣》電影里的雪人Olaf:他知道前面有塊石頭,要散開自己,繞過去。
![]()
文本的局限在于:
人類感知到的世界極其豐富,而文本只是一個非常小、且高度壓縮的子集。它是建立在人類三維感知之上的一種「描述世界的發明」。
但對于世界模型和智能體,你必須能夠與環境交互,才能建立對自己所處環境的通用直覺(general intuition)。
我們之所以會以為「人類知識大多體現在文本里」,是因為很多我們認為的知識,確實被寫成了文字。
但事實并不是說所有人類知識都能通過文本很好地表達
真正大部分的人類知識,其實是關于物理世界和各種情境的心理模型和直覺,這些都是不直接以文本形式存在的。
人類的思考是在腦子里發生的,不是以token的形式運轉,更多是以心理意象(mental imagery)和各種其它表征出現的。
LeCun希望構建的系統,也能做到這一點。
再見,LeCun!Meta不投錢
在離職信中,LeCun表示盡管與Meta分道揚鑣,小扎等Meta高管支持其創業項目。
![]()
在巴黎的AI-Pulse活動上,LeCun表示Meta不是投資者。
「但在過去幾個月發生的事情,讓我們雙方都意識到,這個項目的應用范圍有點超出Meta的興趣范圍,」他說。
LeCun說:「硅谷完全被生成模型迷住了」。他暗示必須在硅谷之外,比如在巴黎非主流AI創業。
此前,媒體報道Yann LeCun計劃離職后,Meta的股價下跌了2%。據此估計,Yann LeCun對Meta大概值300億美元,是他新上司28歲的Alexandr Wang的兩倍。
![]()
但這次,扎克伯格選擇了「群體思維」,而非「AI教父」。
![]()
毫無疑問,人類對「智能的本質」的探索,仍在繼續。
當然,少有人可以斷言Yann LeCun是否正確。也許,LLM擁護者是對的。
但事實是,這門科學尚無定論,而圍繞新技術的「共識」形成得如此之快,這本身就值得我們停下來深思。
如果連AI領域最聰明的大腦都無法對「什么是智能」達成一致,那么要預測這場大戲將如何收場,恐怕更是難上加難。
參考資料:
https://x.com/gen_intuition/status/1996638738777002210?s=20
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.