吵起來了。
圖靈獎(jiǎng)得主和諾貝爾獎(jiǎng)得主,為了“智能的本質(zhì)”——直接激情友好地交流上了。
AI三巨頭之一、圖靈獎(jiǎng)得主Yann LeCun明確表示:
純粹就是胡扯(complete BS)。
而諾貝爾獎(jiǎng)得主、谷歌DeepMind CEO哈薩比斯也不留情面了,指名道姓回?fù)簦?/p>
LeCun的說法簡直是大錯(cuò)特錯(cuò)。
論戰(zhàn)之激烈,關(guān)注度之高,已經(jīng)讓專門開辟了一個(gè)話題板塊:
![]()
馬斯克也跑來吃瓜了——
沒有任何多余的解釋,但這波他站哈薩比斯——“Demis is right”。
![]()
當(dāng)然,馬斯克的站隊(duì)可能也有別的原因。畢竟他和LeCun素來不是很對付,跟哈薩比斯則亦師亦友——馬斯克還是哈薩比斯DeepMind早期投資人。
要科學(xué)吃瓜,可能還是要知道他們究竟在激辯什么?
![]()
爭論焦點(diǎn):智能的本質(zhì)是什么?
事情還要從LeCun幾天前接受的一場采訪說起。
他在節(jié)目中言辭犀利地指出:
根本不存在所謂的“通用智能”,純粹就是胡扯(complete BS)
這個(gè)概念毫無意義,因?yàn)樗鼘?shí)際上是用來指代人類水平的智能,但人類智能其實(shí)是高度專業(yè)化的。我們在現(xiàn)實(shí)世界里確實(shí)干得不錯(cuò),比如認(rèn)個(gè)路、導(dǎo)航blabla;也特別擅長跟人打交道,因?yàn)樵蹅冞M(jìn)化了這么多年就是干這個(gè)的。
但在國際象棋方面,我們表現(xiàn)很差。而且還有一堆事兒都搞不定,反倒是有些動物比我們強(qiáng)得多。所以說,我們其實(shí)就是“專才”。
我們認(rèn)為自己是“通用”的,但這僅僅是一種錯(cuò)覺,因?yàn)槲覀兡芾斫獾乃袉栴}都局限于我們能想到的那些
![]()
簡單概括就是,LeCun認(rèn)為人類智能并不“通用”,而是為了適應(yīng)現(xiàn)實(shí)物理世界而專門進(jìn)化出來的某種專業(yè)能力。
人類之所以擅長識別物體、躲避危險(xiǎn)、與他人合作等,也只是因?yàn)檫@些能力在進(jìn)化中被環(huán)境塑造。
然而,這一觀點(diǎn)很快遭到了哈薩比斯的直接回懟。哈薩比斯表示:
LeCun的說法簡直是大錯(cuò)特錯(cuò)。
他這是把“general intelligence”和“universal intelligence”兩個(gè)概念搞混了。
![]()
然后他一一駁斥了LeCun的觀點(diǎn),其原話如下:
大腦是目前宇宙中已知最精妙、最復(fù)雜的事物,實(shí)際上具有極強(qiáng)的通用性。
但是在實(shí)際的系統(tǒng)當(dāng)中,“天下沒有免費(fèi)的午餐”這個(gè)道理是無法回避的——任何實(shí)際且有限的系統(tǒng),在其所學(xué)目標(biāo)分布周圍,都必然存在一定程度的專門化。
但從圖靈機(jī)的理論意義上講,通用性的核心在于,只要給予足夠的時(shí)間、內(nèi)存(及數(shù)據(jù)),就能夠?qū)W習(xí)任何可計(jì)算的內(nèi)容。而人腦(以及AI基礎(chǔ)模型)正是近似的圖靈機(jī)。
并且,針對LeCun關(guān)于國際象棋棋手的評論,哈薩比斯認(rèn)為人類能發(fā)明國際象棋本身就令人驚嘆,更不用說從科學(xué)到波音747等現(xiàn)代文明的一切了。
關(guān)于LeCun對棋手的評論——人類最初竟能發(fā)明國際象棋(乃至從科學(xué)到波音747的整個(gè)現(xiàn)代文明!)本就令人驚嘆,更不用說還能出現(xiàn)像馬格努斯·卡爾森那樣棋藝卓絕的人物。
他或許并非嚴(yán)格意義上的最優(yōu)解(畢竟記憶有限、決策時(shí)間也受限),但考慮到我們的大腦本是為狩獵采集而進(jìn)化,他和我們?nèi)缃袼艹删偷囊磺校炎阋哉宫F(xiàn)人腦的驚人潛力
![]()
顯而易見,哈薩比斯對“智能”的理解從不局限于計(jì)算機(jī)科學(xué),而是深度融合了神經(jīng)科學(xué)。
一直以來,他認(rèn)為真正衡量智能的兩個(gè)關(guān)鍵標(biāo)準(zhǔn)分別是通用性(Generality)和學(xué)習(xí)能力(Learning),為此他經(jīng)常拿1997年“深藍(lán)”戰(zhàn)勝卡斯帕羅夫舉例——
雖然“深藍(lán)”在國際象棋上很強(qiáng),但還是連簡單的井字游戲都不會玩,所以足以見得這種程序的死板之處。
而關(guān)于這場對決,哈薩比斯還透露,最吸引他的不是“深藍(lán)”這個(gè)系統(tǒng),而是卡斯帕羅夫的大腦(畢竟他能作為人類代表與AI進(jìn)行比賽)。
沒錯(cuò),又是“大腦”這個(gè)關(guān)鍵詞。哈薩比斯一直堅(jiān)信,人類大腦是宇宙中已知的唯一關(guān)于“通用智能可行性”的存在性證明。
當(dāng)大腦和AI結(jié)合之后,所謂的“通用人工智能”其實(shí)就是能夠展現(xiàn)出人類所擁有的所有認(rèn)知能力的系統(tǒng)。
至于具體如何實(shí)現(xiàn)AGI,哈薩比斯多年來也形成了一套自己的方法論,總結(jié)起來就是——
預(yù)測構(gòu)建理解,規(guī)劃擴(kuò)展可能,強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)自主進(jìn)化。
第一步:以預(yù)測為基石。
在他看來,智能的本質(zhì)在于預(yù)測——無論是預(yù)測下一個(gè)單詞還是預(yù)測蛋白質(zhì)的折疊形狀。這是所有認(rèn)知活動的基礎(chǔ)形式,也是AI理解世界的內(nèi)在驅(qū)動力。
第二步:引入搜索與規(guī)劃
AI系統(tǒng)首先要建立一個(gè)世界模型,然后在此基礎(chǔ)上進(jìn)行搜索或規(guī)劃,以在巨大的組合搜索空間中找到最優(yōu)解。
第三步:最終通向深度強(qiáng)化學(xué)習(xí)
這是哈薩比斯最推崇的終局路徑,也是對大腦運(yùn)作方式的模擬——深度學(xué)習(xí)負(fù)責(zé)模式匹配和尋找結(jié)構(gòu),強(qiáng)化學(xué)習(xí)負(fù)責(zé)通過試錯(cuò)進(jìn)行規(guī)劃和達(dá)成目標(biāo)。這在生物學(xué)上對應(yīng)著大腦的神經(jīng)通路和多巴胺獎(jiǎng)勵(lì)系統(tǒng)。
至此,我們看到兩位大佬關(guān)于智能本質(zhì)的爭論,表面上看起來似乎確實(shí)截然不同。
一個(gè)認(rèn)為“通用性智能”是胡扯,本質(zhì)上智能是自然世界高度專業(yè)化的產(chǎn)物;另一個(gè)認(rèn)為通用性智能不僅存在,而且仍有巨大潛力有待挖掘。
但事實(shí),真的如此嗎?
上述爭論過后,LeCun又再次出來回應(yīng)了,而且這次直接點(diǎn)名了分歧核心——用詞。
我認(rèn)為分歧主要在于用詞。我反對用“通用(general)”來指代“人類水平”,因?yàn)槿祟愂歉叨葘iT化的。
![]()
不過,雖然承認(rèn)用詞有分歧,但他還是繼續(xù)重申了“人類智能并不通用”的觀點(diǎn)。其論證如下:
第一,理論完備≠實(shí)際通用。
你也許不同意人類思維是專門化的,但事實(shí)確實(shí)如此。這不僅是理論能力的問題,更是實(shí)踐效率的問題。顯然,一個(gè)經(jīng)過良好訓(xùn)練的人腦,如果配合無限量的紙和筆,是圖靈完備的。但對于絕大多數(shù)計(jì)算問題來說,這種方式效率極低,因此在資源受限的情況下(比如下棋),它遠(yuǎn)非最優(yōu)方案。
就是說,哈薩比斯所構(gòu)想的“理想的圖靈機(jī)”對解決現(xiàn)實(shí)問題幾乎沒有意義,因?yàn)檎嬲闹悄鼙仨氃谟邢拶Y源下高效運(yùn)作——而人腦的進(jìn)化恰恰是資源約束下高度優(yōu)化的結(jié)果。
第二,兩個(gè)典型例子可以反映大腦的“非通用性”。
在理論上,一個(gè)兩層神經(jīng)網(wǎng)絡(luò)可以以任意精度逼近任何函數(shù);但在實(shí)踐中,幾乎所有有意義的函數(shù)都需要隱藏層中包含數(shù)量巨大、難以實(shí)現(xiàn)的神經(jīng)元。正因如此,我們才使用多層網(wǎng)絡(luò)——這正是深度學(xué)習(xí)存在的根本原因。
再換一個(gè)角度來看:視神經(jīng)大約有100萬根神經(jīng)纖維。為了簡化討論,我們假設(shè)信號是二進(jìn)制的,那么一次視覺任務(wù)就可以被視為一個(gè)從100萬比特映射到1比特的布爾函數(shù)。在所有可能的此類函數(shù)中,有多少是人腦可以實(shí)現(xiàn)的?答案是:一個(gè)無窮小的比例。
通過這兩個(gè)例子,LeCun再次重申了自己的觀點(diǎn):
所以我們不僅談不上“通用”,而且是極其高度專業(yè)化的。可能的函數(shù)空間極其廣闊。我們之所以沒有意識到這一點(diǎn),是因?yàn)槠渲薪^大多數(shù)函數(shù)對我們來說復(fù)雜到難以想象,看起來幾乎完全是隨機(jī)的
而且他還提到了愛因斯坦曾經(jīng)說過的一句話——世界上最不可思議的事情,是世界竟然是可以被理解的。
在所有可能的、隨機(jī)的世界組織方式中,我們竟然能夠理解其中極小的一部分,這本身就令人驚嘆。而我們無法理解的那一部分,我們稱之為“熵”。從這個(gè)意義上說,宇宙中絕大多數(shù)的信息都是熵——是我們孱弱的認(rèn)知能力無法理解、因而只能選擇忽略的內(nèi)容。
總之,事情battle到最后,網(wǎng)友們也是紛紛回過神來了——這場爭論最大的bug可能就在用詞上了。
![]()
而拋開用詞不談,本質(zhì)上來看,兩個(gè)人其實(shí)更像是在談?wù)摬煌膯栴}:一個(gè)核心在強(qiáng)調(diào)“我們是什么”,另一個(gè)則在強(qiáng)調(diào)“我們能成為什么” 。
而這,也恰恰指向了同一個(gè)更深層、也更現(xiàn)實(shí)的議題——
接下來,我們究竟該以怎樣的方式實(shí)現(xiàn)AGI?
答案:世界模型
不管是在LeCun還是哈薩比斯這里,答案其實(shí)都已經(jīng)很清晰了——
世界模型。
眾所周知,即將從Meta正式離職的LeCun,下一站就是創(chuàng)業(yè)世界模型。
據(jù)《金融時(shí)報(bào)》爆料,其新公司名為Advanced Machine Intelligence Labs(AMI Labs),計(jì)劃于明年一月正式亮相,目標(biāo)估值30億歐元(約247億人民幣)。
在LeCun的理解中,世界模型所要追求的不是渲染精美的像素,而是掌握控制理論和認(rèn)知科學(xué)。
他認(rèn)為對AI而言,只有中間那個(gè)抽象表征才重要(和JEPA研究一脈相承),模型沒必要浪費(fèi)算力去生成像素,只需專注于捕捉那些能用于AI決策的世界狀態(tài)。
換言之,了解“世界的結(jié)構(gòu)是什么”才是最關(guān)鍵的。
而哈薩比斯這邊也在采訪中多次表示,世界模型絕對是自己和谷歌接下來的重點(diǎn)。
今年8月,谷歌DeepMind推出了新版世界模型Genie 3。哈薩比斯表示:
我們談?wù)摰氖澜缒P停傅氖悄欠N能夠理解世界運(yùn)行機(jī)制中因果關(guān)系與協(xié)同效應(yīng)的模型,也就是一種“直觀物理學(xué)”——事物如何運(yùn)動、如何相互作用、如何表現(xiàn)。
你已經(jīng)可以在當(dāng)前的視頻模型中看到這種能力的雛形。
而檢驗(yàn)是否真正具備這種理解的一種方式是否能夠構(gòu)建一個(gè)逼真的世界。因?yàn)槿绻隳軌蛏伤敲丛谀撤N意義上,你就已經(jīng)理解并內(nèi)化了這個(gè)系統(tǒng)的運(yùn)作規(guī)律。
這也解釋了為什么Genie、Veo這些模型首先會以視頻模型的形式出現(xiàn)。在他看來,這種可交互的世界模型正是通往AGI的關(guān)鍵一步。
通過對比,我們能發(fā)現(xiàn)雖然二者都是在描繪“世界模型”,但他們的理解和實(shí)踐方向也明顯存在差別——
LeCun代表著“世界模型即認(rèn)知框架”,而谷歌哈薩比斯代表著“世界模型即模擬器”。
嗯,同一個(gè)概念,不同的理解和實(shí)踐——怎么不算一種call back呢?(手動狗頭)
![]()
Anyway,回顧歷史,實(shí)際上AI的每一次躍遷都伴隨著這樣的“爭吵”:
符號主義和連接主義的爭論,定義了智能的根基究竟是“邏輯”還是“數(shù)據(jù)”;
端到端學(xué)習(xí)和模塊化系統(tǒng)的爭論,定義了“系統(tǒng)該如何構(gòu)建”;
再加上我們今天的“開源VS閉源之爭”、“智能本質(zhì)之爭”……
還是那些老話,“真理不辯不明”、“真理越辯越明”。
不過玩笑說說,等到真理辯明了,那個(gè)老頭可要來了……
One More Thing
幾乎同一時(shí)間,LSTM之父Jürgen Schmidhuber又出來隨機(jī)掉落了一個(gè)“小彩蛋”,他預(yù)判了預(yù)判——
LeCun即將創(chuàng)業(yè)的世界模型,他們在2014年就有涉獵了(原話是二者高度相似)。
![]()
怎么說呢,Jürgen Schmidhuber老爺子這幾年,基本都在“維權(quán)”了。
作為LSTM的發(fā)明者,LSTM一度在ChatGPT誕生前被稱為“最具商業(yè)價(jià)值的人工智能成就”,而作為LSTM之父,Jürgen Schmidhuber早在三巨頭獲得圖靈獎(jiǎng)之前就被《紐約時(shí)報(bào)》稱為“成熟人工智能之父”。
但當(dāng)AI時(shí)代真正到來,各種技術(shù)發(fā)明者桂冠沒有他、圖靈獎(jiǎng)沒有他、諾貝爾獎(jiǎng)也沒有他……
Schmidhuber只能一次次維權(quán)、隔空懟人,最后成為祥林嫂·Schmidhuber。
幸好,還有推特,可以讓他主頁上清晰完整展示——
![]()
以及推特當(dāng)前的擁有者馬斯克,他評價(jià)Jürgen Schmidhuber時(shí)言簡意賅:一切的發(fā)明者。
這,確定不是在陰陽八卦?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.