![]()
「講好AI故事」
本號(hào)成天寫AI產(chǎn)品如何講故事,很遺憾,創(chuàng)業(yè)小登們講故事能力有每況愈下的趨勢(shì)。
今天我們來整點(diǎn)純正的宏大敘事。
講故事著實(shí)是一個(gè)技術(shù)活。《人類簡(jiǎn)史》就用了一整本書的篇幅,來論證人類文明就是由講故事驅(qū)動(dòng)的。
而在二級(jí)市場(chǎng),故事的價(jià)值可以直接量化,
比如,阿里開一場(chǎng)云棲大會(huì),CEO吳泳銘講了一個(gè)故事,當(dāng)天阿里市值就漲了將近3000億港幣。
這個(gè)故事就講得非常地好,tremendous。論據(jù)充分,邏輯環(huán)環(huán)相扣。這是現(xiàn)在非常稀缺的宏大敘事能力。
那么,吳媽的「通往ASI之路」,到底邏輯是怎么講的?
一個(gè)好故事,必須直面核心問題,然后用自己的方式回答。
吳媽的故事正是如此。他要解答的,是AI最底層的矛盾:大語言模型這條技術(shù)路線,到底能不能實(shí)現(xiàn)AGI,能不能讓AI超越人類?
楊立昆、李飛飛這些反方的質(zhì)疑很清晰:現(xiàn)在訓(xùn)練大模型的數(shù)據(jù)都來自互聯(lián)網(wǎng),但互聯(lián)網(wǎng)上已有的高質(zhì)量數(shù)據(jù)快用完了。
更重要的是,只用人類已有的文本信息來訓(xùn)練,AI無法憑空產(chǎn)生物理感知,也就無法真正超越人類。
AI做題可以做得很好,甚至拿IMO金牌,達(dá)到博士水平。但它沒有主觀能動(dòng)性、沒有原生的創(chuàng)造力。
從信息論的角度思考,世界的本質(zhì)是信息,而信息的輸入質(zhì)量,決定了輸出質(zhì)量。如果AI無法與物理世界發(fā)生交互,那它就只能在文字、編程領(lǐng)域打轉(zhuǎn)、內(nèi)卷。
所以,這就是AI行業(yè)最根本的矛盾:
AI要想超越人類,必須能夠和物理世界交互,獲取未經(jīng)過人類歸納的、海量的、一手原始數(shù)據(jù)。
這個(gè)「信息論困境」,是吳媽敘事需要解決的根本矛盾。
明白了這個(gè)根本矛盾之后,我們?cè)賮砜磪菋尩闹v話,一切都串起來了。
吳媽上來先立論。
沒有直接給出答案,而是先抬高了所有人的預(yù)期——把目標(biāo)從AGI,提高到ASI,超級(jí)人工智能。
AGI只是起點(diǎn),只是達(dá)到人類通用認(rèn)知能力。我們要做的,是遠(yuǎn)遠(yuǎn)超越人類智能、能夠自我迭代進(jìn)化的ASI。
非常好,目標(biāo)有了,接下來就要談實(shí)現(xiàn)路徑。
吳媽隨即提出了一個(gè)通往ASI的「AI發(fā)展三段論」
第一階段:智能涌現(xiàn)。 AI充分學(xué)習(xí)互聯(lián)網(wǎng)上已有的知識(shí)。這已經(jīng)基本完成。
第二階段:自主行動(dòng)。AI開始與物理世界交互,關(guān)鍵是學(xué)會(huì)調(diào)用工具。我們正處在這個(gè)階段的早期。
第三階段:自我迭代。AI獲取了物理世界的全量原始數(shù)據(jù),能自我迭代、自我學(xué)習(xí),最終實(shí)現(xiàn)ASI。這遠(yuǎn)未到來。
這個(gè)三段論的邏輯精妙之處在于,它的第三階段,直接回應(yīng)了開頭提出的核心矛盾。自然引出了下一個(gè)問題:這個(gè)關(guān)鍵的第三階段,具體要如何實(shí)現(xiàn)?AI如何自我迭代超越人類?
大家都不知道,只能聽吳媽提出阿里云的敘事。
![]()
為了讓邏輯閉環(huán),吳媽又把第三階段aka自我迭代,拆解成了兩個(gè)核心要素。
第一個(gè)要素,AI要能夠連接真實(shí)世界,獲取原始的一手?jǐn)?shù)據(jù)。
這就回到了我們一開頭提出的核心問題:AI只學(xué)二手知識(shí),是沒有前途的。就像自動(dòng)駕駛,不能靠人去寫規(guī)則,人永遠(yuǎn)也寫不完真實(shí)路況的規(guī)則。人必須讓AI自己學(xué)會(huì)看攝像頭的原始視頻,自己去理解和學(xué)習(xí)。
第二個(gè)要素,AI要學(xué)會(huì)自主學(xué)習(xí),Self-learning。
和物理世界交互之后,AI必須要有一個(gè)持續(xù)學(xué)習(xí)機(jī)制,能夠持續(xù)獲新的數(shù)據(jù)并接收實(shí)時(shí)反饋,自主優(yōu)化、修正偏差、實(shí)現(xiàn)自我迭代與智能升級(jí)。
很好,到了這里,吳媽的敘事已經(jīng)邏輯自洽了。AI如何超越人類?
那就是通過連接真實(shí)世界來解決信息輸入問題,再通過自主學(xué)習(xí)來驅(qū)動(dòng)智能升級(jí)。
理論講完了。如何證明你能做到?
這就引出了阿里云的兩個(gè)戰(zhàn)略判斷。這兩個(gè)判斷,分別對(duì)應(yīng)前面提出的兩個(gè)核心要素,理論結(jié)合實(shí)踐了屬于是。
第一個(gè)判斷是:大模型是下一代的操作系統(tǒng)。
這個(gè)判斷最核心的點(diǎn)在于,大模型要通過調(diào)用工具、調(diào)用Agent,來和真實(shí)世界產(chǎn)生交互,來獲得更多的原始數(shù)據(jù)。
比如智譜前段時(shí)間做的AutoGLM 2.0,讓AI可以根據(jù)用戶指令,完成點(diǎn)外賣、寫個(gè)好評(píng)之類的操作,比較簡(jiǎn)單地和物理世界有了交互。
背后,就是調(diào)用的阿里云的無影AgentBay。AutoGLM 2.0上真的有一個(gè)云安卓手機(jī),AI直接使用云手機(jī)里安裝的APP。非常直接粗暴的交互邏輯。
并且,今天邏輯能力比較好的非技術(shù)用戶,都可以通過自然語言,讓編程Agent來創(chuàng)造一些能用的小工具。
未來,更多非技術(shù)背景的行業(yè)專家,可以將自己腦海里的知識(shí)經(jīng)驗(yàn)結(jié)構(gòu)化,創(chuàng)造出若干Agent小工具,這些Agent可以通過協(xié)議互聯(lián),可以調(diào)用物理世界的各種服務(wù)和設(shè)備時(shí),一個(gè)龐大的Agent生態(tài)就形成了。
(call back一下,這就是)
這個(gè)大模型OS的核心價(jià)值,在于通過調(diào)用工具和Agent,來和真實(shí)世界產(chǎn)生交互。這恰恰是實(shí)現(xiàn)「要素一,連接真實(shí)世界」的手段。
也正因如此,通義千問必須選擇開源。因?yàn)橐蛟霢I時(shí)代的安卓,就必須是一個(gè)開放的生態(tài),讓盡可能多的場(chǎng)景和設(shè)備接入進(jìn)來,最大化連接的可能性。
邏輯串起來了
![]()
第二個(gè)判斷是:超級(jí)AI云是下一代的計(jì)算機(jī)。
無論是Agent生態(tài)要連接真實(shí)世界,還是AI模型要進(jìn)行自我迭代,整個(gè)體系都必須運(yùn)行在實(shí)際的算力載體上。這背后需要海量的計(jì)算資源。
大模型這個(gè)新的「操作系統(tǒng)」,需要運(yùn)行在一臺(tái)新的計(jì)算機(jī)上。新的計(jì)算機(jī)提供的海量算力,正是為了支撐「要素二,AI要自我學(xué)習(xí)」。
兩個(gè)戰(zhàn)略判斷合在一起,就構(gòu)成了一個(gè)邏輯閉環(huán):阿里云的兩大核心戰(zhàn)略,就是是實(shí)現(xiàn)其「ASI三段論」的實(shí)踐方案。
現(xiàn) 在我們回看整個(gè)敘事。
從提出「信息論困境」這個(gè)核心矛盾,到給出「ASI三段論」拆解目標(biāo),再給出兩個(gè)核心要素的解法,然后把公司戰(zhàn)略和解法綁定,最后證明自己有能力實(shí)現(xiàn)這一切。
這才是純正且閉環(huán)的宏大敘事。
![]()
當(dāng)然,正所謂,批判的武器抵不過武器的批判。
最有說服力的,還是當(dāng)天通義大模型一次性發(fā)了7個(gè)。從Qwen MAX到萬相2.5,文本生成、視覺理解、語音識(shí)別、視頻生成應(yīng)有盡有。
應(yīng)有盡有,這才是真的endless win,贏無止境
(本文配圖由 ChatGPT 生成,Gemini CLI輔助寫作。)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.