<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Ilya重新定義AGI: 為什么ChatGPT離真正的AGI還很遠(yuǎn)

      0
      分享至

      從OpenAI離開后,Ilya Sutskever從公眾視野中消失了許久。

      前段時間,他終于上了個視頻播客節(jié)目,和主播Dwarkesh Patel聊了1小時36分鐘,把他現(xiàn)在對AGI的看法完整表述了一遍。


      如果你不知道Ilya是誰的話,簡單介紹下,他是OpenAI前首席科學(xué)家,GPT系列的核心設(shè)計者,現(xiàn)在創(chuàng)辦了SSI(Safe Superintelligence Inc.)。

      我關(guān)注Ilya很久了。從ChatGPT發(fā)布起,他的每一次公開發(fā)言,我都會仔細(xì)看。這個人對AI的理解,比大多數(shù)人深太多。

      這次訪談更狠。他提出了一個顛覆性的觀點(diǎn):

      我們對AGI的理解,可能從一開始就錯了。

      AI行業(yè)的大轉(zhuǎn)折:規(guī)模時代結(jié)束了

      在講AGI之前,Ilya先說了一個更大的背景。

      他說了一句讓我印象很深的話:

      "2020到2025,是規(guī)模時代(Age of Scaling)。但現(xiàn)在規(guī)模已經(jīng)夠大了。我們回到了研究時代(Age of Research)——只不過這次有大算力支持。"

      什么意思?

      過去5年,AI公司都在做一件事:堆數(shù)據(jù)、堆算力、堆參數(shù)。

      規(guī)模定律(Scaling Law)吸走了所有空氣。所有人都在做同樣的事:

      • 2020:GPT-3,175B參數(shù)

      • 2021-2024:所有公司瘋狂擴(kuò)大預(yù)訓(xùn)練規(guī)模

      • 數(shù)據(jù)從TB級到PB級

      • 算力從百GPU到萬GPU

      Ilya甚至說了一句狠話:

      "Scaling sucked out all the air in the room. Everyone started to do the same thing. We got to the point where there are more companies than ideas by quite a bit."

      公司數(shù)量比想法還多。這話太準(zhǔn)了。

      但現(xiàn)在呢?

      規(guī)模已經(jīng)足夠大了。再100x也不會帶來質(zhì)變。數(shù)據(jù)快耗盡了,算力再堆10倍,能力提升可能只是邊際改善。

      接下來拼什么?拼想法。拼對AI本質(zhì)的理解。

      這也是為什么SSI才有機(jī)會——不再是純拼預(yù)算,而是拼研究深度。

      說實話,這個判斷如果是對的,對整個AI行業(yè)的影響會很大。意味著小團(tuán)隊、研究驅(qū)動的公司,又有機(jī)會了。

      模型很強(qiáng),但經(jīng)濟(jì)影響很弱——為什么?

      Ilya提出了一個讓所有人困惑的問題:

      "現(xiàn)在的模型在評測(evals)上表現(xiàn)驚人。但經(jīng)濟(jì)影響遠(yuǎn)遠(yuǎn)落后。怎么解釋這個矛盾?"

      你看各種benchmark:

      • 代碼競賽:超過人類平均水平

      • 數(shù)學(xué)問題:接近IMO金牌選手

      • 復(fù)雜推理:能解決博士級別的題目

      但實際用起來呢?

      會在兩個bug之間循環(huán)。會重復(fù)說同樣的話。前一句話和后一句話自相矛盾。

      為什么會這樣?

      Ilya給出了一個絕妙的類比。

      學(xué)生A vs 學(xué)生B:AI過度訓(xùn)練的陷阱

      想象兩個學(xué)生:

      學(xué)生A: 要成為競賽編程冠軍。于是瘋狂練習(xí)10,000小時,刷了所有競賽題,背下所有算法,成為頂尖競賽選手。

      學(xué)生B: 也覺得競賽編程挺有意思,練了100小時,也做得不錯。

      問題來了:誰在以后的職業(yè)生涯中會更成功?

      十有八九是學(xué)生B。

      為什么?

      因為學(xué)生A只會做競賽題。遇到實際項目,遇到?jīng)]見過的問題,就懵了。

      學(xué)生B雖然練得少,但他有"那個東西"——學(xué)習(xí)能力、舉一反三的能力、解決新問題的能力。

      現(xiàn)在的AI就是學(xué)生A。

      我們怎么訓(xùn)練大模型的?

      1. 預(yù)訓(xùn)練: 喂給它所有能找到的數(shù)據(jù)——所有書、所有代碼、所有網(wǎng)頁。就像讓學(xué)生A刷遍所有競賽題。

      2. 強(qiáng)化學(xué)習(xí)(RL): 針對特定任務(wù)瘋狂訓(xùn)練。想讓它在編程評測上表現(xiàn)好?那就專門訓(xùn)練編程任務(wù),訓(xùn)練到評測分?jǐn)?shù)爆表。

      結(jié)果呢?評測上確實表現(xiàn)驚人。但真實場景一塌糊涂。

      Ilya說了一個觀察:

      現(xiàn)在所有AI公司都有專門的團(tuán)隊,不停地設(shè)計新的RL訓(xùn)練環(huán)境。這些環(huán)境怎么設(shè)計的?

      很多時候是從評測中找靈感。

      "我希望模型在發(fā)布時評測成績好看,那我就專門訓(xùn)練它做這類任務(wù)。"

      這就是為什么模型能在評測上做很難的題,卻在實際使用中會犯低級錯誤。

      它沒有真的理解,只是記住了而已。

      Ilya甚至說了一句狠話:

      "The real reward hacking is the human researchers who are too focused on the evals."

      真正的獎勵破解(reward hacking),是研究人員太關(guān)注評測分?jǐn)?shù)了。

      人類的秘密武器:泛化能力

      這是整個訪談中最讓我震撼的部分。

      Ilya說:人類用更少的數(shù)據(jù),學(xué)得更好。

      他提到了一個他自己的例子:

      "我5歲的時候,超級喜歡汽車。那時候我對汽車的識別能力,已經(jīng)足夠支撐開車了——雖然我還沒法開,但我能認(rèn)出所有車型。"

      想想看,一個5歲小孩:

      • 見過的世界很小(大部分時間在家)

      • 數(shù)據(jù)多樣性極低(每天看到的東西差不多)

      • 訓(xùn)練數(shù)據(jù)量只是大模型的零頭

      但人類學(xué)到的東西,理解得更深。

      15歲的人類,學(xué)習(xí)的數(shù)據(jù)量只是GPT預(yù)訓(xùn)練數(shù)據(jù)的千分之一。

      但人類不會犯AI犯的那些低級錯誤:

      • 不會在兩個bug之間循環(huán)

      • 不會重復(fù)說同樣的話

      • 不會前一句話和后一句話自相矛盾

      那人類靠什么做到的?

      價值函數(shù):人類內(nèi)置的"對錯感"

      Ilya提到了一個神經(jīng)科學(xué)案例:

      有個人大腦的情緒處理中樞受損了。他不再有情緒——不會難過、不會憤怒、不會興奮。

      在測試中,他依然能說話、能做智力題,看起來一切正常。

      但他完全喪失了決策能力。

      選穿哪雙襪子,能糾結(jié)好幾個小時。做財務(wù)決策,完全一團(tuán)糟。

      這說明什么?

      情緒系統(tǒng)是人類的內(nèi)置"價值函數(shù)"(Value Function)。

      它告訴我們:什么是好的,什么是壞的,什么事情值得做,什么事情不值得。

      沒有這個系統(tǒng),即使智力正常,也無法在真實世界中運(yùn)作。

      那什么是價值函數(shù)?

      Ilya給了個很清楚的解釋:

      "你下棋,丟了一個子,你不用下完整盤棋就知道自己犯錯了。價值函數(shù)能讓你提前知道:這步是好是壞。"

      現(xiàn)在的AI怎么訓(xùn)練的?

      你讓它寫1000行代碼,等它寫完,你告訴它"對"或"錯"。它學(xué)不到中間過程哪一步走錯了。

      如果有價值函數(shù)呢?

      AI寫到第100行,價值函數(shù)就能判斷:"這個方向不對,應(yīng)該換思路。"不用等到寫完1000行才發(fā)現(xiàn)。

      人類就是這么學(xué)的。

      你編程時寫了幾行代碼,感覺"不對勁",就會停下來重新思考。這就是你的價值函數(shù)在起作用。

      AI現(xiàn)在缺的,可能就是這個。

      Ilya說他對怎么解決有想法,但"由于種種原因,無法詳細(xì)討論"。(這個有點(diǎn)神秘,估計是SSI的核心競爭力)

      新定義: AGI不是"全知全能",而是"能學(xué)會任何事"

      說了這么多,終于到了核心:Ilya對AGI的重新定義。

      什么是AGI(通用人工智能)?

      問十個人,九個會說:能做所有工作的AI。

      OpenAI的定義就是這樣——"能勝任人類所有經(jīng)濟(jì)價值工作的系統(tǒng)"。

      聽起來很合理對吧?

      但I(xiàn)lya說:等等,這個定義好像哪里不對。

      為什么?

      他給了個很直接的理由:人類自己都不是AGI啊。

      你想想,一個普通人知道多少東西?

      你會編程嗎?不一定。會做心臟手術(shù)嗎?肯定不會。會設(shè)計芯片嗎?更不可能。

      人類缺少大量的知識。我們不是"什么都會"。

      那為什么人類是"通用智能"?

      很簡單——我們能學(xué)。

      你不會編程?給你幾個月時間,你能學(xué)會。你不懂醫(yī)學(xué)?讓你去醫(yī)學(xué)院學(xué)幾年,你能成為醫(yī)生。

      人類的"通用"體現(xiàn)在哪?不在"已經(jīng)會了",在"能學(xué)會"。

      所以,Ilya給出了新的AGI定義:

      AGI不是"已經(jīng)會做所有工作",而是"能學(xué)會做所有工作"。

      他給了一個很形象的比喻:

      "想象我造出了一個15歲的超級智能學(xué)生。他非常聰明,學(xué)習(xí)能力極強(qiáng),但知識儲備幾乎為零。" "你讓他去當(dāng)程序員,他會去學(xué)編程。" "你讓他去當(dāng)醫(yī)生,他會去學(xué)醫(yī)。" "這就是AGI。"

      這個定義的核心是什么?

      持續(xù)學(xué)習(xí)能力(Continual Learning)。

      不是一次性訓(xùn)練好,然后什么都知道。

      而是:

      • 快速學(xué)習(xí): 比人類更快掌握新技能

      • 深度理解: 真正理解,不只是記住

      • 靈活遷移: 一個領(lǐng)域?qū)W到的東西,能用到其他領(lǐng)域

      這才是真正的"通用"。

      SSI的戰(zhàn)略調(diào)整:從"直擊超級智能"到漸進(jìn)式部署

      這個新定義,改變了SSI的整個戰(zhàn)略。

      SSI最初的計劃是"straight-shot superintelligence"——直擊超級智能。

      什么意思?就是不發(fā)布中間產(chǎn)品,埋頭研究,直到造出真正的超級智能才發(fā)布。

      好處是:避免市場競爭的各種權(quán)衡和壓力,專注研究。

      但I(xiàn)lya說,這個計劃可能會調(diào)整。

      為什么?

      因為AI的部署本身就是學(xué)習(xí)過程。

      你想想,人類的很多系統(tǒng)是怎么變安全的?

      • 飛機(jī)為什么現(xiàn)在這么安全?不是因為設(shè)計師一開始就想清楚了所有問題,而是通過事故、改進(jìn)、再事故、再改進(jìn),迭代了幾十年。

      • Linux為什么bug這么少?不是因為Linus一開始就寫出了完美代碼,而是無數(shù)人在實際使用中發(fā)現(xiàn)問題、修復(fù)問題。

      AI可能也需要這樣。

      Ilya說:

      "很難想象有哪個工程領(lǐng)域,是純靠思考就能做到安全的,而不需要實際部署和反饋。"

      所以,即使是"直擊超級智能",也需要漸進(jìn)式發(fā)布。

      更重要的是:展示AI的價值。

      Ilya說了一句很有意思的話:

      "你寫一篇文章說'AI會怎樣怎樣',別人看了會說'挺有意思的'。" "但當(dāng)你讓別人看到AI實際在做這個、做那個——那完全不一樣。"

      看到 vs 聽說,天壤之別。

      這也是為什么SSI可能會改變策略,在中間階段就發(fā)布產(chǎn)品。(這個轉(zhuǎn)變挺關(guān)鍵的,說明Ilya也在務(wù)實地思考商業(yè)化)

      對我個人的啟示

      這個新定義,不只是對AI行業(yè)的顛覆。

      對我個人也有深刻觸動。

      我做了5年產(chǎn)品、開發(fā)、內(nèi)容創(chuàng)作。如果按傳統(tǒng)思路,我應(yīng)該選一個方向深挖,成為某個領(lǐng)域的專家。

      但在AI時代,這個策略好像不太對了。

      為什么?我最近一直在想這個問題。

      你看:

      • 我2023年研究的Prompt技巧,很多現(xiàn)在不需要了

      • 我半年前用的AI工具,現(xiàn)在又出了更好的

      我有段時間很焦慮。總覺得自己在追,但永遠(yuǎn)追不上。

      直到聽完Ilya這次訪談,我突然想明白了:

      如果我只是積累知識,我永遠(yuǎn)追不上。

      但如果我培養(yǎng)的是學(xué)習(xí)能力——快速上手新工具、快速理解新概念、快速應(yīng)用到實際問題——那我永遠(yuǎn)不會過時。

      這就是為什么Ilya說,AGI的本質(zhì)是學(xué)習(xí)能力,而不是知識儲備。

      人類在這方面還有巨大優(yōu)勢。我們可以:

      • 快速切換領(lǐng)域

      • 從失敗中學(xué)習(xí)

      • 舉一反三

      • 在不確定中探索

      這些,AI還做不好。但差距在縮小。

      當(dāng)AI也有了真正的持續(xù)學(xué)習(xí)能力,當(dāng)它也能像15歲的天才學(xué)生一樣,快速學(xué)會任何新技能...那時候,競爭會更激烈。

      所以,現(xiàn)在就該問自己:

      我的學(xué)習(xí)能力,夠強(qiáng)嗎?

      我能多快掌握一個新領(lǐng)域?

      我能不能在AI的幫助下,學(xué)得更快?

      這些問題的答案,決定了你在AI時代能走多遠(yuǎn)。

      Ilya的這次訪談,還談了很多其他內(nèi)容:

      • 為什么強(qiáng)化學(xué)習(xí)現(xiàn)在花的算力已經(jīng)超過預(yù)訓(xùn)練

      • SSI怎么用30億美元跟OpenAI的百億預(yù)算競爭(這個數(shù)據(jù)挺有意思,OpenAI年研究支出50-60億,但大部分分散在產(chǎn)品、銷售等方向。SSI只做研究,實際研究算力差距沒那么大)

      • 怎么讓超級智能"關(guān)心所有有感知能力的生命"

      • 為什么AI對齊比想象中難

      每一個都值得單獨(dú)寫一篇文章。

      但這篇文章,我想聚焦在這個核心洞察上:

      AGI不是"什么都會",而是"什么都能學(xué)"。

      這個定義,改變了我對AI的理解。也改變了我對自己的期待。

      在AI時代,知識不再是護(hù)城河。學(xué)習(xí)能力才是。

      : Ilya完整訪談在這里 → https://www.youtube.com/watch?v=aR20FWCCjAs

      • 時長: 1小時36分鐘

      • 嘉賓: Ilya Sutskever (SSI創(chuàng)始人, 前OpenAI首席科學(xué)家)

      • 主持: Dwarkesh Patel

      • 發(fā)布時間: 2025年12月

      強(qiáng)烈推薦完整看一遍。這是今年必看的訪談之一。(我看了兩遍,第二遍才真正理解他說的價值函數(shù)那段)

      你覺得現(xiàn)在的AI,離Ilya說的"15歲天才學(xué)生"還有多遠(yuǎn)?

      歡迎評論區(qū)聊聊。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      秋瓷炫透露兒子9月上三年級:很辛苦,要學(xué)中韓英三門語言,曾因語言不通,要求“換個會韓語的爸爸”

      秋瓷炫透露兒子9月上三年級:很辛苦,要學(xué)中韓英三門語言,曾因語言不通,要求“換個會韓語的爸爸”

      臺州交通廣播
      2026-04-09 00:37:05
      歐冠0-2輸球 亞馬爾哭了!蹲在地上抹淚 馬競球員紛紛安慰

      歐冠0-2輸球 亞馬爾哭了!蹲在地上抹淚 馬競球員紛紛安慰

      葉青足球世界
      2026-04-09 09:16:54
      驚!超美人氣偶像金子涵直播求救:再逼我就把所有的都說出來!

      驚!超美人氣偶像金子涵直播求救:再逼我就把所有的都說出來!

      魔都囡
      2026-04-09 09:59:32
      繼續(xù)斬首,再次成功,為何伊朗破不了以色列的斬首戰(zhàn)術(shù)?

      繼續(xù)斬首,再次成功,為何伊朗破不了以色列的斬首戰(zhàn)術(shù)?

      高博新視野
      2026-04-07 08:00:11
      Anthropic 終于如愿以償,親手訓(xùn)出了“強(qiáng)大到威脅人類”的Mythos

      Anthropic 終于如愿以償,親手訓(xùn)出了“強(qiáng)大到威脅人類”的Mythos

      硅星GenAI
      2026-04-08 10:21:59
      戲劇性轉(zhuǎn)變:通牒到期,美伊停火

      戲劇性轉(zhuǎn)變:通牒到期,美伊停火

      南風(fēng)窗
      2026-04-08 14:07:48
      上海市格致中學(xué)原校長柴志洪因病逝世,享年83歲

      上海市格致中學(xué)原校長柴志洪因病逝世,享年83歲

      澎湃新聞
      2026-04-08 10:34:26
      錯失最年輕147!中國斯諾克新星險創(chuàng)紀(jì)錄,3分37秒轟單桿112分

      錯失最年輕147!中國斯諾克新星險創(chuàng)紀(jì)錄,3分37秒轟單桿112分

      全景體育V
      2026-04-09 07:56:24
      樊振東自愿放棄!國乒公布世乒賽名單僅1小時 溫瑞博落選原因曝光

      樊振東自愿放棄!國乒公布世乒賽名單僅1小時 溫瑞博落選原因曝光

      侃球熊弟
      2026-04-08 20:41:29
      40-39!開拓者或換帥!楊瀚森,天亮了!

      40-39!開拓者或換帥!楊瀚森,天亮了!

      籃球?qū)崙?zhàn)寶典
      2026-04-08 16:54:05
      岳陽男子遇害細(xì)節(jié)曝光!發(fā)小預(yù)謀60天,自制鋼珠射擊器,兩槍斃命

      岳陽男子遇害細(xì)節(jié)曝光!發(fā)小預(yù)謀60天,自制鋼珠射擊器,兩槍斃命

      青橘罐頭
      2026-04-09 07:41:34
      老道長告誡:燒紙時煙往身上飄,那不是風(fēng)吹的!是亡者提醒你

      老道長告誡:燒紙時煙往身上飄,那不是風(fēng)吹的!是亡者提醒你

      叮當(dāng)當(dāng)科技
      2026-04-09 03:29:39
      4周實現(xiàn)100%清除腫瘤!國研TIL療法再傳捷報,狂攻肺癌、腦膠質(zhì)瘤

      4周實現(xiàn)100%清除腫瘤!國研TIL療法再傳捷報,狂攻肺癌、腦膠質(zhì)瘤

      無癌家園i
      2026-04-08 12:03:23
      男子套圈套中鸚鵡帶回家 父親隨后感染“鸚鵡熱” 救治25天花費(fèi)已超18萬元

      男子套圈套中鸚鵡帶回家 父親隨后感染“鸚鵡熱” 救治25天花費(fèi)已超18萬元

      閃電新聞
      2026-04-08 22:05:56
      看了七年浪姐,第一次見到這么多姐姐“劃水”

      看了七年浪姐,第一次見到這么多姐姐“劃水”

      八卦南風(fēng)
      2026-04-08 17:19:20
      特斯拉FSD 14.3視覺畫質(zhì)大改,更驚艷

      特斯拉FSD 14.3視覺畫質(zhì)大改,更驚艷

      沙雕小琳琳
      2026-04-08 10:17:45
      阿斯:相比皇馬6000萬歐簽馬斯坦托諾,拜仁簽奧利塞堪稱撿漏

      阿斯:相比皇馬6000萬歐簽馬斯坦托諾,拜仁簽奧利塞堪稱撿漏

      懂球帝
      2026-04-09 06:53:23
      2020年,長沙女子癌癥晚期,爭奪女兒40萬學(xué)費(fèi),直言:我只想活著

      2020年,長沙女子癌癥晚期,爭奪女兒40萬學(xué)費(fèi),直言:我只想活著

      大魚簡科
      2026-04-06 11:33:07
      NBA調(diào)查!國王回應(yīng)故意犯規(guī)罰球高手小庫里:戰(zhàn)術(shù)失誤而非擺爛

      NBA調(diào)查!國王回應(yīng)故意犯規(guī)罰球高手小庫里:戰(zhàn)術(shù)失誤而非擺爛

      羅說NBA
      2026-04-09 06:14:42
      不要再管你的孩子叫“寶寶、小乖乖、崽”等,盡可能把他往高了叫

      不要再管你的孩子叫“寶寶、小乖乖、崽”等,盡可能把他往高了叫

      布衣粗食68
      2026-04-07 14:49:33
      2026-04-09 10:28:49
      AI進(jìn)化論花生 incentive-icons
      AI進(jìn)化論花生
      AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
      181文章數(shù) 109關(guān)注度
      往期回顧 全部

      科技要聞

      Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

      頭條要聞

      福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

      頭條要聞

      福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

      體育要聞

      40歲,但實力倒退12年

      娛樂要聞

      侯佩岑全家悉尼度假,一家四口幸福滿溢

      財經(jīng)要聞

      局勢再升級!霍爾木茲海峽關(guān)閉

      汽車要聞

      20萬級滿配華為全家桶 華境S是懂家庭的大六座

      態(tài)度原創(chuàng)

      時尚
      本地
      數(shù)碼
      房產(chǎn)
      公開課

      ED網(wǎng)紅病,正在掏空年輕女性

      本地新聞

      跟著歌聲游安徽,聽古村回響

      數(shù)碼要聞

      蘋果自助維修商店更新 新增多款設(shè)備獨(dú)立維修零件

      房產(chǎn)要聞

      超級卷王登場!海口首個抬板四代宅,徹底刷新認(rèn)知!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版