<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AI 大神 Karpathy 2025 年度總結(jié)刷屏:AI 既是天才也是智障,這 6 個轉(zhuǎn)折最關(guān)鍵

      0
      分享至


      最近各種年度回顧陸續(xù)上線, OpenAI 的前聯(lián)合創(chuàng)始人 Andrej Karpathy 也交出了自己對大模型的年度總結(jié)

      就在今年早些時候,他在 YC 的一場演講刷爆了全網(wǎng),提出了不少新的觀點:

      • 軟件 3.0 已來: 從最初的人寫代碼(1.0),到喂數(shù)據(jù)訓練模型(2.0),現(xiàn)在我們進入了直接對模型「念咒語」(Prompt)的 3.0 時代。
      • LLM 是新操作系統(tǒng): 它不是像自來水一樣的普通商品,而是一個負責調(diào)度內(nèi)存(Context Window)和 CPU(推理算力)的復雜 OS。
      • Agent 的十年: 別指望 AI Agent 一年就成熟,從 99% 到 99.999% 的可靠性,我們需要走上十年。

      Karpathy 今天這篇《2025 年度總結(jié)》,他再次向我我們剖析了這一年 AI 究竟長出了什么樣的「腦子」。

      以下是對 Karpathy 年度總結(jié)的精譯,APPSO 在不改變原意的基礎(chǔ)上做了更多通俗解讀。

      如果想看原文可以點擊 https://karpathy.bearblog.dev/year-in-review-2025/

      2025 年是 LLM(大語言模型)發(fā)展強勁且充滿變數(shù)的一年。以下是我列出的幾點個人認為值得注意且稍感意外的「范式轉(zhuǎn)變」——這些變化不僅重塑了行業(yè)版圖,更在概念層面上狠狠地沖擊了我的認知。

      太長不看版:

      2025 年既讓人興奮,又有點讓人措手不及。

      LLM 正在作為一種新型智能涌現(xiàn),它同時比我預期的要聰明得多,也比我預期的要笨得多。

      無論如何,它們極其有用。我認為即使以目前的能力,行業(yè)甚至還沒挖掘出其潛力的 10%。同時,還有太多的想法可以嘗試,從概念上講,這個領(lǐng)域感覺依然廣闊。正如我今年早些時候提到的,我同時(表面上矛盾地)相信:我們將看到持續(xù)快速的進步,但前方仍有大量艱苦的工作要做。

      系好安全帶,我們要發(fā)車了。

      1. RLVR:教 AI 像做奧數(shù)題一樣「思考」

      在解釋這個復雜的基礎(chǔ)概念之前,先看看以前是大模型訓練是怎么做的?

      在 2025 年初,各大實驗室訓練 LLM 的「老三樣」配方非常穩(wěn)定:

      1. 預訓練(Pretraining):像 GPT-3 那樣,讓 AI 讀遍全網(wǎng)文章,學會說話。

      2. 監(jiān)督微調(diào)(SFT):找人寫好標準答案,教 AI 怎么回答問題。

      3. 人類反饋強化學習(RLHF):讓 AI 生成幾個答案,人來打分,教它討人喜歡。

      現(xiàn)在發(fā)生了什么變化?

      2025 年,我們在這個配方里加了一味猛藥:RLVR(從可驗證獎勵中進行強化學習)。

      這是什么意思?

      簡單來說,就是不再讓人來打分(人太慢且主觀),而是讓 AI 去做那些「有標準答案」的任務,比如數(shù)學題或?qū)懘a。對就是對,錯就是錯,機器能自動驗證。

      在數(shù)百萬次的自我博弈和試錯中,模型自發(fā)地演化出了看似「推理」的策略。它們學會了先把大問題拆解成小步驟,甚至學會了「回過頭來檢查」這種高級技巧(參考 DeepSeek R1 論文)。

      核心對比:

      • 舊范式(RLHF): 像是教小孩寫作文。因為沒有標準答案,AI 很難知道自己哪一步想錯了,只能模仿人類的語氣。
      • 新范式(RLVR): 像是把 AI 關(guān)進奧數(shù)訓練營。不用教它具體怎么想,只要給它足夠多的題和對錯反饋,它自己就能摸索出解題套路。

      這一招太好用了,以至于 2025 年大部分算力都被這只「吞金獸」吃掉了。結(jié)果就是:模型并沒有變大,但訓練時間變長了。 我們還獲得了一個新旋鈕:讓 AI 思考得久一點。OpenAI 的 o1 是開端,而 o3 則是真正的拐點。

      2. 幽靈 vs 動物:AI 不是「電子寵物」

      2025 年,我和整個行業(yè)終于從直覺上理解了 LLM 智能的「形狀」。

      一個驚悚的比喻:我們不是在像養(yǎng)寵物一樣「進化/養(yǎng)育動物」,我們是在「召喚幽靈」

      為什么這么說?

      因為 AI 的一切都和生物不同。人類的大腦是為了在叢林里活下來、為了繁衍后代而優(yōu)化的;而 LLM 的大腦是為了模仿人類文字、在數(shù)學題里拿分、在競技場里騙贊而優(yōu)化的。

      參差不齊的智能(Jagged Intelligence):

      正是因為 RLVR(可驗證獎勵)的存在,AI 的能力在某些領(lǐng)域(如數(shù)學、編程)會突然飆升成刺狀。這就導致了一種極其滑稽的現(xiàn)象:

      • 它同時是一個絕世天才(秒解高數(shù)題);
      • 又是一個智障小學生(會被簡單的邏輯陷阱騙得團團轉(zhuǎn))。


      ▲這里 Karpathy 引用了一張梗圖:人類智能是圓潤的藍色圓圈,AI 智能是像海膽一樣滿是尖刺的紅色圖形。這很形象.

      這也解釋了為什么我對現(xiàn)在的「跑分榜單」(Benchmarks)失去了信任。

      什么是「刷榜」的本質(zhì)?

      既然榜單是可驗證的,那就可以用 RLVR 針對性訓練。現(xiàn)在的實驗室都在搞「應試教育」,把 AI 的能力尖刺專門往考題上長。「在測試集上訓練」已經(jīng)不僅僅是作弊,而成了一門新的藝術(shù)形式。

      3. Cursor:不僅是編輯器,更是「包工頭」


      Cursor 今年的爆火,揭示了一個新真相:LLM 應用層比我們想象的要厚。

      大家開始談論「醫(yī)療界的 Cursor」、「法律界的 Cursor」。這些應用到底做了什么?

      • 「上下文工程師」: 幫你整理好所有背景資料喂給 AI。
      • 「工頭」: 在后臺偷偷指揮多個 LLM 干活,把復雜任務拆解,還要幫你省錢。
      • 「遙控器」: 給你一個調(diào)節(jié)「自主性」的滑塊,決定放手讓 AI 干多少。

      預測:大模型實驗室(如 OpenAI)會負責培養(yǎng)「全科大學生」;而應用開發(fā)商(如 Cursor)則負責給這些學生提供私有數(shù)據(jù)和工具,把他們組建成「專業(yè)施工隊」

      4. Claude Code:住在你電腦里的「賽博幽靈」


      Claude Code (CC) 的出現(xiàn)讓我眼前一亮。它不僅僅是一個能寫代碼的 Agent(智能體),更重要的是:它活在你的電腦里

      對比來看,我認為OpenAI 搞錯了方向。

      OpenAI 早期的 Agent 都在云端跑(ChatGPT),離你的真實環(huán)境太遠。雖然云端智能體聽起來像是 AGI 的終局,但在當前這個「參差不齊」的過渡階段,本地才是王道。

      為什么本地很重要?

      因為你的代碼、你的配置、你的密鑰、你的混亂環(huán)境,都在本地。Anthropic(Claude 的母公司)搞對了優(yōu)先級,他們把 AI 塞進了一個小小的命令行界面(CLI)里。

      它不再是你瀏覽器里的一個網(wǎng)頁(像 Google 那樣),它變成了一個寄宿在你電腦里的「賽博幽靈」,隨時準備幫你干活。這才是未來 AI 交互的樣子。

      5. Vibe Coding

      什么是 Vibe Coding?

      這是我在推特上隨口造的一個詞(居然火了):意思是寫代碼不再需要你真的懂語法,你只需要用英語描述你的「意圖」和「感覺」,剩下的交給 AI。

      這帶來了什么改變?

      • 對于普通人: 編程的門檻徹底消失了。
      • 對于專家: 代碼變得像紙巾一樣「廉價、一次性、用完即棄」。

      舉個例子,我為了找一個 Bug,可能會讓 AI 現(xiàn)場寫一個專門的 App 來測試,測完就刪。放在以前,為了找個 Bug 專門寫個 App?瘋了吧!但在 2025 年,代碼是免費的。

      Vibe Coding 將會徹底重塑軟件行業(yè),也會改寫程序員的招聘 JD。

      6. Nano Banana:AI 終于有了自己的「臉」


      為什么現(xiàn)在的 AI 交互很反人類?

      不管是 ChatGPT 還是 Claude,我們還在用「打字」跟它們聊天。這就像 80 年代還在用 DOS 命令行的黑底白字。

      事實是: 計算機喜歡文本,但人類討厭讀文本。人類是視覺動物,我們喜歡看圖、看表、看視頻。

      Google Gemini Nano banana(這是一個虛構(gòu)的模型代號,指代某種多模態(tài)交互模型)是 2025 年的另一個范式轉(zhuǎn)變。它暗示了未來的 LLM GUI(圖形界面) 是什么樣子的

      未來的 AI 不應該給你吐一堆字,它應該直接給你畫一張圖、生成一個網(wǎng)頁、彈出一個交互面板。 這不僅僅是「畫圖」,而是將文本生成、邏輯推理和視覺表達糾纏在一起的混合能力。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      云南副局長出軌被抓:不雅畫面流出,三人對話內(nèi)容曝光,原配被扒

      云南副局長出軌被抓:不雅畫面流出,三人對話內(nèi)容曝光,原配被扒

      博士觀察
      2025-12-30 18:59:06
      最新證據(jù)出爐,姜昆不僅去了美國,還去了墨西哥

      最新證據(jù)出爐,姜昆不僅去了美國,還去了墨西哥

      金牌娛樂
      2025-12-29 12:15:10
      李在明下館子慶祝入駐青瓦臺 街頭與市民合影

      李在明下館子慶祝入駐青瓦臺 街頭與市民合影

      看看新聞Knews
      2025-12-31 18:25:03
      失業(yè)潮的終極解法,歷史只教了我們一課:不是救濟,是戰(zhàn)爭

      失業(yè)潮的終極解法,歷史只教了我們一課:不是救濟,是戰(zhàn)爭

      經(jīng)濟學教授V
      2025-12-30 18:41:37
      中雪!江蘇發(fā)布最新全省雨雪落區(qū)預報圖

      中雪!江蘇發(fā)布最新全省雨雪落區(qū)預報圖

      江蘇警方
      2025-12-31 13:04:10
      拿了中國幾十億投資就翻臉,資源全賣給美國,如今求助我們該幫么

      拿了中國幾十億投資就翻臉,資源全賣給美國,如今求助我們該幫么

      凡知
      2025-12-29 11:08:56
      一頓飯11個菜,客廳大得能打球,哭窮的閆學晶害慘“啃老”的兒子

      一頓飯11個菜,客廳大得能打球,哭窮的閆學晶害慘“啃老”的兒子

      翰飛觀事
      2025-12-30 11:56:38
      從5連敗到5連勝!快船實現(xiàn)蛻變,激活萊昂納德,找到加強版祖巴茨

      從5連敗到5連勝!快船實現(xiàn)蛻變,激活萊昂納德,找到加強版祖巴茨

      球場沒跑道
      2025-12-31 15:29:31
      2026年1月起,江蘇養(yǎng)老金、工資將迎來新變化,部分人收入增加

      2026年1月起,江蘇養(yǎng)老金、工資將迎來新變化,部分人收入增加

      有范又有料
      2025-12-31 09:16:26
      部分高位人氣股跳水

      部分高位人氣股跳水

      第一財經(jīng)資訊
      2025-12-31 10:25:13
      美專家驚人兵推曝光:美軍若向京滬扔核彈,中國不會選擇對等報復

      美專家驚人兵推曝光:美軍若向京滬扔核彈,中國不會選擇對等報復

      番茄說史聊
      2025-12-28 14:09:37
      年底兩天微信支付不能使用?微信回應

      年底兩天微信支付不能使用?微信回應

      新京報
      2025-12-31 12:25:11
      陜甘之戰(zhàn)——漢人最偉大的一場巔峰戰(zhàn)役,帶領(lǐng)華夏重回世界之巔

      陜甘之戰(zhàn)——漢人最偉大的一場巔峰戰(zhàn)役,帶領(lǐng)華夏重回世界之巔

      小豫講故事
      2025-12-31 06:00:06
      2025十佳運動員出爐:全紅嬋落榜,孫穎莎位列第四,他意外上榜

      2025十佳運動員出爐:全紅嬋落榜,孫穎莎位列第四,他意外上榜

      阿纂看事
      2025-12-30 09:22:12
      解放軍離登島只差一步,特朗普一句話讓臺當局如墜冰窖,高市沉默

      解放軍離登島只差一步,特朗普一句話讓臺當局如墜冰窖,高市沉默

      時時有聊
      2025-12-30 17:37:32
      京東001號快遞員已退休,勤懇工作16年,劉強東承諾的房給了嗎?

      京東001號快遞員已退休,勤懇工作16年,劉強東承諾的房給了嗎?

      阿纂看事
      2025-12-10 15:38:14
      錢再多有啥用?身價上億美金的貝克漢姆現(xiàn)狀,給所有運動員提了醒

      錢再多有啥用?身價上億美金的貝克漢姆現(xiàn)狀,給所有運動員提了醒

      人間無味啊
      2025-12-24 19:34:17
      災難級表現(xiàn)!紐卡世界級球星全場夢游 名宿怒批:毫無斗志

      災難級表現(xiàn)!紐卡世界級球星全場夢游 名宿怒批:毫無斗志

      瀾歸序
      2025-12-31 08:13:09
      北京紫金書院發(fā)生業(yè)主大規(guī)模拒收事件

      北京紫金書院發(fā)生業(yè)主大規(guī)模拒收事件

      地產(chǎn)微資訊
      2025-12-31 14:08:14
      全球經(jīng)濟警報拉響:2026年或?qū)⒈l(fā)“史無前例”的金融危機!

      全球經(jīng)濟警報拉響:2026年或?qū)⒈l(fā)“史無前例”的金融危機!

      復轉(zhuǎn)這些年
      2025-12-30 23:52:23
      2025-12-31 19:07:00
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38251文章數(shù) 2600501關(guān)注度
      往期回顧 全部

      科技要聞

      老羅,演砸了,也封神了?

      頭條要聞

      青島保時捷女銷售2025年再奪銷冠 1年賣192臺車破紀錄

      頭條要聞

      青島保時捷女銷售2025年再奪銷冠 1年賣192臺車破紀錄

      體育要聞

      快船大勝國王解鎖5連勝 小卡33+5+5

      娛樂要聞

      林俊杰女友被扒 父親涉經(jīng)濟案卷款13億?

      財經(jīng)要聞

      高培勇:分配制度改革是提振消費的抓手

      汽車要聞

      凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

      態(tài)度原創(chuàng)

      家居
      本地
      親子
      游戲
      公開課

      家居要聞

      無形有行 自然與靈感詩意

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      親子要聞

      幼兒園娃娃當家作“市”義賣,迎新日里愛心暖滿園

      跳水瞎迎來高光?爐石1月份高分段卡組推薦,新版任務防戰(zhàn)有說法

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲无码天堂| 欧美日韩亚洲国产| 丁香五月激情图片| 天堂中文8资源在线8| 四虎成人在线观看免费| 91资源总站| 无码天堂成人| 国产中年熟女高潮大集合| 美女露出奶头扒开尿口免费网站| 久久精品国产精品亚洲毛片| 国产成人精品综合在线观看| 亚洲成人在线网站| 陵水| 国产av一区二区三区| 熟妇好大好深好满好爽| 人妻va精品va欧美va| 97免费人妻在线视频| 国产乱沈阳女人高潮乱叫老| 日韩91| 伊春市| 中文字幕av高清片| 精品熟女亚洲av在线观看| 美女毛片| 宿松县| 亚洲国产长腿丝袜av天堂 | 欧美一区二区三区成人久久片| 国产精品一区二区三区黄| 日韩大片高清播放器| 爆菊熟女人妻| 99re66| 老师破女学生处特级毛ooo片| 久久天天躁狠狠躁夜夜2020老熟妇| 国产XXXX| 美女高潮黄又色高清视频免费| 老熟妇仑乱视频一区二区| 老熟妇仑乱视频一区二区| 自拍 另类 综合 欧美小说| 色偷偷亚洲女人天堂观看| 国产黄色短视频| 老司机久久影院| 久久天天躁夜夜躁狠狠|