<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Open聯合創始人:AI大模型2025年度回顧

      0
      分享至

      Andrej Karpathy 是 OpenAI 聯合創始人、前特斯拉 AI 總監,也是全球最有影響力的 AI 研究者之一。他剛剛發布了一篇 2025 年 LLM 年度回顧。

      我推薦每一個AI產品經理都學習,這里翻譯為中文如下

      第一個大變化:訓練方法的范式升級

      2025 年之前,訓練一個好用的大模型基本是三步走:預訓練、監督微調、人類反饋強化學習。

      這個配方從 2020 年用到現在,穩定可靠。

      2025 年多了關鍵的第四步:RLVR,全稱是 Reinforcement Learning from Verifiable Rewards,翻譯過來就是「可驗證獎勵的強化學習」。

      什么意思?簡單說,就是讓模型在「有標準答案」的環境里反復練習。比如數學題,答案對就是對,錯就是錯,不需要人來打分。

      代碼也一樣,能跑通就是能跑通。

      這和之前的訓練有什么本質區別?之前的監督微調和人類反饋,本質上是「照葫蘆畫瓢」,人給什么樣本,模型學什么樣本。但 RLVR 不一樣,它讓模型自己摸索出解題策略。

      就像學游泳,之前是看教學視頻模仿動作,現在是直接扔水里,只要你能游到對岸,怎么劃水我不管。

      結果呢?模型自己「悟」出了看起來像推理的東西。它學會了把大問題拆成小步驟,學會了走錯路時回頭重來。這些策略如果靠人類標注示范,根本標不出來,因為人自己也說不清「正確的思考過程」長什么樣。

      這個變化帶來一個連鎖反應:算力的分配方式變了。以前大部分算力砸在預訓練階段,現在越來越多算力用于 RL 階段。

      模型的參數規模沒怎么漲,但推理能力飆升。OpenAI 的 o1 是這條路的起點,o3 是真正讓人「感覺到不一樣」的拐點。

      還有個新玩法:推理時也能花更多算力。讓模型「想久一點」,生成更長的推理鏈條,效果就更好。這相當于多了一個調節能力的旋鈕。

      第二個大變化:我們終于搞懂了 AI 是什么「形狀」的聰明

      Karpathy 用了一個很妙的比喻:我們不是在「養動物」,而是在「召喚幽靈」,人類的智能是進化出來的,優化目標是「在叢林里讓部落活下去」。

      大模型的智能是訓練出來的,優化目標是「模仿人類文本、在數學題里拿分、在評測榜單上刷分」。

      優化目標完全不同,出來的東西當然也完全不同。

      所以 AI 的智能是「參差不齊」的,英文叫 jagged intelligence。它可以在某些領域表現得像全知全能的學者,同時在另一些領域犯小學生都不會犯的錯。上一秒幫你推導復雜公式,下一秒被一個簡單的越獄提示騙走你的數據。

      為什么會這樣?因為哪個領域有「可驗證的獎勵」,模型在那個領域就會長出「尖刺」。

      數學有標準答案,代碼能跑測試,所以這些領域進步飛快。但常識、社交、創意這些領域,什么是「對」很難定義,模型就沒法高效學習。

      這也讓 Karpathy 對基準測試失去了信任。道理很簡單:測試題本身就是「可驗證環境」,所有基準都刷滿了,但離真正的通用智能還差得遠,這是完全可能發生的事。

      第三個大變化:LLM 應用層浮出水面

      Cursor 今年火得一塌糊涂,但 Karpathy 認為它最大的意義不是產品本身,而是證明了「LLM 應用」這個新物種的存在。

      大家開始討論「X 領域的 Cursor」,這說明一種新的軟件范式成立了。這類應用做什么?

      • 第一,做上下文工程。把相關信息整理好,喂給模型。

      • 第二,編排多個模型調用,后臺可能串了一堆 API 調用,平衡效果和成本。

      • 第三,提供專業場景的界面,讓人類能在關鍵節點介入。

      • 第四,給用戶一個「自主程度滑桿」。

      你可以讓它多干點,也可以讓它少干點。 有個問題被討論了一整年:這個應用層有多「厚」?模型廠商會不會把所有應用都吃掉?

      Karpathy 的判斷是:模型廠商培養的是「有通用能力的大學畢業生」,但 LLM 應用負責把這些畢業生組織起來、培訓上崗,變成能在具體行業干活的專業團隊。數據、傳感器、執行器、反饋循環,這些都是應用層的活。

      第四個大變化:AI 搬進了你的電腦 Claude Code 是今年最讓 Karpathy 印象深刻的產品之一。

      它展示了「AI 智能體」應該長什么樣:能調用工具、能做推理、能循環執行、能解決復雜問題。

      但更關鍵的是,它跑在你的電腦上。用你的環境、你的數據、你的上下文。 Karpathy 認為 OpenAI 在這里判斷失誤了。他們把 Codex 和智能體的重心放在云端容器里,從 ChatGPT 去調度。這像是在瞄準「AGI 終局」,但我們還沒到那一步。

      現實是,AI 的能力還是參差不齊的,還需要人類在旁邊看著、配合著干活。把智能體放在本地,和開發者并肩工作,才是當下更合理的選擇。 Claude Code 用一個極簡的命令行界面做到了這一點。

      AI 不再只是你訪問的一個網站,而是「住在」你電腦里的一個小精靈。這是一種全新的人機交互范式。

      第五個大變化:Vibe Coding 起飛了 2025 年,AI 的能力跨過了一個門檻:你可以純用英語描述需求,讓它幫你寫程序,完全不用管代碼長什么樣。Karpathy 隨手發了條推特,給這種編程方式起了個名字叫 vibe coding,結果這個詞火遍全網。

      這意味著什么?編程不再是專業程序員的專利,普通人也能做。這和過去所有技術的擴散模式都不一樣。以前新技術總是先被大公司、政府、專業人士掌握,然后才慢慢下沉。但大模型反過來,普通人從中受益的比例遠超專業人士。

      不只是「讓不會編程的人能編程」。對會編程的人來說,很多以前「不值得寫」的小程序現在都值得寫了。

      Karpathy 自己就用 vibe coding 做了一堆項目:用 Rust 寫了個定制的分詞器、做了好幾個工具類 App、甚至寫了一次性的程序只為找一個 bug。 代碼突然變得廉價、即用即棄、像草稿紙一樣隨便寫。

      這會徹底改變軟件的形態和程序員的工作內容。

      第六個大變化:大模型的「圖形界面時代」要來了 Google 的 Gemini Nano Banana 是今年最被低估的產品之一。

      它能根據對話內容實時生成圖片、信息圖、動畫,把回復「畫」出來而不是「寫」出來。 Karpathy 把這件事放到更大的歷史脈絡里看:大模型是下一個重大計算范式,就像 70 年代、80 年代的計算機一樣。所以我們會看到類似的演進路徑。 現在和大模型「聊天」,有點像 80 年代在終端敲命令。文字是機器喜歡的格式,但不是人喜歡的格式。

      人其實不愛讀文字,讀文字又慢又累。人喜歡看圖、看視頻、看空間布局。這就是傳統計算機為什么要發明圖形界面。 大模型也需要自己的「GUI」。

      它應該用我們喜歡的方式跟我們說話:圖片、幻燈片、白板、動畫、小應用。現在的 Emoji 和 Markdown 只是初級形態,幫文字「化個妝」。真正的 LLM GUI 會是什么樣?Nano Banana 是一個早期暗示。 最有意思的是,這不只是圖像生成的事。它需要把文本生成、圖像生成、世界知識全部絞在一起,在模型權重里融為一體。

      Karpathy 的總結是這樣的:2025 年的大模型,比他預期的聰明,也比他預期的蠢。兩者同時成立。 但有一點很確定:即使以現在的能力,我們連 10% 的潛力都沒挖掘出來。

      還有太多想法可以試,整個領域感覺是敞開的。

      他在 Dwarkesh 的播客里說過一句看似矛盾的話: > 他相信進步會繼續飛速推進, > 同時也相信還有大量的工作要做。

      兩件事并不矛盾。2026 年系好安全帶繼續加速吧。

      “分享產品經理改變世界的點滴”

      產品顧問| 產品咨詢|培訓合作

      請添加微信 PMxiaowanzi

      最近我的原創

      每日案例拆解庫,AI等產品打卡群

      我創建的產品設計打卡社群,加入后365天,每天體驗一款APP。提升產品設計能力,同時有1300份體驗報告幫助你找到競品

      在這里你可以隨時查詢到你想找的各類競品行業APP,無須自己親自下載就可以馬上得到APP的一手產品優化、交互設計、功能描述信息。

      從優化&建議、商業模式、運營、功能描述、交互設計、產品定位至少6個維度,體驗一款應用。

      平均1天1塊錢,掃碼購買即可加入

      連續體驗48款應用,通過后原路退回


      報名后添加星球助理

      PMTalk123

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      結束了!再見河村勇輝!收官戰NBA生涯新高

      結束了!再見河村勇輝!收官戰NBA生涯新高

      籃球實戰寶典
      2026-04-13 16:42:40
      以軍準備再對伊朗發動襲擊

      以軍準備再對伊朗發動襲擊

      每日經濟新聞
      2026-04-13 07:38:17
      Kimi正臉照流出,生圖下臉歪嘴斜牙齒外凸,網友:不像林志穎了

      Kimi正臉照流出,生圖下臉歪嘴斜牙齒外凸,網友:不像林志穎了

      不似少年游
      2026-04-13 16:57:07
      總部必須在杭州!張雪師父牙哥造飛機:定價在20萬到60萬區間

      總部必須在杭州!張雪師父牙哥造飛機:定價在20萬到60萬區間

      快科技
      2026-04-13 18:03:05
      CBA積分榜:季后賽定9席!遼寧險勝提前晉級,廣州掌握主動權

      CBA積分榜:季后賽定9席!遼寧險勝提前晉級,廣州掌握主動權

      燒體壇
      2026-04-13 21:51:41
      科大訊飛員工中1500萬彩票火速離職,網友:羨慕了

      科大訊飛員工中1500萬彩票火速離職,網友:羨慕了

      鞭牛士
      2026-04-13 09:48:14
      張成剛:大量網約車司機可能會“逃避”新規來確保收入

      張成剛:大量網約車司機可能會“逃避”新規來確保收入

      經濟觀察報
      2026-04-13 15:37:06
      陳麗華離世8天,一大傳聞來勢洶洶,事關另一女人,難怪官媒出手

      陳麗華離世8天,一大傳聞來勢洶洶,事關另一女人,難怪官媒出手

      阿鳧愛吐槽
      2026-04-14 02:57:03
      張凌赫軍裝造型火海外 碾壓韓劇男主引熱議

      張凌赫軍裝造型火海外 碾壓韓劇男主引熱議

      喜歡歷史的阿繁
      2026-04-12 02:15:42
      我國肝癌高發,茶葉是背后的禍因?醫生勸告:3種茶才是幫兇

      我國肝癌高發,茶葉是背后的禍因?醫生勸告:3種茶才是幫兇

      岐黃傳人孫大夫
      2026-04-12 06:30:03
      超京粵升第3!深圳13連勝送四川38連敗 賀希寧33分王浩然29+10

      超京粵升第3!深圳13連勝送四川38連敗 賀希寧33分王浩然29+10

      醉臥浮生
      2026-04-13 21:09:06
      天氣回暖,醫生叮囑糖尿病患者:寧愿打打麻將,也別輕易做這3事

      天氣回暖,醫生叮囑糖尿病患者:寧愿打打麻將,也別輕易做這3事

      新時代的兩性情感
      2026-04-14 02:23:11
      中俄管道生變,哈薩克斯坦強勢插隊,蒙古國:怎么就讓他截胡了?

      中俄管道生變,哈薩克斯坦強勢插隊,蒙古國:怎么就讓他截胡了?

      愛史紀
      2026-04-14 00:33:16
      下午察:賣假貨的董宇輝為何不驚慌

      下午察:賣假貨的董宇輝為何不驚慌

      周軍律師聊案子
      2026-04-11 16:10:04
      巴基斯坦預警機緊急升空!以色列偷襲計劃落空,中方戰術果然高

      巴基斯坦預警機緊急升空!以色列偷襲計劃落空,中方戰術果然高

      十三級臺階
      2026-04-11 09:09:36
      一線記者傳回中東戰報,伊朗國內的慘烈程度,遠比想象中大得多

      一線記者傳回中東戰報,伊朗國內的慘烈程度,遠比想象中大得多

      滄海旅行家
      2026-04-13 14:41:54
      科大訊飛回應“員工中1500萬彩票”

      科大訊飛回應“員工中1500萬彩票”

      界面新聞
      2026-04-13 16:42:49
      山東省菏澤市委常委、秘書長肖友華接受審查調查

      山東省菏澤市委常委、秘書長肖友華接受審查調查

      界面新聞
      2026-04-13 10:04:23
      斯諾克世錦賽14日戰報:中國3勝3負,一場德比,10-1大勝

      斯諾克世錦賽14日戰報:中國3勝3負,一場德比,10-1大勝

      吳锎旅行ing
      2026-04-14 02:39:22
      撕破臉了!巴西前模特警告特朗普:你們兩口子什么樣我最清楚!

      撕破臉了!巴西前模特警告特朗普:你們兩口子什么樣我最清楚!

      愛一449
      2026-04-13 21:02:39
      2026-04-14 03:43:00
      Kevin改變世界的點滴 incentive-icons
      Kevin改變世界的點滴
      每周一次,產品案例與經驗分享
      288文章數 21關注度
      往期回顧 全部

      科技要聞

      "抄作業"近四年,馬斯克版微信周五上線

      頭條要聞

      上海女子2個月內結2次婚 生下的孩子卻是第3個男人的

      頭條要聞

      上海女子2個月內結2次婚 生下的孩子卻是第3個男人的

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      初代“跑男團”合體,鄧超、鹿晗缺席

      財經要聞

      談判未完全關閉?3國力促美伊重啟談判

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      房產
      本地
      時尚
      公開課
      軍事航空

      房產要聞

      6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      今年春夏一定要擁有的4條裙子,這樣穿減齡又好看!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:今晚10點封鎖伊朗 對北約非常失望

      無障礙瀏覽 進入關懷版