2025年眼看就要收尾,AI圈的年終總結(jié)直接炸場了!
OpenAI元老、前特斯拉AI負(fù)責(zé)人安德烈·卡帕西(Andrej Karpathy)曬出的年終大模型清單,一發(fā)布就引爆全網(wǎng),近兩百萬網(wǎng)友蹲點圍觀。
這位曾入選MIT 35歲以下科技創(chuàng)新榜單的大佬,總結(jié)里沒有半句廢話,全是重塑行業(yè)格局的“范式級突破”。咱們今天就用大白話拆透,看看今年的AI到底藏著哪些真本事,又有哪些坑要避。
![]()
講真,2025年大模型的核心提升,壓根不是模型體量變大,而是訓(xùn)練路子換了——可驗證獎勵強化學(xué)習(xí)(RLVR)直接頂替了之前的RLHF,成了行業(yè)通用玩法。
以前訓(xùn)練大模型,全靠人類標(biāo)注員打分,不僅費錢又慢,遇到數(shù)學(xué)推理這種復(fù)雜活,壓根教不會。
但RLVR就聰明多了,它讓模型在數(shù)學(xué)題、代碼題這些有標(biāo)準(zhǔn)答案的“題庫”里自己刷題,拆解步驟、試錯修正,慢慢摸出最優(yōu)解題思路,這種思考過程,人類想手動設(shè)計都難。
![]()
更關(guān)鍵的是,RLVR的評分標(biāo)準(zhǔn)客觀又難作弊,能讓模型長時間“刷題”修煉。
哪怕是和以前規(guī)模差不多的模型,練久了能力也能翻倍,性價比直接拉滿,甚至把原本用來做預(yù)訓(xùn)練的算力都搶著用。
OpenAI去年底的o1模型先露了手,今年初的o3版本直接迎來質(zhì)變,成了RLVR落地的標(biāo)桿,能力提升肉眼可見。
![]()
不是真懂推理,甚至用隨機(jī)獎勵、錯誤標(biāo)簽訓(xùn)練,某些模型也能漲分,換個新場景就歇菜,泛化能力還得再觀察。
這也印證了Karpathy說的“鋸齒智能”——現(xiàn)在的AI就是個偏科生,可驗證領(lǐng)域是天才,換個場景可能就變笨蛋,就像有工程師說的,AI能解復(fù)雜難題,卻可能在簡單常識題上翻車。
不知道你有沒有發(fā)現(xiàn),2025年AI Agent算是徹底火出圈了,但真正能打的,反而不是云端巨頭,而是扎進(jìn)你電腦里的“小幽靈”。
Karpathy在清單里重點夸了Claude Code,說它是第一個讓他覺得“像真Agent”的工具。
和OpenAI把Agent放在云端調(diào)度不同,Claude Code直接裝在你電腦里,能用你的本地環(huán)境、數(shù)據(jù),循環(huán)串聯(lián)推理與工具調(diào)用。
![]()
再難的長周期任務(wù)都能啃下來,極簡的操作界面更是戳中開發(fā)者痛點。
這種貼身干活的定位,比云端Agent更懂實際需求,用著也更順手。
但Karpathy也沒盲目吹,他10月在播客里直言,現(xiàn)在的Agent還有三大短板:不會持續(xù)學(xué)習(xí)、不能真正多模態(tài)、操作電腦的能力還差得遠(yuǎn),要想達(dá)到能“雇傭”的水平,至少還得等十年。
這就像自動駕駛,從90%可靠度沖到99.9999%,每多一個9,都要付出天大的努力。
![]()
Agent爆火的同時,也帶火了Karpathy隨口創(chuàng)造的“Vibe Coding(氛圍編程)”。
現(xiàn)在不用死磕代碼,用英語就能搭復(fù)雜程序,連Meta、谷歌這些大廠的工程師,都開始用這種方式干活——先寫好測試,再讓AI生成代碼,效率直接翻倍。
普通人能上手編程,工程師能快速趕demo、臨時排bug,代碼徹底變“廉價”了,用完就能丟,軟件形態(tài)和職場角色都在跟著變天。
![]()
![]()
12月4日的技術(shù)報告顯示,Nano Banana Pro已經(jīng)在生命科學(xué)領(lǐng)域落地用起來了,能生成精準(zhǔn)的解剖圖、代謝路徑圖,還能合成醫(yī)學(xué)影像幫科研人員訓(xùn)練模型,省了不少時間。
從另一個角度看,Nano Banana也是Gemini家族多模態(tài)路線的極致體現(xiàn)。
![]()
2025年的大模型,就是個“偏科天才”——靠RLVR實現(xiàn)能力躍遷,在可驗證領(lǐng)域能封神,卻在常識題上可能翻車;Agent和氛圍編程改變了工作方式,卻還沒成熟到能“打工”。
Karpathy說行業(yè)潛力才發(fā)揮10%,這話一點不假。現(xiàn)在的AI就像剛學(xué)會走路的孩子,未來十年會慢慢融入每份工作、每種生活,咱們能做的,就是跟上節(jié)奏,別被時代甩在身后!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.