![]()
智東西
編譯 王欣逸
編輯 程茜
智東西12月30日消息,今天,AI學術大牛、斯坦福大學教授、谷歌大腦聯合創始人吳恩達在社交媒體平臺發布公開信和一篇長文,稱2025年或將作為AI工業時代的黎明,并總結了今年AI發展的四大關鍵詞:模型的推理能力、AI人才爭奪戰、巨大規模的AI基建以及編程Agent的普及。
在公開信中,吳恩達分享了關于掌握AI系統構建能力的三步法:系統學習AI課程、動手實踐構建項目和閱讀前沿研究論文。
![]()
關于模型的推理能力,吳恩達提到,它已成為大多數新一代模型的內置常規能力,能顯著提升模型在各種任務上的表現,而這一能力,在2025年初還需通過特別提示來觸發。
今年7月,由Meta首先引爆的AI人才爭奪戰將AI人才的市場價值推向前所未有的高度。AI數據標注公司Scale AI的首席執行官汪滔(Alexandr Wang)及其核心團隊、蘋果AI研發團隊負責人龐若鳴等AI大牛加盟Meta,在這場人才混戰中,微軟AI CEO穆斯塔法·蘇萊曼(Mustafa Suleyman)挖走谷歌20多名研究員和工程師,特斯拉首席執行官埃隆·馬斯克(Elon Musk)也為xAI挖走Meta的10余名工程師。
在AI基礎設施上,吳恩達認為,2025年可能正是一個以AI基礎設施為核心的新工業時代的開端,代表項目有OpenAI、甲骨文和軟銀聯合推進的“星際之門”項目、Meta的“Hyperion”項目。
全球知名咨詢公司貝恩公司估計,2030年AI行業年收入需達到2萬億美元(約合人民幣13.98萬億元)才能支撐這些AI基建投入,而這一數據將超過亞馬遜、蘋果、Alphabet、微軟、Meta和英偉達2024年的收益總和。
在編程Agent的發展上,吳恩達認為,無需擔心AI將取代初級開發者,AI輔助編程很快可能就被簡單地視為編程本身,類似拼寫檢查和自動補全是寫作的一部分,而擅長使用AI的開發者的開發效率和質量將遠勝以往。
以下為吳恩達的信和年度AI總結特刊全文編譯(為優化閱讀體驗,智東西做了不改變原意的編輯):
親愛的朋友們:
又一年AI技術的飛速進步,為每個人創造了前所未有的軟件開發機遇,包括剛剛踏入這個領域的人。現實情況是,如今很多公司都難以招到足夠多的熟練AI人才。每年冬天,我都會抽出時間學習和做些項目,也希望你能一起。這不僅能幫我鞏固舊技能、掌握新本領,也能為你的科技職業道路增添助力。
想真正掌握構建AI系統的能力,我的建議是:
1、系統學習AI課程
2、動手實踐構建項目
3、(可選)閱讀前沿研究論文
下面我會具體說說為什么這三條缺一不可。
我注意到,有些開發者會建議新人“直接開干,別管學習”。這其實是個非常糟糕的建議!除非你本身就處在一個經驗豐富的AI開發者社群里,能隨時獲得指導,否則在缺乏基礎知識的情況下直接動手,很可能意味著你會重復發明輪子,而且更可能的是,費力造出一個更差的輪子。
舉個例子,我在面試中遇到過一些開發者,他們曾耗費大量時間“重新發明”了標準的RAG文檔分塊方案,重復實現了已有的Agent評估方法,或是寫出了難以維護的大模型上下文管理代碼。如果他們事先學過幾門相關的課程,就能更好地理解那些現成的、成熟的模塊。他們當然依然可以選擇從頭搭建(甚至可能造出更好的),但這本可以避免他們數周不必要的重復勞動。
所以,系統的結構化學習很重要,更何況,我發現學習課程本身也充滿樂趣。比起刷劇,我更愿意每天聽一場資深AI講師的精彩課程。
與此同時,僅僅上課是不夠的。有很多經驗教訓,只有通過動手實踐才能獲得。學習飛機的工作原理對成為飛行員至關重要,但沒人能只靠上課就學會駕駛。關鍵的一步,是真正坐進駕駛艙。 好消息是,借助如今高度智能化的Agent編程,實際構建的過程已變得前所未有的便捷。同時,系統學習AI的構成模塊,也常能點燃你創作新項目的靈感。每當我缺乏項目靈感時,通常會選擇去上課或讀幾篇論文,這樣做一段時間之后,新想法總會源源不斷地涌現。更重要的是,動手構建本身充滿樂趣,我希望你也能親身感受到這份快樂。
最后,不是每個人都必須這樣做,但我觀察到,當今就業市場上最具競爭力的候選人大多保持著偶爾閱讀論文的習慣。雖然我發現研究論文比課程難消化得多,但它包含著大量尚未被簡化普及的前沿知識。我將它的優先級置于系統學習和實踐構建之后,但如果你有機會提升閱讀論文的能力,我強烈建議你去嘗試(你也可以參考我早年關于如何讀論文的建議視頻)。對我來說,學習和構建充滿趣味,而讀論文有時則像“苦差”,但從閱讀論文中獲得的靈光一閃是令人愉悅的。
祝你有一個美好的冬日假期,新年快樂!除了學習和構建,我也希望你能花時間與所愛之人共度,那同樣重要!
此致
安德魯
以下為吳恩達發布在《The Batch》上的年度AI總結特刊,標題為《2025年頂級AI新聞(Top AI Stories of 2025)》。
2025年或將作為AI工業時代的黎明。創新驅動模型性能邁上新臺階,AI應用正變得無處不在、不可或缺,頂尖企業為爭奪人才激烈角逐,大規模基礎設施建設也拉動了美國經濟增長。與過去的冬季假日季一樣,本期《The Batch》特刊梳理了過去一年的核心脈絡。隨著AI更深地融入社會生活的方方面面,新的一年將有望進一步鞏固這些變革的根基。
一、思考模型:解決更復雜的問題
一步一步思考、解釋你的推理、從答案倒推,這些策略在2025年初還需通過特別提示來觸發,而如今,它們已成為大多數新一代大型語言模型的內置常規能力,顯著提升了模型在各種任務上的表現。
(1)發生了什么:
這一變革始于2023年底OpenAI推出首個具備自主推理工作流的“思考”模型o1。隨后,DeepSeek-R1于2024年1月展示了構建此類模型的可行路徑。其直接成果是:數學與編程能力大幅躍升,問答準確性提高,機器人更加智能,AI Agent也發展迅猛。
(2)發展脈絡:
此類模型能力的源頭可追溯到論文《大模型是零樣本推理者(Large Language Models Are Zero-Shot Reasoners)》,其中提出的“讓我們一步一步地思考”提示詞,能顯著改善模型輸出。研究人員很快意識到,可通過訓練將這種推理策略內化。關鍵方法在于強化學習微調:通過獎勵模型產生正確答案,從而讓其在輸出前進行深度“思考”。
1、最初的幾個推理模型專門通過RL進行訓練,以正確解決數學問題、準確回答科學問題和完成代碼生成任務,成績斐然。例如,o1-preview在AIME 2024數學競賽上的表現較GPT-4o提升43個百分點,在博士級科學考試GPQA Diamond上提升22個百分點,其編程能力在Codeforces平臺上可位列人類程序員的前62%,遠超GPT-4o的11%。
2、當推理模型學會調用計算器、搜索引擎等外部工具時,能力進一步增強。例如,配備工具后,OpenAI o4-mini在一項涵蓋100個領域的多模態專業測試中,準確率提升了3個百分點以上。
3、機器人行動模型(Robotic action models)已通過RL訓練進行推理。例如,與像OpenVLA這樣的非思考模型相比,ThinkAct模型通過推理在任務中獲得了約8%的性能提升。
4、同時,它助力AI Agent解決復雜問題。例如,AlphaEvolve使用Google Gemini反復生成、評估和修改代碼,最終為現實世界問題生成更快的算法。同樣,AI Co-Scientist使用Gemini生成科學研究提案,然后審查、排名并改進它們,其中一項關于抗生素耐藥性的假設竟與人類科學家同期獨立提出的想法不謀而合。
(3)潛在局限:
然而,推理模型可能并不像看起來那樣理性。
蘋果公司的一項研究指出,即使給模型提供了能解決難題的算法,推理模型也無法解決超出一定復雜度的謎題。模型應用算法的能力不足,對機器推理與人類推理之間的表面相似性提出了質疑。
Anthropic的研究發現,雖然模型的推理步驟有助于解釋它如何得出結論,但這些步驟也可能省略了促成結論的關鍵信息。例如,可以在提示中加入暗示來引導推理模型產生特定輸出,但這些暗示可能不會在其推理步驟中體現。
(4)現狀:
推理顯著提升了大模型性能。然而,更好的輸出是有代價的。啟用了推理的Gemini 3 Flash使用了1.6億個Token來運行Artificial Analysis Intelligence Index的基準測試(并獲得了71分),而未啟用推理的Gemini 3 Flash使用了740萬個Token(獲得了低得多的55分)。此外,啟用推理也導致了生成延遲,增加了對模型推理服務商更快提供Tokens的壓力。研究人員正在尋找方法優化效率。Claude Opus 4.5和設置為高推理模式的GPT-5.1獲得了相同的性能分數,但前者使用了4800萬個Tokens,后者則使用了8100萬個Tokens。
二、大型AI公司的高薪人才爭奪戰
科技巨頭間爆發了一場激烈的人才爭奪戰,為吸引頂尖人才,它們開出了堪比職業體育明星的天價薪酬。
(1)發生了什么:
2025年7月,Meta啟動了一場招聘狂潮,為新成立的Meta超級智能實驗室(MSL)儲備人才,向來自OpenAI、谷歌、Anthropic等頂級公司的研究員開出了高達數億美元的薪酬方案,其中包括巨額現金獎金以及為補償其放棄原公司股權而設立的獎勵。作為反擊,Meta的競爭對手們也紛紛從Meta及其他公司挖走關鍵員工,將AI人才的市場價值推至前所未有的高度。
(2)背后推手:
Meta以價值高達3億美元(約合人民幣20.97億元)、為期四年的薪酬方案顛覆了行業慣例,其流動現金補償遠超其他公司需要多年才能歸屬的股票期權。據《華爾街日報》報道,在成功招攬Scale AI的首席執行官汪滔(Alexandr Wang)及其核心團隊后,Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)親自擬定了一份“愿望清單”并展開攻勢:
扎克伯格登門拜訪,說服目標人選跳槽,有時還會帶上自制的湯。此舉成功招募了包括OpenAI推理模型研究員韋杰森(Jason Wei)和鄭亨元(Hyung Won Chung)在內的多位頂尖人才。
據《華爾街日報》報道,與OpenAI前CTO 米拉·穆拉蒂(Mira Murati)共同創立Thinking Machines Lab的安德魯·塔羅克(Andrew Tulloch),最初拒絕了Meta一份包含15億美元(約合人民幣104.84億元)獎金的邀約,但數月后仍選擇加入。
Meta雇傭了曾在蘋果公司負責AI模型的龐若鳴(Ruoming Pang)。彭博社報道,這份多年期的薪酬方案價值數億美元。該報價超過了蘋果除首席執行官外的最高管理層薪酬,而蘋果公司拒絕提出還價。
在這場混戰中,微軟AI CEO穆斯塔法·蘇萊曼(Mustafa Suleyman)從谷歌帶走了20多名研究員和工程師,其中包括工程副總裁阿馬爾·蘇布拉馬尼(Amar Subramanya)。
埃隆·馬斯克的xAI則從Meta挖走十余名AI研究員與工程師。馬斯克批評競爭對手的報價“瘋狂”,并吹捧自己公司“高度精英”的文化以及股權更大的增長潛力。
(3)背景信息:
AI工程師薪酬的演變軌跡,清晰地反映了該領域從學術研究到產業核心的變遷:
2011年:谷歌大腦在吳恩達領導下成立時,AI人才主要集中于學術界。隨著神經網絡進入搜索引擎和AI助手等商業產品,機器學習工程師職位成為企業標準層級。
2014年,谷歌收購DeepMind時,AI薪資顯著超過一般軟件工程薪資。《紐約時報》估計,DeepMind的每名員工人力成本約為34.5萬美元(約合人民幣241.14萬元)。到2017年谷歌推出Transformer架構時,頂級薪酬已升至高達50萬美元(約合人民幣349.48萬元)。
大約在2023年,隨著ChatGPT的興起,薪酬再次躍升。據報道,頂級軟件工程師的薪酬方案已超過70萬美元(約合人民幣489.27萬元)。
(4)當前現狀:
隨著2026年的開始,AI招聘市場已徹底改變。《華爾街日報》報道,為留住人才,OpenAI提供了更優厚的股權激勵、加速了新員工期權歸屬,并發放了高達150萬美元(約合人民幣1048.44萬元)的留任獎金。盡管今年存在對“AI泡沫”的討論,但對于計劃投入數百億美元建設數據中心的公司而言,高昂的薪酬是合理的,既然能在硬件上投入巨資,為何不在至關重要的人才資源上投入其一小部分呢?
三、數據中心建設規模巨大
全球頂級科技公司宣布了建設數據中心的計劃,預計未來幾年將消耗數萬億美元和數十億瓦特的電力。
(1)發生了什么:
僅今年一年,AI行業的資本支出就超過3000億美元(約合人民幣2.10萬億元),且大部分流向了新的AI算力基礎設施。這僅僅是開始,各公司正規劃建設小鎮規模、能源需求匹敵中型城市的巨型設施。咨詢公司麥肯錫預計,為滿足未來的模型訓練與推理需求,到2030年,這場算力競賽的總投入可能高達5.2萬億美元(約合人民幣36.35萬億元)。
(2)背后推手:
頂級AI公司在全球范圍內宣布了一系列數據中心項目,每千兆瓦數據中心容量的建設成本約需500億美元(約合人民幣3494.8億元)。
今年一月,OpenAI聯合甲骨文、軟銀等啟動了耗資5000億美元(約合人民幣3.49萬億元)的“星際之門”項目,并計劃在全球建設200億瓦數據中心,還預測了需求可能高達這一數值的5倍。OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)甚至提出了“最終實現每周新增10億瓦容量”的目標。
Meta 2025年的基礎設施投資約720億美元(約合人民幣5032.51億元),主要位于美國,其高管表示這一數字在2026年將大幅上升。該公司標志性的“Hyperion”項目包括在路易斯安那州農村地區投資270億美元(約合人民幣1887.19億元)、50億瓦的數據中心。通過特殊融資安排,該項目的資產與債務未計入公司資產負債表。
微軟在2025年花費了800億美元(約合人民幣5591.68億元)用于全球數據中心項目,包括威斯康星州和亞特蘭大的設施,這些設施將通過專用光纖網絡連接,作為一個龐大的超級計算機運行。為了供電,該公司簽署了一項為期20年的協議,重啟賓夕法尼亞州的三哩島核反應堆,該反應堆將從2028年開始提供835兆瓦的電力。公司還計劃將歐洲的云與AI容量擴展至200個數據中心。
亞馬遜預計2025年在基礎設施上花費1250億美元,2026年將更多。其110億美元(約合人民幣768.86億元)的“Rainier項目”是印第安納州的一個22億瓦、運行在50萬個Amazon Trainium 2芯片上的數據中心。此外,亞馬遜計劃在澳大利亞花費大約140億美元(約合人民幣978.54億元)擴展數據中心,并在2025年至2029年間在德國投資約210億美元(約合人民幣1467.82億元)。
谷歌母公司Alphabet預計2025年在基礎設施上花費高達930億美元(約合人民幣9500.33億元),高于此前750億美元(約合人民幣5242.2億元)的預測。該公司宣布了一項400億美元(約合人民幣3075.42億元)的項目,計劃到2027年在德克薩斯州新增3個數據中心。它還承諾在印度投入150億美元(約合人民幣1048.44億元)、在德國投資約60億美元(約合人民幣419.38億元),并在澳大利亞、馬來西亞和烏拉圭推出了新的或擴展的項目。
(3)現實挑戰
然而,如此龐大的基建計劃能否被現有經濟與基礎設施所承載,仍存疑慮:
貝恩公司估計,為支撐這些投資,到2030年AI行業年收入需達到2萬億美元(約合人民幣13.98萬億元),這將超過亞馬遜、蘋果、Alphabet、微軟、Meta和英偉達2024年的收益總和。
此外,當前的電網可能不足以支持這些數據中心。據彭博社報道,硅谷的兩個設施因當地公用事業公司沒有足夠的容量將其接入電網而處于閑置狀態。
另據英國《金融時報》報道,十二月中旬,Blue Owl Capital曾因擔憂債務問題,退出了為甲骨文和OpenAI的一個100億美元(約合人民幣698.96億元)數據中心提供融資的談判。報告引用了對甲骨文在數據中心建設過程中債務不斷增加的擔憂。Blue Owl Capital繼續為其他甲骨文和OpenAI的數據中心項目提供融資。
(4)現狀:
盡管存在對AI泡沫的擔憂,但數據中心的建設熱潮已在疲軟的經濟中創造了實實在在的就業與產值。哈佛經濟學家杰森·弗曼(Jason Furman)稱,2025年上半年美國GDP的增長幾乎全部來源于對數據中心和AI的投資。有充分證據表明,2025年可能正是一個以AI基礎設施為核心的新工業時代的開端。
四、編程Agent更快,還更便宜
代碼生成已從簡單的自動補全,演進為能夠管理復雜軟件開發全流程的Agent系統。
(1)發生了什么:
編程成為具有最直接商業價值的Agent工作流應用。從Claude Code、Google Gemini CLI到OpenAI Codex,編程Agent現已成為各大AI公司的關鍵競爭戰場,較小的競爭者也不得不開發自有的Agent模型以維持競爭力。
(2)背后推手:
2024年,Agent代碼生成器Devin將SWE-Bench基準的解決率從1.96%大幅提升至13.86%;到2025年,基于最新大模型的編程Agent已能解決超過80%的同類任務。開發者開始采用更復雜的Agent框架,使其能進行任務規劃、自我評估、調用工具并管理整個代碼庫。
2024年底出現的推理模型顯著提升了編程能力與性價比。Agent可利用推理能力規劃任務,并將具體執行分配給成本更低的模型。引入“可變推理預算”機制后,單個模型能動態分配更多計算資源用于復雜規劃,減少簡單編輯的消耗。至2025年底,Gemini 3 Pro、Claude Opus 4.5和GPT-5.2成為該領域的領先模型。
與此同時,開源模型迅速跟進。Z.ai GLM-4.5和Kimi K2大幅降低了自動化編程初創公司的成本。七月發布的Qwen3-Coder擁有4800億參數,基于超5萬億Tokens訓練,性能已接近Claude Sonnet 4。
Anthropic二月推出的基于Agent框架創建的Claude Code應用獲得市場成功,重新定義了Agent編程的體驗標準。OpenAI以基于其GPT-5系列編程專用版本的Codex應用作為回應。Claude Code最初在本地運行,而Codex應用在瀏覽器中運行,這有助于推廣在云端運行的Agent編程。到年底,這些Agent已經能夠使用多個子Agent——通常是一個啟動器來開始任務并跟蹤進度,以及各種編程Agent來完成不同任務,每個都有其自己的上下文窗口,來處理運行時間更長的問題。
模型制造商與集成開發環境(IDE)供應商之間的拉鋸戰導致像Anysphere(Cursor母公司)和Cognition AI(Windsurf母公司)這樣的流行IDE供應商建立了自己的模型。與此同時,谷歌構建了自己的IDE Antigravity,并于十一月首次亮相。
(3)背景信息:
隨著Agent能力提升,傳統的SWE-Bench基準已不足夠,催生了SWE-Bench Verified、LiveBench、Terminal-Bench等一系列新評估標準。然而,由于各廠商傾向于引用對自己有利的基準,客觀評估和工具選型反而變得更加困難。
在2025年初,大多數觀察家認為Agent擅長生成常規代碼、文檔和單元測試,但在戰略設計上有經驗的人類工程師和產品經理表現得更好。到年底,情況已然改變:微軟、谷歌、亞馬遜和Anthropic表示,其代碼庫中由AI自動生成的高層級任務代碼比例正在顯著上升。
(4)行業現狀:
在短時間內,編程Agent已將“Vibe Coding(氛圍編程)”從一個令人費解的流行語推動為一個蓬勃發展的行業。像Loveable、Replit和Vercel這樣的初創公司使用戶幾乎無需編程經驗就能從頭構建應用。盡管有人擔憂AI將取代初級開發者,但事實表明,善用AI的開發者其原型構建效率和質量遠勝以往。很快,AI輔助編程可能就被簡單地視為編程本身,就像拼寫檢查和自動補全是寫作的一部分一樣。
來源:X
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.