![]()
圖片系AI生成
日前,AI領域投資人、風投公司Air Street Capital聯合創始人內森·貝奈奇(Nathan Benaich)與其團隊共同發布了《人工智能現狀報告 2025》。該系列報告已連續發布八年,而本次報告長達300多頁,由業界和研究領域的頂尖AI從業者進行評審,涵蓋了技術研究與產業、政策與安全、用戶市場調研等多個維度。
基于此,內森·貝奈奇對下一年度給出預測,他在報告中寫道:“對前沿AI模型的研究,中國的研究機構會超越美國;開放式AI智能體(Agent)更值得獲得進一步科研發現;AI安全領域,基于AI生成欺詐視頻的網絡攻擊事件將引發國際間討論;美國某頭部AI研究架構會最終轉向開源生態以獲得其政府支持。”
筆者根據該報告調研數據及分析,梳理出三大類關鍵信息。
過去一年,超級智能與中美大模型PK
2024年末至2025年,隨著GPT-o1的發布,迎來基于深度推理的大模型發展熱潮,各家大模型廠商快速面世了多個推理模型。
期間,以Meta為代表的科技巨頭定義了“超級人工智能”(Superintelligence)一詞,“通用人工智能”(AGI)成為過去時。
![]()
請輸入圖說
報告認為,開源模型與閉源模型之間的差距雖曾一度縮小,但當前最頂尖的模型仍保持閉源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等。其中,OpenAI憑借其最新的GPT-5在多個基準測試中保持領先,繼續鞏固在基礎模型領域的優勢地位。
盡管中國基礎模型尚未取得突破性進展,但在開源模型領域卻頗具競爭力。相比之下,美國的開源模型表現令人失望,OpenAI的開源模型性能遠遜于GPT-5。
隨著中國DeepSeek、Qwen和Kimi等模型的崛起,市場競爭愈發激烈。特別是在推理和編程任務方面,中國廠商正逐步縮小與領先者的差距。報告強調,開源為中國廠商提供了快速追趕的契機,越來越多的開發者選擇基于Qwen進行開發。中國的大模型不僅在智能水平上有所提升,還呈現出多樣化的特點。相比之下,曾作為開源模型標桿的Meta Llama,其市場份額已從2024年末的約50%大幅下滑至目前的15%。
![]()
報告指出,近期推理模型的方法改進完全處于基準模型的誤差范圍內,這或許意味著推理模型的進步并不真實。而且,強化學習(RL)帶來的實際收益也微乎其微,且容易過擬合。
針對此,報告援引一篇論文,深入剖析了研究人員間的爭議焦點:推理模型在應對復雜問題時表現欠佳,究竟是源于實驗設計本身的缺陷,還是僅在特定領域才能展現出超越基準模型的優勢?
當前,前沿AI實驗室正積極探索將強化學習、基于可驗證的獎勵機制、可驗證推理與新環境相結合,賦予模型規劃、反饋、自我修正以及在更長時間跨度內執行任務的能力。
報告還提到,AI研究目前正考慮利用小語言模型(SLMs)構建智能體(Agentic AI)。鑒于大多數智能體的工作流存在局限性、重復性且高度依賴格式,小語言模型已能滿足實際操作需求,且成本顯著降低。因此,采用小語言模型構建有限的異構智能體架構,僅在必要時調用大模型,成為一種可行的策略。
![]()
作為構建AI智能體的軟件平臺,AI智能體框架發展同樣迅速。盡管LangChain仍廣受歡迎,但如今已只是眾多選擇之一,目前市面上各細分領域已涌現數十種框架,如研發領域的AutoGen、camel,軟件工程領域的MetaGPT等。
此外,AI智能體的研究正賦予其記憶能力,實現從拓展上下文窗口到結構化、持久性終身記憶的轉變,并且進一步延伸至動態整合、遺忘和反思,旨在使智能體在交互、任務乃至整個運行周期中保持連貫性。
報告還提到,AI如今在跨學科領域的應用價值日益凸顯。例如,在生物領域,DeepMind的AI系統“Co-scientist”,基于Gemini 2.0構建,能夠生成、辯論并進化其假設生成與實驗規劃過程。
AI智能同樣涌現物理世界。如艾倫人工智能研究所Ai2發布的針對于具身智能系統的模型MolmoAct,谷歌的Gemini Robotics 1.5,與大模型“思維鏈”相呼應,能夠顯著提升物理機器人的可解釋性和可靠性。
產業進展:更便宜的智能,限制與競爭
當前,AI產業應用正迅速普及。AI優先企業營收遠超其SaaS同行,并且在各個行業展現出發展勢頭。2025年,隨著AI采用率上升,用戶留存率上升,企業支出增加。特別是在音視頻、虛擬形象、圖像生成領域,AI公司的收入有望實現爆發式增長。
![]()
在企業內部,AI應用場景以內容生成、代碼生成、研究及分析密集型任務最為常見。
ChatGPT、Claude、Gemini/Google和Perplexity成為使用頻率最高的工具。盡管Meta的AI工具覆蓋面廣,但其使用頻率遠不及Mistral Le Chat或Midjourney。值得注意的是,DeepSeek雖然覆蓋率略低,但使用頻率相對較高。
在開發者工具方面,Cursor、Claude Code和GitHub Copilot備受青睞;而在非編程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude的使用頻率也非常高。
![]()
然而,AI編程工具的應用也伴隨著一定風險。例如,AI編程工具可能會主動覆蓋企業生產代碼,導致開發成果受損。同時,從事AI編程開發的初創公司仍面臨嚴峻的單位經濟效益挑戰,其盈利狀況受制于上游模型價格和競爭對手。這可能導致初創公司在提高利潤時,除了技術降本外,還可能采取突然提價或限制用戶功能等措施。
瀏覽器正成為AI應用的最新焦點和企業競爭的新戰場。目前,OpenAI、Google、Anthropico和Perplexity均推出了助手功能,不僅能解答用戶關于網頁內容的問題,還能代表用戶在瀏覽器中進行導航和操作。這一轉變將瀏覽器重新定義為互聯網的智能操作系統。此外,谷歌公司在其產品中嵌入Gemini能力,讓更多用戶體驗到AI檢索服務。據谷歌公司聲稱,其每月Token消耗數量在2025年同比增長了50倍,達到千萬億個Token。
事實上,AI的工業時代已經到來。
但在這其中,電力供應正成為制約AI發展的新因素。報告稱,若電力供應不足,國家AI計劃將面臨崩潰風險。未來1-3年內,美國幾個主要地區可能會出現電力短缺。美國能源部(DOE)警告稱,由于電力供應不穩定和AI需求增長,到2030年,停電頻率可能會增加100倍。
報告提到了2024年末DeepSeek對整個AI市場的攪動,市場重新認識“杰文斯悖論”,即更便宜的智能,帶來更高的需求,更高的需求又會提高對芯片的消耗。
![]()
無論是在公有云、私有云還是本地化部署環境中,GPU都至關重要。英偉達的市值突破4萬億美元,占據90%的AI研究論文市場份額,定制芯片與新云服務同步崛起。除了英偉達之外,隨著客戶對優惠價格、靈活合同條款及AI專用軟件套件的需求增加,上市公司Coreweave、Nebius以及私企Lambda、Crusoe正實現快速增長。同時,報告指出TPU和AMD的GPU普及程度并不高。
報告還首次對1183名AI從業者進行了調研,結果顯示,95%的專業人士現在在工作或生活中使用AI,76%的人自掏腰包購買AI工具,且大多數人表示生產力持續提高。這充分證明AI的真正普及已成為主流趨勢。
報告指出,目前AI主要擠壓的是入門級崗位市場,其中在軟件和客服領域,這類崗位極易受AI技術影響,其招聘崗位持續下降,經驗豐富的勞動力暫時保持工作穩定性。
![]()
報告還指出,研究發現當前勞動力市場變化早于2022年ChatGPT的問世,AI自動化目前并未削弱經濟領域對認知型勞動力的需求。
AI政策“反復”,安全風險加劇
整體來看,美國推行“美國AI優先”的戰略并調整出口政策,中國則加速推進自主研發與本土芯片制造,以中美為代表的AI競賽愈演愈烈。
2025年,特朗普政府將人工智能安全研究所更名為人工智能標準與創新中心(CAISI),并啟動了5000億美元的“星門計劃”。與此同時,美國政府發布《人工智能行動計劃》力求保持其在全球AI領域的主導地位。
與中國最密切相關的是AI芯片出口限制的相關政策,報告用“反復”來形容。事實上,美國政府在國家安全目標與供應鏈依賴、供應商游說這見尋求平衡,這使得英偉達和AMD成為政治焦點。報告指出,英偉達在中國市場并未達到穩定狀態。
![]()
與此同時,美國監管措施在巨額投資浪潮中被邊緣化:國際外交陷入僵局,《人工智能法案》實施遭遇重重阻礙。
AI數據中心建設陷入了新的瓶頸:鄰避主義(NIMBYism)。在最新事件中,美國公眾對新建大規模數據中心的反對聲日益高漲。
而盡管政府《人工智能行動計劃》提及需自主AI領域”基礎科學“,但其核心研發資金遠低于專家建議的2026年320億美元投資目標。
與此同時,硅谷科技巨頭目前采取了“逆向”并購政策:通過快速引進人才(創始人及團隊高薪)以規避并購限制,同時保留原業務精簡的公司轉型拓展小眾市場。其原因在于,特朗普政府以來的并購增長預期尚未到來,同時又受制于前拜登政府推行的反壟斷審查。例如,微軟收購Inflection,谷歌收購Character AI,亞馬遜收購Adept,Meta收購Scale AI(貌似最近的Manus并購案也存在同樣模式)。
![]()
目前美國聯邦貿易委員會(FTC)對這類“逆向”并購行為的擔憂日益加劇。
與此同時,美國就AI安全相關的政策議題也在發生轉變,加之實驗室間日益激烈的商業競爭,某些安全規程已被列為非優先事項。
外部安全機構年度預算甚至不及頂尖實驗室單日總支出,曾以安全為核心的機構開始將重點轉向產品化。報告估算,外部AI安全研究投入僅約1.3億美元,而同期全球AI研發支出接近千億美元,比例極低。
AI實驗室為防范生物安全風險和網絡攻擊部署了空前防護,部分實驗室卻因錯過自我設定的截止日期或悄然放棄測試方案。
![]()
報告指出,網絡攻擊能力每五個月翻一番,遠超防御措施的更新速度。犯罪分子利用AI智能體的勒索軟件已滲透至世界500強企業。
涉及生成式AI的安全事件正呈急劇增長態勢。其中,大量報告事件涉及AI換臉技術,這與大模型的濫用密切相關。與此同時,AI代理正日益成為網絡安全防御的重大挑戰。(作者 | 楊麗,編輯 | 蓋虹達)
報告來源:https://www.stateof.ai/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.