![]()
文/陳永偉
2025年的帷幕已經落下,這一年中,AI行業無疑走過了極具里程碑意義的一程。從技術范式的革新,到商業邏輯的重構,從產業應用的落地,到全球規則的博弈,這一年既有突破,也留下諸多思考。
鑒于AI發展錯綜復雜,這里只能從十個側面做一個簡要回顧。
一、多模融合
過去幾年中,AI大模型在文字、推理等方面進展神速,但它們多模態能力的發展卻相對遲緩,這在很大程度上限制了其能力的發揮。比如,在4.0版本之前,GPT雖然已經能寫詩、會編程,但既看不見、也畫不出,如果用戶想讓它分析一張圖片講了什么,或是根據要求生成一張圖片,它就顯得力不從心。
雖然從2024年開始,AI開發者們就開始大力發展模型的多模態能力,但在相當長一段時間里,這些努力仍然主要集中在對既有模型進行組合——文本一個系統,圖像一個系統,語音再來一個系統,然后用工程手段把它們拼在一起。這樣的模型可以完成一些多模態任務,但由于各系統之間存在協調問題,其能力局限性一直十分明顯。到了2025年,越來越多的開發者不再滿足于這種“拼裝式”方案,轉而開始設計“原生多模態”模型,從訓練之初起,就讓模型在同一個體系里同時處理文本、圖像、音頻、視頻等信息。
在設計原生多模態模型的過程中,很多人逐漸意識到:多模態模型的真正瓶頸,并不在于它能不能看圖、聽聲音,而在于能否把視覺、語言、時間與空間組織成一個可推理、可行動的統一表征。現在的大模型在語言上已經高度成熟,卻依然缺乏對三維空間、物理約束和因果關系的系統理解。因此,下一代AI的突破重點,可能并不在于再多幾個參數,而在于能否構建對真實世界的內部模型,使其可以在腦中“預演”行動后果。在這種思路之下,“世界模型”與“空間智能”重新被重視,并逐漸成為設計原生多模態模型的重要理論依據。
在實踐層面,多模態模型幾乎成為頭部AI企業的主戰場。企業不再滿足于“能看圖”,而是把能力推進到看得準、看得全、看得懂流程,并能把視覺理解轉化為可執行的動作:有的強化視覺與語言的一體化表達,有的把能力擴展到視頻與長時序理解,也有的嘗試把“看懂屏幕”轉化為界面操作。共同的趨勢是,模型不再只是回答問題,而是越來越多地介入真實任務本身。
多模態模型的蓬勃發展,為AI技術的應用化和普及化提供了強大的助力。麥肯錫在《技術趨勢展望2025》中指出,多模態AI正在成為新一代AI系統的關鍵底座,并將與智能體(Agent)、自動化、物理系統控制深度融合,其影響將從數字世界延伸至現實世界。而Gartner則強調,多模態技術的影響將超出AI范疇,全面重塑當前的軟件生態。據其預測,到2030年,80%的企業軟件將在其產品中植入多模態AI能力。
二、具身爆發
如果說多模融合解決了AI“怎么看”和“怎么理解”的問題,那么具身智能(Embodied AI)要回答的,則是AI在真實世界中“做什么”和“怎么做”。雖然具身智能的發展已有數十年時間,但過去,機器人更多停留在實驗室展示階段:完成一些酷炫動作,在受限場景中做局部自動化,人們討論的也只是它們“技術上究竟能做到什么”。而到了2025年,情況開始發生變化——具身機器人真正走向市場,行業敘事也從“能不能做到”轉向“能不能規模化、能不能穩定工作、能不能進入崗位”。
最直接的信號,來自量產節奏的變化。2025年,國內的宇樹、優必選,國外的波士頓動力、Apptronik等企業,都明確宣布產品進入量產與商業化試點階段,而不再只是單臺原型或演示樣機。在以北美和中國為代表的主要市場中,具身機器人開始按“百臺級”“千臺級”規劃供應鏈、制造與交付。IDC估算顯示,2025年全球在倉儲、制造、巡檢等崗位的試點應用,較2024年增長了數倍。
與此同時,成本也出現了顯著下降。幾年前,能夠與人交互的人形機器人價格動輒幾十萬甚至上百萬美元,幾乎無法商業化;而根據美國銀行研究院的數據,目前典型人形機器人的價格已經下降到每臺約3.5萬元左右,比2023年下降至少40%,并且未來幾年還有繼續下探的空間。這種成本下降,正在迅速降低使用門檻,讓機器人更容易走向工廠、走進家庭。
具身智能在2025年的“爆發”,是多種因素共同作用的結果。一方面,原生多模態AI的發展,補上了機器人“看不懂世界”的短板,讓它不僅會跑會跳,還能理解環境、根據情境做出決策,從而具備真正的實用價值;另一方面,用工成本的持續抬升,也在擴大市場需求。制造、物流、巡檢、服務等領域本就勞動力密集,在老齡化、年輕人不愿進入高強度崗位、合規與安全成本增加等因素疊加下,企業開始轉而接受機器人替代,由此帶動了需求的快速增長。
三、算力競爭
如果說前幾年算力競爭的核心,是“誰能搶到更多GPU”,那么到了2025年,這場競爭已從資本驅動的資源爭奪,升級為一場長期、立體、甚至帶有地緣意義的綜合博弈。
首先,算力競爭從“規模導向”轉向“效率導向”。過去,人們普遍相信:模型遇到瓶頸,就繼續疊加參數與算力;但隨著規模膨脹,成本與復雜度迅速上升,邊際收益卻不斷遞減。越來越多公司開始意識到,決定差距的已不是算力總量,而是如何把有限算力轉化為有效能力。國產模型 DeepSeek 就是典型——通過多維并行、混合精度等策略,在更低投入下做出接近性能,被視為“效率轉向”的象征。
其次,部分開發者開始直接介入芯片環節。長期以來,GPU幾乎是大模型訓練的唯一主力,而英偉達的供應與生態具有決定性影響。為降低依賴,一些公司轉向自研芯片。谷歌的TPU便是代表,如今已在核心模型訓練中大規模替代GPU,逐步構建起相對自主的算力體系。
第三,算力設施開始全面“基礎設施化”。過去企業擴容,只需采購服務器、租機房、疊加云服務;而在大模型時代,這種“拼裝式”做法難以承載高密度并行與穩定需求。2025年的智算中心,從一開始就圍繞AI負載設計:網絡拓撲以并行訓練為核心,甚至連選址都需要同時評估電力、能耗與時延。一些公司也通過投資與并購深入上游,押注包括“太空算力”等潛在方向。
四、范式爭議
就在產業界為贏得算力競爭而各顯神通之時,理論界開始對持續算力投入的理論基礎——“規模法則”提出反思。過去十幾年里,這幾乎是一條被反復驗證的鐵律:更多數據、更大模型、更強算力,往往帶來更好的效果,進而塑造了研究范式、資本邏輯與產業結構。但到了2025年,圍繞這條路徑的信心,第一次出現了系統性分化。
比如,“圖靈獎”得主楊立昆多次指出,單純擴大自回歸大模型,并不會自然通向通用智能。當前以語言預測為核心的模型,本質上仍是“被動系統”,缺乏因果理解、物理常識與長期規劃能力;繼續堆參數與數據,只會帶來收益遞減,反而掩蓋結構性短板。類似的觀點,也被其他研究者認同。安德烈·卡帕斯強調,未來突破更可能來自訓練范式、數據結構與推理機制,而不是參數規模本身;原OpenAI首席科學家伊利亞·蘇茨克維同樣提醒,“無限堆規模”可能正在接近階段性極限。
不過,規模法則依然有不少擁護者。他們認為,以大模型為核心的路線仍在推進,能力邊界仍在外擴,尤其在多模態和復雜推理任務上,規模仍是重要前提。DeepMind聯合創始人德米斯·哈撒比就認為,通向更高層次智能的關鍵在于世界模型、規劃與推理結構——這些并非否定規模,而是在規模基礎上的方向修正。在這種視角下,規模法則未必終結,反而可能在新范式出現后獲得新的生命。
規模法則是否繼續有效,還需要時間來驗證。但當我們把支持與反對的觀點放在一起看,就會發現:雙方其實都對現有范式有所不滿。或許,正是這種爭議,會推動AI界重新審視既有思路,從而尋找一條更優的發展路徑。
五、代理崛起
2025年3月,初創公司Monica公布了一段名為Manus的AI應用演示視頻。視頻中,它可以根據用戶要求,自動調用外部工具,完成簡歷篩選、房產研究、股票分析等復雜任務,全程無需人工干預。Manus一度迅速走紅,被視為繼 DeepSeek 之后的又一“現象級”產品;雖然隨后因“技術創新不足”“炒作過度”而引發爭議,但它仍被看作AI智能體崛起的重要象征。更有意味的是,Meta 隨后以數十億規模收購了Manus,從側面印證了這一趨勢。
AI智能體不同于傳統大模型,它不只是“更聰明的對話界面”,而是一種能夠理解目標、拆解任務、調用工具、執行操作并根據反饋調整策略的主體。它帶來了人機交互方式的變化:從“人去找功能”,轉向“任務驅動系統”。過去用戶需要理解界面結構、在多個頁面來回切換;而在智能體模式下,只需提出目標,系統便自動規劃路徑,在關鍵節點請求確認。這種轉變看似細微,卻顯著降低了學習和使用成本。
需要強調的是,智能體的出現并非偶然,而是多項技術成熟后的結果:一方面,大模型在推理、多模態和長上下文上的能力增強,使其能夠理解復雜任務;另一方面,MCP、ANP、A2A 等協議使工具調用與外部系統接入逐步標準化,AI不再局限于“只會說話”,而可以操作代碼、文檔、數據庫乃至業務系統與物理設備,由此第一次具備跨步驟、跨系統完成任務的可行性。
可以預見,智能體將對產業生態產生深遠影響。它帶來的,并不僅是自動化某些崗位,而是重組流程本身——組織結構將從圍繞“人”設計,逐漸轉向圍繞“任務”組織。在商業層面,價值計量也會從“提供能力”轉向“完成事情”:企業不再按調用量付費,而更可能按任務與結果付費,從而推動商業模式發生變化。
當然,智能體的興起也伴隨風險。就業替代、隱私與數據使用邊界等問題,都可能成為普及過程中的阻力。圍繞豆包AI手機引發的爭議,已經為我們揭開了冰山一角,類似討論在未來一段時間內仍將持續。
六、開源盛世
2025年,開源模型已經從AI世界的邊緣力量,逐漸演變為全球創新的基礎設施。在這一年里,開源模型在性能、生態與采用率上全面逼近閉源體系,甚至在部分場景實現超越。多份權威報告顯示,近兩年新發布的大模型中,開源或“開放權重”模型已占據多數,而在被活躍調用的模型里,開源模型也占到大頭,尤其在私有部署、微調和智能體等場景中占據主導。
開源模型的崛起,并不只是因為“免費”,而是AI創新邏輯正在發生變化:算力成本上升、應用需求高度分化,封閉模型難以覆蓋全部場景;而開源模型依托社區協作與快速定制,在工程效率和適配能力上展現出明顯優勢,吸引了越來越多企業和開發者加入其中。
在這種背景下,AI創新的分工結構正在重組——基礎模型不再是“終點產品”,而更像操作系統或數據庫的底層平臺;真正的創新,越來越多發生在模型之上的微調、工具鏈、智能體架構與行業應用中。開源由此不再只是理想主義選擇,而成為降低門檻、加速擴散的現實機制。
在這股浪潮中,中國力量格外醒目。以 DeepSeek 與 Qwen 為代表的一批模型,在工程效率、推理成本與可部署性上形成鮮明優勢。相關統計顯示,2025年全球開源模型使用中,中國來源已接近三成,正在成為全球開源生態中最重要的供給方之一。
從更長時間看,2025年的“開源盛世”,并非簡單的路線回潮,而是AI進入成熟階段的標志之一:當創新不再過度依賴封閉體系與資本堆疊,而更多依賴開放協作與工程智慧,誰能夠提供“可用、可改、可擴展”的技術底座,誰就將在下一階段占據更有利的位置。
七、商業革新
過去兩年,“盈利難”一直困擾著AI行業。很多公司即便做出了不錯的產品,卻仍然難以形成穩定收入,最終被迫退出市場。到了2025年,行業開始逐漸摸索出新的商業路徑——不同層級的玩家,各自找到與自身能力匹配的變現方式,AI也從單一的技術競賽,轉向分工更加清晰的產業生態。
在技術底層,能力開始被商品化。算力、訓練與推理被標準化為可計量、可定價的“生產要素”,云廠商、芯片公司與基礎模型提供方,通過算力租賃、API與推理服務形成相對穩定的收入結構。隨著算力基礎設施化、模型效率提升,這一層也逐漸從“軍備競賽”走向“運營競爭”,單位成本下降、單位調用價值上升。
在平臺服務層,“結果作為商品”(Outcome-as-a-Service,OaaS)開始崛起。過去AI產品更多停留在“功能售賣”,而智能體的普及,讓“完成任務”成為核心價值單位,定價也逐漸轉向按任務、流程或結果收費。雖然時間不長,但這一模式正在成為利潤潛力最大、競爭最激烈的地帶。
在應用層,場景分化明顯成熟。2025年,一個重要變化是:通用應用的想象空間收斂,而垂直行業的價值被逐步釋放。無論軟件開發、企業運營、金融分析還是內容與客服,AI正深度嵌入業務流程,與數據和規則耦合,逐漸成為企業的長期系統投入,而不再是一次性工具采購。
這三層疊加在一起,標志著一個轉折:AI的商業邏輯正在從“能力展示”走向“效率兌現”。過去更大的模型更容易獲得關注與融資;而在2025年,真正決定成敗的,是誰能把能力穩定轉化為可計量的客戶價值,這也促使越來越多公司把重心放在工程效率、部署成本和用戶留存之上。
八、規則博弈
如果說此前AI發展的主要矛盾集中在技術層面,那么到了2025年,另一條同樣重要的戰線——AI治理——已經全面展開。它可以從兩個維度理解:一是創新與規則之間的橫向張力,二是不同制度體系之間的縱向博弈。
從橫向看,矛盾并不在于“要不要監管”,而在于如何避免規則過早鎖死尚未定型的技術路徑。AI的不確定性,使“先立規矩、再準入”的傳統方式面臨挑戰:制定得過早,可能固化現有形態;放得過松,又可能積累系統性風險。2025年的一個明顯變化是,治理逐漸從“靜態合規”轉向“動態校準”,通過分層、分階段、可調整的方式,與技術演進保持同步。
這一轉向,源于對AI本質的重新理解:AI不是單一產品,而是一套持續演化的能力體系。因此,治理對象也從單個模型,延伸到數據、算力、模型訓練、部署與使用場景等完整鏈條。共識正在形成——治理的目標不是壓低創新速度,而是在不可逆節點上避免風險放大,“沙盒”“分級管理”“事后糾偏”等機制由此逐漸取代“一刀切”做法。
從縱向看,治理正在演化為國家與制度之間的競爭。規則不再只是內部秩序工具,而具有外溢效應:誰的規則更易被采納,誰就獲得更大的制度影響力。
在這一維度上,美國傾向將治理視為“護欄”,優先關注國家安全、關鍵基礎設施與極端風險,盡量減少對研發的前置限制;其邏輯是,通過技術領先來換取治理彈性。
歐盟則強調在擴散之前先明確制度邊界,通過系統化規則塑造發展方向,以規則和標準參與全球競爭。
中國更強調發展秩序與場景適配,規則與產業推進同步調整,不提前凍結技術路線,也不過度依賴事后糾偏,但對治理能力提出更高要求。
當這些不同路徑在全球層面相遇時,治理便成為一場規則間的博弈:企業在不同制度間選擇落地,技術在不同規則中分化演進,標準在競爭中被試探與擴散。全球治理格局因此更可能呈現多套模式并存、相互影響的狀態。
從這個角度看,2025年的治理博弈,并非AI發展的“減速器”,而是其邁向成熟的標志之一——當技術被系統性治理,意味著它既足夠重要,也具有潛在風險。如何在創新開放性與規則約束之間形成動態平衡,將決定AI能否長期、穩定嵌入社會結構。
九、大國競合
2025年,AI 的國際競爭已從企業層面上升到國家層面:誰來定義下一代 AI 的技術路徑?誰能掌控芯片與算力供應鏈?誰有能力把技術選擇轉化為全球通行的標準?圍繞這些問題,中美歐逐漸形成了一種彼此錯位、卻高度糾纏的競爭格局。
在核心技術層面,美國依然掌握著最強的話語權。這種優勢不僅體現在模型性能,更體現在“問題定義權”上——從大模型、多模態到世界模型、智能體架構,許多關鍵方向往往首先由美國提出,隨之而來的評測方式與技術敘事,也自然成為行業默認參照。
中國的路徑則明顯不同。并未把全部籌碼押在“重新定義范式”上,而是更強調在既有技術框架下,通過工程優化、系統集成和真實場景反饋,把技術轉化為可規模復制的能力,從而在訓練效率、算力調度、具身智能與產業級應用等方面逐步形成優勢。
歐盟在核心技術原創上的存在感相對有限,但并未缺席。它更多通過基礎研究網絡、跨國科研項目與評測體系,在關鍵概念與方法論層面保持影響力,為后續標準制定保留位置。
如果說核心技術決定長期上限,那么芯片與算力供應鏈,則決定誰能把技術持續跑下去。美國在高端芯片設計、先進制程與軟件生態上的主導,使算力逐漸具有戰略屬性;中國在壓力之下加快推進多路徑算力體系建設,一方面補齊本土芯片與制造能力,另一方面通過智算中心與算法優化增強韌性;歐洲雖然在規模上不占優勢,但在設備、材料與部分關鍵工藝節點上仍然不可替代。
隨著 AI 從軟件工具走向基礎設施,標準制定權的重要性迅速上升,并成為最隱蔽、也最持久的競爭戰場。美國更多依托技術領先形成“事實標準”,中國在大規模部署中形成“用出來的標準”,歐洲則試圖通過制度化規則,在國際標準體系中持續發聲。三種路徑并行,使標準本身成為競爭的一部分。
值得注意的是,這種競爭并非簡單對抗。現實中的中美歐,在技術、供應鏈與市場層面依然高度相互依賴:美國的前沿技術離不開全球制造體系,中國的產業能力深度嵌入國際網絡,歐洲的規則影響力也需要技術生態配合。由此,2025年的國際格局更接近“高強度競爭中的有限合作”。真正的較量,已不再是單一模型或一代技術的勝負,而是圍繞誰能構建并長期運轉一整套技術與產業體系。
十、少帥掌兵
2025年AI行業的另一個重要趨勢,是一批三十歲出頭、甚至二十多歲的年輕科學家開始被大公司賦予指揮權,直接影響工程架構、數據策略與下一代AI能力的走向。
騰訊在調整AI組織架構時,任命27歲的姚順雨為首席AI科學家,并負責基礎設施與大模型團隊;更早之前,小米啟用“95后”科學家羅福莉負責MiMo系列核心研發。在硅谷,這一趨勢更為明顯。Meta引入Scale AI創始人亞歷山大·王擔任首席AI官,并在其與公司內部元老意見沖突時仍然堅定支持,顯示出對年輕技術領袖的高度信任。
這種“年輕化+實權化”的背后,是AI發展邏輯本身的變化:AI已經進入“下半場”。技術邊界不再只是把模型做得更大、更久,而是重新定義問題、重塑評估方式、判斷未來路徑。越來越多的企業意識到,AI的核心從“解決問題”轉向“提出什么問題、如何衡量進步”,而這種能力往往出現在長期浸泡在一線研究中的年輕技術派身上。
因此,“少帥掌兵”并非一時的人事口號,而是產業進入深水區后的結構性調整:當技術范式更加不確定、探索性更強,組織更需要那些愿意快速試錯、敢于在不完全信息下判斷的人,而不僅依賴經驗豐富的工程管理者。正因如此,羅福莉、姚順雨、亞歷山大·王等年輕科學家,不僅站在研發一線,也開始直接影響公司戰略與技術路徑。可以預計,在未來相當長時間內,AI方向的關鍵抉擇,很可能就掌握在這一代年輕技術領袖手中。
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.