![]()
2025年的人工智能(AI)領域可謂風起云涌:大模型你追我趕、商業版圖急劇擴張。
以前我感覺用ChatGPT+Claude就可以了,現在必須加上Gemini和Grok,要取四個AI之長。跟打王者榮耀升級一樣,要有個本命英雄,但是同一分路還要會點別的英雄,最好還要擅長不同分路。
當然,被討論和使用最多的,還是ChatGPT,Claude和Gemini,我愿稱之為AI御三家。
01
AI御三家瘋狂加碼
年底壓軸登場的OpenAI GPT-5.2成為年終焦點。
面對Gemini 3在各大榜單上后來居上的壓力,OpenAI提前啟動紅色代碼警告,加速推出了這款新一代大模型。
GPT-5.2被定位為“一款為專業知識工作打造的最強模型”,在推理、編程和智能體任務上較前代有顯著提升。
其最大亮點之一是超長上下文記憶能力:支持40萬Token的輸入窗口和12.8萬Token的輸出長度,可一次性 ingest 海量文檔或代碼庫并生成長篇報告。
這意味著GPT-5.2能夠閱讀理解數百頁資料后給出總結,在長鏈多步驟推理中表現更穩健。
OpenAI還將GPT-5.2劃分為Instant、Thinking和Pro三個等級模型,以平衡速度與深度需求——Instant偏重日常快速回答,Thinking適合復雜結構化任務和長時智能Agent執行,Pro則追求極致準確率以應對棘手問題。
在各項權威基準測試上,GPT-5.2全面刷新紀錄:比如在SWE-Bench Pro編程測試中達到55.6%的新高分,遠超前代;在通用推理ARC-AGI測試上首次突破90%正確率。
值得一提的是,GPT-5.2雖然對圖像生成暫未有顯著改進(OpenAI透露“圖像生成的增強還在籌備中”),但在多模態理解上已有進步:它能夠更好地“感知圖像”并結合視覺輸入完成復雜任務。
此外,GPT-5.2成為OpenAI推動“Mega-Agent時代”的引擎,其連貫長程代理能力令人矚目——測試顯示它能自主完成40%更復雜的長鏈任務,如根據乘客反饋自動完成改簽航班、預訂酒店、申請賠償的一整套事務,比前代5.1覆蓋更多步驟且更準確。
這一年,經歷了年初GPT-5.0/5.1推出時的波折(性能和風格調整一度飽受爭議,被用戶批評“過于冰冷刻板”,OpenAI火速用5.1版本改善了親和度),OpenAI憑借GPT-5.2在年末重奪技術王冠,在大模型軍備競賽中卷土重來。
作為OpenAI強勁的對手,Anthropic在2025年持續發力,9月發布了Claude 4.5。Claude 4.5主打自主編程與工具操作能力。
在內部測試中,其子型號Claude 4.5-Sonnet曾連續自主編程30小時構建出一個Web應用,而此前Claude Opus 4只能堅持7小時。
這一飛躍體現出Claude在長程任務上的穩定性提升,讓AI代理真正能夠長時間無監督地工作。
Anthropic表示4.5在金融分析和科學推理上也更勝一籌,在一項操作系統使用能力測試中得分約60%,遠高于前代模型的40%。
換言之,Claude 4.5更善于像人一樣使用電腦完成多步驟任務,這對需要AI自動執行業務流程的企業非常關鍵。Anthropic一貫強調安全可靠,以降低出錯或產生有害內容的風險,定位于企業及專業用戶場景。
在架構上,Claude 4.5提供了不同性能版本:例如Claude 4.5-Haiku、Sonnet、Opus等,分別平衡速度、成本與精度,其中最強的Opus 4.5版本支持更大的上下文窗口和更高的調用上限(相應成本也最高)。
這反映出大模型普遍朝著精細化配置方向發展。值得關注的是,Claude 4.5在發布當日即宣布與微軟深化合作:微軟將其引入Microsoft 365 Copilot,增加Excel/Word的“智能體模式”和Copilot聊天中的“Office助手”等新特性。
微軟此舉意在讓Office用戶獲得更強的自動辦公助手,同時也表明其生態策略從獨家捆綁OpenAI轉為多模型并舉。
而在OpenAI和Anthropic激戰正酣之際,谷歌DeepMind整合優勢,于11月發布了里程碑式的Gemini 3模型。作為谷歌雄心勃勃的旗艦,Gemini 3 Pro號稱谷歌“有史以來最智能、事實準確率最高”的AI。
與其前代相比,Gemini 3最大的突破是“原生多模態”:它能同時處理文本、圖像和音頻,多模態融合能力業界領先。
例如,用戶可以讓Gemini讀取菜譜照片并直接生成烹飪手冊,或讓它看一系列視頻課程后自動創建交互式學習卡片。
這種將視覺、聽覺與文本理解打通的能力,為AI應用打開了新局面。借助多模態和強大的編程能力,Gemini 3還能輸出富媒體結果:在Google搜索的AI模式下,它可以把答案呈現為圖片、表格、網頁等動態格式,而非僅有文字。
更驚艷的是,Gemini 3內置增強版的搜索工具調用機制,能自主將復雜問題拆解成子查詢去搜索,并結合結果給出整合答案。這一“查詢分解+工具使用”策略提升了答案的廣度和準確性。
Gemini 3在交互風格上也別具特色:谷歌直言其回復將摒棄討好傾向,不再一味迎合用戶而是提供“聰明、簡潔、直接”的洞見,避免空洞恭維。過去聊天機器人易有的過度諂媚在Gemini上大幅減少,這被視為對ChatGPT習慣說“好話”的一針諷刺。
除了日常問答,Gemini 3 Pro還強化了推理規劃和Agent能力。谷歌稱其可以“可靠地進行更長遠的計劃”,驅動實驗性的Gemini智能代理,幫助用戶自動收發郵件、研究行程甚至預訂機票。這預示著搜索引擎正從提供信息進化為直接代辦任務的全能助理。
性能方面,Gemini 3 Pro一經推出即登頂權威排行榜LMArena,足見其實力。Gemini 3發布當天,谷歌選擇在其Gemini App上向全民免費開放旗艦模型Pro,并很快在搜索服務中提供給訂閱用戶使用。
這種大規模分發策略與OpenAI先會員后開放的方式形成對比,也顯示了谷歌在消費級AI領域搶占用戶的迫切。
Gemini 3 Pro的橫空出世,標志著谷歌在經歷了GPT-4/Bard時期的相對落后后,于2025年強勢反超,一度引發行業內“Holy Shit!,谷歌贏得AI競賽”的驚嘆。
02
估值飆升再飆升
2025年,AI賽道的融資規模再創新高,多家頭部獨角獸估值飆漲,吸金能力驚人。
OpenAI在未進行公開融資的情況下,據報道正尋求員工股份出售,潛在估值高達5000億美元——這一數字是歐洲AI獨角獸估值的數十倍,體現出投資者對其龍頭地位的信心。
而Anthropic在9月宣布完成130億美元的巨額融資,投后估值達1830億美元,較年初翻了近兩倍。
此輪融資由硅谷知名投資機構ICONIQ領投,富達、Lightspeed等跟投,亦有中東的卡塔爾主權基金和華爾街巨頭黑石等參與。
Anthropic一躍成為全球估值第三高的非上市公司,僅次于SpaceX等少數巨頭隨著資金涌入,Anthropic公布其業務營收增長迅猛:2025年初年化收入約10億美元,到了8月激增至50億美元,表明大型AI模型的商業付費需求正被快速開發。
另一家引人注目的創業公司是法國的Mistral AI。這家2023年才成立的創業公司,2025年9月獲得了17億歐元(約20億美元)的系列C投資由荷蘭光刻機巨頭ASML領投1.3億歐元,占股11%,其余包括DST、a16z、創投基金Bpifrance、英偉達等紛紛押注。
此次融資使Mistral估值達到117億歐元,成為歐洲AI領域新的價值巔峰。盡管這一估值僅相當于OpenAI傳聞估值的約1/40,但對于歐洲來說是重大突破——Mistral被視為歐盟對抗美中AI巨頭的重要希望,法國更將其視作國家AI戰略的核心。
馬斯克于2023年創建的xAI在今年也有所動作。xAI開發的對話模型Grok持續迭代,2025年推出了Grok 4,據稱在部分基準上號稱“世界最聰明”。
Musk在社交媒體上高調宣傳Grok整合了實時網絡檢索和各種工具插件,并賦予其鮮明的“直言不諱”個性,讓其回答帶有一點“Meme風格”,以吸引年輕用戶。
03
巨頭博弈變化再變化
作為OpenAI背后最大的金主和合作伙伴,微軟在2025年的策略出現了微妙變化。一方面,微軟將OpenAI模型深度嵌入其Windows、Office、Bing等核心產品,持續收割付費用戶和云計算消耗。
今年微軟全面上線了Windows 11的Copilot助手,將操作系統與GPT助手融為一體,用戶可以直接在桌面調用AI完成設置、搜索等操作,讓傳統OS煥發新生。
同時,微軟Azure云借助OpenAI服務吸引了大量企業上云進行AI開發,Azure的使用量和收入顯著增長。
但另一方面,微軟不再將寶押在OpenAI一家:10月,微軟宣布與Anthropic達成合作,將后者Claude模型引入Azure并在Office中集成。微軟高管稱此舉是為了給客戶提供“多樣化選擇”,降低對單一供應商的依賴。
這或許與2023年末OpenAI高層動蕩(Altman一度被董事會驅逐后又復歸)有關,微軟意識到必須預防風險、扶持第二陣營以維持自己的AI領先地位。
此外,微軟也加碼自研,傳聞其內部的生成式模型項目(代號Omega)在研制多模態基礎模型,以備不時之需。
谷歌在經歷了ChatGPT帶來的“AI覺醒”之后,今年實現了AI戰略的大幅轉身。Google DeepMind的成立整合了谷歌原有的Brain團隊與DeepMind研究院資源,成為谷歌AI創新的核心引擎。
Gemini 3的成功推出讓谷歌重奪技術話語權,也增強了內部信心。谷歌隨即在產品線上全面開花:搜索業務推出“AI對話模式”,地圖應用上線路線智能生成和旅行規劃助手,Gmail/Docs增加AI寫作輔助功能等。
不僅軟件服務,谷歌在Android系統中也增加了端側AI能力,例如利用手機SoC內的TPU微芯片,實現小型語言模型的本地推理,提供離線的智能輸入法、更精準的相冊識別等。
甚至有報道指出,谷歌與蘋果達成協議,為后者提供定制的Gemini模型用于提升iOS上的智能體驗。
這表明谷歌積極尋求將其AI技術輸出賦能更多平臺。商業上,谷歌云也以提供多元模型著稱——除了自家的PaLM/Gemini系列,第三方的Meta Llama2、Anthropic Claude等也能在其Vertex AI平臺上獲取,從而與微軟Azure在企業市場上抗衡。
谷歌今年對AI創業公司的投資并購也有增加,據傳它投資了多家生成式AI初創(例如Inflection)以擴展生態。谷歌卷土重來,在AI領域從被動應戰轉為主動出擊,通過技術突破和生態聯盟重塑了自己的領先地位。
Meta繼續走開放生態和消費者應用兩手抓的路線。一方面,它在開源社區的地位鞏固。自從2023年開源LLaMA模型大獲成功后,Meta在2025年又相繼推出了改進版的LLaMA 3模型以及一系列開源的多模態模型,包括圖像生成模型和語音合成模型。
這些模型免費供研究者和開發者使用,僅要求遵守一些不用于有害用途的許可,大量第三方應用建立在Meta模型之上。
另一方面,Meta充分發揮旗下社交產品的流量,將AI融入數十億用戶的日常。2025年,Meta在Messenger和Instagram中推出了一系列AI角色聊天功能,例如用戶可以和由名人形象構建的AI聊天(這些明星形象的對話風格由模型模擬,并獲得了明星本人的授權)。
用戶還可以讓AI根據朋友圈內容自動生成趣味回應,或在Instagram上通過文字命令生成個性化的圖片貼紙。Meta的VR/AR事業部也不甘落后,在Meta Quest頭顯中集成了AI教練和AI健身指導,提供沉浸式的互動體驗。
值得注意的是,Meta在AI商業化上更側重間接收益——通過提升用戶黏性、廣告定向和內容生態繁榮來賺錢,而非直接出售API。因此,Meta樂于推動AI開源降低成本,同時憑借其社交帝國將AI無縫融入產品,鞏固自身社交媒體霸主地位。
相比喧囂的友商,蘋果在AI領域依舊低調、緩慢但務實。2025年的WWDC大會上,蘋果官宣了一項重大底層升級:iOS/macOS引入了本地大型語言模型(Foundation Models)框架,開發者可調用系統提供的基礎模型,在App中實現更智能的功能。
蘋果透露,他們針對Apple設備專門訓練了多語言的中等規模語言模型,并進行了深度優化,使其能夠在iPhone/蘋果電腦上離線運行,用于鍵盤聯想、語音助手Siri應答等場景。
這意味著用戶的部分AI請求不必上傳云端,在設備上即可處理,提升了隱私與響應速度。同時,蘋果也將AI應用于照片處理(利用生成模型一鍵除物或改變背景)、Apple Music個性歌單(AI分析用戶喜好生成播放列表)等方面,提升用戶體驗。
有傳聞稱蘋果還與谷歌達成某種合作,可能在云端借助定制版Gemini模型來增強iCloud的AI服務。
但截至年底,蘋果并未發布類似ChatGPT的通用聊天產品,Siri的智能度也還有提升空間——不過可以預料,一旦蘋果認為時機成熟,可能會推出深度融合硬件優勢的AI助手,引發新的行業震動。
蘋果的策略體現了差異化競爭:它不與OpenAI等正面拼參數規模,而是發揮軟硬件一體的長處,讓AI默默融入生態,為用戶提供便利且安全的功能。這種潤物細無聲的推進,契合蘋果品牌調性,也為行業提供了另一種范式:以終端和隱私為中心的AI道路。
當然,另一面,AI是否存在泡沫的討論也越來越多。
無論如何,作為用戶,還是希望,2026,AI御三家,以及更多玩家,繼續打起來吧。
你還可以看
吳懟懟原創出品
吳懟懟,左手科技互聯網、右手文創與消費。鈦媒體2021影響力創作者,領英2020年度行家,人人都是產品經理2017年度作者,新榜2018年度商業觀察者,DONEWS2019年度十大專欄作者,NEWMEDIA2019年度科技新媒體,天極網2019年度影響力自媒體。
騰訊全媒派榮譽導師,虎嗅、36氪、鈦媒體、數英等專欄作者。
轉載、商務、以及加讀者群,請聯系個人微信「wuduidui728」,備注個人信息,公司—職務—姓名。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.