網易首頁 > 網易號 > 正文申請入駐

AI御三家年終“火拼”

2025-12-15 10:10:11　來源: 吳懟懟

上海舉報

分享至

2025年的人工智能（AI）領域可謂風起云涌：大模型你追我趕、商業版圖急劇擴張。

以前我感覺用ChatGPT+Claude就可以了，現在必須加上Gemini和Grok，要取四個AI之長。跟打王者榮耀升級一樣，要有個本命英雄，但是同一分路還要會點別的英雄，最好還要擅長不同分路。

當然，被討論和使用最多的，還是ChatGPT，Claude和Gemini，我愿稱之為AI御三家。

01
AI御三家瘋狂加碼

年底壓軸登場的OpenAI GPT-5.2成為年終焦點。

面對Gemini 3在各大榜單上后來居上的壓力，OpenAI提前啟動紅色代碼警告，加速推出了這款新一代大模型。

GPT-5.2被定位為“一款為專業知識工作打造的最強模型”，在推理、編程和智能體任務上較前代有顯著提升。

其最大亮點之一是超長上下文記憶能力：支持40萬Token的輸入窗口和12.8萬Token的輸出長度，可一次性 ingest 海量文檔或代碼庫并生成長篇報告。

這意味著GPT-5.2能夠閱讀理解數百頁資料后給出總結，在長鏈多步驟推理中表現更穩健。

OpenAI還將GPT-5.2劃分為Instant、Thinking和Pro三個等級模型，以平衡速度與深度需求——Instant偏重日常快速回答，Thinking適合復雜結構化任務和長時智能Agent執行，Pro則追求極致準確率以應對棘手問題。

在各項權威基準測試上，GPT-5.2全面刷新紀錄：比如在SWE-Bench Pro編程測試中達到55.6%的新高分，遠超前代；在通用推理ARC-AGI測試上首次突破90%正確率。

值得一提的是，GPT-5.2雖然對圖像生成暫未有顯著改進（OpenAI透露“圖像生成的增強還在籌備中”），但在多模態理解上已有進步：它能夠更好地“感知圖像”并結合視覺輸入完成復雜任務。

此外，GPT-5.2成為OpenAI推動“Mega-Agent時代”的引擎，其連貫長程代理能力令人矚目——測試顯示它能自主完成40%更復雜的長鏈任務，如根據乘客反饋自動完成改簽航班、預訂酒店、申請賠償的一整套事務，比前代5.1覆蓋更多步驟且更準確。

這一年，經歷了年初GPT-5.0/5.1推出時的波折（性能和風格調整一度飽受爭議，被用戶批評“過于冰冷刻板”，OpenAI火速用5.1版本改善了親和度），OpenAI憑借GPT-5.2在年末重奪技術王冠，在大模型軍備競賽中卷土重來。

作為OpenAI強勁的對手，Anthropic在2025年持續發力，9月發布了Claude 4.5。Claude 4.5主打自主編程與工具操作能力。

在內部測試中，其子型號Claude 4.5-Sonnet曾連續自主編程30小時構建出一個Web應用，而此前Claude Opus 4只能堅持7小時。

這一飛躍體現出Claude在長程任務上的穩定性提升，讓AI代理真正能夠長時間無監督地工作。

Anthropic表示4.5在金融分析和科學推理上也更勝一籌，在一項操作系統使用能力測試中得分約60%，遠高于前代模型的40%。

換言之，Claude 4.5更善于像人一樣使用電腦完成多步驟任務，這對需要AI自動執行業務流程的企業非常關鍵。Anthropic一貫強調安全可靠，以降低出錯或產生有害內容的風險，定位于企業及專業用戶場景。

在架構上，Claude 4.5提供了不同性能版本：例如Claude 4.5-Haiku、Sonnet、Opus等，分別平衡速度、成本與精度，其中最強的Opus 4.5版本支持更大的上下文窗口和更高的調用上限（相應成本也最高）。

這反映出大模型普遍朝著精細化配置方向發展。值得關注的是，Claude 4.5在發布當日即宣布與微軟深化合作：微軟將其引入Microsoft 365 Copilot，增加Excel/Word的“智能體模式”和Copilot聊天中的“Office助手”等新特性。

微軟此舉意在讓Office用戶獲得更強的自動辦公助手，同時也表明其生態策略從獨家捆綁OpenAI轉為多模型并舉。

而在OpenAI和Anthropic激戰正酣之際，谷歌DeepMind整合優勢，于11月發布了里程碑式的Gemini 3模型。作為谷歌雄心勃勃的旗艦，Gemini 3 Pro號稱谷歌“有史以來最智能、事實準確率最高”的AI。

與其前代相比，Gemini 3最大的突破是“原生多模態”：它能同時處理文本、圖像和音頻，多模態融合能力業界領先。

例如，用戶可以讓Gemini讀取菜譜照片并直接生成烹飪手冊，或讓它看一系列視頻課程后自動創建交互式學習卡片。

這種將視覺、聽覺與文本理解打通的能力，為AI應用打開了新局面。借助多模態和強大的編程能力，Gemini 3還能輸出富媒體結果：在Google搜索的AI模式下，它可以把答案呈現為圖片、表格、網頁等動態格式，而非僅有文字。

更驚艷的是，Gemini 3內置增強版的搜索工具調用機制，能自主將復雜問題拆解成子查詢去搜索，并結合結果給出整合答案。這一“查詢分解+工具使用”策略提升了答案的廣度和準確性。

Gemini 3在交互風格上也別具特色：谷歌直言其回復將摒棄討好傾向，不再一味迎合用戶而是提供“聰明、簡潔、直接”的洞見，避免空洞恭維。過去聊天機器人易有的過度諂媚在Gemini上大幅減少，這被視為對ChatGPT習慣說“好話”的一針諷刺。

除了日常問答，Gemini 3 Pro還強化了推理規劃和Agent能力。谷歌稱其可以“可靠地進行更長遠的計劃”，驅動實驗性的Gemini智能代理，幫助用戶自動收發郵件、研究行程甚至預訂機票。這預示著搜索引擎正從提供信息進化為直接代辦任務的全能助理。

性能方面，Gemini 3 Pro一經推出即登頂權威排行榜LMArena，足見其實力。Gemini 3發布當天，谷歌選擇在其Gemini App上向全民免費開放旗艦模型Pro，并很快在搜索服務中提供給訂閱用戶使用。

這種大規模分發策略與OpenAI先會員后開放的方式形成對比，也顯示了谷歌在消費級AI領域搶占用戶的迫切。

Gemini 3 Pro的橫空出世，標志著谷歌在經歷了GPT-4/Bard時期的相對落后后，于2025年強勢反超，一度引發行業內“Holy Shit!，谷歌贏得AI競賽”的驚嘆。

估值飆升再飆升

2025年，AI賽道的融資規模再創新高，多家頭部獨角獸估值飆漲，吸金能力驚人。
OpenAI在未進行公開融資的情況下，據報道正尋求員工股份出售，潛在估值高達5000億美元——這一數字是歐洲AI獨角獸估值的數十倍，體現出投資者對其龍頭地位的信心。
而Anthropic在9月宣布完成130億美元的巨額融資，投后估值達1830億美元，較年初翻了近兩倍。
此輪融資由硅谷知名投資機構ICONIQ領投，富達、Lightspeed等跟投，亦有中東的卡塔爾主權基金和華爾街巨頭黑石等參與。
Anthropic一躍成為全球估值第三高的非上市公司，僅次于SpaceX等少數巨頭隨著資金涌入，Anthropic公布其業務營收增長迅猛：2025年初年化收入約10億美元，到了8月激增至50億美元，表明大型AI模型的商業付費需求正被快速開發。
另一家引人注目的創業公司是法國的Mistral AI。這家2023年才成立的創業公司，2025年9月獲得了17億歐元（約20億美元）的系列C投資由荷蘭光刻機巨頭ASML領投1.3億歐元，占股11%，其余包括DST、a16z、創投基金Bpifrance、英偉達等紛紛押注。
此次融資使Mistral估值達到117億歐元，成為歐洲AI領域新的價值巔峰。盡管這一估值僅相當于OpenAI傳聞估值的約1/40，但對于歐洲來說是重大突破——Mistral被視為歐盟對抗美中AI巨頭的重要希望，法國更將其視作國家AI戰略的核心。

馬斯克于2023年創建的xAI在今年也有所動作。xAI開發的對話模型Grok持續迭代，2025年推出了Grok 4，據稱在部分基準上號稱“世界最聰明”。

Musk在社交媒體上高調宣傳Grok整合了實時網絡檢索和各種工具插件，并賦予其鮮明的“直言不諱”個性，讓其回答帶有一點“Meme風格”，以吸引年輕用戶。

03
巨頭博弈變化再變化

作為OpenAI背后最大的金主和合作伙伴，微軟在2025年的策略出現了微妙變化。一方面，微軟將OpenAI模型深度嵌入其Windows、Office、Bing等核心產品，持續收割付費用戶和云計算消耗。

今年微軟全面上線了Windows 11的Copilot助手，將操作系統與GPT助手融為一體，用戶可以直接在桌面調用AI完成設置、搜索等操作，讓傳統OS煥發新生。

同時，微軟Azure云借助OpenAI服務吸引了大量企業上云進行AI開發，Azure的使用量和收入顯著增長。

但另一方面，微軟不再將寶押在OpenAI一家：10月，微軟宣布與Anthropic達成合作，將后者Claude模型引入Azure并在Office中集成。微軟高管稱此舉是為了給客戶提供“多樣化選擇”，降低對單一供應商的依賴。

這或許與2023年末OpenAI高層動蕩（Altman一度被董事會驅逐后又復歸）有關，微軟意識到必須預防風險、扶持第二陣營以維持自己的AI領先地位。

此外，微軟也加碼自研，傳聞其內部的生成式模型項目（代號Omega）在研制多模態基礎模型，以備不時之需。

谷歌在經歷了ChatGPT帶來的“AI覺醒”之后，今年實現了AI戰略的大幅轉身。Google DeepMind的成立整合了谷歌原有的Brain團隊與DeepMind研究院資源，成為谷歌AI創新的核心引擎。

Gemini 3的成功推出讓谷歌重奪技術話語權，也增強了內部信心。谷歌隨即在產品線上全面開花：搜索業務推出“AI對話模式”，地圖應用上線路線智能生成和旅行規劃助手，Gmail/Docs增加AI寫作輔助功能等。

不僅軟件服務，谷歌在Android系統中也增加了端側AI能力，例如利用手機SoC內的TPU微芯片，實現小型語言模型的本地推理，提供離線的智能輸入法、更精準的相冊識別等。

甚至有報道指出，谷歌與蘋果達成協議，為后者提供定制的Gemini模型用于提升iOS上的智能體驗。

這表明谷歌積極尋求將其AI技術輸出賦能更多平臺。商業上，谷歌云也以提供多元模型著稱——除了自家的PaLM/Gemini系列，第三方的Meta Llama2、Anthropic Claude等也能在其Vertex AI平臺上獲取，從而與微軟Azure在企業市場上抗衡。

谷歌今年對AI創業公司的投資并購也有增加，據傳它投資了多家生成式AI初創（例如Inflection）以擴展生態。谷歌卷土重來，在AI領域從被動應戰轉為主動出擊，通過技術突破和生態聯盟重塑了自己的領先地位。

Meta繼續走開放生態和消費者應用兩手抓的路線。一方面，它在開源社區的地位鞏固。自從2023年開源LLaMA模型大獲成功后，Meta在2025年又相繼推出了改進版的LLaMA 3模型以及一系列開源的多模態模型，包括圖像生成模型和語音合成模型。

這些模型免費供研究者和開發者使用，僅要求遵守一些不用于有害用途的許可，大量第三方應用建立在Meta模型之上。

另一方面，Meta充分發揮旗下社交產品的流量，將AI融入數十億用戶的日常。2025年，Meta在Messenger和Instagram中推出了一系列AI角色聊天功能，例如用戶可以和由名人形象構建的AI聊天（這些明星形象的對話風格由模型模擬，并獲得了明星本人的授權）。

用戶還可以讓AI根據朋友圈內容自動生成趣味回應，或在Instagram上通過文字命令生成個性化的圖片貼紙。Meta的VR/AR事業部也不甘落后，在Meta Quest頭顯中集成了AI教練和AI健身指導，提供沉浸式的互動體驗。

值得注意的是，Meta在AI商業化上更側重間接收益——通過提升用戶黏性、廣告定向和內容生態繁榮來賺錢，而非直接出售API。因此，Meta樂于推動AI開源降低成本，同時憑借其社交帝國將AI無縫融入產品，鞏固自身社交媒體霸主地位。

相比喧囂的友商，蘋果在AI領域依舊低調、緩慢但務實。2025年的WWDC大會上，蘋果官宣了一項重大底層升級：iOS/macOS引入了本地大型語言模型（Foundation Models）框架，開發者可調用系統提供的基礎模型，在App中實現更智能的功能。

蘋果透露，他們針對Apple設備專門訓練了多語言的中等規模語言模型，并進行了深度優化，使其能夠在iPhone/蘋果電腦上離線運行，用于鍵盤聯想、語音助手Siri應答等場景。

這意味著用戶的部分AI請求不必上傳云端，在設備上即可處理，提升了隱私與響應速度。同時，蘋果也將AI應用于照片處理（利用生成模型一鍵除物或改變背景）、Apple Music個性歌單（AI分析用戶喜好生成播放列表）等方面，提升用戶體驗。

有傳聞稱蘋果還與谷歌達成某種合作，可能在云端借助定制版Gemini模型來增強iCloud的AI服務。

但截至年底，蘋果并未發布類似ChatGPT的通用聊天產品，Siri的智能度也還有提升空間——不過可以預料，一旦蘋果認為時機成熟，可能會推出深度融合硬件優勢的AI助手，引發新的行業震動。

蘋果的策略體現了差異化競爭：它不與OpenAI等正面拼參數規模，而是發揮軟硬件一體的長處，讓AI默默融入生態，為用戶提供便利且安全的功能。這種潤物細無聲的推進，契合蘋果品牌調性，也為行業提供了另一種范式：以終端和隱私為中心的AI道路。

當然，另一面，AI是否存在泡沫的討論也越來越多。

無論如何，作為用戶，還是希望，2026，AI御三家，以及更多玩家，繼續打起來吧。

你還可以看

吳懟懟原創出品

吳懟懟，左手科技互聯網、右手文創與消費。鈦媒體2021影響力創作者，領英2020年度行家，人人都是產品經理2017年度作者，新榜2018年度商業觀察者，DONEWS2019年度十大專欄作者，NEWMEDIA2019年度科技新媒體，天極網2019年度影響力自媒體。

騰訊全媒派榮譽導師，虎嗅、36氪、鈦媒體、數英等專欄作者。

轉載、商務、以及加讀者群，請聯系個人微信「wuduidui728」，備注個人信息，公司—職務—姓名。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.