![]()
2026 年的馬年春節,AI 的火藥味甚至蓋過了紅包味。
字節、阿里、騰訊幾乎同時把 AI 大規模推向臺前:紅包、免單、春晚互動、本地生活接入……都在爭入口。與此同時,BAT 三家也在基礎模型上連續出牌,視頻生成(Seedance 2.0)、圖像(Qwen-IMAGE-2.0)、多模態、語音模型密集更新,幾乎沒有空檔。
不過,基礎模型的對抗也從字節、阿里、騰訊等巨頭迅速蔓延到了 DeepSeek 和「AI 小龍」們。
2 月 11 日晚,DeepSeek 新模型版本全面上線,繼續把長上下文與復雜任務能力往前推;幾乎同一時間,智譜推出新一代旗艦 GLM-5,強調 Agent 與編程能力;MiniMax 也帶來了 MiniMax M2.5,延續多模態與應用導向路線。
三家幾乎在同一時間點出手,讓這場春節 AI 大戰的「模型交鋒」又升級了一個檔位。
巨頭雙線推進,既搶入口也搶模型;創業公司聚焦底層能力,把籌碼壓在基礎模型上。真正決定 2026 年甚至未來幾年的競爭,正在這里展開。
春節 AI 大戰:前線發紅包,后端拼模型
2 月 12 日,阿里千問宣布「春節 30 億大免單」上線 6 天完成 1.2 億筆 AI 下單,用戶說了 41 億次。稍早前,騰訊元寶則宣布春節活動啟動 5 天,元寶 AI 生圖功能日均調用增長 30 倍,時長增長超 80%。
![]()
圖片來源:千問、元寶
如果說今年春節 AI 大戰前半段是純粹的入口之爭,后半段則是更為復雜,從巨頭到初創大模型公司,都在集中發力基礎模型的迭代。
這一點其實雷科技在之前的報道《一切為了Agent:千問、階躍、Gemini打響「3.5模型大戰」,春節將成關鍵節點?》就有提到,包括:
- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;
- 國內已經發布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;
- 剛剛發布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;
- 還有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。
DeepSeek V4大招還沒發,把「長上下文」做深是亮點
考慮到 DeepSeek 并沒有發布官方博文,這一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或為 V3.5)。
不過這也可以看作 V4 發布前的「灰度版」,因為按照 The Information 的最新爆料,DeepSeek V4 內部初步測試顯示,其在模型的編程能力了已經超越了 Claude(沒有指出具體模型)。
而從網友們統一收到的 DeepSeek 回復來看,DeepSeek 新模型的變化集中在兩點:百萬級長上下文和知識庫更新。
![]()
首先是上下文窗口從之前的 128K 直接拉升到了 1M(100 萬 Token),你可以一次性把《三體》全集或者一整個項目的代碼倉庫塞給它。測試顯示,它處理這類長文檔的響應速度非常快,不再需要手動拆分文件。
另外,DeepSeek 新模型的知識庫也更新到了 2025 年 5 月,但依然不支持多模態——無法理解圖片(文字內容除外)和視頻,也符合 DeepSeek 一直堅持的「語言模型」路線:
不追求炫目的多模態,而是把文本推理、工程任務這些高頻剛需做到極致。
而上下文長度的大幅提升,不僅長文檔處理與多輪推理能力更穩定,理論上也會改善長代碼理解、多步驟分析等復雜場景執行表現。
時隔 1 個多月迭代,智譜 GLM-5 把 Agent 推到臺前
![]()
相比之下,GLM-5 作為原生 Agent 基座模型的升級更具「代際感」。雖然距離去年底發布 GLM-4.7 僅僅過去 1 個多月,但智譜年初上市時候預告的新一代模型,確實升級不小。
這一代模型的核心關鍵詞不再是對話,而是 Agent 與編程能力,也規格已經明顯向「Agent 基礎模型」靠攏:上下文達到 200K 級別,最大輸出可達 128K,模型規模進一步擴大,訓練體系也做了重構。
但真正的變化還是發生在能力結構上。
GLM-5.0 被直接設計為可執行任務的 Agent 模型,強調編程能力、工具調用與長流程執行。在編程測試中,它已經能處理項目級代碼與調試問題,模型可以拆解需求、調用接口、持續執行任務,并在多階段過程中保持目標一致。
繼續押注多模態,MiniMax M2.5依然堅持生產至上
![]()
MiniMax 從模型到應用的垂直路線,依舊與前兩者拉開距離。
MiniMax M2.5 的升級重點仍然放在多模態與內容生成能力,但強調的一整套多模態能力的推進,包括語音生成、音樂生成與文本能力同步提升,強調可直接進入創作與產品流程。
模型繼續采用 MoE 架構,在保持規模的同時控制推理成本,更適合部署在應用側。語音克隆、情緒表達、音樂生成質量的提升,使它更接近「生產工具」,而不是推理模型。
MiniMax 的定位因此也很清晰——不是去比誰最聰明,而是更偏向讓模型在內容生產環節真正可用,生成內容、參與創作、進入產品流程。
這條路徑也決定了 MiniMax 的目標不是 benchmark,而是可落地的生產能力。
三家模型的路徑差異由此變得非常具體:DeepSeek 把長推理能力做到極致,智譜把模型推向 Agent 工程形態,MiniMax 則把多模態生產能力做成基礎設施。它們不再圍繞同一套指標競爭,而是在不同能力方向上構建各自的模型形態。
但共性同樣明顯。參數規模不再是核心賣點,聊天體驗也不再是主要目標,所有升級都在指向一件事——模型要能參與真實任務,而不僅是給出答案。
DeepSeek 炸場一年后,「AI 小龍」位次已劇變
把時間撥回到去年春節,DeepSeek-V3 和 R1 的開源發布,沖擊了全球 AI 格局,也成為「AI 小龍」陣營的分水嶺。
關鍵不只是「模型很強」,更在于成本被重新定義。低成本、高性能的推理模型開始出現后,行業對基礎模型的預期突然變了——不只是要求嚴格訓練出一個模型,而是要求更低成本的更強模型。
![]()
劇烈的模型競爭加速,再加之訓練算力的匱乏,直接引發了「AI 小龍」陣營的明顯分化。百川和零一幾乎已經退出「前沿基礎模型」的主戰場:前者轉向醫療等垂直方向,后者更多走企業與行業場景路線,更新節奏明顯放緩。
當基礎模型進入高投入、高密度迭代階段,只有極少數團隊還能長期承受算力與研發壓力。
不過今年的情況又有些不一樣,最直接的一點就是 DeepSeek V4 至今沒有發布。從外部看,可能有兩種解釋。
一種是技術層面的現實:推理能力、長上下文、工程穩定性這些方向本身難度更高,模型要跨出一整代的差距,需要更長周期,而且之前也傳出過 DeepSeek 在訓練過程遇到難題。另一種則是更偏策略性,不只是跟著友商一起發布,而是作為壓軸登場,形成宣發上的優勢。
還有一個更容易被忽略的變化是:今年春節,DeepSeek 要面對字節、阿里、騰訊在模型上的高強度投入,以及全球模型的快速迭代,最直觀的例子就是最近引爆全球的字節 Seedance 5.0 視頻模型。

Seedance 5.0 生成,圖片來源:bilibili
當然,還在活躍的「AI 小龍」也在第一線持續推進基礎模型的迭代,智譜 GLM 和階躍星辰 Step 更多還是集中在模型,面向行業提供更創新、更實用的基礎模型。
MiniMax 和月之暗面 Kimi 則更多主打「模型即應用」,不只打造模型,也在發力自己的原生 AI 應用,MiniMax 更是形成了一定的產品矩陣,但二者都在從基礎模型到應用進行垂直整合。
這不是簡單的「誰強誰弱」,而是一種更現實的分化。
寫在最后
2026 年的春節還沒正式開始,但大模型下半場的發令槍已經響得震耳欲聾。
從巨頭們的「撒幣」入口戰,到 DeepSeek、智譜、MiniMax 在初四晚上的模型突襲,這場仗的打法變了。大家不再執著于在 Benchmark 上刷分,而是開始比誰能更深地嵌入真實生產力:是吞下百萬行代碼的胃口,是自主跑通工程的雙手,還是理解人類情緒的耳朵。
DeepSeek 這次雖然沒祭出傳說中的 V4,但這記「1M 上下文」的長拳,依然也讓不少空談 Agent 卻解決不了長程記憶的對手感到脊背發涼。而智譜和 MiniMax 的如期對壘,則證明了「AI 小龍」們已經從去年的防守反擊,轉向了更有底氣的差異化進攻。
懸念依然存在。DeepSeek 憋了許久的 V4 究竟是在等一個「一力降十會」的壓軸時刻,還是在攻克某種未知的技術天花板?在大廠與小龍的混戰中,誰能率先把「模型能力」真正轉化為「商業護城河」?
但有一點是肯定的:2026 年,單純靠「會聊天」已經拿不到門票了。煙花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.