網易首頁 > 網易號 > 正文申請入駐

在這個開源「從夯到拉」榜單，我終于明白中國 AI 為什么能逆襲

2025-12-17 15:51:49　來源: 愛范兒

廣東舉報

分享至

最近幾天，一張開源模型的等級列表在 X 上被瘋狂轉載。

▲ 圖片來源：https://www.interconnects.ai/p/2025-open-models-year-in-review

從夯到拉，國產開源模型排在了數一數二的位置，DeepSeek、Qwen、Kimi、智譜、還有 MiniMax 是全球開源模型的前五名。而 OpenAI 排在了第四梯隊，小扎的 Meta，挖了硅谷半壁江山想打造的 Llama 更扎心，只落得了一個榮譽提名。

這份榜單并不是國產模型花錢打廣告，也不是中國人王婆賣瓜，自賣自夸。知名的 AI 研究員 Nathan Lambert 和德國 AI 研究中心的博士生 Florian Brand，在 interconnectai 上的一篇文章，給出了全球開源模型的完整排名。

▲Nathan Lambert 曾在 Meta、DeepMind、和 Hugging Face 工作

文章里詳細回顧過去這一年，全球開源模型的發展，以 DeepSeek 和 Qwen 為主的國產開源模型，正在用開源改變整個 AI 行業的運行規則。

事實也如此，2024 年對于全球開源來說，可能還是 Llama 的天下。到了今年，國產開源以一種不可忽視的姿態，持續刷新著全球大模型的默認選項。

性能、價格、生態、可用性……每個維度都在快速逼近閉源巨頭，甚至在某些方向已經實現了反超。

▲中美開源模型發布歷史，2024.01-2025.11，圖片來源：https://www.atomproject.ai/

當我們還在想國產模型什么時候能追上 ChatGPT、Gemini 時，AI 的軍備競賽場上，另一個問題也開始沸騰起來，為什么全球開發者都在用國產開源模型？

開源模型，前浪后浪一起上

過去這幾個月，國產開源模型的更新節奏幾乎沒有停過。而且不只是某一家模型公司的爆發，是整個國產開源生態，持續接力，就像一條快速攀升的曲線，不斷在突破瓶頸。

11 月，Kimi 發布了萬億參數的混合專家模型，Kimi K2 Thinking，直接拿下多個榜單第一名，甚至超過了 OpenAI 的 GPT-5 和 Anthropic 的 Claude 4.5。

10 月底，MiniMax 正式發布了 MiniMax M2 混合專家模型 MoE，和 Kimi 一樣，繼續開源，在綜合榜單上的表現，MiniMax M2 排名第五，超過了 Gemini 2.5 Pro 和 Claude Opus 4.1。

9 月，阿里在云棲大會上，一套模型七連發的組合拳，在視覺、語音、推理、編程等多個領域做到極致。

海外社交媒體上，關于國產開源模型的認可，從橫空出世的 DeepSeek 以來就沒停過。「好用、便宜、小公司的開發首選、自己做的副業項目，用的就是中國開源模型……」，這些評論在 X 上隨處可見。

像是網友們對 Kimi K2 Thinking 寫作風格，以及用 token 數量換思考深度的稱贊。

還有網友說拿 Minimax M2 和 Claude Sonnet 4 對比，M2 只用一次就能生成一個功能齊全的網站，但是 Sonnet 4 會失敗。

關于 Qwen 的帖子就更多了，從 2.5 更新到現在的 3.0，從大尺寸的 4800 億參數，到只有 6 億參數的小模型，從視覺語言 Qwen 3 VL，到代碼編寫 Qwen 3 Coder，開源市場幾乎都有 Qwen 的影子在。

愛彼迎 CEO 在接受采訪時，甚至大方的表示 OpenAI 雖然好，但是不適合我們；而來自中國的開源模型 Qwen 非常好，能實際地應用到他們的工作中，比 OpenAI 更好更便宜。

在開源這塊，說國產開源模型還在追趕都不貼切，是已經實打實地成為了全球默認的開源選擇。

MiniMax M2，能落地的開源智能體

如果要用具體案例，來說明國產開源模型，到底好在哪里，過去我們分享的多個開源工具的實測體驗，其實就已經有了答案。

發布時間最近的 Kimi K2 Thinking，一次性能執行 300 次工具調用的超長思考鏈條，還有為手機而生的通用 Agent，智譜 AutoGLM 2.0；以及 AI 時代的安卓，阿里通義模型大家族。

▲Artificial Analysis 統計的 2025 Q1 國產前沿 AI 模型大廠和初創公司

這些模型雖然都是開源，但是都有各自的技術亮點，努力讓國產開源模型這張地圖，變得更完整、更豐富。

像 K2 Thinking 主打萬億參數大模型，然后還有自己的 KDA（Kimi Delta Attention）機制；DeepSeek 主打混合注意力，成本驟降；Minimax M2 在這次的更新里面，反而是一改常態，使用了完全注意力，模型參數也僅 2300 億。

M2 好不好用，本著能體驗都上手試試的原則，我們也簡單測了一下。

第一個任務是讓他處理 Excel 表格數據，我們把今年國考的崗位信息表格發給他，讓它根據表格內容，設計一個通用的公務員崗位篩選工具。

表格的數據非常多，大小有 10MB，累計兩萬多個崗位。MiniMax M2 特別好的一點是，它會在正式執行任務前，詢問用戶，是否需要對任務進行調整。

在他們的技術博客里面提到，M2 此次采用了「交錯思考」的技術，這項技術最早是在 Claude Sonnet 4 模型中開始應用，但具體的采用還很有限。

MiniMax 給了一個小貼士，提醒用戶保留模型的思考記錄，即 think 標簽。M2 依賴于交錯式思維，上下文就是為記憶，保留了，才能更好的開展交錯式思考。

▲MiniMax 工程主管發 X 解釋，交錯思考如何讓模型更好地完成智能體任務

簡單來說，交錯思維（Interleaved Thinking）就是讓大模型在「動手做事（用工具/調用接口），停下來想一想再動手，然后接著再思考」，這樣的循環里推進任務，而不是先把一大段思路想完再一次性執行。

最近更新的 Kimi K2 Thinking 同樣采用了交錯式思考的技術。邊思考邊調用的方式，能讓模型在每次拿到工具輸出后，立刻復盤、調整計劃，這特別適合流程長、結果不確定的智能體任務。

▲ 體驗地址：https://2rfxtimus5nr.space.minimaxi.com/；雖然考試已經結束，但是也能看到 MiniMax M2 處理 Excel 表格數據的能力，不容小覷

最后給出的結果是非常的準確的，20714 個崗位，以及對于應屆生、基層工作年限、戶籍地等方面的條件，它都有統計到；相比市面上一些付費的選崗工具，自己用 Agent 自動生成一個，再方便不過。

我們還讓它去做一些深度研究，丟給它關于 M2 自己的信息，讓它制作一個精美的 PPT。

▲預覽鏈接：https://z4czsdfoakc7.space.minimaxi.com/

除了這種從零開始做一個產品的 vibe coding 體驗，MiniMax 還提供了詳細的教程，關于如何接入 Claude Code 等命令行工具，或開發平臺 Cursor、VS Code 等。

▲使用 MiniMax M2 模型 API 的 Claude Code

交錯思考能讓模型更聰明，知道何時該調用何種工具。但 MiniMax M2 這次在技術上還有一個亮點，是它一反常態的使用了全注意力機制。

之前我們介紹過 DeepSeek 能把成本打到這么低，其中最重要的原因之一就是它采用了稀疏注意力，以及混合注意力機制。稀疏注意力能讓模型在處理 token 時，和我們人類一樣，有選擇的聚焦在重要信息，而忽略掉次要信息。

配合其他的策略，就能在不影響輸出質量的前提下，提升模型的推理速度，降低成本。

▲ 博客原文：https://huggingface.co/blog/MiniMax-AI/why-did-m2-end-up-as-a-full-attention-model

MiniMax 團隊也專門寫了一篇技術博客來介紹，為什么又走回了原點，繼續選擇全注意力機制，這種增加訓練和推理壓力的方式。

他們提到主要的原因是「具體的表現」，現在大部分所說的稀疏注意力、或者高效注意力，并不是讓模型的效果更好，而是單純為了節省計算資源、降低成本。

全注意力模型的性能，和可靠性仍然是更高，隨著上下文長度需求不斷增加，以及 GPU 計算增速放緩，到那時，線性和稀疏注意力的潛力，可能會逐漸顯現。

而 MiniMax M2 目前要做的，是在有限的算力資源下，盡可能實現質量、速度、價格這個三角的平衡，這次它也確實做到了。

所以說，在某種程度上，很多人覺得開源，就意味著把技術白白送給別人；但在整個的技術發展路線歷史上，開源是讓不同的技術碰撞，讓不同的研究員合作，從而取得進一步的技術創新。

大模型分析平臺，Artificial Analysis 在發 X 介紹 MiniMax M2 的綜合榜單表現時，也提到了國產開源，他說。

中國 AI 實驗室在開源領域持續保持領先地位。 MiniMax 的發布延續了中國 AI 在開源領域的領先地位，這一地位由 DeepSeek 在 2024 年底開啟，并由 DeepSeek 的后續發布、阿里巴巴、智譜、和 Kimi 等公司持續保持。

確實是這樣，等了一年都沒等來的 DeepSeek R2，卻讓我們看到了在國外爆火的 Kimi K2，智譜 GLM 系列，還有幾乎所有開發者都離不開的 Qwen 系列。

所有的這些國產開源模型，多元的技術路線、不同的應用方向，完全組合在一起，才有了真正的優勢和力量，讓閉源不再成為「好模型」的代表。

▲ Hugging Face 上，熱門榜單前四個，都是國產開源模型；圖片來源：https://huggingface.co/models?sort=trending

閉源沒法卷贏閉源，只有開源，才能打穿壁壘

前段時間，在小紅書的 1024 程序員節上，Hugging Face 創始人提到，開源和閉源差距在縮小，中國在這方面比較領先；小紅書的技術負責人也說，開源降低了社會運用 AI 的成本，動用大家的力量，推著技術往前走。

毫無疑問，開源肯定是一件好事，只是沒有人想到，打敗閉源的，是來自我們的開源。

DeepSeek 的出現，除了向全世界公開了全新的模型訓練邏輯，以更低的成本實現同等驚艷的效果；更多的是讓整個國產 AI 的運行模式，有了明確的方向。

它讓所有人意識到，在當時全球 AI 話語權被美國壟斷的語境里，開源是讓自己被看見的唯一方式。

▲OpenAI 的萬億算力商業帝國，包括 Google、Meta、Anthropic 等

當然，選擇開源，背后更具體的原因有很多，OpenAI、Anthropic、Gemini 每家都在閉門造車，他們可以靠著無上限的顯卡，訓練更大的模型，融資動輒千億美元。

但國產模型面臨的困境是，算力緊張、芯片受限……如果不共享模型，就沒人能復用算力。沒有可以使用的基礎模型，就意味著一切都要從頭開始。百度一開始選擇了閉源，為了商業模式的運轉；在今年六月，他們也宣布正式開源了，文心大模型 4.5 系列模型。

另一方面是國產模型廠商太多、競爭太激烈，他選擇不開源，就會有別人開源；而閉源，用戶就有可能選擇其他模型。

▲圖片來源：https://a16z.substack.com/p/charts-of-the-week-open-model-of

a16z 前段時間統計了開源模型的數據，結果顯示，國產開源模型的累計下載量，不僅超過了美國模型，而且領先優勢還在不斷擴大。

今年四月，斯坦福大學也發表了一份 2025 人工智能指數報告，里面統計了開源模型和閉源模型的性能對比，以及中美兩國模型的性能對比。這份報告的數據只截止到今年 2 月份，明年再看的時候，國產開源大概會順利超過閉源和美國。

如果把國產開源的優勢拆到最小，我們會發現現在的領先，是因為一個完整、龐大的開源系統，這個系統的每一環都在讓國產開源的能力，越來越強大。

▲無論是社區對國產開源模型的評價，即 Elo 排名，還是在 ArtificialAnalysis 基準測試中，按地區劃分的性能對比，國產開源都在領先位置｜圖片來源：https://www.atomproject.ai/

DeepSeek 拿成本結構和高效推理打開了第一道縫；Qwen 憑借著生態規模把縫撕成了口；MiniMax、智譜和 Kimi 則用不同的技術路線，把這個口越撐越大。

當全球的小團隊都用 Qwen 做微調、用 DeepSeek 做推理基座、用 MiniMax 做智能體驗證，國產開源從選擇變成了默認。結果就是，全球開源生態的中心，開始向中國傾斜。

上個月，黃仁勛在人工智能峰會上接受采訪時表示，「中國將在人工智能競賽中獲勝。」盡管隨后他立刻通過英偉達官方賬號 X 發表聲明，收回了之前的言論，澄清說中國實際上「在人工智能競賽中，落后美國僅幾納秒。」

其實這也不是黃仁勛第一次提到，中國在人工智能競賽的位置了。過去在多個公開場合，他都表示開源模型極其重要，無論是對開發者還是初創公司，甚至是所謂的 AI 競賽。

今年 10 月的英偉達 GTC 大會上，黃仁勛的演講里再次提到，全球模型開源市場，來自中國的通義千問排名第一，并且占據了大部分的市場份額。

▲幾乎超過 60% 都是 Qwen

今年 4 月，他還在華盛頓的科技大會上說，「毫無疑問，華為是世界上最強大的科技公司之一……中國在人工智能領域并不落后。我們非常非常接近……全球50%的人工智能研究人員是中國人。我們將不得不競爭。」

但是在開源上的競爭，看美國的開源老大，來自 Meta 的 Llama，去年四月發布了 Llama 3，7 月 Llama 3.1，9 月 Llama 3.2，然后到了今年 4 月讓人大跌眼鏡的 Llama 4，甚至還有一個更高級的 Behemoth 版本至今沒發布。

▲四月份發布的 Llama 4，提到有 Behemoth、Maverick、Scout 三個版本，Behemoth 目前看來是被放棄了

再后來，關于 Meta 的新聞就只有小扎開出天價薪酬到處挖人，然后最近又瘋狂裁員六百人，連圖靈獎得主 Yann LeCun 都不干了，要走人自己去創業。

大概小扎根本沒想到，自己在硅谷選擇開源，可以說是一枝獨秀的存在，也會被今年 1 月爆火的 DeepSeek 偷了家。于是乎，Meta 現在開源也不是，閉源也難追趕，進退兩難。

很難不認同，Llama 走到今天這步，有一半是國產開源的「功勞」。

▲Meta 相關的衍生模型，和 Mistral AI 早期領先優勢，完全被阿里巴巴的 Qwen 模型超越

前幾天刷社交媒體，看到一個評論說，「開源就是把你的對手變成了你的兒子，沒有兒子會去打爸爸。」話糙理不糙，在 AI 的開源周期里，中國的代表性開源模型，明顯地變成了 AI 生態的底座。

這場由國產開源引領的 AI 模型浪潮，正在改變誰能定義未來的 AI 這個問題。它會讓我們每個人，以更低的成本、更快的速度，用上全世界最頂尖、也最好用的 AI。

最后這張圖的詳細情況如下。

▲從上到下依次為：
前沿模型：DeepSeek、Qwen、Moonshot AI（Kimi）
主要競爭對手：智譜（Z.Ai）、MiniMax
值得關注的公司：StepFun 階躍星辰、InclusionAI / 螞蟻 Ling、美團龍貓、騰訊、IBM、英偉達、谷歌、Mistral
專業領域：OpenAI、Ai2、Moondream、Arcee、RedNote、HuggingFace、LiquidAI、微軟、小米、穆罕默德·本·扎耶德人工智能大學
崛起中：字節跳動 Seed、Apertus、OpenBMB、Motif、百度、Marin Community、InternLM、OpenGVLab、ServiceNow、Skywork
榮譽提名：TNG 集團、Meta、Cohere、北京人工智能研究院、多模態藝術投影、華為

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.