<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      在這個開源「從夯到拉」榜單,我終于明白中國 AI 為什么能逆襲

      0
      分享至

      最近幾天,一張開源模型的等級列表在 X 上被瘋狂轉載。


      ▲ 圖片來源:https://www.interconnects.ai/p/2025-open-models-year-in-review

      從夯到拉,國產開源模型排在了數一數二的位置,DeepSeek、Qwen、Kimi、智譜、還有 MiniMax 是全球開源模型的前五名。而 OpenAI 排在了第四梯隊,小扎的 Meta,挖了硅谷半壁江山想打造的 Llama 更扎心,只落得了一個榮譽提名。

      這份榜單并不是國產模型花錢打廣告,也不是中國人王婆賣瓜,自賣自夸。知名的 AI 研究員 Nathan Lambert 和德國 AI 研究中心的博士生 Florian Brand,在 interconnectai 上的一篇文章,給出了全球開源模型的完整排名。


      ▲Nathan Lambert 曾在 Meta、DeepMind、和 Hugging Face 工作

      文章里詳細回顧過去這一年,全球開源模型的發展,以 DeepSeek 和 Qwen 為主的國產開源模型,正在用開源改變整個 AI 行業的運行規則

      事實也如此,2024 年對于全球開源來說,可能還是 Llama 的天下。到了今年,國產開源以一種不可忽視的姿態,持續刷新著全球大模型的默認選項。

      性能、價格、生態、可用性……每個維度都在快速逼近閉源巨頭,甚至在某些方向已經實現了反超。


      ▲中美開源模型發布歷史,2024.01-2025.11,圖片來源:https://www.atomproject.ai/

      當我們還在想國產模型什么時候能追上 ChatGPT、Gemini 時,AI 的軍備競賽場上,另一個問題也開始沸騰起來,為什么全球開發者都在用國產開源模型?

      開源模型,前浪后浪一起上

      過去這幾個月,國產開源模型的更新節奏幾乎沒有停過。而且不只是某一家模型公司的爆發,是整個國產開源生態,持續接力,就像一條快速攀升的曲線,不斷在突破瓶頸。

      11 月,Kimi 發布了萬億參數的混合專家模型,Kimi K2 Thinking,直接拿下多個榜單第一名,甚至超過了 OpenAI 的 GPT-5 和 Anthropic 的 Claude 4.5。


      10 月底,MiniMax 正式發布了 MiniMax M2 混合專家模型 MoE,和 Kimi 一樣,繼續開源,在綜合榜單上的表現,MiniMax M2 排名第五,超過了 Gemini 2.5 Pro 和 Claude Opus 4.1。

      9 月,阿里在云棲大會上,一套模型七連發的組合拳,在視覺、語音、推理、編程等多個領域做到極致。

      海外社交媒體上,關于國產開源模型的認可,從橫空出世的 DeepSeek 以來就沒停過。「好用、便宜、小公司的開發首選、自己做的副業項目,用的就是中國開源模型……」,這些評論在 X 上隨處可見。

      像是網友們對 Kimi K2 Thinking 寫作風格,以及用 token 數量換思考深度的稱贊。


      還有網友說拿 Minimax M2 和 Claude Sonnet 4 對比,M2 只用一次就能生成一個功能齊全的網站,但是 Sonnet 4 會失敗。


      關于 Qwen 的帖子就更多了,從 2.5 更新到現在的 3.0,從大尺寸的 4800 億參數,到只有 6 億參數的小模型,從視覺語言 Qwen 3 VL,到代碼編寫 Qwen 3 Coder,開源市場幾乎都有 Qwen 的影子在。


      愛彼迎 CEO 在接受采訪時,甚至大方的表示 OpenAI 雖然好,但是不適合我們;而來自中國的開源模型 Qwen 非常好,能實際地應用到他們的工作中,比 OpenAI 更好更便宜。

      在開源這塊,說國產開源模型還在追趕都不貼切,是已經實打實地成為了全球默認的開源選擇。

      MiniMax M2,能落地的開源智能體

      如果要用具體案例,來說明國產開源模型,到底好在哪里,過去我們分享的多個開源工具的實測體驗,其實就已經有了答案。

      發布時間最近的 Kimi K2 Thinking,一次性能執行 300 次工具調用的超長思考鏈條,還有為手機而生的通用 Agent,智譜 AutoGLM 2.0;以及 AI 時代的安卓,阿里通義模型大家族。


      ▲Artificial Analysis 統計的 2025 Q1 國產前沿 AI 模型大廠和初創公司

      這些模型雖然都是開源,但是都有各自的技術亮點,努力讓國產開源模型這張地圖,變得更完整、更豐富。

      像 K2 Thinking 主打萬億參數大模型,然后還有自己的 KDA(Kimi Delta Attention)機制;DeepSeek 主打混合注意力,成本驟降;Minimax M2 在這次的更新里面,反而是一改常態,使用了完全注意力,模型參數也僅 2300 億。

      M2 好不好用,本著能體驗都上手試試的原則,我們也簡單測了一下。

      第一個任務是讓他處理 Excel 表格數據,我們把今年國考的崗位信息表格發給他,讓它根據表格內容,設計一個通用的公務員崗位篩選工具。


      表格的數據非常多,大小有 10MB,累計兩萬多個崗位。MiniMax M2 特別好的一點是,它會在正式執行任務前,詢問用戶,是否需要對任務進行調整。

      在他們的技術博客里面提到,M2 此次采用了「交錯思考」的技術,這項技術最早是在 Claude Sonnet 4 模型中開始應用,但具體的采用還很有限。

      MiniMax 給了一個小貼士,提醒用戶保留模型的思考記錄,即 think 標簽。M2 依賴于交錯式思維,上下文就是為記憶,保留了,才能更好的開展交錯式思考。


      ▲MiniMax 工程主管發 X 解釋,交錯思考如何讓模型更好地完成智能體任務

      簡單來說,交錯思維(Interleaved Thinking)就是讓大模型在「動手做事(用工具/調用接口),停下來想一想再動手,然后接著再思考」,這樣的循環里推進任務,而不是先把一大段思路想完再一次性執行。

      最近更新的 Kimi K2 Thinking 同樣采用了交錯式思考的技術。邊思考邊調用的方式,能讓模型在每次拿到工具輸出后,立刻復盤、調整計劃,這特別適合流程長、結果不確定的智能體任務。


      ▲ 體驗地址:https://2rfxtimus5nr.space.minimaxi.com/;雖然考試已經結束,但是也能看到 MiniMax M2 處理 Excel 表格數據的能力,不容小覷

      最后給出的結果是非常的準確的,20714 個崗位,以及對于應屆生、基層工作年限、戶籍地等方面的條件,它都有統計到;相比市面上一些付費的選崗工具,自己用 Agent 自動生成一個,再方便不過。

      我們還讓它去做一些深度研究,丟給它關于 M2 自己的信息,讓它制作一個精美的 PPT。


      ▲預覽鏈接:https://z4czsdfoakc7.space.minimaxi.com/

      除了這種從零開始做一個產品的 vibe coding 體驗,MiniMax 還提供了詳細的教程,關于如何接入 Claude Code 等命令行工具,或開發平臺 Cursor、VS Code 等。


      ▲使用 MiniMax M2 模型 API 的 Claude Code

      交錯思考能讓模型更聰明,知道何時該調用何種工具。但 MiniMax M2 這次在技術上還有一個亮點,是它一反常態的使用了全注意力機制

      之前我們介紹過 DeepSeek 能把成本打到這么低,其中最重要的原因之一就是它采用了稀疏注意力,以及混合注意力機制。稀疏注意力能讓模型在處理 token 時,和我們人類一樣,有選擇的聚焦在重要信息,而忽略掉次要信息。

      配合其他的策略,就能在不影響輸出質量的前提下,提升模型的推理速度,降低成本。


      ▲ 博客原文:https://huggingface.co/blog/MiniMax-AI/why-did-m2-end-up-as-a-full-attention-model

      MiniMax 團隊也專門寫了一篇技術博客來介紹,為什么又走回了原點,繼續選擇全注意力機制,這種增加訓練和推理壓力的方式。

      他們提到主要的原因是「具體的表現」,現在大部分所說的稀疏注意力、或者高效注意力,并不是讓模型的效果更好,而是單純為了節省計算資源、降低成本。

      全注意力模型的性能,和可靠性仍然是更高,隨著上下文長度需求不斷增加,以及 GPU 計算增速放緩,到那時,線性和稀疏注意力的潛力,可能會逐漸顯現。

      而 MiniMax M2 目前要做的,是在有限的算力資源下,盡可能實現質量、速度、價格這個三角的平衡,這次它也確實做到了。


      所以說,在某種程度上,很多人覺得開源,就意味著把技術白白送給別人;但在整個的技術發展路線歷史上,開源是讓不同的技術碰撞,讓不同的研究員合作,從而取得進一步的技術創新。

      大模型分析平臺,Artificial Analysis 在發 X 介紹 MiniMax M2 的綜合榜單表現時,也提到了國產開源,他說。

      中國 AI 實驗室在開源領域持續保持領先地位。 MiniMax 的發布延續了中國 AI 在開源領域的領先地位,這一地位由 DeepSeek 在 2024 年底開啟,并由 DeepSeek 的后續發布、阿里巴巴、智譜、和 Kimi 等公司持續保持。


      確實是這樣,等了一年都沒等來的 DeepSeek R2,卻讓我們看到了在國外爆火的 Kimi K2,智譜 GLM 系列,還有幾乎所有開發者都離不開的 Qwen 系列。

      所有的這些國產開源模型,多元的技術路線、不同的應用方向,完全組合在一起,才有了真正的優勢和力量,讓閉源不再成為「好模型」的代表。


      ▲ Hugging Face 上,熱門榜單前四個,都是國產開源模型;圖片來源:https://huggingface.co/models?sort=trending

      閉源沒法卷贏閉源,只有開源,才能打穿壁壘

      前段時間,在小紅書的 1024 程序員節上,Hugging Face 創始人提到,開源和閉源差距在縮小,中國在這方面比較領先;小紅書的技術負責人也說,開源降低了社會運用 AI 的成本,動用大家的力量,推著技術往前走。

      毫無疑問,開源肯定是一件好事,只是沒有人想到,打敗閉源的,是來自我們的開源。


      DeepSeek 的出現,除了向全世界公開了全新的模型訓練邏輯,以更低的成本實現同等驚艷的效果;更多的是讓整個國產 AI 的運行模式,有了明確的方向。

      它讓所有人意識到,在當時全球 AI 話語權被美國壟斷的語境里,開源是讓自己被看見的唯一方式。


      ▲OpenAI 的萬億算力商業帝國,包括 Google、Meta、Anthropic 等

      當然,選擇開源,背后更具體的原因有很多,OpenAI、Anthropic、Gemini 每家都在閉門造車,他們可以靠著無上限的顯卡,訓練更大的模型,融資動輒千億美元。

      但國產模型面臨的困境是,算力緊張、芯片受限……如果不共享模型,就沒人能復用算力。沒有可以使用的基礎模型,就意味著一切都要從頭開始。百度一開始選擇了閉源,為了商業模式的運轉;在今年六月,他們也宣布正式開源了,文心大模型 4.5 系列模型。

      另一方面是國產模型廠商太多、競爭太激烈,他選擇不開源,就會有別人開源;而閉源,用戶就有可能選擇其他模型。


      ▲圖片來源:https://a16z.substack.com/p/charts-of-the-week-open-model-of

      a16z 前段時間統計了開源模型的數據,結果顯示,國產開源模型的累計下載量,不僅超過了美國模型,而且領先優勢還在不斷擴大。


      今年四月,斯坦福大學也發表了一份 2025 人工智能指數報告,里面統計了開源模型和閉源模型的性能對比,以及中美兩國模型的性能對比。這份報告的數據只截止到今年 2 月份,明年再看的時候,國產開源大概會順利超過閉源和美國。

      如果把國產開源的優勢拆到最小,我們會發現現在的領先,是因為一個完整、龐大的開源系統,這個系統的每一環都在讓國產開源的能力,越來越強大。


      ▲無論是社區對國產開源模型的評價,即 Elo 排名,還是在 ArtificialAnalysis 基準測試中,按地區劃分的性能對比,國產開源都在領先位置|圖片來源:https://www.atomproject.ai/

      DeepSeek 拿成本結構和高效推理打開了第一道縫;Qwen 憑借著生態規模把縫撕成了口;MiniMax、智譜和 Kimi 則用不同的技術路線,把這個口越撐越大。

      當全球的小團隊都用 Qwen 做微調、用 DeepSeek 做推理基座、用 MiniMax 做智能體驗證,國產開源從選擇變成了默認。結果就是,全球開源生態的中心,開始向中國傾斜。

      上個月,黃仁勛在人工智能峰會上接受采訪時表示,「中國將在人工智能競賽中獲勝。」盡管隨后他立刻通過英偉達官方賬號 X 發表聲明,收回了之前的言論,澄清說中國實際上「在人工智能競賽中,落后美國僅幾納秒。」


      其實這也不是黃仁勛第一次提到,中國在人工智能競賽的位置了。過去在多個公開場合,他都表示開源模型極其重要,無論是對開發者還是初創公司,甚至是所謂的 AI 競賽。

      今年 10 月的英偉達 GTC 大會上,黃仁勛的演講里再次提到,全球模型開源市場,來自中國的通義千問排名第一,并且占據了大部分的市場份額。


      ▲幾乎超過 60% 都是 Qwen

      今年 4 月,他還在華盛頓的科技大會上說,「毫無疑問,華為是世界上最強大的科技公司之一……中國在人工智能領域并不落后。我們非常非常接近……全球50%的人工智能研究人員是中國人。我們將不得不競爭。」

      但是在開源上的競爭,看美國的開源老大,來自 Meta 的 Llama,去年四月發布了 Llama 3,7 月 Llama 3.1,9 月 Llama 3.2,然后到了今年 4 月讓人大跌眼鏡的 Llama 4,甚至還有一個更高級的 Behemoth 版本至今沒發布。


      ▲四月份發布的 Llama 4,提到有 Behemoth、Maverick、Scout 三個版本,Behemoth 目前看來是被放棄了

      再后來,關于 Meta 的新聞就只有小扎開出天價薪酬到處挖人,然后最近又瘋狂裁員六百人,連圖靈獎得主 Yann LeCun 都不干了,要走人自己去創業。

      大概小扎根本沒想到,自己在硅谷選擇開源,可以說是一枝獨秀的存在,也會被今年 1 月爆火的 DeepSeek 偷了家。于是乎,Meta 現在開源也不是,閉源也難追趕,進退兩難。

      很難不認同,Llama 走到今天這步,有一半是國產開源的「功勞」。


      ▲Meta 相關的衍生模型,和 Mistral AI 早期領先優勢,完全被阿里巴巴的 Qwen 模型超越

      前幾天刷社交媒體,看到一個評論說,「開源就是把你的對手變成了你的兒子,沒有兒子會去打爸爸。」話糙理不糙,在 AI 的開源周期里,中國的代表性開源模型,明顯地變成了 AI 生態的底座。

      這場由國產開源引領的 AI 模型浪潮,正在改變誰能定義未來的 AI 這個問題。它會讓我們每個人,以更低的成本、更快的速度,用上全世界最頂尖、也最好用的 AI。

      最后這張圖的詳細情況如下。

      ▲從上到下依次為:
      前沿模型:DeepSeek、Qwen、Moonshot AI(Kimi)
      主要競爭對手 :智譜(Z.Ai)、MiniMax
      值得關注的公司 :StepFun 階躍星辰、InclusionAI / 螞蟻 Ling、美團龍貓、騰訊、IBM、英偉達、谷歌、Mistral
      專業領域 :OpenAI、Ai2、Moondream、Arcee、RedNote、HuggingFace、LiquidAI、微軟、小米、穆罕默德·本·扎耶德人工智能大學
      崛起中 :字節跳動 Seed、Apertus、OpenBMB、Motif、百度、Marin Community、InternLM、OpenGVLab、ServiceNow、Skywork
      榮譽提名 :TNG 集團、Meta、Cohere、北京人工智能研究院、多模態藝術投影、華為

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      迅猛龍直播掉美顏上熱搜:當百萬粉絲看到她素顏,反應絕了

      迅猛龍直播掉美顏上熱搜:當百萬粉絲看到她素顏,反應絕了

      手工制作阿殲
      2025-12-31 11:40:42
      從5連敗到5連勝!快船實現蛻變,激活萊昂納德,找到加強版祖巴茨

      從5連敗到5連勝!快船實現蛻變,激活萊昂納德,找到加強版祖巴茨

      球場沒跑道
      2025-12-31 15:29:31
      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      顧史
      2025-12-12 14:59:24
      非常罕見!28國不許解放軍軍演,臺軍總部發話,高市早苗膽怯沉默

      非常罕見!28國不許解放軍軍演,臺軍總部發話,高市早苗膽怯沉默

      時時有聊
      2025-12-31 10:30:12
      江蘇一賓館內,兩人當場被抓

      江蘇一賓館內,兩人當場被抓

      無錫eTV全媒體
      2025-12-31 05:54:49
      書記每次簽字都故意讓我空等3小時,我不急不躁,他晉升時卻后悔了

      書記每次簽字都故意讓我空等3小時,我不急不躁,他晉升時卻后悔了

      張道陵秘話
      2025-12-28 12:08:06
      美論壇直言:不管中國承不承認,中國其實已經輸掉了這場關稅戰?

      美論壇直言:不管中國承不承認,中國其實已經輸掉了這場關稅戰?

      素年文史
      2025-12-31 11:02:46
      臺灣問題難以解決!主要原因不是臺獨,而是島內的反共情緒

      臺灣問題難以解決!主要原因不是臺獨,而是島內的反共情緒

      史之銘
      2025-12-31 03:44:31
      建國后劉亞樓回憶平津戰役:毛主席要敵人怎樣行動,敵人就怎樣動

      建國后劉亞樓回憶平津戰役:毛主席要敵人怎樣行動,敵人就怎樣動

      大運河時空
      2025-12-30 15:55:03
      年終冠軍不是冠,但阿森納復仇維拉的意義真不一般

      年終冠軍不是冠,但阿森納復仇維拉的意義真不一般

      體壇周報
      2025-12-31 16:43:06
      明朝一男子將私房錢藏于木雕中,藏了600年,幾任收藏家都沒發現

      明朝一男子將私房錢藏于木雕中,藏了600年,幾任收藏家都沒發現

      銘記歷史呀
      2025-12-30 18:14:57
      誰懂!你永遠不知道你的顧客是干什么的,網友:在知識面前顫抖吧

      誰懂!你永遠不知道你的顧客是干什么的,網友:在知識面前顫抖吧

      夜深愛雜談
      2025-12-20 16:51:40
      外媒:“以臺制華”紙墻難阻歷史洪流

      外媒:“以臺制華”紙墻難阻歷史洪流

      參考消息
      2025-12-30 16:00:16
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      贏105分!快船成歷史第一,泰倫盧賽后分析透徹,哈登能進季后賽

      贏105分!快船成歷史第一,泰倫盧賽后分析透徹,哈登能進季后賽

      巴叔GO聊體育
      2025-12-31 16:16:07
      賴昌星發妻曾明娜現狀:逃亡10年后回國,守著3000平老宅安靜養老

      賴昌星發妻曾明娜現狀:逃亡10年后回國,守著3000平老宅安靜養老

      古書記史
      2025-12-12 11:21:38
      伊朗兌美元匯率暴跌至145萬!持續爆發大規模抗議

      伊朗兌美元匯率暴跌至145萬!持續爆發大規模抗議

      項鵬飛
      2025-12-30 19:36:00
      大雪暴雪!局地降溫15℃!元旦出行提醒,山東最新天氣來了......

      大雪暴雪!局地降溫15℃!元旦出行提醒,山東最新天氣來了......

      山東經濟廣播
      2025-12-30 18:12:35
      82歲的徐湖平栽了

      82歲的徐湖平栽了

      說故事的阿襲
      2025-12-31 09:15:32
      探花準絕殺76人加時險勝灰熊 費城三核93分莫蘭特40分賽季新高

      探花準絕殺76人加時險勝灰熊 費城三核93分莫蘭特40分賽季新高

      醉臥浮生
      2025-12-31 11:52:06
      2025-12-31 17:55:00
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38249文章數 2600501關注度
      往期回顧 全部

      科技要聞

      老羅,演砸了,也封神了?

      頭條要聞

      新車撞上花壇報保險發現兩公司都有保單 車店稱填錯了

      頭條要聞

      新車撞上花壇報保險發現兩公司都有保單 車店稱填錯了

      體育要聞

      2025全球射手榜:姆巴佩66球 梅西第6C羅第9

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      高培勇:分配制度改革是提振消費的抓手

      汽車要聞

      凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

      態度原創

      時尚
      健康
      親子
      房產
      本地

      今年冬天流行的“倒三角”穿法,時髦又高級!

      元旦舉家出行,注意防流感

      親子要聞

      科學守護遠視儲備:兒童近視防控的核心密碼

      房產要聞

      終于等來了!2026年首個買房大利好

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 韩城市| 天天色欲综合| 亚洲日韩欧美国产高清αv| 东丽区| 色秘?乱码一码二码三码熟女| 国产乱子伦精品免费女| 久热99re在线无码一区| 亚洲性爱AV| 国产乱理伦片在线观看| 狼友看片| 波多野结衣绝顶大高潮| 国产午夜亚洲精品不卡| 合集国产精品| 亚洲av永久无码精品水牛影视| 精品久久久久久国产| 五月婷女| 精品久久久久无码| 亚洲精品美女久久久久99| 久久无码一区| 亚洲第一福利网站在线观看 | 国精产品999国精产品官网| 超碰福利导航| 97精品人妻系列无码人妻| 妖精色av无码国产在线看| 无码专区成人| 五月婷婷久久中文字幕| 香蕉久久福利院| 亚洲国语无码| 成人av中文字幕在线播放| 国产精品高潮露脸在线观看| 国产欧美精品一区二区三区| 3P在线看| 国产女人被狂躁到高潮小说| 天堂在线中文| 武隆县| 999无码精品亚洲精品日韩人妻无码| 亚洲欧美不卡高清在线| gogogo高清免费观看| 国产精品夜间视频香蕉| 九九国产视频| 色色狠狠|