<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      在這個開源「從夯到拉」榜單,我終于明白中國 AI 為什么能逆襲

      0
      分享至

      最近幾天,一張開源模型的等級列表在 X 上被瘋狂轉載。


      圖片來源:https://www.interconnects.ai/p/2025-open-models-year-in-review

      從夯到拉, 國產開源模型排在了數一數二的位置,DeepSeek、Qwen、Kimi、智譜、還有 MiniMax 是全球開源模型的前五名

      而 OpenAI 排在了第四梯隊,小扎的 Meta,挖了硅谷半壁江山想打造的 Llama 更扎心,只落得了一個榮譽提名。

      這份榜單并不是國產模型花錢打廣告,也不是咱中國人王婆賣瓜,自賣自夸。知名的 AI 研究員 Nathan Lambert 和德國 AI 研究中心的博士生 Florian Brand,在 interconnectai 上的一篇文章,給出了全球開源模型的完整排名。


      Nathan Lambert 曾在 Meta、DeepMind、和 Hugging Face 工作

      文章里詳細回顧過去這一年,全球開源模型的發展,以 DeepSeek 和 Qwen 為主的國產開源模型,正在用開源改變整個 AI 行業的運行規則

      事實也如此,2024 年對于全球開源來說,可能還是 Llama 的天下。到了今年,國產開源以一種不可忽視的姿態,持續刷新著全球大模型的默認選項。

      性能、價格、生態、可用性……每個維度都在快速逼近閉源巨頭,甚至在某些方向已經實現了反超。


      上下滑動查看更多內容,全球 開源模型發布歷史,2024.01-2025.11,

      圖片來源:https://www.atomproject.ai/

      當我們還在想國產模型什么時候能追上 ChatGPT、Gemini 時,AI 的軍備競賽場上,另一個問題也開始沸騰起來,為什么全球開發者都在用國產開源模型?

      開源模型,前浪后浪一起上

      過去這幾個月,國產開源模型的更新節奏幾乎沒有停過。而且不只是某一家模型公司的爆發,是整個國產開源生態,持續接力,就像一條快速攀升的曲線,不斷在突破瓶頸。

      11 月,Kimi 發布了萬億參數的混合專家模型,Kimi K2 Thinking,直接拿下多個榜單第一名,甚至超過了 OpenAI 的 GPT-5 和 Anthropic 的 Claude 4.5。


      10 月底,MiniMax 正式發布了 MiniMax M2 混合專家模型 MoE,和 Kimi 一樣,繼續開源,在綜合榜單上的表現,MiniMax M2 排名第五,超過了 Gemini 2.5 Pro 和 Claude Opus 4.1。

      9 月,阿里在云棲大會上,一套模型七連發的組合拳,在視覺、語音、推理、編程等多個領域做到極致。

      海外社交媒體上,關于國產開源模型的認可,從橫空出世的 DeepSeek 以來就沒停過。「好用、便宜、小公司的開發首選、自己做的副業項目,用的就是中國開源模型……」,這些評論在 X 上隨處可見。

      像是網友們對 Kimi K2 Thinking 寫作風格,以及用 token 數量換思考深度的稱贊。


      還有網友說拿 Minimax M2 和 Claude Sonnet 4 對比,M2 只用一次就能生成一個功能齊全的網站,但是 Sonnet 4 會失敗。


      上下滑動查看更多內容

      關于 Qwen 的帖子就更多了,從 2.5 更新到現在的 3.0,從大尺寸的 4800 億參數,到只有 6 億參數的小模型,從視覺語言 Qwen 3 VL,到代碼編寫 Qwen 3 Coder,開源市場幾乎都有 Qwen 的影子在。


      愛彼迎 CEO 在接受采訪時,甚至大方的表示 OpenAI 雖然好,但是不適合我們;而來自中國的開源模型 Qwen 非常好,能實際地應用到他們的工作中,比 OpenAI 更好更便宜。

      在開源這塊,說國產開源模型還在追趕都不貼切,是已經實打實地成為了全球默認的開源選擇。

      MiniMax M2,能落地的開源智能體

      如果要用具體案例,來說明國產開源模型,到底好在哪里,過去我們分享的多個開源工具的實測體驗,其實就已經有了答案。

      發布時間最近的 Kimi K2 Thinking,一次性能執行 300 次工具調用的超長思考鏈條,還有為手機而生的通用 Agent,智譜 AutoGLM 2.0;以及 AI 時代的安卓,阿里通義模型大家族。


      Artificial Analysis 統計的 2025 Q1 國產前沿 AI 模型大廠和初創公司

      這些模型雖然都是開源,但是都有各自的技術亮點,努力讓國產開源模型這張地圖,變得更完整、更豐富。

      像 K2 Thinking 主打萬億參數大模型,然后還有自己的 KDA(Kimi Delta Attention)機制;DeepSeek 主打混合注意力,成本驟降;Minimax M2 在這次的更新里面,反而是一改常態,使用了完全注意力,模型參數也僅 2300 億。

      M2 好不好用,本著能體驗都上手試試的原則,我們也簡單測了一下。

      第一個任務是讓他處理 Excel 表格數據,我們把今年國考的崗位信息表格發給他,讓它根據表格內容,設計一個通用的公務員崗位篩選工具。


      表格的數據非常多,大小有 10MB,累計兩萬多個崗位。MiniMax M2 特別好的一點是,它會在正式執行任務前,詢問用戶,是否需要對任務進行調整。

      在他們的技術博客里面提到,M2 此次采用了「交錯思考」的技術,這項技術最早是在 Claude Sonnet 4 模型中開始應用,但具體的采用還很有限。

      MiniMax 給了一個小貼士,提醒用戶保留模型的思考記錄,即 think 標簽。M2 依賴于交錯式思維,上下文就是為記憶,保留了,才能更好的開展交錯式思考。


      上下滑動查看更多內容,MiniMax 工程主管發 X 解釋,交錯思考如何讓模型更好地完成智能體任務

      簡單來說,交錯思維(Interleaved Thinking)就是讓大模型在「動手做事(用工具/調用接口),停下來想一想再動手,然后接著再思考」,這樣的循環里推進任務,而不是先把一大段思路想完再一次性執行。

      最近更新的 Kimi K2 Thinking 同樣采用了交錯式思考的技術。邊思考邊調用的方式,能讓模型在每次拿到工具輸出后,立刻復盤、調整計劃,這特別適合流程長、結果不確定的智能體任務。


      體驗地址:https://2rfxtimus5nr.space.minimaxi.com/;雖然考試已經結束,但是也能看到 MiniMax M2 處理 Excel 表格數據的能力,不容小覷

      最后給出的結果是非常的準確的,20714 個崗位,以及對于應屆生、基層工作年限、戶籍地等方面的條件,它都有統計到;相比市面上一些付費的選崗工具,自己用 Agent 自動生成一個,再方便不過。

      我們還讓它去做一些深度研究,丟給它關于 M2 自己的信息,讓它制作一個精美的 PPT。


      預覽鏈接:https://z4czsdfoakc7.space.minimaxi.com/

      除了這種從零開始做一個產品的 vibe coding 體驗,MiniMax 還提供了詳細的教程,關于如何接入 Claude Code 等命令行工具,或開發平臺 Cursor、VS Code 等。


      使用 MiniMax M2 模型 API 的 Claude Code

      交錯思考能讓模型更聰明,知道何時該調用何種工具。但 MiniMax M2 這次在技術上還有一個亮點,是它一反常態的使用了全注意力機制

      之前我們介紹過 DeepSeek 能把成本打到這么低,其中最重要的原因之一就是它采用了稀疏注意力,以及混合注意力機制。稀疏注意力能讓模型在處理 token 時,和我們人類一樣,有選擇的聚焦在重要信息,而忽略掉次要信息。

      配合其他的策略,就能在不影響輸出質量的前提下,提升模型的推理速度,降低成本。


      上下滑動查看更多內容| 博客原文

      https://huggingface.co/blog/MiniMax-AI/why-did-m2-end-up-as-a-full-attention-model

      MiniMax 團隊也專門寫了一篇技術博客來介紹,為什么又走回了原點,繼續選擇全注意力機制,這種增加訓練和推理壓力的方式。

      他們提到主要的原因是「具體的表現」,現在大部分所說的稀疏注意力、或者高效注意力,并不是讓模型的效果更好,而是單純為了節省計算資源、降低成本。

      全注意力模型的性能,和可靠性仍然是更高,隨著上下文長度需求不斷增加,以及 GPU 計算增速放緩,到那時,線性和稀疏注意力的潛力,可能會逐漸顯現。

      而 MiniMax M2 目前要做的,是在有限的算力資源下,盡可能實現質量、速度、價格這個三角的平衡,這次它也確實做到了。


      上下滑動查看更多內容

      所以說,在某種程度上,很多人覺得開源,就意味著把技術白白送給別人;但在整個的技術發展路線歷史上,開源是讓不同的技術碰撞,讓不同的研究員合作,從而取得進一步的技術創新。

      大模型分析平臺,Artificial Analysis 在發 X 介紹 MiniMax M2 的綜合榜單表現時,也提到了國產開源,他說。

      中國 AI 實驗室在開源領域持續保持領先地位。
      MiniMax 的發布延續了中國 AI 在開源領域的領先地位,這一地位由 DeepSeek 在 2024 年底開啟,并由 DeepSeek 的后續發布、阿里巴巴、智譜、和 Kimi 等公司持續保持。


      確實是這樣,等了一年都沒等來的 DeepSeek R2,卻讓我們看到了在國外爆火的 Kimi K2,智譜 GLM 系列,還有幾乎所有開發者都離不開的 Qwen 系列。

      所有的這些國產開源模型,多元的技術路線、不同的應用方向,完全組合在一起,才有了真正的優勢和力量,讓閉源不再成為「好模型」的代表。


      Hugging Face 上,熱門榜單前四個,都是國產開源模型;圖片來源:https://huggingface.co/models?sort=trending

      閉源沒法卷贏閉源,只有開源,才能打穿壁壘

      前段時間,在小紅書的 1024 程序員節上,Hugging Face 創始人提到,開源和閉源差距在縮小,中國在這方面比較領先;小紅書的技術負責人也說,開源降低了社會運用 AI 的成本,動用大家的力量,推著技術往前走。

      毫無疑問,開源肯定是一件好事,只是沒有人想到,打敗閉源的,是來自我們的開源。


      DeepSeek 的出現,除了向全世界公開了全新的模型訓練邏輯,以更低的成本實現同等驚艷的效果;更多的是讓整個國產 AI 的運行模式,有了明確的方向。

      它讓所有人意識到,在當時全球 AI 話語權被美國壟斷的語境里,開源是讓自己被看見的唯一方式。


      OpenAI 的萬億算力商業帝國,包括 Google、Meta、Anthropic 等

      當然,選擇開源,背后更具體的原因有很多,OpenAI、Anthropic、Gemini 每家都在閉門造車,他們可以靠著無上限的顯卡,訓練更大的模型,融資動輒千億美元。

      但國產模型面臨的困境是,算力緊張、芯片受限……如果不共享模型,就沒人能復用算力。沒有可以使用的基礎模型,就意味著一切都要從頭開始。百度一開始選擇了閉源,為了商業模式的運轉;在今年六月,他們也宣布正式開源了,文心大模型 4.5 系列模型。

      另一方面是國產模型廠商太多、競爭太激烈,他選擇不開源,就會有別人開源;而閉源,用戶就有可能選擇其他模型。


      圖片來源:https://a16z.substack.com/p/charts-of-the-week-open-model-of

      a16z 前段時間統計了開源模型的數據,結果顯示,國產開源模型的累計下載量,不僅超過了美國模型,而且領先優勢還在不斷擴大。


      今年四月,斯坦福大學也發表了一份 2025 人工智能指數報告,里面統計了開源模型和閉源模型的性能對比,以及中美兩國模型的性能對比。這份報告的數據只截止到今年 2 月份,明年再看的時候,國產開源大概會順利超過閉源和美國。

      如果把國產開源的優勢拆到最小,我們會發現現在的領先,是因為一個完整、龐大的開源系統,這個系統的每一環都在讓國產開源的能力,越來越強大。


      無論是社區對國產開源模型的評價,即 Elo 排名,還是在 ArtificialAnalysis 基準測試中,按地區劃分的性能對比,國產開源都在領先位置|圖片來源:https://www.atomproject.ai/

      DeepSeek 拿成本結構和高效推理打開了第一道縫;Qwen 憑借著生態規模把縫撕成了口;MiniMax、智譜和 Kimi 則用不同的技術路線,把這個口越撐越大。

      當全球的小團隊都用 Qwen 做微調、用 DeepSeek 做推理基座、用 MiniMax 做智能體驗證,國產開源從選擇變成了默認。結果就是,全球開源生態的中心,開始向中國傾斜。

      上個月,黃仁勛在人工智能峰會上接受采訪時表示,「中國將在人工智能競賽中獲勝。」盡管隨后他立刻通過英偉達官方賬號 X 發表聲明,收回了之前的言論,澄清說中國實際上「在人工智能競賽中,落后美國僅幾納秒。」


      其實這也不是黃仁勛第一次提到,中國在人工智能競賽的位置了。過去在多個公開場合,他都表示開源模型極其重要,無論是對開發者還是初創公司,甚至是所謂的 AI 競賽。

      今年 10 月的英偉達 GTC 大會上,黃仁勛的演講里再次提到,全球模型開源市場,來自中國的通義千問排名第一,并且占據了大部分的市場份額。


      幾乎超過 60% 都是 Qwen

      今年 4 月,他還在華盛頓的科技大會上說,「毫無疑問,華為是世界上最強大的科技公司之一……中國在人工智能領域并不落后。我們非常非常接近……全球50%的人工智能研究人員是中國人。我們將不得不競爭。」

      但是在開源上的競爭,看美國的開源老大,來自 Meta 的 Llama,去年四月發布了 Llama 3,7 月 Llama 3.1,9 月 Llama 3.2,然后到了今年 4 月讓人大跌眼鏡的 Llama 4,甚至還有一個更高級的 Behemoth 版本至今沒發布。


      四月份發布的 Llama 4,提到有 Behemoth、Maverick、Scout 三個版本,Behemoth 目前看來是被放棄了

      再后來,關于 Meta 的新聞就只有小扎開出天價薪酬到處挖人,然后最近又瘋狂裁員六百人,連圖靈獎得主 Yann LeCun 都不干了,要走人自己去創業。

      大概小扎根本沒想到,自己在硅谷選擇開源,可以說是一枝獨秀的存在,也會被今年 1 月爆火的 DeepSeek 偷了家。于是乎,Meta 現在開源也不是,閉源也難追趕,進退兩難。

      很難不認同,Llama 走到今天這步,有一半是國產開源的「功勞」。


      Meta 相關的衍生模型,和 Mistral AI 早期領先優勢,完全被阿里巴巴的 Qwen 模型超越

      前幾天刷社交媒體,看到一個評論說,「開源就是把你的對手變成了你的兒子,沒有兒子會去打爸爸。」話糙理不糙,在 AI 的開源周期里,中國的代表性開源模型,明顯地變成了 AI 生態的底座。

      這場由國產開源引領的 AI 模型浪潮,正在改變誰能定義未來的 AI 這個問題。它會讓我們每個人,以更低的成本、更快的速度,用上全世界最頂尖、也最好用的 AI。

      最后這張圖的詳細情況如下。


      從上到下依次為:

      前沿模型:DeepSeek、Qwen、Moonshot AI(Kimi)

      主要競爭對手:智譜(Z.Ai)、MiniMax

      值得關注的公司:StepFun 階躍星辰、InclusionAI / 螞蟻 Ling、美團龍貓、騰訊、IBM、英偉達、谷歌、Mistral

      專業領域:OpenAI、Ai2、Moondream、Arcee、RedNote、HuggingFace、LiquidAI、微軟、小米、穆罕默德·本·扎耶德人工智能大學

      崛起中:字節跳動 Seed、Apertus、OpenBMB、Motif、百度、Marin Community、InternLM、OpenGVLab、ServiceNow、Skywork

      榮譽提名:TNG 集團、Meta、Cohere、北京人工智能研究院、多模態藝術投影、華為

      歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      大連一室內滑雪場突然閉店,消費者數十萬元預付款無處退費

      大連一室內滑雪場突然閉店,消費者數十萬元預付款無處退費

      半島晨報
      2025-12-24 20:17:55
      我被同事掛網上,說我提供的免費午餐是“豬食”,我直接發公司群

      我被同事掛網上,說我提供的免費午餐是“豬食”,我直接發公司群

      小秋情感說
      2025-12-24 14:43:57
      李湘前夫李厚霖被刑拘,被抓原因曝光,與秦海璐多個女星談過戀愛

      李湘前夫李厚霖被刑拘,被抓原因曝光,與秦海璐多個女星談過戀愛

      寒士之言本尊
      2025-12-22 13:22:18
      1977年李敏與姐姐楊月花相認,姐姐提要求,賀敏學嘆其性子像子珍

      1977年李敏與姐姐楊月花相認,姐姐提要求,賀敏學嘆其性子像子珍

      嘮叨說歷史
      2025-12-23 19:40:20
      網傳“熱力公司人員戴警徽記錄儀入戶測溫”,公司回應:為服務記錄儀

      網傳“熱力公司人員戴警徽記錄儀入戶測溫”,公司回應:為服務記錄儀

      界面新聞
      2025-12-24 08:49:04
      曼城計劃陣容大洗牌,4大邊緣人恐遭瓜帥清洗,一人成最難甩包袱

      曼城計劃陣容大洗牌,4大邊緣人恐遭瓜帥清洗,一人成最難甩包袱

      零度眼看球
      2025-12-24 08:43:49
      李蘭娟發現:經常吃紅薯的人,用不了多久,腸胃或有這5個變化

      李蘭娟發現:經常吃紅薯的人,用不了多久,腸胃或有這5個變化

      九哥聊軍事
      2025-11-30 18:49:01
      威廉凱特發布王室全家福,夏公主偎依父親肩膀,喬治王子戴手鏈

      威廉凱特發布王室全家福,夏公主偎依父親肩膀,喬治王子戴手鏈

      我是盲流
      2025-12-19 12:45:08
      拿600萬,全場19分鐘怒砍0分,成為浙江隊毒瘤,球迷:軟如面條

      拿600萬,全場19分鐘怒砍0分,成為浙江隊毒瘤,球迷:軟如面條

      南海浪花
      2025-12-24 08:02:01
      對華合約全部撕毀!中國又一伙伴背后捅刀,騙走20億倒向美國

      對華合約全部撕毀!中國又一伙伴背后捅刀,騙走20億倒向美國

      離離言幾許
      2025-12-20 19:56:40
      中央定調!延遲退休實施,70后多選擇,80后對表算,90后早規劃

      中央定調!延遲退休實施,70后多選擇,80后對表算,90后早規劃

      深析古今
      2025-12-24 13:15:50
      奇怪了!中國“三頭怪航母”沒導彈沒彈射,憑啥讓美軍坐立不安?

      奇怪了!中國“三頭怪航母”沒導彈沒彈射,憑啥讓美軍坐立不安?

      Hi秒懂科普
      2025-12-22 18:49:28
      入獄2年刑滿釋放!秦升:我不會8國語言 啥也不會 和老外各罵各的

      入獄2年刑滿釋放!秦升:我不會8國語言 啥也不會 和老外各罵各的

      念洲
      2025-12-24 10:58:46
      終于找到能“趕跑”血管斑塊的食物,每天吃一點,斑塊見了都繞道

      終于找到能“趕跑”血管斑塊的食物,每天吃一點,斑塊見了都繞道

      江江食研社
      2025-12-23 07:30:07
      火箭108-128快船!可怕的不是輸球,而是杜蘭特對哈登兩人的表態

      火箭108-128快船!可怕的不是輸球,而是杜蘭特對哈登兩人的表態

      魚崖大話籃球
      2025-12-24 16:30:44
      片約不斷,演啥毀啥,央視《老舅》這倆戲混子,趁早收手吧

      片約不斷,演啥毀啥,央視《老舅》這倆戲混子,趁早收手吧

      查爾菲的筆記
      2025-12-18 16:03:46
      在超市制止插隊,被黑人當眾毆打身亡,妻子目睹全程,結果兇手只判了5年?!

      在超市制止插隊,被黑人當眾毆打身亡,妻子目睹全程,結果兇手只判了5年?!

      新歐洲
      2025-12-23 20:57:43
      丘吉爾:日本如果不是被原子彈炸過,日本這個國家可能就沒有了

      丘吉爾:日本如果不是被原子彈炸過,日本這個國家可能就沒有了

      素年文史
      2025-12-23 12:23:47
      防守端被快船各種打爆!火箭鋒線新星可能才是真的被嚴重高估了?

      防守端被快船各種打爆!火箭鋒線新星可能才是真的被嚴重高估了?

      稻谷與小麥
      2025-12-24 20:04:18
      大廠集體漲工資,對樓市意味著什么

      大廠集體漲工資,對樓市意味著什么

      謝暉說房
      2025-12-24 19:30:08
      2025-12-24 21:36:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      5956文章數 26732關注度
      往期回顧 全部

      科技要聞

      智譜和MiniMax拿出了“血淋淋”的賬本

      頭條要聞

      韓國財閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

      頭條要聞

      韓國財閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

      體育要聞

      26歲廣西球王,在質疑聲中成為本土得分王

      娛樂要聞

      懷孕增重30斤!闞清子驚傳誕一女夭折?

      財經要聞

      北京進一步放松限購 滬深是否會跟進?

      汽車要聞

      “運動版庫里南”一月份亮相???或命名極氪9S

      態度原創

      教育
      家居
      旅游
      數碼
      公開課

      教育要聞

      “光盤到了國外成了可恥”,家長被新西蘭老師約談,原因令人不解

      家居要聞

      法式大平層 智能家居添彩

      旅游要聞

      北海市海絲首港將上演跨年煙花秀

      數碼要聞

      MAINGEAR推出BYO RAM模式:用戶自帶內存,規避漲價沖擊

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 盐津县| √天堂资源网最新版在线| 看黄a大片日本真人视频直播| 久久精品道一区二区三区| 亚洲乱码中文字幕小综合| 亚洲人妻一区二区精品| 探花av| 亚洲另类色综合网站| 国产av一区二区三区| 又粗又猛又黄又爽无遮挡| 最新日韩精品视频在线| 成人A在线播放| 国产97色在线| 少妇被躁爽到高潮无码文| 日韩肏屄| 男人天堂一区| 无码偷拍| 两性午夜刺激性视频| 国产免费无遮挡吸奶头视频| 92国产福利午夜757小视频| 国产极品精品自在线不卡| 老司机性色福利精品视频| 欧美另类高清videos的特点| 欧美成人动态图| 91性爱视频| 九九精品免费看| 撕开奶罩揉吮奶头视频| 成人性能视频在线| 色88久久久久高潮综合影院| 在线国产毛片| 久久婷婷大香萑太香蕉AV人| 夜夜夜影院| 亚洲国产综合日韩AV一波多野结衣| 欧美精品v国产精品v日韩精品| 肉色丝袜足j视频国产| 最爽free性欧美人妖| 欧美日韩亚洲国产| 日日网| 91在线观看免费高清| 东京热av无码一区二区| www.国产在线|