<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Kimi超過DeepSeek的新模型被指“套殼”Qwen?到底怎么回事兒

      0
      分享至


      作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

      昨天深夜,月之暗面發布了開源代碼模型Kimi-Dev-72B。這個模型在軟件工程任務基準測試SWE-bench Verified上取得了60.4%的成績,創下開源模型新紀錄,超越了包括DeepSeek在內的多個競爭對手。

      然而,當開發者們深入了解這個模型時,發現它明確標注了:Base model: Qwen/Qwen2.5-72B。這引發了一些人的疑問,Kimi-Dev的優異表現,究竟是創新還是“套殼”?


      Kimi-Dev-72B:基于Qwen打造的代碼專家

      Kimi-Dev-72B并非從零開始訓練的模型。根據月之暗面在Hugging Face上的說明,這個模型明確標注了Base model: Qwen/Qwen2.5-72B。在官方博客中也寫到:以 Qwen 2.5-72B 基礎模型為起點,我們收集了數百萬個 GitHub 問題單和 PR 提交作為中期訓練數據集。這意味著Kimi-Dev是基于阿里巴巴Qwen團隊的72B參數模型進行二次開發的。

      從技術角度看,Kimi-Dev的創新主要體現在訓練方法上。月之暗面采用了大規模強化學習技術,讓模型在Docker環境中自主修復真實代碼倉庫的問題,只有當完整測試套件通過時才能獲得獎勵。這種訓練方式確保了模型生成的代碼不僅正確,而且符合實際開發標準。

      在軟件工程任務基準測試上,Kimi-Dev-72B展現了出色的性能。它在SWE-bench Verified上取得了60.4%的成績,這是一個專門評估模型解決真實GitHub issues能力的基準測試。相比之下,前一名開源模型的成績僅為約50%左右,Kimi-Dev實現了顯著的提升。

      在許可證方面,Kimi-Dev-72B的LICENSE.md文件顯示其采用MIT協議發布。


      但同時,月之暗面也在文檔中明確說明:“Kimi-Dev-72B is built with Qwen-2.5-72B. Qwen-2.5-72B is licensed under the Qwen LICENSE AGREEMENT, Copyright (c) Alibaba Cloud. All Rights Reserved.Subject to the Qwen LICENSE AGREEMENT, Kimi-Dev-72B is under MIT license”。

      也就是說Kimi-Dev-72B需要遵守Qwen-2.5-72B的原始許可限制,同時將自己的創新工作(即通過強化學習獲得的微調權重)以MIT協議開源。這種做法在開源社區中被稱為“delta權重”發布,即只發布相對于基礎模型的增量部分。

      一個“歷史遺留”問題

      爭議的起源是社區對“月之暗面是否獲得了使用Qwen-2.5-72B的特殊許可”的質疑。根據Qwen的許可協議體系,雖然較小的模型采用Apache 2.0協議,但72B這個旗艦模型采用的是《通義千問許可協議》(Qwen LICENSE AGREEMENT)。

      這份協議規定,當產品的月活躍用戶(MAU)超過1億時,需要向阿里申請商業授權。考慮到Kimi作為熱門AI助手的用戶規模,可能將Kimi-Dev-72B引入其產品,這個限制條款引起了關注。

      面對社區詢問,Qwen團隊負責人林俊旸(Junyang Lin)在X平臺上的第一個回復簡短而直接:"no we did not give them the permission"(不,我們沒有給他們授權)。


      這個回復立即引發討論,然而,僅僅一個多小時后,林俊旸發布了第二條推文,改變了事件走向:“nvm this is our legacy issue. for qwen3, all are under apache 2.0 now.”(沒事了,這是我們的歷史遺留問題。對于qwen3,現在所有模型都采用apache 2.0協議了。)

      林俊旸的第二條推文揭示了問題的本質,這不是月之暗面的違規使用,而是Qwen團隊自身許可策略演進中的“歷史遺留問題”。

      具體來說,Qwen2.5系列采用了復雜的分級許可體系:大部分模型(包括 0.5?B、1.5?B、7?B、14?B、32?B、VL、Omni 等)采用Apache 2.0協議,屬于完全開源許可,而3B和72B模型采用的是《通義千問許可協議》,包含商業限制條款。

      這種分級許可策略在開源社區中并不罕見,目的是在推動技術普及的同時保護核心商業利益。但隨著時間推移,Qwen團隊可能意識到這種策略可能會阻礙生態發展。

      在2025年4月底發布的Qwen3系列中,所有模型都已經采用了更加開放的Apache 2.0協議。Apache 2.0是一種廣受歡迎的開源協議,它具有以下特點:

      商業友好:全球開發者、研究機構和企業均可免費下載并商用,無需額外申請授權。

      無限制使用:允許商業使用與二次開發,用戶可以修改代碼并以其他協議重新發布。

      社區驅動:通過降低使用門檻,促進更多開發者參與,推動技術的快速迭代和創新。

      通過全面轉向Apache 2.0,Qwen試圖正在構建一個更加開放和活躍的AI生態系統。

      在這種背景下,將Kimi-Dev基于“舊協議”模型的使用定性為“歷史遺留問題”,實際上是一種著眼未來,支持生態伙伴的創新的選擇。

      開源協作的新范式

      從技術角度看,這個案例反映了當前AI創業的現實。根據MosaicML的數據,訓練一個達到GPT-3質量的30B參數模型需要約45萬美元,而更大規模的模型如70B參數級別,成本會達到數百萬美元。對于希望從零開始訓練一個70B模型的機構來說,需要準備好數百萬美元的基礎預算,還需要配備頂尖的AI研究和工程團隊,并且要考慮到隨著技術發展,未來模型的訓練成本可能會進一步攀升。

      而月之暗面選擇Qwen-2.5-72B作為基座并非偶然。根據多項評測,Qwen2.5系列在代碼、數學、多語言等方面都達到了業界領先水平。站在這樣的基座模型上,月之暗面可以在類似這樣的研究項目中,將資源集中在自己的核心優勢——強化學習訓練方法上。

      NebulaGraph GenAI負責人Wey Gu對硅星人表示:“我認為他們(Kimi)的開放權重、透明地分享paper的工作對社區是非常有益處的”,他還指出,Kimi-Dev分發MIT協議的delta權重文件沒有問題,“不過模型的消費者是繞不過base model的Qwen license的”。

      值得注意的是,盡管Kimi-Dev在SWE-bench上取得了優異成績,但實際應用中仍有改進空間。有開發者測試發現,模型生成的代碼有時需要調試才能運行,對復雜需求的理解也不夠完整。這說明即使基于強大的基礎模型,要做出真正優秀的垂直應用仍需要大量創新。

      這場“套殼”爭議最終成為了一個行業發展的縮影。開源策略正在從限制性許可向完全開放轉變,這是贏得開發者生態的必然選擇。同時,基于優秀基礎模型的“二次創新”正在興起,關鍵是找到自己的差異化價值。大廠與創業公司不再是簡單的競爭關系,而是在開源生態中形成新的協作模式。

      隨著更多的開源模型采用Apache 2.0協議,類似的許可爭議將越來越少。而像Kimi-Dev這樣基于開源模型的專項優化案例,或許會越來越多,這正是開源AI生態繁榮發展的標志。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      深圳發布以舊換新方案:汽車、家電、數碼、智能產品均有補貼

      深圳發布以舊換新方案:汽車、家電、數碼、智能產品均有補貼

      南方都市報
      2026-02-28 16:38:04
      伊朗稱摧毀美軍戰略預警雷達,探測距離5000公里,系美軍戰略級裝備

      伊朗稱摧毀美軍戰略預警雷達,探測距離5000公里,系美軍戰略級裝備

      澎湃新聞
      2026-02-28 21:22:26
      張元英辱華升級!在港參加活動發言挑釁,相關代言被抵制連夜捂嘴

      張元英辱華升級!在港參加活動發言挑釁,相關代言被抵制連夜捂嘴

      瓜農娟姐
      2026-01-03 15:15:00
      250架戰機集結中國大西北!美媒驚呼:中國最大規模空戰演習來了

      250架戰機集結中國大西北!美媒驚呼:中國最大規模空戰演習來了

      壹知眠羊
      2026-02-28 09:37:22
      《鏢人》女演員長相排名,陳麗君墊底,李云霄第3,第1實至名歸

      《鏢人》女演員長相排名,陳麗君墊底,李云霄第3,第1實至名歸

      銀河史記
      2026-02-28 13:17:46
      踏俄之土,充俄之軍?俄羅斯要求18至65歲外國男性服兵役,到底意味著什么?

      踏俄之土,充俄之軍?俄羅斯要求18至65歲外國男性服兵役,到底意味著什么?

      靜夜史君
      2026-02-27 23:56:22
      去政府部門借廁所,被懟“我還把你當神敬嘞”

      去政府部門借廁所,被懟“我還把你當神敬嘞”

      中國新聞周刊
      2026-02-27 21:04:19
      美以動手了!明明伊朗已經慫到了家,為何還要打?原因其實很簡單

      美以動手了!明明伊朗已經慫到了家,為何還要打?原因其實很簡單

      剛哥說法365
      2026-02-28 18:42:47
      新華社快訊:以色列特拉維夫一建筑冒起濃煙

      新華社快訊:以色列特拉維夫一建筑冒起濃煙

      極目新聞
      2026-02-28 15:48:43
      春天,少吃蘋果多吃它,一次買20斤,曬干囤起來,從春天吃到夏天

      春天,少吃蘋果多吃它,一次買20斤,曬干囤起來,從春天吃到夏天

      阿龍美食記
      2026-02-26 19:13:38
      太憋屈!昔日王牌自曝曼聯噩夢:滕哈格毀了他的職業生涯

      太憋屈!昔日王牌自曝曼聯噩夢:滕哈格毀了他的職業生涯

      瀾歸序
      2026-02-28 04:57:16
      張洪福母親感謝恒大足校:樹高千尺不忘根,人行千里莫忘本

      張洪福母親感謝恒大足校:樹高千尺不忘根,人行千里莫忘本

      懂球帝
      2026-02-28 10:47:21
      特朗普怒了:拉入黑名單

      特朗普怒了:拉入黑名單

      環球時報國際
      2026-02-28 23:36:00
      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      室內設計師有料兒
      2026-02-19 11:17:18
      慘烈的仗,要打到2030年?

      慘烈的仗,要打到2030年?

      中國新聞周刊
      2026-02-26 22:44:14
      游客吐槽“杭州西湖景區停車費30元一小時”,官方回應:節假日差別化收費,倡導公交出行,日常收費10元一小時

      游客吐槽“杭州西湖景區停車費30元一小時”,官方回應:節假日差別化收費,倡導公交出行,日常收費10元一小時

      大象新聞
      2026-02-27 15:45:09
      81歲林豆豆現狀:已退休23年,獨居在北京老房子,用閱讀打發時間

      81歲林豆豆現狀:已退休23年,獨居在北京老房子,用閱讀打發時間

      攬星河的筆記
      2025-11-12 12:36:17
      俄媒突發警告:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰

      俄媒突發警告:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰

      剛哥說法365
      2026-02-28 21:07:26
      高市破防了,中國剛重拳出擊,日本喊話“無法容忍”,求中方收手

      高市破防了,中國剛重拳出擊,日本喊話“無法容忍”,求中方收手

      通文知史
      2026-02-28 00:00:04
      大消息!美的集團出手,“加倉”300048

      大消息!美的集團出手,“加倉”300048

      中國基金報
      2026-02-28 14:29:49
      2026-03-01 00:44:49
      硅星GenAI incentive-icons
      硅星GenAI
      比一部分人更先進入GenAl。
      243文章數 14關注度
      往期回顧 全部

      科技要聞

      狂攬1100億美元!OpenAI再創融資神話

      頭條要聞

      媒體:美以的真實目標已經擺上臺面 不達目的不罷休

      頭條要聞

      媒體:美以的真實目標已經擺上臺面 不達目的不罷休

      體育要聞

      球隊主力全報銷?頂風擺爛演都不演了

      娛樂要聞

      周杰倫兒子正面照曝光,與父親好像

      財經要聞

      沖突爆發 市場變天?

      汽車要聞

      嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

      態度原創

      健康
      本地
      藝術
      教育
      軍事航空

      轉頭就暈的耳石癥,能開車上班嗎?

      本地新聞

      津南好·四時總相宜

      藝術要聞

      驚艷!這位天使般的女子與油畫讓人心動不已!

      教育要聞

      “比預估高了20多分,激動得有點想哭!”今天有人歡呼,有人沉默,有人紅了眼眶,這一年都經歷了什么?

      軍事要聞

      美國以色列聯合襲擊伊朗 實時戰況

      無障礙瀏覽 進入關懷版