<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Kimi超過DeepSeek的新模型被指“套殼”Qwen?到底怎么回事兒

      0
      分享至


      作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

      昨天深夜,月之暗面發(fā)布了開源代碼模型Kimi-Dev-72B。這個(gè)模型在軟件工程任務(wù)基準(zhǔn)測試SWE-bench Verified上取得了60.4%的成績,創(chuàng)下開源模型新紀(jì)錄,超越了包括DeepSeek在內(nèi)的多個(gè)競爭對手。

      然而,當(dāng)開發(fā)者們深入了解這個(gè)模型時(shí),發(fā)現(xiàn)它明確標(biāo)注了:Base model: Qwen/Qwen2.5-72B。這引發(fā)了一些人的疑問,Kimi-Dev的優(yōu)異表現(xiàn),究竟是創(chuàng)新還是“套殼”?


      Kimi-Dev-72B:基于Qwen打造的代碼專家

      Kimi-Dev-72B并非從零開始訓(xùn)練的模型。根據(jù)月之暗面在Hugging Face上的說明,這個(gè)模型明確標(biāo)注了Base model: Qwen/Qwen2.5-72B。在官方博客中也寫到:以 Qwen 2.5-72B 基礎(chǔ)模型為起點(diǎn),我們收集了數(shù)百萬個(gè) GitHub 問題單和 PR 提交作為中期訓(xùn)練數(shù)據(jù)集。這意味著Kimi-Dev是基于阿里巴巴Qwen團(tuán)隊(duì)的72B參數(shù)模型進(jìn)行二次開發(fā)的。

      從技術(shù)角度看,Kimi-Dev的創(chuàng)新主要體現(xiàn)在訓(xùn)練方法上。月之暗面采用了大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),讓模型在Docker環(huán)境中自主修復(fù)真實(shí)代碼倉庫的問題,只有當(dāng)完整測試套件通過時(shí)才能獲得獎(jiǎng)勵(lì)。這種訓(xùn)練方式確保了模型生成的代碼不僅正確,而且符合實(shí)際開發(fā)標(biāo)準(zhǔn)。

      在軟件工程任務(wù)基準(zhǔn)測試上,Kimi-Dev-72B展現(xiàn)了出色的性能。它在SWE-bench Verified上取得了60.4%的成績,這是一個(gè)專門評估模型解決真實(shí)GitHub issues能力的基準(zhǔn)測試。相比之下,前一名開源模型的成績僅為約50%左右,Kimi-Dev實(shí)現(xiàn)了顯著的提升。

      在許可證方面,Kimi-Dev-72B的LICENSE.md文件顯示其采用MIT協(xié)議發(fā)布。


      但同時(shí),月之暗面也在文檔中明確說明:“Kimi-Dev-72B is built with Qwen-2.5-72B. Qwen-2.5-72B is licensed under the Qwen LICENSE AGREEMENT, Copyright (c) Alibaba Cloud. All Rights Reserved.Subject to the Qwen LICENSE AGREEMENT, Kimi-Dev-72B is under MIT license”。

      也就是說Kimi-Dev-72B需要遵守Qwen-2.5-72B的原始許可限制,同時(shí)將自己的創(chuàng)新工作(即通過強(qiáng)化學(xué)習(xí)獲得的微調(diào)權(quán)重)以MIT協(xié)議開源。這種做法在開源社區(qū)中被稱為“delta權(quán)重”發(fā)布,即只發(fā)布相對于基礎(chǔ)模型的增量部分。

      一個(gè)“歷史遺留”問題

      爭議的起源是社區(qū)對“月之暗面是否獲得了使用Qwen-2.5-72B的特殊許可”的質(zhì)疑。根據(jù)Qwen的許可協(xié)議體系,雖然較小的模型采用Apache 2.0協(xié)議,但72B這個(gè)旗艦?zāi)P筒捎玫氖恰锻x千問許可協(xié)議》(Qwen LICENSE AGREEMENT)。

      這份協(xié)議規(guī)定,當(dāng)產(chǎn)品的月活躍用戶(MAU)超過1億時(shí),需要向阿里申請商業(yè)授權(quán)。考慮到Kimi作為熱門AI助手的用戶規(guī)模,可能將Kimi-Dev-72B引入其產(chǎn)品,這個(gè)限制條款引起了關(guān)注。

      面對社區(qū)詢問,Qwen團(tuán)隊(duì)負(fù)責(zé)人林俊旸(Junyang Lin)在X平臺上的第一個(gè)回復(fù)簡短而直接:"no we did not give them the permission"(不,我們沒有給他們授權(quán))。


      這個(gè)回復(fù)立即引發(fā)討論,然而,僅僅一個(gè)多小時(shí)后,林俊旸發(fā)布了第二條推文,改變了事件走向:“nvm this is our legacy issue. for qwen3, all are under apache 2.0 now.”(沒事了,這是我們的歷史遺留問題。對于qwen3,現(xiàn)在所有模型都采用apache 2.0協(xié)議了。)

      林俊旸的第二條推文揭示了問題的本質(zhì),這不是月之暗面的違規(guī)使用,而是Qwen團(tuán)隊(duì)自身許可策略演進(jìn)中的“歷史遺留問題”。

      具體來說,Qwen2.5系列采用了復(fù)雜的分級許可體系:大部分模型(包括 0.5?B、1.5?B、7?B、14?B、32?B、VL、Omni 等)采用Apache 2.0協(xié)議,屬于完全開源許可,而3B和72B模型采用的是《通義千問許可協(xié)議》,包含商業(yè)限制條款。

      這種分級許可策略在開源社區(qū)中并不罕見,目的是在推動技術(shù)普及的同時(shí)保護(hù)核心商業(yè)利益。但隨著時(shí)間推移,Qwen團(tuán)隊(duì)可能意識到這種策略可能會阻礙生態(tài)發(fā)展。

      在2025年4月底發(fā)布的Qwen3系列中,所有模型都已經(jīng)采用了更加開放的Apache 2.0協(xié)議。Apache 2.0是一種廣受歡迎的開源協(xié)議,它具有以下特點(diǎn):

      商業(yè)友好:全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)下載并商用,無需額外申請授權(quán)。

      無限制使用:允許商業(yè)使用與二次開發(fā),用戶可以修改代碼并以其他協(xié)議重新發(fā)布。

      社區(qū)驅(qū)動:通過降低使用門檻,促進(jìn)更多開發(fā)者參與,推動技術(shù)的快速迭代和創(chuàng)新。

      通過全面轉(zhuǎn)向Apache 2.0,Qwen試圖正在構(gòu)建一個(gè)更加開放和活躍的AI生態(tài)系統(tǒng)。

      在這種背景下,將Kimi-Dev基于“舊協(xié)議”模型的使用定性為“歷史遺留問題”,實(shí)際上是一種著眼未來,支持生態(tài)伙伴的創(chuàng)新的選擇。

      開源協(xié)作的新范式

      從技術(shù)角度看,這個(gè)案例反映了當(dāng)前AI創(chuàng)業(yè)的現(xiàn)實(shí)。根據(jù)MosaicML的數(shù)據(jù),訓(xùn)練一個(gè)達(dá)到GPT-3質(zhì)量的30B參數(shù)模型需要約45萬美元,而更大規(guī)模的模型如70B參數(shù)級別,成本會達(dá)到數(shù)百萬美元。對于希望從零開始訓(xùn)練一個(gè)70B模型的機(jī)構(gòu)來說,需要準(zhǔn)備好數(shù)百萬美元的基礎(chǔ)預(yù)算,還需要配備頂尖的AI研究和工程團(tuán)隊(duì),并且要考慮到隨著技術(shù)發(fā)展,未來模型的訓(xùn)練成本可能會進(jìn)一步攀升。

      而月之暗面選擇Qwen-2.5-72B作為基座并非偶然。根據(jù)多項(xiàng)評測,Qwen2.5系列在代碼、數(shù)學(xué)、多語言等方面都達(dá)到了業(yè)界領(lǐng)先水平。站在這樣的基座模型上,月之暗面可以在類似這樣的研究項(xiàng)目中,將資源集中在自己的核心優(yōu)勢——強(qiáng)化學(xué)習(xí)訓(xùn)練方法上。

      NebulaGraph GenAI負(fù)責(zé)人Wey Gu對硅星人表示:“我認(rèn)為他們(Kimi)的開放權(quán)重、透明地分享paper的工作對社區(qū)是非常有益處的”,他還指出,Kimi-Dev分發(fā)MIT協(xié)議的delta權(quán)重文件沒有問題,“不過模型的消費(fèi)者是繞不過base model的Qwen license的”。

      值得注意的是,盡管Kimi-Dev在SWE-bench上取得了優(yōu)異成績,但實(shí)際應(yīng)用中仍有改進(jìn)空間。有開發(fā)者測試發(fā)現(xiàn),模型生成的代碼有時(shí)需要調(diào)試才能運(yùn)行,對復(fù)雜需求的理解也不夠完整。這說明即使基于強(qiáng)大的基礎(chǔ)模型,要做出真正優(yōu)秀的垂直應(yīng)用仍需要大量創(chuàng)新。

      這場“套殼”爭議最終成為了一個(gè)行業(yè)發(fā)展的縮影。開源策略正在從限制性許可向完全開放轉(zhuǎn)變,這是贏得開發(fā)者生態(tài)的必然選擇。同時(shí),基于優(yōu)秀基礎(chǔ)模型的“二次創(chuàng)新”正在興起,關(guān)鍵是找到自己的差異化價(jià)值。大廠與創(chuàng)業(yè)公司不再是簡單的競爭關(guān)系,而是在開源生態(tài)中形成新的協(xié)作模式。

      隨著更多的開源模型采用Apache 2.0協(xié)議,類似的許可爭議將越來越少。而像Kimi-Dev這樣基于開源模型的專項(xiàng)優(yōu)化案例,或許會越來越多,這正是開源AI生態(tài)繁榮發(fā)展的標(biāo)志。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      收拾完伊朗,下一個(gè)輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個(gè)字

      收拾完伊朗,下一個(gè)輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個(gè)字

      千羽解讀
      2026-04-18 10:12:15
      80年失蹤已久的彭加木“現(xiàn)身”美國,中央嚴(yán)令:無論如何要找到他

      80年失蹤已久的彭加木“現(xiàn)身”美國,中央嚴(yán)令:無論如何要找到他

      春秋硯
      2026-04-18 15:30:08
      斯諾克世錦賽:中國雙星不敗!趙心童創(chuàng)紀(jì)錄,張安達(dá)2-2暫平名將

      斯諾克世錦賽:中國雙星不敗!趙心童創(chuàng)紀(jì)錄,張安達(dá)2-2暫平名將

      劉姚堯的文字城堡
      2026-04-18 19:12:24
      斯諾克大冷門?12冠王或翻車,張安達(dá)上半場不敗,趙心童4-2到4-4

      斯諾克大冷門?12冠王或翻車,張安達(dá)上半場不敗,趙心童4-2到4-4

      劉姚堯的文字城堡
      2026-04-18 20:38:42
      “魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

      “魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

      胖胖說他不胖
      2026-04-18 09:00:31
      梁文鋒,扛不住了

      梁文鋒,扛不住了

      邱處機(jī)
      2026-04-18 16:03:02
      雷軍宣布:小米車主安全行駛里程達(dá)十萬公里,可獲贈實(shí)體限量徽章、精美虛擬勛章,一鍵生成專屬行車故事

      雷軍宣布:小米車主安全行駛里程達(dá)十萬公里,可獲贈實(shí)體限量徽章、精美虛擬勛章,一鍵生成專屬行車故事

      魯中晨報(bào)
      2026-04-18 16:20:17
      秦嵐首度公開父母過世,一個(gè)人辦追悼會不哭,和魏大勛不婚不育

      秦嵐首度公開父母過世,一個(gè)人辦追悼會不哭,和魏大勛不婚不育

      椰黃娛樂
      2026-04-18 13:41:46
      全部遇難!印尼發(fā)生墜機(jī)事故

      全部遇難!印尼發(fā)生墜機(jī)事故

      魯中晨報(bào)
      2026-04-18 09:56:04
      正式離開,告別德甲首季,扣除掉上繳乒協(xié),樊振東薪水還剩多少?

      正式離開,告別德甲首季,扣除掉上繳乒協(xié),樊振東薪水還剩多少?

      林子說事
      2026-04-18 15:43:32
      新中國對外輸出革命史:上萬知青奔赴緬甸,結(jié)局如何?

      新中國對外輸出革命史:上萬知青奔赴緬甸,結(jié)局如何?

      談史論天地
      2026-04-18 14:30:03
      日本已具備制造核武器的幾乎所有物質(zhì)和技術(shù)條件:已囤積約44.4噸分離钚,足夠制造約5500枚核彈頭,同時(shí)還有核武器的投射工具

      日本已具備制造核武器的幾乎所有物質(zhì)和技術(shù)條件:已囤積約44.4噸分離钚,足夠制造約5500枚核彈頭,同時(shí)還有核武器的投射工具

      魯中晨報(bào)
      2026-04-18 16:40:15
      一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀(jì)檢這道關(guān)

      一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀(jì)檢這道關(guān)

      周哥一影視
      2026-04-17 19:29:59
      難以置信!飛上海航班幾乎全是“金銀卡”打工人,網(wǎng)友吐槽引熱議

      難以置信!飛上海航班幾乎全是“金銀卡”打工人,網(wǎng)友吐槽引熱議

      火山詩話
      2026-04-17 14:56:51
      六小齡童回應(yīng) “煩死了” 表情包,稱這是當(dāng)年拍戲時(shí)導(dǎo)演抓拍到的真實(shí)狀態(tài),意外成了全網(wǎng)爆款表情

      六小齡童回應(yīng) “煩死了” 表情包,稱這是當(dāng)年拍戲時(shí)導(dǎo)演抓拍到的真實(shí)狀態(tài),意外成了全網(wǎng)爆款表情

      魯中晨報(bào)
      2026-04-18 17:20:04
      “不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

      “不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

      新華社
      2026-04-16 20:38:52
      只差0.071 秒!張雪機(jī)車WSBK荷蘭站憾失超級桿位賽榜首 張雪回應(yīng)53號車手末圈發(fā)力原因

      只差0.071 秒!張雪機(jī)車WSBK荷蘭站憾失超級桿位賽榜首 張雪回應(yīng)53號車手末圈發(fā)力原因

      快科技
      2026-04-18 17:59:16
      特朗普又定下最后期限

      特朗普又定下最后期限

      大象新聞
      2026-04-18 15:55:19
      連休8天!浙江最新放假通知

      連休8天!浙江最新放假通知

      新浪財(cái)經(jīng)
      2026-04-18 13:06:36
      4.8萬紫檀珠直播被砍暈!彈幕比妖怪還犀利?遲重瑞憋不住了

      4.8萬紫檀珠直播被砍暈!彈幕比妖怪還犀利?遲重瑞憋不住了

      鑒史錄
      2026-04-18 17:55:00
      2026-04-18 21:27:00
      硅星GenAI incentive-icons
      硅星GenAI
      比一部分人更先進(jìn)入GenAl。
      270文章數(shù) 36關(guān)注度
      往期回顧 全部

      科技要聞

      傳Meta下月擬裁8000 大舉清退人力為AI騰位

      頭條要聞

      女子經(jīng)介紹加入平臺搶紅包結(jié)果40萬沒了 報(bào)警未獲受理

      頭條要聞

      女子經(jīng)介紹加入平臺搶紅包結(jié)果40萬沒了 報(bào)警未獲受理

      體育要聞

      時(shí)隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      《穿普拉達(dá)的女王2》疑似辱華?

      財(cái)經(jīng)要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬元起

      態(tài)度原創(chuàng)

      時(shí)尚
      旅游
      數(shù)碼
      本地
      軍事航空

      選對發(fā)型,真的能少走很多變美彎路

      旅游要聞

      @你的旅行搭子 一起來山東當(dāng)“寶藏獵人”

      數(shù)碼要聞

      REDMI Buds 8官宣:升級立式耳機(jī)盒 電量一眼識別

      本地新聞

      12噸巧克力有難,全網(wǎng)化身超級偵探添亂

      軍事要聞

      解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

      無障礙瀏覽 進(jìn)入關(guān)懷版