![]()
![]()
出品|搜狐科技
作者|鄭松毅
編輯| 楊 錦
近日,日本樂天集團(tuán)高調(diào)官宣“日本國內(nèi)最大規(guī)模、性能最強(qiáng)”的AI大模型——Rakuten AI 3.0,宣稱其搭載7000億參數(shù),是日本政府扶持下的“本土AI里程碑”,肩負(fù)著“擺脫海外技術(shù)依賴”的使命。
然而發(fā)布僅不到12小時(shí),該模型就被全球開源社區(qū)扒穿——被捧為“日本AI全村希望”的模型,內(nèi)核竟然照搬中國DeepSeek V3。所謂“自研”不過是換皮微調(diào),更涉嫌刻意虛假宣傳,一場鬧劇迅速演變?yōu)锳I圈年度最大丑聞。
![]()
12小時(shí)破防的“自研神話”
樂天對Rakuten AI 3.0的宣傳堪稱“鋪天蓋地”。官方介紹,該模型采用混合專家(MoE)架構(gòu),總參數(shù)量約7000億,在日語文化歷史知識(shí)、研究生級推理、競技數(shù)學(xué)等領(lǐng)域的測試成績遠(yuǎn)超GPT-4o等前沿模型,是“打破海外AI壟斷的重大成果”。
作為日本政府重點(diǎn)扶持對象,這款模型還獲得了特殊補(bǔ)貼,樂天首席AI官Ting Cai更是將其稱為“數(shù)據(jù)工程與創(chuàng)新架構(gòu)的規(guī)模化杰出結(jié)合”,一度被日本媒體奉為“國家隊(duì)希望之光”。
然而,光環(huán)的消退速度極快。
搜狐科技從官方上傳至Hugging Face開源平臺(tái)中的config.json配置文件發(fā)現(xiàn),文件中“architectures”字段寫著“DeepseekV3ForCausalLM”,“model_type”字段直接標(biāo)注“deepseek_v3”,毫無遮掩可言。
![]()
![]()
更致命的是,Rakuten AI 3.0的核心參數(shù)與DeepSeek V3完全重合:總參數(shù)量實(shí)為671B,樂天宣傳的“7000億”不過是四舍五入的噱頭,甚至MoE架構(gòu)的設(shè)計(jì)細(xì)節(jié)都分毫不差。
有開發(fā)者調(diào)侃:“這哪里是自研,分明是把DeepSeek V3的內(nèi)核拿過來,換了個(gè)日語皮膚就敢稱第一。”
![]()
開源不是放任抄襲
律師解讀如何合規(guī)使用
在AI行業(yè),基于開源模型進(jìn)行二次開發(fā)是常態(tài),DeepSeek V3采用的MIT/Apache 2.0開源協(xié)議,更是業(yè)內(nèi)最寬松的許可之一,僅要求使用者保留原創(chuàng)方版權(quán)聲明,即可自由商用、修改。
樂天的爭議,從來不是“使用開源模型”,而是“刻意隱瞞”的惡劣操作,徹底觸碰了開源倫理與商業(yè)誠信的底線。
也難怪有日本網(wǎng)友怒批:“我們繳納的稅金,不是用來讓企業(yè)做‘換皮游戲’的。”
更令人不齒的是,DeepSeek V3的開源協(xié)議明確要求使用者保留版權(quán)聲明與許可證文件,樂天卻在初始上傳模型時(shí)刻意刪除包含DeepSeek信息的MIT許可證文件,甚至偷偷將協(xié)議替換為自身的Apache 2.0版本,試圖徹底抹除中國技術(shù)的痕跡,直到被開源社區(qū)實(shí)錘后,才慌忙補(bǔ)傳NOTICE文件、補(bǔ)上DeepSeek的版權(quán)信息。
與此同時(shí),樂天在所有官方宣傳中全程未提及“DeepSeek”三字,僅用“融合開源社區(qū)精華”一筆帶過。
細(xì)心網(wǎng)友在模型實(shí)測中也發(fā)現(xiàn)端倪,這款“日本最強(qiáng)AI”在回答相關(guān)問題時(shí),輿論立場竟明顯偏向中國,坐實(shí)其“中國內(nèi)核”的身份。評論區(qū)有網(wǎng)友無奈調(diào)侃:“我們以為的本土之光,連立場都站不對。”
不少開發(fā)者表示:“開源的本質(zhì)是共享與透明,不是拿來欺世盜名。樂天刪除許可證的行為,比套殼更惡劣,破壞的是整個(gè)開源生態(tài)的信任。”
有AI行業(yè)分析師指出,此次事件側(cè)面印證了中國開源大模型的實(shí)力——DeepSeek V3能被日本巨頭直接采用,說明其架構(gòu)、性能已達(dá)到全球頂級水平,“中國一開源,日本就自研”的背后,是對中國AI技術(shù)的認(rèn)可。
開源中國董事長馬越也向搜狐科技直言,“這是好事,開源就不怕被抄,說明了國內(nèi)開源模型的實(shí)力。開源的目的就是要從競爭的角度去分那些閉源的市場,如果開源后沒人用,沒人抄,那開源有什么意義呢?”
不少人仍有疑問,該如何合規(guī)使用開源模型?
隆安律所全國合規(guī)委副主任陳煥向搜狐科技介紹,首先必須保留原始許可證文件,這是最基本的要求;其次,需要在產(chǎn)品文檔中詳細(xì)說明技術(shù)棧——包括基礎(chǔ)模型、微調(diào)數(shù)據(jù)、微調(diào)方法等信息;最后,建立企業(yè)內(nèi)部的開源合規(guī)審查流程,確保每一個(gè)基于開源模型開發(fā)的產(chǎn)品都經(jīng)過充分的合規(guī)檢查。
值得注意的是,樂天事件并非個(gè)例。據(jù)報(bào)道,日本企業(yè)開發(fā)的前十大AI模型中,有6個(gè)均以DeepSeek或中國通義千問為底座進(jìn)行二次開發(fā),只是其他企業(yè)均坦誠標(biāo)注了來源,而樂天選擇了隱瞞。
![]()
![]()
運(yùn)營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.