![]()
智東西
作者 陳駿達(dá)
編輯 云鵬
Anthropic又跟中國(guó)同行們杠上了?
智東西2月24日?qǐng)?bào)道,今天,美國(guó)大模型獨(dú)角獸Anthropic連續(xù)發(fā)布多則推文、博客,指控DeepSeek、月之暗面和MiniMax三家中國(guó)AI實(shí)驗(yàn)室,正對(duì)Claude進(jìn)行“工業(yè)級(jí)規(guī)模的蒸餾攻擊”。
Anthropic聲稱,上述三家公司通過約24000個(gè)虛假賬戶,與Claude進(jìn)行超過1600萬次交互,系統(tǒng)性提取其在推理、工具調(diào)用與編程等方面的核心能力,用于訓(xùn)練和改進(jìn)自身模型。
![]()
▲Anthropic的推文(圖源:X平臺(tái))
不過,Anthropic的指控一經(jīng)發(fā)布,就遭到了一邊倒的質(zhì)疑。有人認(rèn)為Anthropic自身的數(shù)據(jù)來源就已經(jīng)存疑,沒有立場(chǎng)質(zhì)疑他人,也有人認(rèn)為,若相關(guān)中國(guó)公司確實(shí)通過API和賬戶付費(fèi)調(diào)用模型接口,那么其行為至少在形式上屬于“合理使用產(chǎn)品”。換言之,蒸餾違法與否應(yīng)當(dāng)由法律界定,而非試圖用輿論先行定性。
![]()
▲網(wǎng)友一邊倒質(zhì)疑Anthropic(圖源:X平臺(tái))
不少AI圈人士下場(chǎng)批評(píng)Anthropic,吐槽了Anthropic”只許州官放火,不許百姓點(diǎn)燈”的雙標(biāo)行為。馬斯克第一時(shí)間反諷道:“絕了,他們(DeepSeek們)怎么敢偷A(chǔ)nthropic從人類程序員那里‘偷’來的東西?”
![]()
▲馬斯克的推文(圖源:X平臺(tái))
馬斯克進(jìn)一步補(bǔ)充道:“Anthropic已經(jīng)犯有大規(guī)模竊取訓(xùn)練數(shù)據(jù)的罪行,他們必須為其盜竊行為支付數(shù)十億美元的賠償金。這就是事實(shí)。”
![]()
▲馬斯克的推文(圖源:X平臺(tái))
知名AI評(píng)論家Garry Marcus認(rèn)為,Anthropic的行為是“肆無忌憚的盜賊抱怨自己被搶劫了”。
![]()
▲Garry Marcus吐槽Anthropic(圖源:X平臺(tái))
還有網(wǎng)友銳評(píng)道:“Anthropic不也是爬取了整個(gè)互聯(lián)網(wǎng)的數(shù)據(jù),并打破了無數(shù)的服務(wù)條款嗎?”
![]()
▲網(wǎng)友吐槽Anthropic(圖源:X平臺(tái))
有人則質(zhì)疑起了Anthropic的動(dòng)機(jī)。下圖中的這位網(wǎng)友分析道,許多AI模型都是使用競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)構(gòu)建的,這在業(yè)內(nèi)是一個(gè)公開的秘密。而Anthropic在此時(shí)采用了一個(gè)非常民族主義的立場(chǎng),把這些行為貼標(biāo)簽,稱之為“外國(guó)實(shí)驗(yàn)室”的“攻擊”,意圖可能是推動(dòng)美國(guó)政府對(duì)跨境AI數(shù)據(jù)訪問和共享,進(jìn)行更嚴(yán)格的監(jiān)管措施。
![]()
▲網(wǎng)友質(zhì)疑Anthropic動(dòng)機(jī)(圖源:X平臺(tái))
由于Anthropic的模型是閉源的,而三家中國(guó)AI公司的模型基本是開源的,因此甚至有網(wǎng)友認(rèn)為,就算蒸餾行為的確存在,他們也支持這種行為,因?yàn)闃I(yè)界需要更強(qiáng)的Deepseek V4, Kimi K3和Minimax M3,沒有用戶會(huì)為Anthropic哭泣。
![]()
值得注意的是,Anthropic提出相關(guān)指控的時(shí)機(jī),正值美國(guó)討論放松對(duì)華AI芯片出口和中國(guó)模型在海外熱度攀升之際。MiniMax M2.5和Kimi K2.5近期都一度成為大模型調(diào)用平臺(tái)OpenRouter上使用量最大的模型,并在海外開發(fā)者群體中獲得了高性價(jià)比、能力出色的良好口碑,而DeepSeek尚未發(fā)布的V4,則吊足了全球網(wǎng)友的胃口。
![]()
▲OpenRouter周榜中,中國(guó)模型占據(jù)了調(diào)用量前五名中的四席(圖源:OpenRouter)
Anthropic在博客中強(qiáng)調(diào),DeepSeek、MiniMax和月之暗面的蒸餾規(guī)模“需要先進(jìn)芯片支持”,并進(jìn)一步提出蒸餾攻擊“強(qiáng)化了出口管制的合理性”,限制芯片獲取不僅能限制直接模型訓(xùn)練,也能限制所謂“非法蒸餾”的規(guī)模。這一言論與Anthropic歷來在對(duì)華議題上偏鷹派的立場(chǎng)一致。
一、Anthropic曝光所謂“蒸餾攻擊”,生成已加強(qiáng)檢測(cè)與防御機(jī)制
在博客中,Anthropic坦言,蒸餾本身是一種廣泛應(yīng)用且合法的技術(shù),許多前沿實(shí)驗(yàn)室都會(huì)用更強(qiáng)大的模型訓(xùn)練體量更小、成本更低的模型版本。
但這項(xiàng)技術(shù)也可以被用于爭(zhēng)議性用途:競(jìng)爭(zhēng)對(duì)手可以用它在更短的時(shí)間和成本下,從其他AI實(shí)驗(yàn)室獲得強(qiáng)大的能力,這遠(yuǎn)低于獨(dú)立開發(fā)所需的能力。
Anthropic認(rèn)為,“非法蒸餾”得到的模型往往不會(huì)繼承原模型內(nèi)置的安全防護(hù)機(jī)制,這意味著原本被限制用于生物武器開發(fā)、惡意網(wǎng)絡(luò)攻擊或其他高風(fēng)險(xiǎn)用途的能力,可能在缺乏約束的情況下擴(kuò)散,從而帶來安全風(fēng)險(xiǎn)。
Anthropic詳細(xì)描述了他們眼中DeepSeek、MiniMax和月之暗面的所謂“蒸餾攻擊”行為。
這三家中國(guó)公司用Claude批量生成推理鏈、工具調(diào)用、編程與數(shù)據(jù)分析等訓(xùn)練數(shù)據(jù),或是讓Claude成為強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型。為獲取這些數(shù)據(jù),DeepSeek進(jìn)行了大約15萬次交互、月之暗面進(jìn)行了超過340萬次交互,而MiniMax進(jìn)行了超過1300萬次交互。
![]()
▲Anthropic博客中關(guān)于三家中國(guó)AI企業(yè)使用方式的描述(圖源:Anthropic官網(wǎng))
三家AI實(shí)驗(yàn)室的操作模式具有相似特征:使用所謂“欺詐賬戶”,繞過區(qū)域限制,同時(shí)規(guī)避偵測(cè)。提示詞的數(shù)量、結(jié)構(gòu)和重點(diǎn)與正常使用模式不同,更像是在有意地提取模型能力而非合法使用。
針對(duì)這些現(xiàn)象,Anthropic稱已加強(qiáng)檢測(cè)與防御機(jī)制,包括建立流量模式識(shí)別與行為指紋系統(tǒng)、識(shí)別思維鏈數(shù)據(jù)提取行為、加強(qiáng)賬戶驗(yàn)證流程,并與其他AI公司、云服務(wù)商及相關(guān)機(jī)構(gòu)共享技術(shù)情報(bào)。
同時(shí),Anthropic也在開發(fā)產(chǎn)品與模型層面的反蒸餾技術(shù),在不影響正常用戶體驗(yàn)的前提下,降低模型輸出被用于非法訓(xùn)練的價(jià)值。
該公司還將蒸餾攻擊與出口管制聯(lián)系起來。Anthropic稱,美國(guó)對(duì)先進(jìn)AI芯片與相關(guān)技術(shù)實(shí)施出口管制,旨在維持技術(shù)領(lǐng)先優(yōu)勢(shì),但大規(guī)模蒸餾可能在一定程度上削弱這一優(yōu)勢(shì),使部分實(shí)驗(yàn)室能夠通過“提取能力”而非自主研發(fā)來縮小差距。
二、Anthropic一家之言遭圍攻,立場(chǎng)到數(shù)據(jù)隱私皆被質(zhì)疑
不過,需要強(qiáng)調(diào)的是,上述言論目前只是Anthropic的一家之言。模型蒸餾通常指的是有意調(diào)用某個(gè)教師模型,大規(guī)模獲取其輸出,并用來系統(tǒng)性訓(xùn)練另一個(gè)模型,以逼近其能力。
Anthropic目前披露的信息中,并沒有中國(guó)公司實(shí)施上述行為的直接證據(jù)或原始數(shù)據(jù)支持。
在上述背景之下,圍繞相關(guān)指控的真實(shí)性、法律邊界以及企業(yè)動(dòng)機(jī)的討論迅速升溫。輿論場(chǎng)幾乎呈現(xiàn)出一邊倒的態(tài)勢(shì),大部分網(wǎng)友對(duì)Anthropic的言論并不買賬。
首先,Anthropic選擇在X平臺(tái)發(fā)文,而非訴諸法律,這在不少網(wǎng)友眼中就有些可疑。
這位網(wǎng)友便認(rèn)為,與其利用公司影響力來聲稱個(gè)別訂戶“濫用”服務(wù)并威脅美國(guó)的創(chuàng)意成果,Anthropic更應(yīng)該做的是將自己的法律和安全資源轉(zhuǎn)向解決這些大規(guī)模的系統(tǒng)性攻擊。
![]()
▲網(wǎng)友吐槽Anthropic(圖源:X平臺(tái))
有位網(wǎng)友給出了自己對(duì)上述現(xiàn)象的分析:蒸餾實(shí)際上并不違法,即便就算是違法行為,那么Claude也是非法構(gòu)造的。這就是為什么Anthropic在向政府抱怨這一問題,而不是直接起訴。
![]()
▲網(wǎng)友分析蒸餾行為的合法性問題(圖源:X平臺(tái))
另一位網(wǎng)友認(rèn)為,合法蒸餾使用的存在,讓監(jiān)管工作變得更難,因?yàn)樽C明企業(yè)使用模型的意圖和規(guī)模,要比傳統(tǒng)的版權(quán)索賠復(fù)雜得多。
![]()
▲網(wǎng)友分析蒸餾行為的合法性問題(圖源:X平臺(tái))
Anthropic的舉動(dòng)在部分網(wǎng)友眼中并不光彩。這位網(wǎng)友就認(rèn)為,Anthropic這一套“請(qǐng)不要向我們的競(jìng)爭(zhēng)對(duì)手出口GPU”的言論,聽起來就像是他們想實(shí)現(xiàn)某種壟斷。
![]()
▲網(wǎng)友質(zhì)疑Anthropic試圖實(shí)現(xiàn)壟斷(圖源:X平臺(tái))
Anthropic還在其官方博客中披露了一項(xiàng)重要細(xì)節(jié):通過分析請(qǐng)求元數(shù)據(jù),他們能夠?qū)⑻囟ǖ膶?duì)話記錄直接追溯到月之暗面和DeepSeek的具體員工,等于順著網(wǎng)線一路精準(zhǔn)鎖定真人。這一做法隨即引發(fā)了外界對(duì)數(shù)據(jù)安全與隱私保護(hù)問題的擔(dān)憂。
一位來自歐洲的用戶稱,Anthropic的這番言論,似乎正在吹噓自己能使用元數(shù)據(jù),實(shí)現(xiàn)用戶的去匿名化,“難道這就是Anthropic如今的隱私政策嗎”?
![]()
▲網(wǎng)友質(zhì)疑Anthropic的數(shù)據(jù)安全問題(圖源:X平臺(tái))
Anthropic將蒸餾行為稱為“蒸餾攻擊”,這一說法本質(zhì)上也有些“文字游戲”的嫌疑。多位Reddit網(wǎng)友認(rèn)為,即便其他公司確實(shí)利用其產(chǎn)品生成的數(shù)據(jù)進(jìn)行訓(xùn)練,這本質(zhì)上也只是用戶在正常使用產(chǎn)品,而且這些用戶是付了費(fèi)的。
有評(píng)論戲謔道,按照Anthropic這套邏輯,就好比你去餐廳吃飯,記住了廚師做出來的味道,然后回家自己做了頓飯,就被扣上了“非法進(jìn)行蒸餾攻擊”的帽子。
![]()
▲Reddit網(wǎng)友吐槽Anthropic的文字游戲(圖源:X平臺(tái))
三、被質(zhì)疑蒸餾不是新鮮事,DeepSeek、月之暗面此前已有正面回應(yīng)
目前,DeepSeek、月之暗面和MiniMax均尚未對(duì)Anthropic的本次指控做出公開回應(yīng)。
不過,對(duì)于中國(guó)模型蒸餾海外模型的質(zhì)疑,自2025年DeepSeek進(jìn)入全球主流視野以來就一直沒有中斷過。而這些中國(guó)企業(yè)此前已經(jīng)在不同的場(chǎng)合,回應(yīng)過相關(guān)質(zhì)疑。
比如,DeepSeek就曾遭到OpenAI質(zhì)疑,稱其模型蒸餾自O(shè)penAI的模型。
作為回應(yīng),DeepSeek在去年9月登上Nature雜志封面的DeepSeek-R1論文中補(bǔ)充道,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的數(shù)據(jù)全部來自互聯(lián)網(wǎng),雖然可能包含GPT-4生成的結(jié)果,但絕非有意而為之,更沒有專門的蒸餾環(huán)節(jié)。
而今年1月,月之暗面也曾回應(yīng)外界對(duì)Kimi K2.5的蒸餾質(zhì)疑。
當(dāng)時(shí),有部分網(wǎng)友發(fā)現(xiàn)Kimi K2.5有時(shí)會(huì)自稱為Claude,懷疑這是對(duì)Claude進(jìn)行蒸餾的證據(jù)。楊植麟回應(yīng)道,這一現(xiàn)象主要是由在預(yù)訓(xùn)練階段對(duì)最新編程數(shù)據(jù)進(jìn)行了上采樣,而這些數(shù)據(jù)似乎與“Claude”這個(gè)token的關(guān)聯(lián)性較強(qiáng)。事實(shí)上,K2.5在許多基準(zhǔn)測(cè)試中似乎都優(yōu)于Claude。
那么,為什么Claude生成的數(shù)據(jù)會(huì)“誤打誤撞”融入中國(guó)企業(yè)的模型呢?
目前的大模型訓(xùn)練,高度依賴公開互聯(lián)網(wǎng)數(shù)據(jù)。像Anthropic推出的Claude以及Claude Code,被全球開發(fā)者廣泛用于寫代碼、生成文檔、提交開源項(xiàng)目。
當(dāng)開發(fā)者把這些生成內(nèi)容發(fā)布到GitHub、博客或技術(shù)論壇后,這些內(nèi)容就進(jìn)入了公共互聯(lián)網(wǎng)語料池。而許多模型在訓(xùn)練時(shí)會(huì)抓取公開網(wǎng)頁(yè)數(shù)據(jù),因此其中一部分自然會(huì)包含由Claude生成的代碼或文本。這是一種間接擴(kuò)散路徑,可能出現(xiàn)在任何模型身上,引發(fā)模型的“自我認(rèn)知”問題。Anthropic自家的模型Claude Sonnet 4.6,也曾出現(xiàn)自稱為DeepSeek的情況。
![]()
▲Claude Sonnet 4.6自稱DeepSeek
有不少海外技術(shù)圈人士也關(guān)注到了這一現(xiàn)象。AI訓(xùn)練平臺(tái)Prime Intellect的工程師Will Brown提出了大量問題。比如,使用Claude貢獻(xiàn)的開源GitHub代碼訓(xùn)練模型,算不算蒸餾?把Claude的數(shù)據(jù)公開分享到互聯(lián)網(wǎng)上,違不違反用戶協(xié)定?用Claude Code寫訓(xùn)練代碼,用于訓(xùn)練競(jìng)對(duì)模型,違不違反用戶協(xié)定?
![]()
▲Will Brown對(duì)Anthropic提出一連串疑問(圖源:X平臺(tái))
如果上述問題的答案都是“是”,那么正如另一位網(wǎng)友所說的,根據(jù)Anthropic的條款,在AI圈里,由于Anthropic和所有企業(yè)都有競(jìng)爭(zhēng)關(guān)系,那么理論上只有Anthropic自己可以使用Claude,其他企業(yè)都不能用。
另一位網(wǎng)友認(rèn)為,所謂的“非法蒸餾”和“正常互聯(lián)網(wǎng)活動(dòng)”的界限并不清晰,如今Anthropic真正需要做的是準(zhǔn)確界定,然后推動(dòng)監(jiān)管。
![]()
▲網(wǎng)友提出該領(lǐng)域存在監(jiān)管空白(圖源:X平臺(tái))
結(jié)語:爭(zhēng)議背后的產(chǎn)業(yè)博弈
從產(chǎn)業(yè)競(jìng)爭(zhēng)角度看,當(dāng)前全球大模型能力正在快速收斂。中國(guó)AI公司在算力受限的情況下,通過算法優(yōu)化、工程能力提升和數(shù)據(jù)利用效率改進(jìn)來追趕國(guó)際前沿,走出獨(dú)特的技術(shù)創(chuàng)新路徑。將所有能力提升都?xì)w因于“蒸餾提取”,大幅度貶低了中國(guó)AI實(shí)驗(yàn)室的研發(fā)投入與工程進(jìn)展。
當(dāng)然,如果確實(shí)存在違反服務(wù)條款、使用虛假賬戶等行為,平臺(tái)方采取技術(shù)封禁和風(fēng)控措施屬于正常商業(yè)行為。但將其上升為國(guó)家安全威脅,甚至作為強(qiáng)化出口管制的論據(jù),則已經(jīng)超出單一企業(yè)糾紛的范圍。對(duì)我們而言,與其簡(jiǎn)單接受某一方的定性,不如保持審慎態(tài)度,冷靜看待其背后的產(chǎn)業(yè)博弈邏輯。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.