![]()
新智元報道
編輯:艾倫
【新智元導(dǎo)讀】美國五角大樓正向 Anthropic 極限施壓,要求徹底解除 Claude 的軍事應(yīng)用限制。會后,Anthropic 發(fā)布新版政策。公司正式放棄了「單方面暫停大模型訓(xùn)練」的安全承諾。在政治與商業(yè)的雙重壓力下,AI 安全理想主義最終向現(xiàn)實妥協(xié)。
就在這兩天,美國五角大樓內(nèi)醞釀著一場氣氛冷硬的會面。
坐在談判桌兩端的,是代表著截然不同兩種意識形態(tài)的權(quán)力掌舵者。
一邊是美國國防部長皮特·海格塞斯(Pete Hegseth),他代表著新一屆政府在國家安全事務(wù)上毫無妥協(xié)的強勢姿態(tài)與放松監(jiān)管的狂飆做派。
![]()
另一邊則是達里奧·阿莫代(Dario Amodei),Anthropic CEO。
![]()
在硅谷,阿莫代(Dario Amodei)和他的公司一直以「安全第一」的教條主義者形象示人,他們甚至將約束 AI 模型視作與開發(fā) AI 模型同等重要的使命。
這并非一次為了增進了解的友好拜訪。
據(jù)多位知情人士透露,這場會面充滿了火藥味。
五角大樓向阿莫代下達了最后通牒。
國防部要求 Anthropic 在美國時間周五晚前(北京時間周六晚前)全面解除其大模型 Claude 在軍事機密系統(tǒng)中的安全限制,允許軍方將其用于「所有合法目的」。
如果 Anthropic 拒絕,五角大樓將考慮動用《國防生產(chǎn)法》(Defense Production Act)強制其修改代碼,或者直接將其打上「供應(yīng)鏈風(fēng)險」的標(biāo)簽,徹底切斷其與軍方乃至其他聯(lián)邦承包商的商業(yè)聯(lián)系。
![]()
https://www.axios.com/2026/02/24/anthropic-pentagon-claude-hegseth-dario
阿莫代帶來的底牌顯得有些單薄。
Anthropic 同意放寬部分使用限制,堅持保留兩條紅線。
這兩條紅線分別是禁止將其 AI 用于對美國民眾的大規(guī)模監(jiān)控,禁止用于開發(fā)無需人類介入的致命性自主武器。
在五角大樓看來,這種要求對軍方每一次具體使用進行審查的「護欄」,是對軍事決策權(quán)的僭越。
就在這場驚心動魄的政商博弈進行的同時,另一場更為隱秘的蛻變正在 Anthropic 內(nèi)部發(fā)生。
會后,這家曾經(jīng)最為保守的 AI 明星企業(yè)悄然發(fā)布了第三版《負(fù)責(zé)任的擴展政策》(RSP 3.0)。
![]()
https://www.anthropic.com/news/responsible-scaling-policy-v3
這份長達近 20 頁的政策文件宣告了一個核心承諾的終結(jié)。
Anthropic 正式放棄了其在 2023 年立下的「一旦安全措施無法保障便單方面暫停大模型訓(xùn)練」的誓言。
一面是在華盛頓的圓桌上死守 AI 應(yīng)用的倫理底線,一面是在舊金山的實驗室里親手拆除制約研發(fā)速度的安全閥。
當(dāng)技術(shù)狂飆與大國博弈相互交織,曾經(jīng)試圖為 ASI 戴上鐐銬的理想主義者們,正在無可奈何地向現(xiàn)實低頭。
五角大樓的焦躁與硅谷的備胎
五角大樓對 Anthropic 的憤怒與依賴是一體兩面的。
早在此次僵局發(fā)生之前,國防部與 Anthropic 已經(jīng)簽署了一份價值 2 億美元的試點合同。
Claude 是目前美國軍方機密網(wǎng)絡(luò)中唯一獲得授權(quán)并正在運行的 AI 模型。
在敏感情報分析、武器開發(fā)以及戰(zhàn)場行動中,軍方人員常常將 Claude 與數(shù)據(jù)分析巨頭 Palantir 的技術(shù)結(jié)合使用。
一月份發(fā)生在委內(nèi)瑞拉的「馬杜羅突襲」行動中,Claude 就曾深度參與并發(fā)揮了關(guān)鍵作用。
防務(wù)官員們毫不諱言 Claude 的強大。
正是因為 Claude 的性能在同行中一騎絕塵,五角大樓才容忍了 Anthropic 至今。
然而,海格塞斯(Pete Hegseth)在今年 1 月發(fā)布的一份備忘錄打破了原有的默契。
備忘錄要求所有提供給軍方的 AI 技術(shù)必須移除限制,這直接導(dǎo)致了雙方合同的重新談判。
在海格塞斯(Pete Hegseth)強硬的施壓策略背后,是一套精心編織的替代方案。
就在阿莫代(Dario Amodei)被傳喚至五角大樓的幾乎同一時間,埃隆·馬斯克旗下的AI公司 xAI 與五角大樓達成了協(xié)議,同意讓其模型 Grok 進入機密系統(tǒng),并完全接受了軍方「用于所有合法目的」的標(biāo)準(zhǔn)。
![]()
https://www.axios.com/2026/02/23/ai-defense-department-deal-musk-xai-grok
xAI 的妥協(xié)為五角大樓提供了向 Anthropic 施壓的絕佳籌碼。
不僅如此,谷歌(該公司曾聲稱信條是: Don't be evil)和 OpenAI 也在緊鑼密鼓地與軍方接洽。
![]()
https://www.nytimes.com/2026/02/23/us/politics/pentagon-anthropic-ai.html
知情人士透露,五角大樓正以前所未有的緊迫感推動與這兩家巨頭的談判。
谷歌為了專門服務(wù)政府已經(jīng)投入巨資建設(shè)數(shù)據(jù)中心,其 Gemini 模型被視為極具潛力的替代品。
雖然 OpenAI 的 ChatGPT 目前仍在機密網(wǎng)絡(luò)之外,且由于復(fù)雜的安全問題距離達成協(xié)議尚有距離,但大門已經(jīng)敞開。
![]()
https://www.nytimes.com/2026/02/23/us/politics/pentagon-anthropic-ai.html
這構(gòu)成了對 Anthropic 的極限施壓。
軍方官員直言不諱地指出,如果 Anthropic 不讓步,就讓其徹底出局。
將 Anthropic 列為「供應(yīng)鏈風(fēng)險」是一項極具毀滅性的懲罰。
這意味著任何希望與國防部做生意的企業(yè),都必須提供證明,確保其工作流程中沒有使用 Claude。
![]()
https://www.axios.com/2026/02/24/anthropic-pentagon-claude-hegseth-dario
對于一家估值高達 3800 億美元、年化收入正以十倍速度瘋漲的明星獨角獸而言,這無疑是切斷了其在政府(To G)與企業(yè)級市場(To B)最豐厚的一條主脈。
更為極端的威脅是《國防生產(chǎn)法》。
這項在新冠疫情期間曾被用來強制生產(chǎn)呼吸機和疫苗的法案,此刻被異化為一種帶有敵意的行政大棒。
五角大樓試圖借此繞過商業(yè)談判,以國家安全的名義直接剝奪一家科技公司對其核心產(chǎn)品的控制權(quán)。
盡管有顧問指出 Anthropic 可以在法庭上抗辯,證明 Claude 是為政府敏感用途定制的軟件而非普通商品,但這種曠日持久的法律消耗戰(zhàn)同樣是初創(chuàng)公司難以承受之重。
「暫停鍵」的消亡與絕對安全的幻滅
就在外界的目光聚焦于華盛頓的政治交鋒時,Anthropic 內(nèi)部正在進行一場痛苦的路線修正。
Anthropic 由達里奧·阿莫代(Dario Amodei)及其妹妹丹妮拉·阿莫代(Daniela Amodei)等一眾前 OpenAI 核心成員創(chuàng)立。
![]()
妹妹 Daniela Amodei
這群人當(dāng)年離開 OpenAI 的初衷,正是擔(dān)憂資本的過度介入會使得 AI 的安全被拋之腦后。
成立之初,Anthropic 就確立了將安全性作為最高信仰的企業(yè)文化。
2023 年出臺的第一版《負(fù)責(zé)任的擴展政策》更是將這種信仰條文化。
那份政策中有一個被外界廣泛贊譽的條款,即如果模型能力超越了特定的安全閾值,且公司無法保證相應(yīng)的風(fēng)險緩解措施到位,Anthropic 將無條件暫停新模型的訓(xùn)練和部署。
當(dāng)時的 Anthropic 高層曾天真地認(rèn)為,這種單邊承諾能夠產(chǎn)生一種「向上攀比」的示范效應(yīng)。他們希望借此倒逼整個行業(yè)將安全置于速度之上,并最終促成具有約束力的國家法規(guī)甚至國際條約。
3 年的時間足以讓任何烏托邦式的幻想破滅。
Anthropic 的首席科學(xué)官杰瑞德·卡普蘭(Jared Kaplan)在接受采訪時道出了變更政策的實情。
![]()
全球 AI 立法的步伐不僅沒有跟上技術(shù)的發(fā)展,反而出現(xiàn)了嚴(yán)重的倒退。
美國新一屆政府高舉放松監(jiān)管的大旗,甚至試圖廢除部分州一級的 AI 監(jiān)管法案。
國際間的協(xié)同治理更是遙遙無期。與此同時,同行間的算力軍備競賽已經(jīng)進入白熱化。
「如果我們停下腳步,而競爭對手正在毫無顧忌地全速前進,這對于任何人都沒有好處。」卡普蘭的這番話解釋了RSP 3.0 的核心邏輯。
新版政策完成了從「絕對風(fēng)險」向「邊際風(fēng)險」的評估體系轉(zhuǎn)移。
Anthropic 在文件中坦承,AI造成的災(zāi)難性風(fēng)險取決于全行業(yè)多個參與者的共同行動。
如果一家負(fù)責(zé)任的開發(fā)者為了實施安全措施而暫停開發(fā),那些缺乏安全保障的開發(fā)者就會主導(dǎo)技術(shù)的前沿。
結(jié)果將是一個更加不安全的世界,因為負(fù)責(zé)任的公司會因此喪失對前沿技術(shù)的理解力,進而失去進行安全研究的能力。
這是一個充滿宿命感的悖論。
為了確保 AI 的安全,必須讓它足夠強大;
為了研究前沿的風(fēng)險,必須自己先觸及前沿。
Anthropic 最終得出的結(jié)論是:在大模型時代,沒有公司可以停在原地。
這種轉(zhuǎn)變也源于科學(xué)評估的困境。
早期的政策設(shè)想中,安全閾值被設(shè)定為一條條清晰的紅線。
然而實際操作中,紅線變成了模糊的漸變色。
以生物武器研發(fā)風(fēng)險為例,現(xiàn)有的 Claude 模型已經(jīng)具備了相當(dāng)程度的生物學(xué)知識,能夠輕易通過各項基準(zhǔn)測試。
這使得 Anthropic 無法證明該模型風(fēng)險很低。
缺乏能夠量化嚴(yán)重災(zāi)難風(fēng)險的成熟科學(xué)標(biāo)準(zhǔn),讓 Anthropic 在試圖說服競爭對手或政府放慢腳步時顯得極其缺乏說服力。
沒有退路的前沿實驗
作為對放棄「單邊暫停」承諾的補償,Anthropic 在 RSP 3.0 中引入了更為密集的透明度機制。
他們承諾每 3 到 6 個月發(fā)布一次詳盡的「風(fēng)險報告」(Risk Reports)(特別寫明了:「部分內(nèi)容會進行刪減」),并在必要時引入無利益沖突的第三方進行嚴(yán)格的外部審查。
![]()
https://www.anthropic.com/news/responsible-scaling-policy-v3
公司還會定期更新「前沿安全路線圖」(Frontier Safety Roadmap),將未來的安全目標(biāo)公之于眾,作為一種不具強制法律約束力卻能接受公眾監(jiān)督的軟性承諾。
非營利組織 METR 的政策主管克里斯·佩因特(Chris Painter)將 Anthropic 的這一轉(zhuǎn)變形容為進入了「分診模式」(Triage mode)。
![]()
在醫(yī)療急救中,分診意味著放棄對輕傷者的即時救治,集中有限的資源搶救最危重的病人。
在 AI 安全領(lǐng)域,這意味著 Anthropic 承認(rèn)現(xiàn)有的評估和緩解手段已經(jīng)跟不上模型能力增長的速度,他們只能在不斷升級的風(fēng)險中做最壞打算。
佩因特表達了對這種「溫水煮青蛙」效應(yīng)的擔(dān)憂:當(dāng)二元化的安全紅線被取消,由一項項具體的風(fēng)險評估取而代之時,社會可能會在不知不覺中滑向危險的深淵,卻再也不會有一個明確的觸發(fā)機制來拉響警報。
回望五角大樓那間氣氛凝重的會議室,我們或許能更深刻地理解 Anthropic 眼下的處境。
面對軍方的極限施壓,阿莫代依然拒絕在「大規(guī)模監(jiān)控」和「致命自主武器」這兩項直接關(guān)乎人命與公民權(quán)利的應(yīng)用層面上妥協(xié)——至少在明面上要維持住公司體面的「人設(shè)」。
他們已經(jīng)意識到,在這個由算力、資本和國家意志共同驅(qū)動的龐大齒輪前,一家試圖通過閉門修行的初創(chuàng)公司是極其脆弱的。
如果拒絕五角大樓,將被貼上敵視國家安全的標(biāo)簽,被驅(qū)逐出擁有無窮資源的市場,進而被那些沒有道德包袱的競爭對手碾壓。
為了留在牌桌上,他們必須保持技術(shù)領(lǐng)先;
為了保持領(lǐng)先,他們必須放棄當(dāng)年立下的那份會阻礙擴張步伐的誓言。
從堅持絕對安全,到尋求相對安全;
從單方面暫停訓(xùn)練的果決,到只求在狂飆的列車上加裝更好剎車片的妥協(xié)。
Anthropic 的蛻變史,就是一部硅谷 AI 理想主義在現(xiàn)實土壤上的降級史。
技術(shù)精英們曾經(jīng)深信自己可以用算法和政策為人類鎖住潘多拉的魔盒,但地緣政治的壓力和商業(yè)競爭的殘酷重塑了游戲的規(guī)則。
在這條通往 ASI 的單行道上,人類最終會驚恐地發(fā)現(xiàn),比機器失控更早到來的,是人類自己對按下暫停鍵的無能為力。
參考資料:
https://www.anthropic.com/news/responsible-scaling-policy-v3
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.