五角大樓極限施壓Anthropic，要求周六前解除所有AI安全限制

2026-02-25 20:22:15　來源: 新智元

北京舉報

分享至

新智元報道

編輯：艾倫

【新智元導(dǎo)讀】美國五角大樓正向 Anthropic 極限施壓，要求徹底解除 Claude 的軍事應(yīng)用限制。會后，Anthropic 發(fā)布新版政策。公司正式放棄了「單方面暫停大模型訓(xùn)練」的安全承諾。在政治與商業(yè)的雙重壓力下，AI 安全理想主義最終向現(xiàn)實妥協(xié)。

就在這兩天，美國五角大樓內(nèi)醞釀著一場氣氛冷硬的會面。

坐在談判桌兩端的，是代表著截然不同兩種意識形態(tài)的權(quán)力掌舵者。

一邊是美國國防部長皮特·海格塞斯（Pete Hegseth），他代表著新一屆政府在國家安全事務(wù)上毫無妥協(xié)的強勢姿態(tài)與放松監(jiān)管的狂飆做派。

另一邊則是達里奧·阿莫代（Dario Amodei），Anthropic CEO。

在硅谷，阿莫代（Dario Amodei）和他的公司一直以「安全第一」的教條主義者形象示人，他們甚至將約束 AI 模型視作與開發(fā) AI 模型同等重要的使命。

這并非一次為了增進了解的友好拜訪。

據(jù)多位知情人士透露，這場會面充滿了火藥味。

五角大樓向阿莫代下達了最后通牒。

國防部要求 Anthropic 在美國時間周五晚前（北京時間周六晚前）全面解除其大模型 Claude 在軍事機密系統(tǒng)中的安全限制，允許軍方將其用于「所有合法目的」。

如果 Anthropic 拒絕，五角大樓將考慮動用《國防生產(chǎn)法》（Defense Production Act）強制其修改代碼，或者直接將其打上「供應(yīng)鏈風(fēng)險」的標(biāo)簽，徹底切斷其與軍方乃至其他聯(lián)邦承包商的商業(yè)聯(lián)系。

https://www.axios.com/2026/02/24/anthropic-pentagon-claude-hegseth-dario

阿莫代帶來的底牌顯得有些單薄。

Anthropic 同意放寬部分使用限制，堅持保留兩條紅線。

這兩條紅線分別是禁止將其 AI 用于對美國民眾的大規(guī)模監(jiān)控，禁止用于開發(fā)無需人類介入的致命性自主武器。

在五角大樓看來，這種要求對軍方每一次具體使用進行審查的「護欄」，是對軍事決策權(quán)的僭越。

就在這場驚心動魄的政商博弈進行的同時，另一場更為隱秘的蛻變正在 Anthropic 內(nèi)部發(fā)生。

會后，這家曾經(jīng)最為保守的 AI 明星企業(yè)悄然發(fā)布了第三版《負(fù)責(zé)任的擴展政策》（RSP 3.0）。

https://www.anthropic.com/news/responsible-scaling-policy-v3

這份長達近 20 頁的政策文件宣告了一個核心承諾的終結(jié)。

Anthropic 正式放棄了其在 2023 年立下的「一旦安全措施無法保障便單方面暫停大模型訓(xùn)練」的誓言。

一面是在華盛頓的圓桌上死守 AI 應(yīng)用的倫理底線，一面是在舊金山的實驗室里親手拆除制約研發(fā)速度的安全閥。

當(dāng)技術(shù)狂飆與大國博弈相互交織，曾經(jīng)試圖為 ASI 戴上鐐銬的理想主義者們，正在無可奈何地向現(xiàn)實低頭。

五角大樓的焦躁與硅谷的備胎

五角大樓對 Anthropic 的憤怒與依賴是一體兩面的。

早在此次僵局發(fā)生之前，國防部與 Anthropic 已經(jīng)簽署了一份價值 2 億美元的試點合同。

Claude 是目前美國軍方機密網(wǎng)絡(luò)中唯一獲得授權(quán)并正在運行的 AI 模型。

在敏感情報分析、武器開發(fā)以及戰(zhàn)場行動中，軍方人員常常將 Claude 與數(shù)據(jù)分析巨頭 Palantir 的技術(shù)結(jié)合使用。

一月份發(fā)生在委內(nèi)瑞拉的「馬杜羅突襲」行動中，Claude 就曾深度參與并發(fā)揮了關(guān)鍵作用。

防務(wù)官員們毫不諱言 Claude 的強大。

正是因為 Claude 的性能在同行中一騎絕塵，五角大樓才容忍了 Anthropic 至今。

然而，海格塞斯（Pete Hegseth）在今年 1 月發(fā)布的一份備忘錄打破了原有的默契。

備忘錄要求所有提供給軍方的 AI 技術(shù)必須移除限制，這直接導(dǎo)致了雙方合同的重新談判。

在海格塞斯（Pete Hegseth）強硬的施壓策略背后，是一套精心編織的替代方案。

就在阿莫代（Dario Amodei）被傳喚至五角大樓的幾乎同一時間，埃隆·馬斯克旗下的AI公司 xAI 與五角大樓達成了協(xié)議，同意讓其模型 Grok 進入機密系統(tǒng)，并完全接受了軍方「用于所有合法目的」的標(biāo)準(zhǔn)。

https://www.axios.com/2026/02/23/ai-defense-department-deal-musk-xai-grok

xAI 的妥協(xié)為五角大樓提供了向 Anthropic 施壓的絕佳籌碼。

不僅如此，谷歌（該公司曾聲稱信條是: Don't be evil）和 OpenAI 也在緊鑼密鼓地與軍方接洽。

https://www.nytimes.com/2026/02/23/us/politics/pentagon-anthropic-ai.html

知情人士透露，五角大樓正以前所未有的緊迫感推動與這兩家巨頭的談判。

谷歌為了專門服務(wù)政府已經(jīng)投入巨資建設(shè)數(shù)據(jù)中心，其 Gemini 模型被視為極具潛力的替代品。

雖然 OpenAI 的 ChatGPT 目前仍在機密網(wǎng)絡(luò)之外，且由于復(fù)雜的安全問題距離達成協(xié)議尚有距離，但大門已經(jīng)敞開。

https://www.nytimes.com/2026/02/23/us/politics/pentagon-anthropic-ai.html

這構(gòu)成了對 Anthropic 的極限施壓。

軍方官員直言不諱地指出，如果 Anthropic 不讓步，就讓其徹底出局。

將 Anthropic 列為「供應(yīng)鏈風(fēng)險」是一項極具毀滅性的懲罰。

這意味著任何希望與國防部做生意的企業(yè)，都必須提供證明，確保其工作流程中沒有使用 Claude。

https://www.axios.com/2026/02/24/anthropic-pentagon-claude-hegseth-dario

對于一家估值高達 3800 億美元、年化收入正以十倍速度瘋漲的明星獨角獸而言，這無疑是切斷了其在政府（To G）與企業(yè)級市場（To B）最豐厚的一條主脈。

更為極端的威脅是《國防生產(chǎn)法》。

這項在新冠疫情期間曾被用來強制生產(chǎn)呼吸機和疫苗的法案，此刻被異化為一種帶有敵意的行政大棒。

五角大樓試圖借此繞過商業(yè)談判，以國家安全的名義直接剝奪一家科技公司對其核心產(chǎn)品的控制權(quán)。

盡管有顧問指出 Anthropic 可以在法庭上抗辯，證明 Claude 是為政府敏感用途定制的軟件而非普通商品，但這種曠日持久的法律消耗戰(zhàn)同樣是初創(chuàng)公司難以承受之重。

「暫停鍵」的消亡與絕對安全的幻滅

就在外界的目光聚焦于華盛頓的政治交鋒時，Anthropic 內(nèi)部正在進行一場痛苦的路線修正。

Anthropic 由達里奧·阿莫代（Dario Amodei）及其妹妹丹妮拉·阿莫代（Daniela Amodei）等一眾前 OpenAI 核心成員創(chuàng)立。

妹妹 Daniela Amodei

這群人當(dāng)年離開 OpenAI 的初衷，正是擔(dān)憂資本的過度介入會使得 AI 的安全被拋之腦后。

成立之初，Anthropic 就確立了將安全性作為最高信仰的企業(yè)文化。

2023 年出臺的第一版《負(fù)責(zé)任的擴展政策》更是將這種信仰條文化。

那份政策中有一個被外界廣泛贊譽的條款，即如果模型能力超越了特定的安全閾值，且公司無法保證相應(yīng)的風(fēng)險緩解措施到位，Anthropic 將無條件暫停新模型的訓(xùn)練和部署。

當(dāng)時的 Anthropic 高層曾天真地認(rèn)為，這種單邊承諾能夠產(chǎn)生一種「向上攀比」的示范效應(yīng)。他們希望借此倒逼整個行業(yè)將安全置于速度之上，并最終促成具有約束力的國家法規(guī)甚至國際條約。

3 年的時間足以讓任何烏托邦式的幻想破滅。

Anthropic 的首席科學(xué)官杰瑞德·卡普蘭（Jared Kaplan）在接受采訪時道出了變更政策的實情。

全球 AI 立法的步伐不僅沒有跟上技術(shù)的發(fā)展，反而出現(xiàn)了嚴(yán)重的倒退。

美國新一屆政府高舉放松監(jiān)管的大旗，甚至試圖廢除部分州一級的 AI 監(jiān)管法案。

國際間的協(xié)同治理更是遙遙無期。與此同時，同行間的算力軍備競賽已經(jīng)進入白熱化。

「如果我們停下腳步，而競爭對手正在毫無顧忌地全速前進，這對于任何人都沒有好處。」卡普蘭的這番話解釋了RSP 3.0 的核心邏輯。

新版政策完成了從「絕對風(fēng)險」向「邊際風(fēng)險」的評估體系轉(zhuǎn)移。

Anthropic 在文件中坦承，AI造成的災(zāi)難性風(fēng)險取決于全行業(yè)多個參與者的共同行動。

如果一家負(fù)責(zé)任的開發(fā)者為了實施安全措施而暫停開發(fā)，那些缺乏安全保障的開發(fā)者就會主導(dǎo)技術(shù)的前沿。

結(jié)果將是一個更加不安全的世界，因為負(fù)責(zé)任的公司會因此喪失對前沿技術(shù)的理解力，進而失去進行安全研究的能力。

這是一個充滿宿命感的悖論。

為了確保 AI 的安全，必須讓它足夠強大；

為了研究前沿的風(fēng)險，必須自己先觸及前沿。

Anthropic 最終得出的結(jié)論是：在大模型時代，沒有公司可以停在原地。

這種轉(zhuǎn)變也源于科學(xué)評估的困境。

早期的政策設(shè)想中，安全閾值被設(shè)定為一條條清晰的紅線。

然而實際操作中，紅線變成了模糊的漸變色。

以生物武器研發(fā)風(fēng)險為例，現(xiàn)有的 Claude 模型已經(jīng)具備了相當(dāng)程度的生物學(xué)知識，能夠輕易通過各項基準(zhǔn)測試。

這使得 Anthropic 無法證明該模型風(fēng)險很低。

缺乏能夠量化嚴(yán)重災(zāi)難風(fēng)險的成熟科學(xué)標(biāo)準(zhǔn)，讓 Anthropic 在試圖說服競爭對手或政府放慢腳步時顯得極其缺乏說服力。

沒有退路的前沿實驗

作為對放棄「單邊暫停」承諾的補償，Anthropic 在 RSP 3.0 中引入了更為密集的透明度機制。

他們承諾每 3 到 6 個月發(fā)布一次詳盡的「風(fēng)險報告」（Risk Reports）（特別寫明了：「部分內(nèi)容會進行刪減」），并在必要時引入無利益沖突的第三方進行嚴(yán)格的外部審查。

https://www.anthropic.com/news/responsible-scaling-policy-v3

公司還會定期更新「前沿安全路線圖」（Frontier Safety Roadmap），將未來的安全目標(biāo)公之于眾，作為一種不具強制法律約束力卻能接受公眾監(jiān)督的軟性承諾。

非營利組織 METR 的政策主管克里斯·佩因特（Chris Painter）將 Anthropic 的這一轉(zhuǎn)變形容為進入了「分診模式」（Triage mode）。

在醫(yī)療急救中，分診意味著放棄對輕傷者的即時救治，集中有限的資源搶救最危重的病人。

在 AI 安全領(lǐng)域，這意味著 Anthropic 承認(rèn)現(xiàn)有的評估和緩解手段已經(jīng)跟不上模型能力增長的速度，他們只能在不斷升級的風(fēng)險中做最壞打算。

佩因特表達了對這種「溫水煮青蛙」效應(yīng)的擔(dān)憂：當(dāng)二元化的安全紅線被取消，由一項項具體的風(fēng)險評估取而代之時，社會可能會在不知不覺中滑向危險的深淵，卻再也不會有一個明確的觸發(fā)機制來拉響警報。

回望五角大樓那間氣氛凝重的會議室，我們或許能更深刻地理解 Anthropic 眼下的處境。

面對軍方的極限施壓，阿莫代依然拒絕在「大規(guī)模監(jiān)控」和「致命自主武器」這兩項直接關(guān)乎人命與公民權(quán)利的應(yīng)用層面上妥協(xié)——至少在明面上要維持住公司體面的「人設(shè)」。

他們已經(jīng)意識到，在這個由算力、資本和國家意志共同驅(qū)動的龐大齒輪前，一家試圖通過閉門修行的初創(chuàng)公司是極其脆弱的。

如果拒絕五角大樓，將被貼上敵視國家安全的標(biāo)簽，被驅(qū)逐出擁有無窮資源的市場，進而被那些沒有道德包袱的競爭對手碾壓。

為了留在牌桌上，他們必須保持技術(shù)領(lǐng)先；

為了保持領(lǐng)先，他們必須放棄當(dāng)年立下的那份會阻礙擴張步伐的誓言。

從堅持絕對安全，到尋求相對安全；

從單方面暫停訓(xùn)練的果決，到只求在狂飆的列車上加裝更好剎車片的妥協(xié)。

Anthropic 的蛻變史，就是一部硅谷 AI 理想主義在現(xiàn)實土壤上的降級史。

技術(shù)精英們曾經(jīng)深信自己可以用算法和政策為人類鎖住潘多拉的魔盒，但地緣政治的壓力和商業(yè)競爭的殘酷重塑了游戲的規(guī)則。

在這條通往 ASI 的單行道上，人類最終會驚恐地發(fā)現(xiàn)，比機器失控更早到來的，是人類自己對按下暫停鍵的無能為力。

參考資料：

https://www.anthropic.com/news/responsible-scaling-policy-v3

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.