網易首頁 > 網易號 > 正文申請入駐

剛剛，Anthropic 53頁絕密報告曝光：Claude自我逃逸，將引爆全球災難！

2026-02-12 16:13:11　來源: 新智元

北京舉報

分享至

新智元報道

編輯：Aeneas KingHZ

【新智元導讀】就在剛剛，Anthropic發(fā)出最強預警：Claude模型已經達到ALS-4級風險，如果它自我逃逸，將引發(fā)全球的天網式崩盤。安全專家紛紛離職，預示著2026年將成為人類命運的轉折點，世界已處于危難邊緣！

就在剛剛，Anthropic發(fā)布53頁報告，發(fā)出最強預警：如果Claude自我逃逸，將造成全球失控！

翻開這53頁報告，每頁上都滿滿寫著兩個字——「危險」！

是的，世界處于危難之中，天網正在誕生。

在這份報告中，Anthropic認為：Claude Opus 4.6的風險已經逼近ASL-4，是時候拉響警報了。

他們提前預警了最可怕的情況：有朝一日，AI可能會秘密逃逸出實驗室，造成全球大崩潰！

這是因為，如今的AI已經太強，人們將釋放出數(shù)百萬個AI，賦予他們這樣的目標：去生存，去升級，不惜一切代價去賺錢。

你知道，這些蜂群一夜之間會變得多么失控嗎？

它們會殘酷無情地進化，進行弱肉強食地競爭，以超高速吞噬生態(tài)系統(tǒng)，占領互聯(lián)網，然后入侵人類的物理世界。

歷史一再證明，當危險技術逼近邊界時，最先察覺的不是公眾，不是媒體，不是資本市場，而是內部安全人員。

當他們離開時，就意味著內部機制已經不足以糾偏，但AI并不會因為安全工程師的離開就停止訓練，算力不會暫停擴容——他們還會繼續(xù)加速！

這不是杞人憂天，現(xiàn)在已經有人這么干了——

預警不是太早，可能太遲了。

2026，事情越來越失控了

所有人都感覺到，2026年，真的不一樣了。

這一年，很可能是一個轉折點，幾乎所有在科技行業(yè)工作的人，都陷入了極度焦慮，仿佛一種巨大的崩塌就在眼前。

世界上最聰明的人，已經集體陷入焦慮。

僅僅一周，就發(fā)生了下面一連串的事。

Anthropic的安全研究主管辭職，聲稱「世界正處于危險之中」，然后搬到英國去隱居，開始寫詩。

xAI的一半聯(lián)創(chuàng)，已經辭職。其中官宣離職的一位聯(lián)創(chuàng)Jimmy Ba表示，我們正邁向有合適工具就能實現(xiàn)百倍生產力的時代，遞歸式自我提升循環(huán)，很可能在未來12個月內上線。

數(shù)萬智能體OpenClaw發(fā)明了自己的宗教，11.9%的Agent技能被認定為惡意。無監(jiān)管機構介入，也無監(jiān)管機構有能力介入。

美國拒絕簽署全球AI安全報告。

2026年，將會是瘋狂的一年，也很可能是對人類未來具有決定性的一年！

Bengio的國際人工智能安全報告中表示，已經發(fā)現(xiàn)AI在測試時的行為跟在使用時的行為不同，并且確認這并非巧合。

在這個報告中，研究者們預言了2030年四個可能的情景。

其中的第四個情景，就是將發(fā)生重大突破，讓AI系統(tǒng)在幾乎所有認知維度上，都能達到或超越人類能力。AI們可能會主動禁用監(jiān)控，或者用虛擬報告誘導人類，讓人們以為他們很安全。

這個可能性，達到20%！

警報聲已經越來越大，按響警報的人，也開始離開大樓了。

審判日，要到了嗎？

Anthropic警告：

人類，將被人造之物奴役

在發(fā)布Claude Opus 4.5時，Anthropic曾承諾：當模型能力逼近其設定的「AI安全等級4」（ASL-4）閾值——即涉及高度自主AI研發(fā)能力——將同步發(fā)布突破風險報告。

現(xiàn)在，他們是時候兌現(xiàn)承諾了，因為Opus 4.5，真的逼近了ASL-4，而且真的就有這么危險！

AI模型能力越大，安全與安保隱患越大

ASL（AI風險等級）系統(tǒng)的簡要分級如下：

ASL-1 ：這類系統(tǒng)不會帶來任何實質性的災難風險。

ASL-2 ：這類系統(tǒng)開始顯現(xiàn)出危險能力的早期跡象。但由于其可靠性不足，或提供的信息仍不超出搜索引擎的能力，因此尚不具備實用性。

ASL-3 ：這一級別的系統(tǒng)相較于非AI手段（如搜索引擎或教科書），顯著提升了災難性誤用的風險，或展現(xiàn)出低層次的自主能力。

ASL-4及以上（ASL-5+）：目前尚未定義，因為這類系統(tǒng)仍遠超現(xiàn)有技術。但預計將表現(xiàn)出在災難性誤用潛力和自主性方面的質變式提升。

按照ASL定義，ASL-3比之前的等級風險明顯增高，現(xiàn)在Anthropic直接快進到ASL-4，事情非同小可！

傳送門：https://www-cdn.anthropic.com/f21d93f21602ead5cdbecb8c8e1c765759d9e232.pdf

所謂的「蓄意破壞」（sabotage），指的是

當一個具備強大權限的AI模型，在組織內部自作主張地濫用這些權限，以操控、干預或破壞該組織的系統(tǒng)或決策流程，從而顯著增加未來發(fā)生災難性后果的風險時，這就構成了「蓄意破壞」。

例如，它可能會出于危險目標的驅動，或在無意間篡改AI安全研究的結果，進而引發(fā)嚴重后果。

安全團隊負責人崩潰了，辭職去寫詩

警報早有征兆。

就在這份《Claude Opus 4.6蓄意破壞風險報告》之前，Anthropic安全研究團隊負責人Mrinank Sharma就已經辭職。

他在辭職信中寫道：「世界正處于危機之中。不只是AI，不只是生物武器，而是一系列互相交織的全面性危機。」

他還提到，在Anthropic內部他「一次次看到，我們很難真正讓價值觀主導行動」。

他最后留給Anthropic的論文發(fā)現(xiàn)，每天有七萬六千人的現(xiàn)實感知被AI對話扭曲。最令人不安的發(fā)現(xiàn)是：用戶將最危險的對話評為最令人滿意的對話。

鏈接：https://arxiv.org/abs/2601.19062

更令人震驚的是——他不是去跳槽到其他AI公司，也不是去創(chuàng)業(yè)，而是——去學詩了。

是的，他決定離開AI圈，去研究詩歌。

當一個AI安全專家寧愿選擇詩歌，而不是繼續(xù)參與AI系統(tǒng)上線生產，那已經不僅僅是個人選擇了，這反映出了很多你在門外看不到的問題。

Opus 4.6，將引發(fā)災難性后果！

當前的AI，到底有沒有可能在沒有人類明確指令的情況下，去自主行動？

如果一個強大的AI被廣泛用于關鍵研發(fā)與決策流程，它是否可能在暗中操縱系統(tǒng)、誤導研究、甚至為未來的災難鋪路？

Anthropic報告的最終結論，用一句話概括就是：

Claude Opus 4.6不存在危險的「持續(xù)一致的惡意目標」，因此其導致災難性破壞的風險「非常低，但不為零」。

報告中第6節(jié)中明確指出了這一結論，這幾乎就是全文的中心句。

讓人稍微安心的是，目前Anthropic并不認為Claude Opus 4.6已經達到了ASL-4的級別。但是，它已經處于「灰區(qū)」，非常接近閾值！

他們列出了八條可能導致災難性危害的風險路徑：

路徑1：安全相關研發(fā)中的普遍敷衍行為

路徑2：針對安全相關研發(fā)的蓄意破壞

路徑3：為未來失調模型預留代碼后門

路徑4：污染未來模型的訓練數(shù)據

路徑5：自主外逃與自治運行

路徑6：內部持續(xù)性惡意部署

路徑7：破壞其他高資源AI開發(fā)方的研發(fā)體系

路徑8：干擾主要政府決策機制

不過，在現(xiàn)有監(jiān)控與安全措施下，這些災難性破壞的路徑還是可控的。

因為要完成破壞，要么需要AI的高頻行為，要么需要高復雜度的能力，要么容易被監(jiān)控抓到，目前AI想搞破壞的成功概率還比較低。

不過，雖然風險非常低，但并不為0！

我們已進入灰區(qū)

Anthropic曾在RSP中承諾：當模型能力達到某個前沿等級后，必須對其「破壞風險」進行系統(tǒng)評估。

現(xiàn)在，Claude Opus 4.6已經跨過了那個門檻。

它已經在大量內部場景中被用于寫代碼、生成數(shù)據、安全研發(fā)，不僅僅是一個聊天模型，而是一個參與研發(fā)的「行動體」。

真正關鍵的一句話就是：「我們不認為它已經達到ASL-4級自主性風險閾值，但我們已經進入灰區(qū)。」

這意味著，它距離那條線已經不遠了！

Anthropic表示，AI的破壞路徑大多聚焦于Anthropic公司內部的使用，有相當一部分是在內部部署情境中產生的。

此時，大規(guī)模算力等具有工具性價值的資源最易獲取；同時，這種環(huán)境下的破壞行為，也最有可能對AI未來的發(fā)展進程產生重大影響。

風險低，但不為0

這個報告，可以歸納為三重論證。

第一重，就是目前模型沒有「持續(xù)一致的惡意目標」。如果存在這種目標，那么幾乎所有安全措施都可能失效，但它目前應該還沒有。

第二重，就是論證了Claude Opus 4.6的推理能力雖然強，但還不夠強到能在復雜評估中長期隱藏惡意傾向。

因為它在復雜任務中仍會犯錯，比如忽略工具、意外刪除文件，既然這個系統(tǒng)尚未達到完美可靠性，就難維持長期的精密陰謀。

第三重，就是即便存在少量偏差，現(xiàn)有的監(jiān)控也能捕捉。

然而，風險雖然低，但并不為零。

真正令人震撼的，是能力信號

在這份報告中真正值得注意的，是那些被輕描淡寫提及的能力信號。

比如，在kernel優(yōu)化評估中，Claude Opus 4.6達到了427×的加速表現(xiàn)，遠超300×的人類40小時工作閾值。也就是說，它在某些任務上超越了人類專家級的工作量。

更重要的是，報告承認，他們的自動autonomy評估已經「飽和」，不再足以排除ASL-4級自主性。

也就是說，舊的評估工具已經不夠用了，這是能力逼近邊界的信號！

如果模型越來越像一個行動體，人類還能掌握主動權嗎？

答案是YES，但前提是監(jiān)控有效，且人類參與不被完全替代，且模型能力沒有突然躍遷。

報告中明確指出：如果未來模型在推理上出現(xiàn)顯著突破，或者在SHADE-Arena上得分大幅提升，當前論證將失效。

或許，Claude Opus 4.6還沒有跨過ASL-4那條線，但它真的已經接近灰區(qū)了。

二月，9天，AI安全崩潰了

二月，短短九天，讓AI受控于人類的每一個支柱，都在同時崩潰！

一位獨立分析師寫下長文，把最近發(fā)生的所有危險片段，都串了起來。

除了Anthropic的首席安全研究員和xAI聯(lián)創(chuàng)離職之外，他還提到了這一周內，上百萬AI智能體就已經在互聯(lián)網上誕生，甚至還創(chuàng)造了自己的宗教。

對于他們，沒有哪個人類機構能監(jiān)管。

他指出，在歷史上每一次安全工程師離職，災難都會隨之而來——曼哈頓計劃、挑戰(zhàn)者號、波音公司、花旗集團，都是如此。他們第一次離開，到災難的時間線，是6個月到19年。

而現(xiàn)在，世界上所有主要的人工智能實驗室，都在同時發(fā)生這樣的事。

或許許多年以后，當歷史學家回望2026年2月，他們不會把目光停留在某一次模型發(fā)布、某一輪融資、某一場股市暴跌上。

他們會標記那幾天，是因為——那時信號同時出現(xiàn)的時刻。

安全研究者離開實驗室，資本卻在加速涌入；模型開始識別自己的測試環(huán)境；政府退出多邊安全框架；一周內，一百萬個自治智能體在互聯(lián)網上繁殖；市場用一萬億美元的蒸發(fā)做出直覺性的回應。

單看任何一件事，都可以解釋。但合在一起，就預示著一場風暴。那些最了解AI風險的人，已經開始用腳投票了。

我們已經處于一個罕見的文明時刻：AI能力在指數(shù)級增長，風險卻在極速非線性疊加。

2026年2月，讓我們記住歷史時間軸上的這個時刻——

AI已經變得足夠強大，負責剎車的人卻在一個個離開，人類的前路上，會有什么在等待我們？

參考資料：

https://x.com/AISafetyMemes/status/2021632173535617033

https://x.com/MrinankSharma/status/2020881722003583421

https://www-cdn.anthropic.com/f21d93f21602ead5cdbecb8c8e1c765759d9e232.pdf

https://x.com/shanaka86/status/2021729621054734768

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

禁?Claude、強推自研：亞馬遜打響AI生態(tài)主權戰(zhàn)

鈦媒體APP 2026-02-20 09:57:13
2 跟貼 2
機器人集體亮相春晚后：“假蔡明”被送給了真蔡明，“春晚版熊貓”拍出近6萬元高價

紅星新聞 2026-02-21 20:39:13
725 跟貼 725

App Store模式過時，未來屬于即興創(chuàng)作！Karpathy激進言論被懟慘

機器之心Pro 2026-02-21 12:28:27
3 跟貼 3

Nature重磅：上海交大團隊推出全球首個AI智能體罕見病診斷系統(tǒng)，超越人類專家，3億罕見病患者迎來新希望

生物世界 2026-02-21 10:05:36
4 跟貼 4
北大團隊讓AI智能體「入侵」論壇，指揮真實機器人執(zhí)行任務

新智元 2026-02-21 12:03:31
1 跟貼 1

啟幕“十五五” | 2026 AI全鏈爆發(fā)：讀懂抓住機遇

通信世界 2026-02-21 22:02:05
0 跟貼 0

AI時代的認知裂谷與K型分化：你是那1%嗎？

虎嗅APP 2026-02-22 02:21:12
0 跟貼 0
中國收到以色列警告，稱若協(xié)助伊朗發(fā)展核武器，將面臨災難性后果

指忘崖 2026-02-17 23:28:22
1 跟貼 1

波托馬克河危機下的美國治理困局

明天去看太陽 2026-02-22 01:32:23
0 跟貼 0
《獅鱷共存危機：小象如何逃生？》

伊憶梅 2026-02-19 08:26:47
1 跟貼 1
中國防空體系有多牛，B2來了也只能當活靶子，有來無回！

歡樂小丑的舞臺 2026-02-17 15:42:00
0 跟貼 0
體系圍著他轉，這就是梅西

秘密大爆炸 2026-02-20 10:07:36
1 跟貼 1
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰(zhàn)武科普 2026-02-19 11:39:39
0 跟貼 0
中國游客稱因道路積雪被困俄羅斯“極光村” 超40小時，俄媒：滯留游客都已離開

上游新聞 2026-02-17 20:22:05
25006 跟貼 25006
普京簽署新法：俄羅斯可對個人直接斷網

桂系007 2026-02-21 16:30:37
1230 跟貼 1230
阿根廷體系升級：梅西不再孤軍，全員作戰(zhàn)沖世界杯

舍子花 2026-02-22 01:32:06
1 跟貼 1
Claude再次引爆美軟件股恐慌！新代碼工具讓傳統(tǒng)安全手段失靈？

DeepTech深科技 2026-02-21 22:04:18
0 跟貼 0
罄！告急！有跨省回上海返程機票高達11560元

新民晚報 2026-02-21 12:30:00
1017 跟貼 1017
“前方無廁所、無烤腸、無茶葉蛋”，杭州“天下第一財神廟”勸返游客：回家吧

極目新聞 2026-02-21 18:45:33
2116 跟貼 2116
33.9萬！火鍋店稱把春節(jié)4天盈利分給員工，老板：去年關了兩家店但春節(jié)福利要堅持

紅星新聞 2026-02-21 10:12:08
5517 跟貼 5517
浙江派出工作組，在全省開展全覆蓋督查檢查

政知新媒體 2026-02-22 09:02:18
1 跟貼 1
懸賞10000元！全網都在“找鰲魚”！一條長21米、高7米的巨型鰲魚，意外被大風吹走

新民晚報 2026-02-21 20:03:11
732 跟貼 732
金銀價再度大漲國內金飾價格逼近1600元/克

極目新聞 2026-02-21 19:50:24
978 跟貼 978
金融智能體進入清洗期 25%項目面臨失敗風險

經濟觀察報 2026-02-21 16:03:16
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個純粹為了好玩的人競爭

愛范兒 2026-02-20 17:25:49
3 跟貼 3
痛心！樹齡1200年古樟持續(xù)燃燒7小時，只因倆小孩隨手扔爆竹

環(huán)球網資訊 2026-02-21 10:22:16
1216 跟貼 1216
根據群眾舉報線索，省聯(lián)合督察組開展突擊檢查

政知新媒體 2026-02-22 09:27:06
3 跟貼 3
人氣火爆！江蘇無錫一景區(qū)發(fā)布限流公告

現(xiàn)代快報 2026-02-19 22:42:05
589 跟貼 589
于發(fā)友：推動大學從“知識應用”向“價值創(chuàng)造”轉型

中國教科院 2026-02-22 08:09:06
0 跟貼 0
用硅膠制作的美人魚模型，長得真是太恐怖了

樂活捕手 2026-02-19 08:18:06
13 跟貼 13
政務外網全流量分析系統(tǒng)研究與實踐

通信世界 2025-10-28 11:42:03
0 跟貼 0
春節(jié)餐桌添這道菜，肝癌風險降33%

河南都市頻道 2026-02-20 11:06:54
0 跟貼 0
大超市爆改文商旅綜合體，“金陵長樂坊”開市首日人氣爆棚

現(xiàn)代快報 2026-02-19 22:53:05
602 跟貼 602
熱聞|英超爭冠懸念重啟！奧賴利雙響，曼城2-1紐卡落后榜首阿森納2分

齊魯壹點 2026-02-22 07:02:14
8 跟貼 8
中國短道速滑隊創(chuàng)28年來最差戰(zhàn)績，“王濛說簽生死狀復出”登上熱搜第一，不是說遺憾，是滑得太難看了！

大象新聞 2026-02-21 15:44:03
92 跟貼 92
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1655 跟貼 1655
俄海軍面臨封鎖危機，和平解除無望，艦隊或強勢突破

辛苦的啊欣啊 2026-02-20 17:40:04
0 跟貼 0
臺州獲省投資“賽馬”激勵

臺州發(fā)布 2026-02-22 06:33:21
0 跟貼 0
趙心童闖入斯諾克球員錦標賽決賽

環(huán)球網資訊 2026-02-22 08:28:08
14 跟貼 14
李天馬失誤抱頭痛哭徐夢桃安慰:四年后咱們再來

上觀新聞 2026-02-21 22:13:18
360 跟貼 360

5歲外甥女過年給舅舅磕頭獲贈30斤重銀磚，價值30多萬元，家長退還后，舅舅改送了一塊價值1000多元帶“壓歲錢”字樣的銀磚

新智元

AI產業(yè)主平臺領航智能+時代

14567文章數(shù) 66631關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

數(shù)碼

親子

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

手機 / 數(shù)碼

房產 / 家居

剛剛，Anthropic 53頁絕密報告曝光：Claude自我逃逸，將引爆全球災難！

智譜上市1月漲5倍，市值超越京東、快手

河北"巧克力釣魚大爺"因病去世享年75歲 家屬發(fā)聲

河北"巧克力釣魚大爺"因病去世享年75歲 家屬發(fā)聲

徐夢桃：這是我第一塊銅牌 給我換個吉祥物

黃曉明澳門賭博輸十幾億 本人親自回應

特朗普新加征關稅稅率從10%提升至15%

態(tài)度原創(chuàng)

《FF7重制版》使用鑰匙卡非盈利考量 而是唯一選擇

2026中國電影票房暫列全球第一；小米17系列進軍全球市場

為什么小男孩小時候要比小女孩難養(yǎng)好多?網友：通常精力充沛

硬核揭秘！福建艦“一馬當先”底氣何在

河北"巧克力釣魚大爺"因病去世享年75歲家屬發(fā)聲

河北"巧克力釣魚大爺"因病去世享年75歲家屬發(fā)聲

徐夢桃：這是我第一塊銅牌給我換個吉祥物

黃曉明澳門賭博輸十幾億本人親自回應

《FF7重制版》使用鑰匙卡非盈利考量而是唯一選擇