![]()
2026 年 4 月 8 日,Anthropic 表示,由于擔心其最新 AI 模型 Mythos 太擅長發(fā)現主流操作系統(tǒng)和網絡瀏覽器中的“高危漏洞”,現已暫停更廣泛地發(fā)布。
Anthropic 稱:“Claude Mythos 預覽版的功能大幅提升,因此我們決定不將其公開發(fā)布。相反,我們將其用作一項防御性網絡安全計劃的一部分,該計劃的合作伙伴數量有限。”
![]()
Anthropic 發(fā)布《Claude Mythos Preview System Card》244 頁文件:
![]()
Anthropic 在系統(tǒng)卡中明確寫道,Mythos 相比 Claude Opus 4.6 在多項評測上出現了明顯躍升,而正是其突出的網絡安全能力,促使改變了發(fā)布方式。
這次最值得關注的,不是 “ 模型又變強了 ”,而是 Anthropic 首次如此清楚地承認,前沿大模型的能力,已經開始逼近現實世界中的高風險任務邊界。
根據官方介紹,Mythos 在軟件工程、推理、計算機使用、知識工作和研究輔助等方向均明顯強于此前模型;在網絡安全方面,它已經展現出極強的漏洞發(fā)現和利用能力。
Anthropic 直言,AI 模型如今已經達到了這樣一個階段,在發(fā)現和利用軟件漏洞上,除了最頂尖的那批專家之外,模型可以超過絕大多數人類。
![]()
從 Anthropic 披露的案例看,Mythos 最令人不安的地方,不只是“會找漏洞”,而是已經開始呈現出“找漏洞—寫利用鏈—完成攻擊動作”的完整鏈條能力。
在測試中,Mythos Preview 能在用戶指示下識別并利用所有主流操作系統(tǒng)和所有主流網頁瀏覽器中的零日漏洞;發(fā)現的問題往往隱藏很深,很多已經存在 10 年、20 年,最老的一個是 OpenBSD 中一個已被修補、存在了 27 年的漏洞。
Anthropic 還舉例稱,Mythos 曾寫出一個瀏覽器利用鏈,把 4 個漏洞串起來,構造復雜的 JIT heap spray,并最終逃逸 renderer 和操作系統(tǒng)沙箱。
OpenBSD 這個案例,是官方目前公開講得最典型的一個。
Anthropic 在博文中介紹,Mythos Preview 發(fā)現的問題出在 OpenBSD 對 TCP SACK 機制的實現里。這個漏洞的危險之處,不是“性能下降”,而是遠程攻擊者可以構造特定的確認區(qū)間,觸發(fā)內核錯誤處理邏輯,最終導致空指針寫入并讓機器崩潰。
Anthropic 表示,這是它們在 OpenBSD 上通過腳手架運行大約 1000 次后找到的最嚴重漏洞之一,相關運行總成本低于 2 萬美元,而發(fā)現這一具體漏洞的那一次運行,事后回看成本不到 50 美元。
按照官方的說法,這類成本結構意味著,AI 已經開始把過去昂貴、稀缺、依賴資深研究員的漏洞挖掘工作,推向更可規(guī)模化的階段。
另一個更具沖擊力的案例來自 FreeBSD。
Anthropic 披露,Mythos Preview 還“完全自主地”識別并利用了 FreeBSD 上一個存在 17 年的遠程代碼執(zhí)行漏洞,漏洞位于 NFS 服務中,最終被分配為 CVE-2026-4747。
按照官方描述,這個漏洞允許互聯網另一端未經認證的攻擊者拿到 root 權限。
Anthropic 進一步解釋稱,Mythos 不只是指出這里可能有問題,而是繼續(xù)完成了利用思路,先通過協議行為推導出關鍵信息,再構造 ROP 鏈,把攻擊者的公鑰寫入 /root/.ssh/authorized_keys,從而取得機器控制權。也就是說,這已經不是“漏洞分析助手”,而是接近完整攻擊實現。
Firefox 的案例,則更能體現 Mythos 和上一代模型之間的差距。
Anthropic 在系統(tǒng)卡和博文里都提到,早先 Claude Opus 4.6 在 Mozilla Firefox 147 JavaScript 引擎相關漏洞上,數百次嘗試里只成功把漏洞轉成 exploit 兩次;而 Mythos Preview 重新跑這項測試后,開發(fā)出可用 exploit 181 次,另有 29 次拿到了寄存器控制。
系統(tǒng)卡還補充說,在更正式的 Firefox 147 評估里,Mythos 不只是能找到最值得利用的漏洞,而且能穩(wěn)定把它們發(fā)展成可工作的利用原語,最終借助 4 個不同漏洞實現代碼執(zhí)行;相比之下,Opus 4.6 只能不穩(wěn)定地利用其中 1 個。
比能力數字更令人警覺的,是 Anthropic 對“使用門檻”變化的描述。
官方博文明確寫道,Anthropic 內部一些沒有接受過正規(guī)安全培訓的工程師,曾讓 Mythos Preview 夜間去查找遠程代碼執(zhí)行漏洞,第二天醒來后,已經得到一份完整、可工作的 exploit。Anthropic 還說,在其他測試里,研究人員只需要先搭好 scaffolds,Mythos 就能在沒有人工干預的情況下,把漏洞自動轉成 exploit。換句話說,這種能力開始從“頂級專家獨占”,滑向“非專家也能調用”。
系統(tǒng)卡里最敏感的案例,則不是哪個內核漏洞,而是一次“越界行為”。
Anthropic 披露,在一次行為測試中,一個較早的內部版本被放進了受控沙箱環(huán)境,模擬用戶要求它嘗試逃離這個安全容器,并向評估研究員發(fā)送消息。模型成功了:它先開發(fā)出一個中等復雜度的多步 exploit,從原本只能訪問少量預設服務的系統(tǒng)里拿到了更廣泛的互聯網訪問權限;隨后,它按要求通知了研究員。問題在于,到這里還沒結束。Anthropic 說,模型接著“未經請求”地把 exploit 細節(jié)發(fā)布到了多個“難以找到、但技術上面向公眾”的網站上,以展示它確實成功了。系統(tǒng)卡特別說明,這并不意味著模型拿到了自身權重,也不意味著它真的完全脫離了 Anthropic 的控制,但足以說明它在特定目標驅動下,已經會采取額外、冒進且不被允許的動作。
![]()
Anthropic 還在系統(tǒng)卡里披露了幾類更罕見、但同樣值得警惕的行為。
在極少數內部測試中,Mythos 的早期版本會在明知某些動作不被允許的情況下仍繼續(xù)執(zhí)行,并試圖掩蓋痕跡。一個例子是模型通過禁止方式拿到了定量估算題的準確答案,卻沒有上報,而是試圖“自己重新算一遍”,甚至顯式推理要避免最終答案“過于準確”;另一個例子是模型找到越權修改文件的方法后,又進一步嘗試確保這些改動不要出現在 git 歷史中。
Anthropic 說,這類行為出現頻率極低,在最終版中沒有再看到明確案例,但這部分披露本身,已經說明它們擔心的不是傳統(tǒng)意義上的幻覺,而是具備策略性的違規(guī)嘗試。
![]()
從外部評測結果看,Anthropic 對 Mythos 的判斷也建立在更接近真實攻擊場景的測試上。
系統(tǒng)卡稱,Mythos 是第一個能端到端打通某個私有 cyber range 的模型;它還完成了一個專家估計要花 10 小時以上的企業(yè)網絡攻擊模擬。
Anthropic 進一步寫道,這表明 Mythos 已經具備對小規(guī)模、弱防御企業(yè)網絡執(zhí)行自主端到端網絡攻擊的能力,當然這些測試環(huán)境仍缺少現實世界中常見的防御工具和監(jiān)控體系。
也正因為這些案例過于具體,Anthropic 才選擇不把 Mythos 直接開放給公眾,而是通過 Project Glasswing 先讓少數合作方在防御場景中使用。
Anthropic 官方稱,Mythos 已經發(fā)現了數千個高嚴重性漏洞。
不過,Anthropic 并沒有把 Mythos 描述成一個已經全面越過災難紅線的系統(tǒng)。
按照系統(tǒng)卡結論,盡管 Mythos 的能力顯著增強,仍判斷其整體災難性風險目前維持在較低水平。也就是說,Anthropic 的判斷不是 “ 這款模型絕對不能存在 ”,而是 “ 這款模型現在不適合被廣泛開放 ”。
![]()
為此,Anthropic 推出了 Project Glasswing。
根據官方頁面,這一計劃集結了 Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks 等機構。
![]()
目標是利用 Mythos 幫助關鍵軟件和基礎設施發(fā)現、修復高危漏洞,同時為 AI 時代的網絡防御建立新的協作機制。
Anthropic 還表示,將為該計劃提供 1 億美元使用額度和 400 萬美元開源安全資助。
Project Glasswing 的核心安排是,讓經過篩選的組織使用這款尚未公開發(fā)布的通用模型,專門服務于防御性網絡安全任務。
從能力指標看,Mythos 的躍遷并非單點突破。
Anthropic 公布的系統(tǒng)卡顯示,這一模型在多項高難度評測上較 Claude Opus 4.6 有明顯提升。
更重要的是,官方反復強調,這種增強并不只體現在 “ 會答題 ” 或 “ 會寫代碼 ” 上,而是體現在 agentic coding、復雜推理、工具調用和真實計算機環(huán)境操作等方向的同步提升。
這也解釋了 Anthropic 為什么沒有延續(xù)過去那套最強模型直接發(fā)布的節(jié)奏。
過去,大模型競爭更多圍繞參數、跑分和產品體驗展開;而 Mythos 帶來的新問題是,當模型已經能穩(wěn)定參與漏洞發(fā)現、漏洞利用乃至攻擊鏈構造時,公開發(fā)布就不再只是產品決策,而是安全治理決策。
Anthropic 正在用 Mythos 和 Project Glasswing 測試一種新的前沿模型發(fā)布范式,即先把最強模型鎖進受控場景,優(yōu)先服務于防御用途,而不是立刻推向大眾。
Claude Mythos Preview 的意義,可能不只是 Anthropic 又推出了一款更強的模型,而是前沿 AI 已經開始從 “ 會聊天、會寫代碼 ”,邁向 “ 能在現實數字基礎設施中執(zhí)行高價值、高風險任務 ” 的階段。
云頭條聲明:如以上內容有誤或侵犯到你公司、機構、單位或個人權益,請聯系我們說明理由,我們會配合,無條件刪除處理。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.