網易首頁 > 網易號 > 正文申請入駐

能力太強，Mythos被Anthropic“凍結”

2026-04-09 03:25:07　來源: 虎嗅APP

北京舉報

分享至

出品｜虎嗅科技組

作者｜趙致格

編輯｜苗正卿

頭圖｜視覺中國

4月8日，關注AI圈動態的極客們收到了一個好消息和一個壞消息。好消息是Anthropic那個被傳得神乎其神的新模型Claude Mythos終于發布了預覽版，而各種公開的數據也顯示出Mythos確實全方面碾壓了Opus4.6。

但壞消息是，因為相關防護機制尚未成熟，Mythos當前不對公眾開放，Anthropic還為其定制了一個安全項目玻璃墻計劃（Project Glasswing）。根據這一安全項目，僅有12家機構能訪問Mythos。與此同時，Anthropic還承諾提供最高1億美元的模型使用額度，用于防御性網絡安全研究。

過去一段時間，關于Mythos的傳聞一直在滿天飛。早在3月26日，Anthropic的一個內容管理系統出現了錯誤，曝光了一篇還沒有正式發布的草稿。這篇草稿稱Mythos是“史上最強大的模型”。

X上同樣有人爆料稱，某家實驗室完成了迄今為止最大的一次成功訓練，而新模型的表現遠遠超過內部預期，也超過了大家根據模型縮放定律（scaling law）能預測的水平。

雖然普通人無法親自體會這個傳說中的又一次“GPT時刻”，但Anthropic公布的一系列數據確實顯示出Mythos 強得可怕。

在專業漏洞復現測試CyberGym上，Mythos的得分是83.1%，而此前Anthropic 的最強模型Opus4.6的分數是66.6%。

在編程能力方面，Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測試分數均顯著高于Opus4.6。Anthropic稱，新模型的能力已經達到“可以與最頂尖人類安全專家競爭”的水平。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中，Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

Mythos不僅是在編程能力上表現強悍。在研究生水平科學問答測試（GPQA Diamond）測試中，Mythos以94.6%的分數超過Opus4.6的91.3%；在Humanity‘s Last Exam的有工具和無工具測試中，Mythos 56.8%和64.7%的分數均超過Opus4.6十個百分點。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中，Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

不過，上述維護的優異表現并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強了。

理論上，所有軟件都可能會有漏洞，但是Mythos在發現并攻擊漏洞上的能力遠超人類水平。根據Anthropic的博文介紹，Mythos已經在在操作系統、網絡瀏覽器和其他軟件中發現了“幾千個”重大漏洞，其中包括OpenBSD中一個存在27年的錯誤，以及FFmpeg中一個存在16年、在自動測試工具運行500萬次后仍未被檢測到的漏洞。

可以說，全世界所有的軟件和系統在Mythos面前都顯得漏洞百出，脆弱不堪。假如Mythos的能力在當下被黑客掌握，無疑會有無數數字基礎設施會遭殃。

Anthropic的CEO達里奧·阿莫迪（Dario Amodei）Mythos發布的同時也在X上表達了自己的擔憂和信心。他表示：“網絡安全是前沿AI模型帶來的首個明確且現實的危險，但絕不會是最后一個。若我們能共同迎接挑戰、應對這一風險，這或將成為一份藍圖，用以解決未來更為艱巨的挑戰。”

達里奧隨后又進一步解釋：“一旦應對失誤，其危險顯而易見；但倘若應對得當，我們將真正迎來機遇：建造一個比AI網絡安全能力出現之前更加安全的互聯網與世界。”

面對AI發展帶來的危險和機遇，Anthropic 提出的應對方法是發起玻璃翼計劃（Project Glasswing）。這個項目將向特定組織開放其未公開發布的通用AI模型“Claude Mythos預覽版”，用于防御性網絡安全工作。12個合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達、CrowdStrike和Palo Alto Networks等科技與網絡安全公司。

這12家公司覆蓋了云計算、瀏覽器、芯片、金融基礎設施、操作系統等各個領域的巨頭。可以說，全球數字基礎設施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級的AI模型，補上現有的系統漏洞。

一直以來，Anthropic都被認為是最重視安全的AI的科技公司，不過與之伴隨的也有不少爭議，很多人認為Anthropic只是說說漂亮話，真實目的是想通過提升AI安全標準來提升中小公司的入場門檻。

但就此次的玻璃翼計劃（Project Glasswing）而言，Anthropic的行動無疑是值得人們贊許的。在研發出了最強模型后，Anthropic沒有將它第一時間推向市場謀取最大曝光，而是先讓全球信息基礎設施來完善自己，為全球軟件安全筑起新一代屏障，也為為未來高風險 AI 治理提供了可復制的藍圖。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4848866.html?f=wyxwapp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.