<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      能力太強,Mythos被Anthropic“凍結”

      0
      分享至


      出品|虎嗅科技組

      作者|趙致格

      編輯|苗正卿

      頭圖|視覺中國

      4月8日,關注AI圈動態的極客們收到了一個好消息和一個壞消息。好消息是Anthropic那個被傳得神乎其神的新模型Claude Mythos終于發布了預覽版,而各種公開的數據也顯示出Mythos確實全方面碾壓了Opus4.6。

      但壞消息是,因為相關防護機制尚未成熟,Mythos當前不對公眾開放,Anthropic還為其定制了一個安全項目玻璃墻計劃(Project Glasswing)。根據這一安全項目,僅有12家機構能訪問Mythos。與此同時,Anthropic還承諾提供最高1億美元的模型使用額度,用于防御性網絡安全研究。


      過去一段時間,關于Mythos的傳聞一直在滿天飛。早在3月26日,Anthropic的一個內容管理系統出現了錯誤,曝光了一篇還沒有正式發布的草稿。這篇草稿稱Mythos是“史上最強大的模型”。

      X上同樣有人爆料稱,某家實驗室完成了迄今為止最大的一次成功訓練,而新模型的表現遠遠超過內部預期,也超過了大家根據模型縮放定律(scaling law)能預測的水平。


      雖然普通人無法親自體會這個傳說中的又一次“GPT時刻”,但Anthropic公布的一系列數據確實顯示出Mythos 強得可怕。

      在專業漏洞復現測試CyberGym上,Mythos的得分是83.1%,而此前Anthropic 的最強模型Opus4.6的分數是66.6%。


      在編程能力方面,Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測試分數均顯著高于Opus4.6。Anthropic稱,新模型的能力已經達到“可以與最頂尖人類安全專家競爭”的水平。

      在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。


      Mythos不僅是在編程能力上表現強悍。在研究生水平科學問答測試(GPQA Diamond)測試中,Mythos以94.6%的分數超過Opus4.6的91.3%;在Humanity‘s Last Exam的有工具和無工具測試中,Mythos 56.8%和64.7%的分數均超過Opus4.6十個百分點。

      在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

      不過,上述維護的優異表現并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強了。

      理論上,所有軟件都可能會有漏洞,但是Mythos在發現并攻擊漏洞上的能力遠超人類水平。根據Anthropic的博文介紹,Mythos已經在在操作系統、網絡瀏覽器和其他軟件中發現了“幾千個”重大漏洞,其中包括OpenBSD中一個存在27年的錯誤,以及FFmpeg中一個存在16年、在自動測試工具運行500萬次后仍未被檢測到的漏洞。

      可以說,全世界所有的軟件和系統在Mythos面前都顯得漏洞百出,脆弱不堪。假如Mythos的能力在當下被黑客掌握,無疑會有無數數字基礎設施會遭殃。

      Anthropic的CEO達里奧·阿莫迪(Dario Amodei)Mythos發布的同時也在X上表達了自己的擔憂和信心。他表示:“網絡安全是前沿AI模型帶來的首個明確且現實的危險,但絕不會是最后一個。若我們能共同迎接挑戰、應對這一風險,這或將成為一份藍圖,用以解決未來更為艱巨的挑戰。”

      達里奧隨后又進一步解釋:“一旦應對失誤,其危險顯而易見;但倘若應對得當,我們將真正迎來機遇:建造一個比AI網絡安全能力出現之前更加安全的互聯網與世界。”


      面對AI發展帶來的危險和機遇,Anthropic 提出的應對方法是發起玻璃翼計劃(Project Glasswing)。這個項目將向特定組織開放其未公開發布的通用AI模型“Claude Mythos預覽版”,用于防御性網絡安全工作。12個合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達、CrowdStrike和Palo Alto Networks等科技與網絡安全公司。


      這12家公司覆蓋了云計算、瀏覽器、芯片、金融基礎設施、操作系統等各個領域的巨頭。可以說,全球數字基礎設施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級的AI模型,補上現有的系統漏洞。

      一直以來,Anthropic都被認為是最重視安全的AI的科技公司,不過與之伴隨的也有不少爭議,很多人認為Anthropic只是說說漂亮話,真實目的是想通過提升AI安全標準來提升中小公司的入場門檻。

      但就此次的玻璃翼計劃(Project Glasswing)而言,Anthropic的行動無疑是值得人們贊許的。在研發出了最強模型后,Anthropic沒有將它第一時間推向市場謀取最大曝光,而是先讓全球信息基礎設施來完善自己,為全球軟件安全筑起新一代屏障,也為為未來高風險 AI 治理提供了可復制的藍圖。

      本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4848866.html?f=wyxwapp

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      接觸10秒即可感染!天津人注意!看到立即報告!

      接觸10秒即可感染!天津人注意!看到立即報告!

      天津族
      2026-04-08 07:33:54
      王寶強帶女友青島度假,馮清開大G氣場全開,身高差真像小嬌夫?

      王寶強帶女友青島度假,馮清開大G氣場全開,身高差真像小嬌夫?

      娛樂領航家
      2026-04-08 20:30:04
      歐冠太殘酷了:隨著馬競2-0,大巴黎2-0,拜仁2-1,3大豪門瀕臨出局

      歐冠太殘酷了:隨著馬競2-0,大巴黎2-0,拜仁2-1,3大豪門瀕臨出局

      側身凌空斬
      2026-04-09 05:20:13
      4月必辦!2個證件全國發放,人人都有,沒領的抓緊辦

      4月必辦!2個證件全國發放,人人都有,沒領的抓緊辦

      混沌錄
      2026-04-08 18:28:12
      中國代表:涉霍爾木茲海峽決議草案若通過 將產生極為嚴重后果

      中國代表:涉霍爾木茲海峽決議草案若通過 將產生極為嚴重后果

      環球網資訊
      2026-04-08 06:11:44
      浙江金華一佳人太漂亮了,仙姿玉色,貌美如花,絕世佳人不過如此

      浙江金華一佳人太漂亮了,仙姿玉色,貌美如花,絕世佳人不過如此

      陳意小可愛
      2026-04-09 04:13:18
      1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

      1986年,顧城與謝燁在成都公園的留影,最后卻親手殺妻,上吊自盡

      浩渺青史
      2026-04-06 17:19:29
      社保基金會:堅決擁護黨中央決定

      社保基金會:堅決擁護黨中央決定

      新京報
      2026-04-07 21:41:14
      因尺度炸裂引發爭議,這5部黃暴劇集,每部都值得收藏

      因尺度炸裂引發爭議,這5部黃暴劇集,每部都值得收藏

      小微看電影
      2026-02-12 09:50:03
      嫣然回應陳光標捐千萬!錢已收到,但無法解決租金,律師再曝猛料

      嫣然回應陳光標捐千萬!錢已收到,但無法解決租金,律師再曝猛料

      云景侃記
      2026-04-08 20:03:45
      不到2小時,油價暴跌40%,人民幣暴漲1000點,國內油價會降嗎?

      不到2小時,油價暴跌40%,人民幣暴漲1000點,國內油價會降嗎?

      哄動一時啊
      2026-04-08 22:21:54
      歐冠0-2,利物浦鎩羽而歸,不敵法甲霸主,命懸一線,瀕臨出局

      歐冠0-2,利物浦鎩羽而歸,不敵法甲霸主,命懸一線,瀕臨出局

      側身凌空斬
      2026-04-09 04:52:41
      醫生告誡:每天睡前玩手機的人,不用半年時間,睡眠或有這6變化

      醫生告誡:每天睡前玩手機的人,不用半年時間,睡眠或有這6變化

      白話電影院
      2026-04-05 15:34:47
      35歲傅彪兒子,住豪宅生活奢華,單身滿頭白發,走上了“不歸路”

      35歲傅彪兒子,住豪宅生活奢華,單身滿頭白發,走上了“不歸路”

      林輕吟
      2026-04-02 19:51:37
      拼多多3元一斤的豬肺,我哭著看完評論區

      拼多多3元一斤的豬肺,我哭著看完評論區

      風味人間
      2026-04-08 12:33:00
      在岸人民幣兌美元匯率升至2023年3月以來最高水平

      在岸人民幣兌美元匯率升至2023年3月以來最高水平

      每日經濟新聞
      2026-04-08 09:54:06
      國家一級女演員陳麗云被逮捕!

      國家一級女演員陳麗云被逮捕!

      許三歲
      2026-03-28 09:24:30
      遠洋版李子柒,“海上廚子”火成真人海綿寶寶

      遠洋版李子柒,“海上廚子”火成真人海綿寶寶

      酷玩實驗室
      2026-04-08 10:10:11
      彩票出現斷崖式暴跌,“花2元中500萬”沒人信了?原因引人深思

      彩票出現斷崖式暴跌,“花2元中500萬”沒人信了?原因引人深思

      平說財經
      2026-02-12 16:27:02
      宋志勇,明確為正部長級

      宋志勇,明確為正部長級

      界面新聞
      2026-04-07 20:19:05
      2026-04-09 06:24:49
      虎嗅APP incentive-icons
      虎嗅APP
      個性化商業資訊與觀點交流平臺
      26070文章數 687664關注度
      往期回顧 全部

      科技要聞

      造出地表最強AI,卻死活不給你用!

      頭條要聞

      特朗普認為北約未通過“考驗” 將考慮“退群”

      頭條要聞

      特朗普認為北約未通過“考驗” 將考慮“退群”

      體育要聞

      40歲,但實力倒退12年

      娛樂要聞

      侯佩岑全家悉尼度假,一家四口幸福滿溢

      財經要聞

      天津海河乳業回應直播間涉黃

      汽車要聞

      20萬級滿配華為全家桶 華境S是懂家庭的大六座

      態度原創

      本地
      藝術
      手機
      房產
      公開課

      本地新聞

      跟著歌聲游安徽,聽古村回響

      藝術要聞

      陸儼少大氣山水手卷18幅

      手機要聞

      三星據傳拿下蘋果折疊屏面板三年獨家供應 今年出貨預期300萬臺

      房產要聞

      正式動工!珠城馬場地塊,簽約華爾道夫!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版