我覺得,人類或許正在以一種超出常規認知的速度在被 AI 追趕。
不知道你們的現狀是怎樣的,至少我現在已經完全離不開 AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。
而且,這個比例還在持續提升。
與此同時,隨著一代又一代新模型的推出,不管是我的工作效率和質量,還是我在 Token 上的每月消費,都在快速增長。
昨晚我看了個消息,Anthropic 發布了一個連他們自己都不敢公開給所有人使用的模型,因為真的太強了。
這個新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。
目前是預覽版,所以官方叫它「Mythos Preview」。不過,這次是以一個叫「Project Glasswing」的項目形式推出的。
關于這個項目,我后面會講。
![]()
上個月,Anthropic 一份內部文檔意外泄露,里面提到有一個比 Opus 更大、更強的模型正在開發,代號就是 Mythos。
隨后,Anthropic 把這次泄露歸因于「人為錯誤」,也沒有進一步說明理由。
現在,這個代號是 Mythos 的模型算是正式官宣了。
官宣歸官宣,但它并沒有公開發布上線。也就是說,普通用戶還不能使用。
原因很直接,Anthropic 覺得這個模型太強了,在安全機制到位之前不適合向所有人開放。
我覺得,這句話值得停下來想一秒。
通常,一家 AI 公司發布新模型巴不得第一時間上線搶占市場,但這次 Anthropic 的做法明顯有點反常。
在我看來,不是他們不想發,而是不敢發。
因為,這個叫 Mythos 的模型的確很強大。
先看幾個官方公布的測試數據。
在編碼能力上,Mythos 和目前公開最強的 Claude Opus 4.6 之間的差距不小,在各項基準測試中,Mythos 基本是完勝 Opus 4.6。
![]()
推理能力上,在 GPQA Diamond(研究生水平科學問答)測試中,結果是 94.6% vs 91.3%,Mythos 勝。
在 Humanity's Last Exam 有工具和無工具測試中,也都是 Mythos 完勝。
![]()
跟 Agent 有關的計算機操作能力上,OSWorld-Verified(自主完成電腦任務),Mythos 以 79.6% 超過 Oputs 4.6 的 72.7%。
每一個維度上,Mythos 都強于 Opus 4.6,有些甚至是碾壓式超過。
![]()
在一些任務表現上,差距已經不是小步迭代,而是大幅躍升。比如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。
讓他們不敢上線 Mythos 的一個最核心原因,就是它突破軟件世界的安全防線能力太強了。
說白了,全世界所有的系統和軟件都有漏洞,而 Mythos 可以用超過人類的水平發現并攻擊這些漏洞。
假設,這種能力被黑客掌握,那全世界的操作系統和軟件都會遭殃,尤其是一些公共基礎設施和國家安全。
Anthropic 在公告里有這么一句話,看完后我覺得細思極恐。
![]()
翻譯過來就是:「 AI 模型的編碼能力已經達到了極高水平,在發現和利用軟件漏洞方面,它們幾乎可以超越除最熟練的人類之外的所有人」。
關于這句話,我想多展開一下。
我是程序員出身,所以我知道軟件的構建方式是怎樣的,以及不同人寫出來的代碼差異有多大。
還有,沒有哪個軟件敢說自己沒有漏斗,即便這個漏洞從來沒被發現過。
以前的漏洞之所以能幾十年安靜地躺在系統里,并不是因為系統足夠安全。
而是因為找漏洞這件事,需要極高的專業能力,極大的耐心和精力,以及大量的時間。
會的人太少,敢投入的人就更少了。
這種「能力稀缺」,構成了整個軟件安全世界的隱性前提。AI 介入之后,這個前提就開始松動了。
AI 能以超過大多數非頂尖人類能力的方式開展工作,我們可以用它來攻擊漏洞,當然也可以用它來堵住漏洞。
為了解決這個問題,接下來我說下 Anthropic 搞的這個 Project Glasswing 是什么。
簡單說,這是一個利用 Mythos 的能力幫全世界基礎設施系統找 bug 的項目。
參與方包括 AWS、蘋果、微軟、谷歌、英偉達、思科、Linux 基金會等共計 12 家機構。
![]()
這個陣容覆蓋了云計算、操作系統、芯片、瀏覽器、金融基礎設施、網絡安全和開源生態。
換句話說,全球數字基礎設施的核心參與者幾乎都在這個項目里了。
這個項目的核心邏輯只有一條,讓防守方先用上這個頂級 AI 模型的能力。
因為如果攻擊方先拿到同等級的工具,窗口一旦打開就很難關上。Anthropic 承諾提供 1 億美元的模型使用額度,覆蓋研究預覽期。
除了 12 家核心機構,還有超過 40 個維護關鍵軟件基礎設施的組織獲得了訪問權限,可以用 Mythos 掃描自家系統和開源項目。
同時,Anthropic 向 Linux 基金會捐了 250 萬美元,向 Apache 軟件基金會捐了 150 萬美元,這二者都是軟件世界的基礎設施。
這么說吧,我們現在使用的各種 App、網站、系統,基本上都是以他們為底層架構的。
在我看來,Anthropic 這次算是干了件好事,不僅推出了更強的模型,還花錢給全球信息基礎設施讓他們來完善自己。
畢竟,如果裸上的話,對誰都沒有好處。
可能說到這你還是感覺不到 Mythos 到底有多強,我從官方原文里看到了三個具體案例,我覺得比數字更能說明問題。
![]()
第一個,OpenBSD。
這是公認安全性極高的操作系統,很多關鍵基礎設施會跑在上面,包括我們用的蘋果手機 iOS 系統、Android 系統、甚至一些企業和機構內部系統。
Mythos 在里面發現了一個存在了 27 年的漏洞,攻擊者只要連上目標機器,就能讓它遠程崩潰。
27 年!不是沒人在意,是壓根沒人找到。
第二個,FFmpeg。
幾乎所有需要處理視頻的軟件都依賴它,你們用的各種視頻播放軟件基本上都有它的身影。
有個漏洞躲在一行寫于 16 年前的代碼里,自動化測試工具反復攻擊了整整 500 萬次,每次都沒找到。
但是,Mythos 找到了。
第三個,Linux 內核。
這個就不用多說了,基本上可以說是整個互聯網的基礎設施,也最值得警惕。
Mythos 不只是發現了幾個獨立漏洞,而是把多個漏洞串聯成一條攻擊鏈。
從普通用戶權限開始,一路提權,最終實現對整臺機器的完全控制。
關于 Linux 這個,和前兩個案例的性質完全不一樣。
找漏洞,是分析能力。
但串漏洞,就是策略能力了。
就像很多產品經理,會畫原型圖會寫文檔會做數據分析,這些是單點能力。但把業務、產品、商業串起來,就是策略能力了。
一個能規劃攻擊路徑的模型,已經不只是審計工具了,它更接近于一個可以在數字環境里主動行動的智能體。
以上三個案例,Anthropic 采取的都是先發現、先報告、先修復、再披露的方式,目前均已修復。
看到這,你就知道 Mythos 有多強了,就像一頭暫時不敢被放出籠的猛獸,現實世界需要先做好適應它的準備。
我想在這里說幾個觀察,或許也是接下來真正變化的開始。
第一,軟件世界的安全假設正在失效。
今天我們習以為常的軟件穩定性,并不完全來自系統設計足夠好。很大程度上,它依賴的是攻擊能力的稀缺。
說得直白點,不是軟件足夠強,而是人不夠強。
找漏洞需要成本,構造利用鏈需要時間,大規模掃描需要資源。所以很多技術債、陳年 bug、老舊系統就那樣活著,從沒被認真清理過。
就像我們做產品一樣,我們覺得邏輯閉環了,沒問題了,并不代表真的萬事無憂了,很可能是我們的能力上限到了。
Mythos 展現的能力,是漏洞從被發現到被利用的時間窗口從過去的幾個月被壓縮到了幾分鐘。
幾分鐘意味著什么?
意味著補丁的節奏,修復的流程,已經開始跟不上攻擊的速度了。
第二,開源世界會最先感受到壓力。
今天大多數現代軟件,底下都壓著大量開源依賴。平時看不見,一旦被打穿,就是全行業同時受影響。
可能有讀者不是很了解這個邏輯,用大白話說,就是我們現在使用的所有軟件都有開源項目作為底層,而這些項目的源代碼是對所有人可見的。
以后當模型能持續地、大規模地掃描開源項目,開源社區維護者們面對的壓力級別會完全不一樣。
這也是為什么 Anthropic 要給 Linux 基金會和 Apache 基金會捐錢的原因。
不是做公益,而是承認開源基礎設施是 AI 時代整個數字世界最脆弱、也最不能倒的那層地基,他們不想被當做壞人和惡人而已。
第三,人會被弱化,AI 開始和 AI 博弈。
以前互聯網產品安全團隊的價值,在于人的判斷力、經驗積累和對系統的深度理解。
未來,這件事會換個邏輯。
比的是誰的模型更強,誰的工具接得更快,誰能把 AI 審計嵌進開發流程的最前端。
這不是程序員被替代的問題,而是安全行業本身的生產方式會重組。
好的那面,是數千個高危漏洞可以在幾周內被找出來。麻煩的是,攻擊方遲早也會有同等級的工具。
到那個時候,軟件產品的安全不再是人和人的對抗,而是模型和模型之間的攻防博弈。
這次,Anthropic 不只發布了能力,還發布了風險。可能是目前這個階段,整個行業最需要看到的那種誠實。
所有人都在談 AI 如何改變工作效率,這沒毛病。
但 Mythos 也在提醒我們,AI 能力的躍最終會從內容世界傳導到軟件世界,再傳導到整個數字世界的基礎設施。
內容世界被改寫,影響的是流量邏輯。
軟件世界被改寫,動的是地基。
此時,我想起了電影《2012》里的一句臺詞,也作為這篇文章的結尾吧。
「無論你是誰,不分種族,不分國家,明天我們都沒有區別!」
PS:我很少寫這種長文,看到這你至少已經花了10分鐘,說明你是擁抱變化喜歡思考的人。那么,就來個點贊、在看、轉發,讓更多人加入對明天的期待中。
················· 唐韌出品 ·················
安可時刻
昨天看完 Mythos 的官方介紹后,我起身走到窗邊發了一會兒呆。
沒想什么,只是有點恍惚,而我的幾個 AI 員工還在電腦上幫我干活,有的在分析數據、有的在搭建文章框架、有的在寫項目文檔。
昨天我還新招了個 AI 員工,取名唐小藝,以后我所有的封面圖、海報、甚至我的日常攝影需求都交給他了。
![]()
以下,就是他給我「拍」的一張照片,還原了上面我描述的場景。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.