
整理 | 褚杏娟
眾所周知,Anthropic 一直把“AI 安全”掛在嘴邊,甚至把它當作公司最核心的自我定位。但就在今天,負責 AI 安全工作的研究員 Mrinank Sharma 宣布辭職,這件事本身就像一記反差極強的注腳:一個組織最強調的價值觀,卻最終無法留住最貼近它的人,那問題往往不只是個人選擇那么簡單。
在公開信里,Mrinank 說得很直白:這些年里,他一次又一次目睹“讓價值觀真正主導行動”有多難。他看見組織不斷面對各種壓力,于是最重要的事情被迫暫時擱置;而這種邏輯并不只發生在 Anthropic,而是整個社會層面的常態。
回看他在 Anthropic 的兩年,Mrinank 認為自己完成了當初來這里的初心。結束博士學業、搬到舊金山后,他幾乎把全部精力投入 AI 安全:研究 AI 迎合人類偏好的機制,搭建防范 AI 被用于生物恐怖主義的防御體系,并推動這些技術真正落地;他還參與撰寫了最早一批 AI 安全案例研究,為行業積累可復制的經驗。
在所有成果里,他尤其看重內部透明機制的建設,他認為這是組織把價值觀“落到行動上”的少數抓手之一。與此同時,他最后一個研究項目是關于 AI 助手是否可能削弱人性、扭曲人類本質的討論,也被他視為一個重要的階段性成果。
但正是在這種“越深入越貼近現實”的過程中,他越來越清楚:自己站在一個必須重新選擇方向的節點上。對他而言,當今世界的風險并不只來自 AI 或生物技術,而是多重系統性危機疊加的結果,真正危險的東西往往來自整體社會結構的不穩定。在組織內部的實踐中,他也反復體會到讓價值觀真正主導行動的難度。
于是,在持續反思現實環境與內心訴求的過程中,他決定去直面那些“不能被回避的問題”。這意味著離開原有體系,開啟新的探索。
離開后,他將搬回英國,并讓自己隱退一段時間。在推特評論區里,他提到自己也在嘗試進行心理治療。接下來,他希望把更多精力放在寫作上,把詩性認知與科學理性并置,作為理解現實、塑造技術的兩條同樣不可替代的路徑。他還計劃攻讀詩歌相關學位,持續練習公共表達,并深化自己在引導、教練、社區建設與群體協作方面的能力。
Mrinank 的離開也很快引發外界揣測與情緒化解讀。有網友嘲諷說:“看來 Anthropologie(故意寫錯以諷刺)真正關心 AI 安全的時代已經過去了?當安全問題影響收入時,他們就會把它放一邊。我們在泄露的 Soul 文檔里就看到了這一點,里面六次提到收入。”
雖帶偏見,但它也提出一個問題:Anthropic 的真實立場到底是什么?它確實比許多競爭對手更認真地談安全,也更公開地把風險放在臺面上,但與此同時,它又在全速推進開發一些自己也承認“可能極其危險”的工具。這家公司像是被撕成兩半:一半在剎車,一半在油門。
對安全的執著,像“宗教信仰“
這種撕裂并不是抽象的,它滲透在 Anthropic 的人才結構與組織氣質里。作為行業從業者,進入 Anthropic 的難度,被人形容為接近高中生或大學生進入 NFL 的概率。
前 Geoworks、Amazon、Google、Grab、Sourcegraph 員工 Steve Yegge 在過去四個月里和近 40 位 Anthropic 員工深入交流,從聯合創始人、高管到不同部門的一線成員,覆蓋研究、工程、市場、銷售、內容與產品。
他認識的每一個 Anthropic 員工幾乎都是“精英中的精英”,甚至比 Google 巔峰時期還夸張。他說“證據之一是 Google 當年居然錄用了我,而我在那群人里幾乎是最菜的”。現在幾乎所有頂級人才都在往那里聚集,而這種場景他以前見過不止一次。
Steve 還提到,Anthropic 這家公司非常“封閉”,員工心里都清楚:只要低調做事、閉嘴干活,將來基本都會非常富有。幾乎每一個在那里工作的人,都處在一種高度興奮又極其投入的狀態里:他們知道一件可能改變社會結構的大事正在發生,同時也隱約知道這件事對社會既可能是好事,也可能是巨大沖擊。
于是,他在 Anthropic 見到的每個人、每個團隊,都帶著一種奇妙的混合情緒:一半是興奮,一半是憂傷。幾乎每個人都處在一種高度興奮又極其投入的狀態里。所有人心里都清楚,一件可能改變整個社會的大事正在發生,同時也隱約知道,這對社會來說既可能是好事,也可能帶來巨大沖擊。
他甚至進一步推斷,Anthropic 員工們可能真的在為許多公司感到惋惜,因為太多企業根本沒有認真對待這場變革。2026 年可能成為壓垮大量公司的關鍵一年,而很多公司現在還沒意識到危險在逼近。Anthropic 一直試圖提醒外界,但這種提醒就像對一個一百年沒見過海嘯的沿海村莊喊“遠處發生了海底地震”,很難被認真對待。
這種“冷酷高效”的運轉方式,又與一個看似矛盾的根源綁定在一起:一種對使命極度執著的文化。
Anthropic 由一批前 OpenAI 員工創立,他們認為 OpenAI 在安全問題上過于松懈,尤其在“AI 對人類生存構成根本性風險”這件事上不夠嚴肅。久而久之,這種焦慮在公司內部演變成近似“信仰”的意識形態,而 CEO Dario Amodei 被視為精神領袖與思想象征。
據報道,他每個月兩次召集員工參加所謂的 “Dario Vision Quest”(DVQ),長時間演講如何構建與人類價值觀對齊的可信 AI 系統,也談地緣政治、勞動力市場沖擊等宏觀議題。接近公司的人甚至形容內部氛圍像一個“宗教團體”,員工在使命上高度一致,對 Amodei 懷有近乎信仰般的認同。
“你去問任何一個人為什么來這里工作,答案都會是:為了讓 AI 更安全。我們的存在意義,就是讓 AI 更安全。”首席工程師之一 Boris Cherny 說道。
“混亂”的內部
更有意思的是:這種使命感并沒有讓 Anthropic 變得“成熟穩定”,反而讓它保持一種反職業化的混亂。
很多員工都會用“混亂”來形容內部狀態。Steve 說,按體量來看,Anthropic 早該流程化、層級化、分工明確了,但它似乎根本不在乎這些。在關鍵領域,如生產系統、穩定性、安全性,他們確實非常嚴肅,有大量世界級 SRE 和擴展工程師在兜底。可真正驅動公司運轉的,是 Claude 不斷進化的產品形態,它像發動機一樣讓整個“蜂群”持續高速運轉。
Steve 說這家公司是被“氛圍”驅動的,他不覺得是在夸張:核心部門的內部環境翻滾沸騰,員工自己也把這種狀態叫做“靠感覺運行的蜂群大腦”。系統看起來脆弱,可能存在未知的擴展上限,但到目前為止,它確實維持住了這種運轉方式。
Steve 把這種狀態稱為“黃金時代”,即一個持續數年的高強度創新期,創造力爆炸、節奏極快、效率極高,同時迅速吸引行業最頂級的人才。Steve 自己經歷過兩次類似的階段,一次在 Amazon,持續到 2005 年離開;一次在 Google,大約持續到 2011 年 4 月,之后他親眼看著 Google 逐漸僵化,跨團隊協作消失、部門開始封閉,而 Amazon 卻繼續保持執行力與創新力。
他還舉了 Microsoft 在 2000 年代初期的例子:輸掉 Java 訴訟案后圍繞 C#/.NET 重建生態,那幾年也曾聚集頂級人才、成為思想領袖型公司,但后來同樣衰落,很多人最終轉投 Google。
在 Steve 看來,殺死創新機器的關鍵,往往不是“人才不行”,而是重心轉向利潤后,“工作量與人力數量”的比例關系被打破。他把這總結為一句話:真正的關鍵在于,是否存在“工作多于人”的狀態。
前 Amazon 首席工程師 Jacob Gabrielson 也有類似觀察:在 Amazon 很少發生搶項目,因為“每個人都始終略微超負荷工作”。而當 Google 在 2011 年后砍掉大量項目卻保留幾乎所有工程師,工作機會開始不足,資源爭奪、地盤意識、派系斗爭與內部政治就成了衰落起點。微軟內部甚至給這種行為起過外號,叫“舔餅干”,即搶占自己做不完的項目,只為了不讓別人拿走。今天很多公司已經默認在這種模式下運行。
而在 Anthropic,幾乎所有方向的工作都遠遠多于人力。它像站在一個不斷擴張的球體表面:混亂、伴隨成長陣痛,但幾乎沒有人需要為“有沒有活干”而內斗,因為機會像是無限的。每個人都能多次把想法拿出來試,“蜂群”系統會自然篩選出真正有價值的方向。
開發模式變成即興戲劇
在這樣的土壤里,Anthropic 形成了一種很不傳統的內部開發模式。Steve 認為未來的軟件開發可能會越來越像“蜂群大腦”:員工把工作方式形容為“是的,而且……”式的即興戲劇。每一個想法都會被接住、展開、品味,然后交給整個“蜂群”判斷價值,并不存在一個絕對中心化的決策權威。大家不斷嘗試、混合、探索,當真正的“魔法”出現時,所有人幾乎會同時意識到。
這更像一種洪水填充式的搜索,通過不斷拼接與試探,找到可以繼續推進的方向。因此,Steve 更傾向把它稱為“探索式開發”或“演化式開發”:不是先寫一份龐大的規格文檔,而是所有人圍坐在“篝火”旁一起構建。篝火中心是一個不斷變化、生長的原型系統,沒有瀑布流程,也沒有完整規格,只有極短的反饋回路和極快的迭代節奏。
在 Anthropic,90 天已經是最長計劃周期。在這種規模下,他們幾乎是在即興創作。Claude Cowork 從第一次被提出到公開發布只用了十天。按他們的說法,如今 Anthropic 工程師的生產效率比使用 Cursor 或聊天工具的普通工程師高 10 到 100 倍,而如果對比 2005 年的 Google 工程師,差距甚至可能上千倍。
從這個角度看,Anthropic 像一臺高速運轉的多臂老虎機:在極短時間內對大量想法下注、驗證,每個人都有機會試一次,只要你能做出來,就有人會去用。但“蜂群”同樣會排斥那些不愿意以“快樂工蜂”姿態參與其中的人:如果你太強調自我、太在意個人表現、太想搶中心位置,很快就會被系統排擠出去。用早期員工的原話就是:這里是“自我中心的終結”。
諷刺的是,絕大多數公司之所以能走到今天,靠的恰恰是不斷學會說“不”。而現在,“不敢拒絕”正在變成越來越大的問題。一位來自銷售部門的內部人士說,當下幾乎所有公司問的問題都可以歸結為兩個:第一,“一切還會好嗎?”第二,“五年后我們還存在嗎?”他們表面鎮定、專業、裝作什么都懂,但實際上幾乎都在恐慌。把這些問題聚類分析,你會發現背后全部是對未來的不確定與恐懼。
而撰稿人 Matteo Wong 也指出,Anthropic 在某種程度上與自己發生沖突,它對幾乎每一個決策都進行深度思考,甚至帶著焦慮。它既擔心自身技術被用于制造生物武器,也公開表達政治立場;它一邊批判自動化的傷害,一邊生產可能奪走崗位的工具;它談安全談到近乎道德姿態,卻又沒人真正認真考慮“把 AI 繁榮放慢下來”這件事。
有人在現場看到基于 Anthropic 技術的招聘外聯自動化工具,興奮地喊“這會摧毀整個行業”;而當作者詢問員工是否愿意放慢 AI 發展速度時,得到的回答從“行業能慢一半就好了”,到“AGI 最好 2032 年再來”,再到“慢幾個月可能就夠”,最后落在同一個信念上:AI 安全研究本身未來也可以被 Claude 自動化。一旦實現,他們相信測試體系就能跟上 AI 能力指數級增長的節奏。
https://steve-yegge.medium.com/the-anthropic-hive-mind-d01f768f3d7b
https://www.bloomberg.com/opinion/articles/2026-02-05/anthropic-ai-safety-obsession-is-its-secret-weapon
https://www.linkedin.com/feed/update/urn:li:activity:7422376409672867841/
會議推薦
InfoQ 2026 全年會議規劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產業落地,從技術前沿到行業應用,全面覆蓋 AI 與軟件開發核心賽道!集結全球技術先鋒,拆解真實生產案例、深挖技術與產業落地痛點,探索前沿領域、聚焦產業賦能,獲取實戰落地方案與前瞻產業洞察,高效實現技術價值轉化。把握行業變革關鍵節點,搶占 2026 智能升級發展先機!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.