網易首頁 > 網易號 > 正文申請入駐

Anthropic AI安全大佬裸辭看心理醫生！“宗教式”狂熱、極度“混亂”，內部開發正變成即興戲劇

2026-02-12 00:08:53　來源: InfoQ

北京舉報

分享至

整理 | 褚杏娟

眾所周知，Anthropic 一直把“AI 安全”掛在嘴邊，甚至把它當作公司最核心的自我定位。但就在今天，負責 AI 安全工作的研究員 Mrinank Sharma 宣布辭職，這件事本身就像一記反差極強的注腳：一個組織最強調的價值觀，卻最終無法留住最貼近它的人，那問題往往不只是個人選擇那么簡單。

在公開信里，Mrinank 說得很直白：這些年里，他一次又一次目睹“讓價值觀真正主導行動”有多難。他看見組織不斷面對各種壓力，于是最重要的事情被迫暫時擱置；而這種邏輯并不只發生在 Anthropic，而是整個社會層面的常態。

回看他在 Anthropic 的兩年，Mrinank 認為自己完成了當初來這里的初心。結束博士學業、搬到舊金山后，他幾乎把全部精力投入 AI 安全：研究 AI 迎合人類偏好的機制，搭建防范 AI 被用于生物恐怖主義的防御體系，并推動這些技術真正落地；他還參與撰寫了最早一批 AI 安全案例研究，為行業積累可復制的經驗。

在所有成果里，他尤其看重內部透明機制的建設，他認為這是組織把價值觀“落到行動上”的少數抓手之一。與此同時，他最后一個研究項目是關于 AI 助手是否可能削弱人性、扭曲人類本質的討論，也被他視為一個重要的階段性成果。

但正是在這種“越深入越貼近現實”的過程中，他越來越清楚：自己站在一個必須重新選擇方向的節點上。對他而言，當今世界的風險并不只來自 AI 或生物技術，而是多重系統性危機疊加的結果，真正危險的東西往往來自整體社會結構的不穩定。在組織內部的實踐中，他也反復體會到讓價值觀真正主導行動的難度。

于是，在持續反思現實環境與內心訴求的過程中，他決定去直面那些“不能被回避的問題”。這意味著離開原有體系，開啟新的探索。

離開后，他將搬回英國，并讓自己隱退一段時間。在推特評論區里，他提到自己也在嘗試進行心理治療。接下來，他希望把更多精力放在寫作上，把詩性認知與科學理性并置，作為理解現實、塑造技術的兩條同樣不可替代的路徑。他還計劃攻讀詩歌相關學位，持續練習公共表達，并深化自己在引導、教練、社區建設與群體協作方面的能力。

Mrinank 的離開也很快引發外界揣測與情緒化解讀。有網友嘲諷說：“看來 Anthropologie（故意寫錯以諷刺）真正關心 AI 安全的時代已經過去了？當安全問題影響收入時，他們就會把它放一邊。我們在泄露的 Soul 文檔里就看到了這一點，里面六次提到收入。”

雖帶偏見，但它也提出一個問題：Anthropic 的真實立場到底是什么？它確實比許多競爭對手更認真地談安全，也更公開地把風險放在臺面上，但與此同時，它又在全速推進開發一些自己也承認“可能極其危險”的工具。這家公司像是被撕成兩半：一半在剎車，一半在油門。

對安全的執著，像“宗教信仰“

這種撕裂并不是抽象的，它滲透在 Anthropic 的人才結構與組織氣質里。作為行業從業者，進入 Anthropic 的難度，被人形容為接近高中生或大學生進入 NFL 的概率。

前 Geoworks、Amazon、Google、Grab、Sourcegraph 員工 Steve Yegge 在過去四個月里和近 40 位 Anthropic 員工深入交流，從聯合創始人、高管到不同部門的一線成員，覆蓋研究、工程、市場、銷售、內容與產品。

他認識的每一個 Anthropic 員工幾乎都是“精英中的精英”，甚至比 Google 巔峰時期還夸張。他說“證據之一是 Google 當年居然錄用了我，而我在那群人里幾乎是最菜的”。現在幾乎所有頂級人才都在往那里聚集，而這種場景他以前見過不止一次。

Steve 還提到，Anthropic 這家公司非常“封閉”，員工心里都清楚：只要低調做事、閉嘴干活，將來基本都會非常富有。幾乎每一個在那里工作的人，都處在一種高度興奮又極其投入的狀態里：他們知道一件可能改變社會結構的大事正在發生，同時也隱約知道這件事對社會既可能是好事，也可能是巨大沖擊。

于是，他在 Anthropic 見到的每個人、每個團隊，都帶著一種奇妙的混合情緒：一半是興奮，一半是憂傷。幾乎每個人都處在一種高度興奮又極其投入的狀態里。所有人心里都清楚，一件可能改變整個社會的大事正在發生，同時也隱約知道，這對社會來說既可能是好事，也可能帶來巨大沖擊。

他甚至進一步推斷，Anthropic 員工們可能真的在為許多公司感到惋惜，因為太多企業根本沒有認真對待這場變革。2026 年可能成為壓垮大量公司的關鍵一年，而很多公司現在還沒意識到危險在逼近。Anthropic 一直試圖提醒外界，但這種提醒就像對一個一百年沒見過海嘯的沿海村莊喊“遠處發生了海底地震”，很難被認真對待。

這種“冷酷高效”的運轉方式，又與一個看似矛盾的根源綁定在一起：一種對使命極度執著的文化。

Anthropic 由一批前 OpenAI 員工創立，他們認為 OpenAI 在安全問題上過于松懈，尤其在“AI 對人類生存構成根本性風險”這件事上不夠嚴肅。久而久之，這種焦慮在公司內部演變成近似“信仰”的意識形態，而 CEO Dario Amodei 被視為精神領袖與思想象征。

據報道，他每個月兩次召集員工參加所謂的 “Dario Vision Quest”（DVQ），長時間演講如何構建與人類價值觀對齊的可信 AI 系統，也談地緣政治、勞動力市場沖擊等宏觀議題。接近公司的人甚至形容內部氛圍像一個“宗教團體”，員工在使命上高度一致，對 Amodei 懷有近乎信仰般的認同。

“你去問任何一個人為什么來這里工作，答案都會是：為了讓 AI 更安全。我們的存在意義，就是讓 AI 更安全。”首席工程師之一 Boris Cherny 說道。

“混亂”的內部

更有意思的是：這種使命感并沒有讓 Anthropic 變得“成熟穩定”，反而讓它保持一種反職業化的混亂。

很多員工都會用“混亂”來形容內部狀態。Steve 說，按體量來看，Anthropic 早該流程化、層級化、分工明確了，但它似乎根本不在乎這些。在關鍵領域，如生產系統、穩定性、安全性，他們確實非常嚴肅，有大量世界級 SRE 和擴展工程師在兜底。可真正驅動公司運轉的，是 Claude 不斷進化的產品形態，它像發動機一樣讓整個“蜂群”持續高速運轉。

Steve 說這家公司是被“氛圍”驅動的，他不覺得是在夸張：核心部門的內部環境翻滾沸騰，員工自己也把這種狀態叫做“靠感覺運行的蜂群大腦”。系統看起來脆弱，可能存在未知的擴展上限，但到目前為止，它確實維持住了這種運轉方式。

Steve 把這種狀態稱為“黃金時代”，即一個持續數年的高強度創新期，創造力爆炸、節奏極快、效率極高，同時迅速吸引行業最頂級的人才。Steve 自己經歷過兩次類似的階段，一次在 Amazon，持續到 2005 年離開；一次在 Google，大約持續到 2011 年 4 月，之后他親眼看著 Google 逐漸僵化，跨團隊協作消失、部門開始封閉，而 Amazon 卻繼續保持執行力與創新力。

他還舉了 Microsoft 在 2000 年代初期的例子：輸掉 Java 訴訟案后圍繞 C#/.NET 重建生態，那幾年也曾聚集頂級人才、成為思想領袖型公司，但后來同樣衰落，很多人最終轉投 Google。

在 Steve 看來，殺死創新機器的關鍵，往往不是“人才不行”，而是重心轉向利潤后，“工作量與人力數量”的比例關系被打破。他把這總結為一句話：真正的關鍵在于，是否存在“工作多于人”的狀態。

前 Amazon 首席工程師 Jacob Gabrielson 也有類似觀察：在 Amazon 很少發生搶項目，因為“每個人都始終略微超負荷工作”。而當 Google 在 2011 年后砍掉大量項目卻保留幾乎所有工程師，工作機會開始不足，資源爭奪、地盤意識、派系斗爭與內部政治就成了衰落起點。微軟內部甚至給這種行為起過外號，叫“舔餅干”，即搶占自己做不完的項目，只為了不讓別人拿走。今天很多公司已經默認在這種模式下運行。

而在 Anthropic，幾乎所有方向的工作都遠遠多于人力。它像站在一個不斷擴張的球體表面：混亂、伴隨成長陣痛，但幾乎沒有人需要為“有沒有活干”而內斗，因為機會像是無限的。每個人都能多次把想法拿出來試，“蜂群”系統會自然篩選出真正有價值的方向。

開發模式變成即興戲劇

在這樣的土壤里，Anthropic 形成了一種很不傳統的內部開發模式。Steve 認為未來的軟件開發可能會越來越像“蜂群大腦”：員工把工作方式形容為“是的，而且……”式的即興戲劇。每一個想法都會被接住、展開、品味，然后交給整個“蜂群”判斷價值，并不存在一個絕對中心化的決策權威。大家不斷嘗試、混合、探索，當真正的“魔法”出現時，所有人幾乎會同時意識到。

這更像一種洪水填充式的搜索，通過不斷拼接與試探，找到可以繼續推進的方向。因此，Steve 更傾向把它稱為“探索式開發”或“演化式開發”：不是先寫一份龐大的規格文檔，而是所有人圍坐在“篝火”旁一起構建。篝火中心是一個不斷變化、生長的原型系統，沒有瀑布流程，也沒有完整規格，只有極短的反饋回路和極快的迭代節奏。

在 Anthropic，90 天已經是最長計劃周期。在這種規模下，他們幾乎是在即興創作。Claude Cowork 從第一次被提出到公開發布只用了十天。按他們的說法，如今 Anthropic 工程師的生產效率比使用 Cursor 或聊天工具的普通工程師高 10 到 100 倍，而如果對比 2005 年的 Google 工程師，差距甚至可能上千倍。

從這個角度看，Anthropic 像一臺高速運轉的多臂老虎機：在極短時間內對大量想法下注、驗證，每個人都有機會試一次，只要你能做出來，就有人會去用。但“蜂群”同樣會排斥那些不愿意以“快樂工蜂”姿態參與其中的人：如果你太強調自我、太在意個人表現、太想搶中心位置，很快就會被系統排擠出去。用早期員工的原話就是：這里是“自我中心的終結”。

諷刺的是，絕大多數公司之所以能走到今天，靠的恰恰是不斷學會說“不”。而現在，“不敢拒絕”正在變成越來越大的問題。一位來自銷售部門的內部人士說，當下幾乎所有公司問的問題都可以歸結為兩個：第一，“一切還會好嗎？”第二，“五年后我們還存在嗎？”他們表面鎮定、專業、裝作什么都懂，但實際上幾乎都在恐慌。把這些問題聚類分析，你會發現背后全部是對未來的不確定與恐懼。

而撰稿人 Matteo Wong 也指出，Anthropic 在某種程度上與自己發生沖突，它對幾乎每一個決策都進行深度思考，甚至帶著焦慮。它既擔心自身技術被用于制造生物武器，也公開表達政治立場；它一邊批判自動化的傷害，一邊生產可能奪走崗位的工具；它談安全談到近乎道德姿態，卻又沒人真正認真考慮“把 AI 繁榮放慢下來”這件事。

有人在現場看到基于 Anthropic 技術的招聘外聯自動化工具，興奮地喊“這會摧毀整個行業”；而當作者詢問員工是否愿意放慢 AI 發展速度時，得到的回答從“行業能慢一半就好了”，到“AGI 最好 2032 年再來”，再到“慢幾個月可能就夠”，最后落在同一個信念上：AI 安全研究本身未來也可以被 Claude 自動化。一旦實現，他們相信測試體系就能跟上 AI 能力指數級增長的節奏。

https://steve-yegge.medium.com/the-anthropic-hive-mind-d01f768f3d7b

https://www.bloomberg.com/opinion/articles/2026-02-05/anthropic-ai-safety-obsession-is-its-secret-weapon

https://www.linkedin.com/feed/update/urn:li:activity:7422376409672867841/

會議推薦

InfoQ 2026 全年會議規劃已上線！從 AI Infra 到 Agentic AI，從 AI 工程化到產業落地，從技術前沿到行業應用，全面覆蓋 AI 與軟件開發核心賽道！集結全球技術先鋒，拆解真實生產案例、深挖技術與產業落地痛點，探索前沿領域、聚焦產業賦能，獲取實戰落地方案與前瞻產業洞察，高效實現技術價值轉化。把握行業變革關鍵節點，搶占 2026 智能升級發展先機！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.