![]()
本文來自微信公眾號:字母AI,作者:苗正,編輯:王靖,題圖來自:視覺中國
谷歌CEO皮查伊在X上高調宣布,Gemini 3 Deep Think在最難的挑戰上,取得了前所未有的成績。
這個項目,正是姚順宇加入谷歌后參與的第一個重量級項目。
作為谷歌的對手之一,xAI的創始人馬斯克都不由得在這條貼文里留下了一句“令人印象深刻”,皮查伊則回復給他一個“大拇指”表情。
![]()
然而,當人們翻看姚順宇的履歷時,通常都會以為自己搜錯名字了。
但你沒有看錯,姚順宇的確沒有任何計算機背景,他本身是一位理論物理學家,他的博士研究方向是量子引力和量子信息擾亂。
正所謂遇事不決量子力學。
當Scaling Law逐漸失效,AI產業正在經歷的一場變革。
真正能給AI帶來突破,帶著人們走向AGI的,或許反而是那群懂得用物理,來理解“智能”這個詞本質的人。
一、這孩子打小就喜歡物理
姚順宇小時候隨父母從寧夏來到上海,就讀于浦東新區的上南中學東校。初三時,他在浦東新區物理競賽中拿了個三等獎。
有一說一,這成績不算特別亮眼,我小時候拿過物理競賽的一等獎。
2012年,姚順宇以推薦生身份被上海市格致中學提前錄取,隨后便開始了他開掛般的人生。
2015年,他考入清華大學物理系。
只不過當時沒人能想到,這個物理系新生,會在10年后給整個AI界帶來不小的震撼。
![]()
進入清華后,姚順宇的表現開始不一樣了。
大二下學期,當大多數同學還在為基礎課程焦頭爛額時,他已經開始上博士生的凝聚態物理課程。
那一年,姚順宇被周期驅動系統(Floquet systems)吸引了。
這是個極其前沿的研究領域,涉及復雜的數學和物理概念。他和導師汪忠教授一起,寫了篇50多頁的長文章,完成了對高維、一般對稱性下 Floquet周期驅動系統的拓撲分類。
這項工作為這一研究方向建立了完整的理論框架,是一項非常系統的里程碑式拓撲分類工作。
并且,姚順宇以第一作者身份,將這篇論文發表在了物理學頂級期刊Physical Review B上。
對一個本科生來說,這幾乎是不可能完成的成就。
物理系主任王亞愚教授后來回憶說,在這門主要面向博士生的課程中,姚順宇是十年來給自己印象最深的兩名學生之一。
但真正讓姚順宇在物理學界出名的,是他在非厄米系統方面的發現。
在清華期間,他首次在國際上給出了關于非厄米系統的拓撲能帶理論,并準確預測了相關現象。
簡單說,他發現在開放量子系統中,電子態會神奇地“擠”到材料邊界,這種現象被稱為“非厄米趨膚效應”(Non-Hermitian Skin Effect)。這個發現顛覆了傳統拓撲物理的理論框架。
這項工作發表在 Physical Review Letters 上,并獲得了編輯推薦。
這篇題為《Non-Hermitian Skin Effect and Chiral Damping in Open Quantum Systems》的論文,后來被引用近千次,成為姚順宇學術影響力最高的作品。
2018年11月8日,清華大學本科生特等獎學金答辯會舉行。
這是清華授予本科生的最高榮譽,每年全校不足十人,在這之中便有姚順宇。
他也成為了物理系當年唯一獲此殊榮的學生。
2019年,姚順宇去斯坦福大學讀理論與數學物理博士。
他的導師是Douglas Stanford和Stephen H. Shenker。
前者被同行認為是最有潛力改變物理發展方向的頂尖青年科學家,后者則是弦理論領域的傳奇人物。
在斯坦福期間,姚順宇研究量子引力和量子信息擾亂(quantum scrambling),這是理論物理中最前沿、也最抽象的領域之一。
博士畢業后,他在加州大學伯克利分校做博士后研究。截至目前,他的總引用次數超過5000次,h指數14。
二、一個學物理的憑什么能研究AI?
雖然很多人大學選的專業,和他們畢業出來后找的工作都沒有直接關聯,但是像姚順宇這樣一直在鉆研物理學的人,理論上應該找個物理相關的工作。
但是姚順宇偏偏選擇了AI。
2024年10月,姚順宇加入Anthropic,參與大模型Claude Sonnet框架的研發。
一個研究量子引力的物理學者,憑什么能負責起世界頂尖AI公司的研發工作?
答案其實不復雜。
大模型的核心技術本質上是數學密集型的工作。訓練大模型需要解決高維空間中的優化問題,這跟物理學中的變分法、統計力學有很深的聯系。
姚順宇研究的拓撲物理、非厄米系統,用的數學工具,比如概率論、線性代數、張量計算、動力系統理論,它們跟深度學習高度重合。
更關鍵的是,理論物理和機器學習處理的是同一類問題:高維、非線性、涌現性強的復雜系統。
統計物理學中的吉布斯分布,就是機器學習中概率推斷的理論基礎。深度神經網絡的訓練過程,可以看作是在高維參數空間中找能量最小值,這跟統計物理中的自由能最小化原理一個道理。
近年來越來越多研究表明,統計物理的工具可以用來理解深度學習中的很多現象。
量子多體系統和大模型在數學結構上很相似。
在量子物理中,大量粒子相互作用時,會涌現出單個粒子層面無法預測的集體行為。
在大模型中,數十億個神經元參數相互作用時,同樣會涌現出超出預期的效果。
事實上現在咱們常說的思維鏈推理、上下文學習、指令遵循,也都是依靠這種涌現的方式才誕生的。
![]()
這種從微觀到宏觀的涌現現象,也正是物理學家最擅長研究的。
因此,基于物理訓練出來的“物理直覺”,恰恰是AI研究最需要的。
從復雜現象中抽象出數學模型,這是物理學家的基本功。
在AI領域,這意味著能理解神經網絡的本質,而不是停留在調參層面。
物理學家習慣在不同尺度上思考問題,從微觀粒子到宏觀宇宙。這種跨尺度建模的能力對應到AI中,就是理解從單個神經元到整體的全景圖。
姚順宇在斯坦福研究的量子信息擾亂(quantum scrambling),關注的是量子信息如何在復雜系統中擴散和混亂化,這套數學框架跟神經網絡中信息的傳播和處理有相似的結構。
那么當他轉去做AI相關的研究時,這些看似抽象的物理理論,就順理成章地變成了理解大模型行為的工具。
更直接的聯系來自強化學習這個概念本身。
姚順宇在Anthropic主要做強化學習研究,而強化學習的理論基礎本身就源于物理學。
最優控制理論恰好是來自經典力學的變分原理,路徑積分方法直接借鑒量子力學的費曼路徑積分,熵正則化來自統計物理的自由能概念。
對一個理論物理學家來說,這些不是需要學習的新知識,而是已經內化在思維方式里的工具。
這種從物理到AI的轉變,不是姚順宇一個人的個案。
卷積神經網絡的發明者楊立昆(Yann LeCun),在進入AI領域之前,學的就是工程物理教育。
深度學習的奠基人杰弗里·辛頓(Geoffrey Hinton),他提出的玻爾茲曼機(Boltzmann Machine),名字就來自統計物理學家路德維希·玻爾茲曼。
而這套系統的核心邏輯,便是用統計物理中的能量函數來描述神經網絡的狀態分布。
事實上,姚順宇在加入Anthropic后,深度參與了Claude 3.7 Sonnet與Claude 4系列的強化學習模塊研發,是這兩代模型能力躍升的關鍵貢獻者。
這不是“跨界”,而是把物理工具應用到新領域。
當AI產業逐漸從“暴力堆算力”的Scaling Law時代,轉向新階段時,反而需要這樣的物理學者。
三、新征程
2025年9月19日,姚順宇在個人博客上發了篇文章,宣布離開 Anthropic。
在這篇文章里,他很坦誠地說明了離職原因,并給出了一個精確的比例:40%和60%。
40%指的是可以公開的原因,來自于姚順宇和Anthropic之間價值觀上的沖突。
![]()
2025年9月5日,Anthropic在內部文件中把中國列為“adversarial nations”(敵對國家),并宣布停止向“中國實體控股的公司”提供AI服務。
姚順宇在博客中寫道:“我強烈反對 Anthropic 發表的反華言論。盡管我相信 Anthropic 的大多數人都會反對這樣的言論,但我認為我沒有辦法繼續留在公司。”
這段話寫得很克制,但能看出他的失望和無奈。
他特別強調“大多數人都會反對”,說明他理解這個政策不是來自公司內部的普遍共識,更多是外部壓力和公司高層決策的結果。
60%指的是那些涉及“內部的機密信息”,不可公開的信息。姚順宇因保密協議無法詳細透露。
但他強調,自己“不希望經驗與知識受到特定實驗室偏見的限制,尤其是在核心研究已無需依賴論文發表的當下,更需要開放、平等的科研環境”。
說起來像是個笑話,但實際情況就是,在AI研究日益商業化、封閉化的今天,學術自由和開放合作正在受到越來越多限制。
在博客結尾,他用了句意味深長的話:“It was good with you, but it is better without you.”(和你在一起很好,但沒有你更好)這句話既是對過去一年工作的肯定,也是對未來道路的期待。
這件事反映了在全球AI競爭的大背景下,華裔科學家面臨的復雜處境。
一方面,美國有世界上最先進的AI研究資源和最優秀的科研團隊。
可另一方面,受地緣影響,很多華裔科學家的身份成了職業發展的障礙。
但故事沒有在離職中結束。離開Anthropic僅10天后,姚順宇就加入了Google DeepMind,擔任高級研究科學家(Senior Staff Research Scientist),且直接進入核心Gemini團隊。
這速度之快,說明DeepMind早就看中了他的能力。
無論是谷歌CEO皮查伊,還是DeepMind CEO哈薩比斯,他倆在國際合作方面采取了更開放的立場。
尤其是后者,他一直在倡導國際合作,認為AI安全問題需要全球科學家共同努力。
因此,即便同樣受到美國出口管制約束,谷歌依然沒有完全切斷與中國研究機構的聯系。
加入DeepMind后,姚順宇立即投入Gemini團隊的工作。
僅僅5個多月后,谷歌就推出了Gemini 3 Deep Think的重大升級。
這是姚順宇加入谷歌后參與的首個項目,成績足以讓整個AI圈震驚。文章開頭處就提到,這次更新甚至讓馬斯克也對其稱贊。
Gemini 3 Deep Think在多項基準測試中刷新了紀錄。
比如在ARC-AGI-2測試中,它達到了84.6%的成績。ARC-AGI是專門測試 AI 的抽象推理能力,測試的目標是檢測AI在面對從未見過的新問題時,能否識別模式并找到解決方案。
這種能力被認為是真正智能的標志,而不是簡單的模式記憶。
Gemini 3 Deep Think的成績,比第二名Claude Opus 4.6的68.8%高出15%,比GPT-5.2 的 52.9% 更是高出30%。
在Codeforces編程平臺上,Gemini 3 Deep Think獲得了3455分的Elo評分,達到“傳奇大師”(Legendary Grandmaster)級別,世界排名第8。
這意味著在算法競賽和系統架構方面,全世界只有7個人類程序員能超越它。
在奧林匹克競賽水平測試中,Gemini 3 Deep Think在數學、物理、化學三個學科都達到了金牌水平。
更重要的是,Gemini 3 Deep Think還處理那些缺乏明確指導原則、答案不唯一、數據雜亂或不完整的現實挑戰。
這其實是當前所有AI都面臨的短板。這些大模型雖然在標準化測試中表現出色,但面對真實世界的復雜問題時,往往表現糟糕。
雖然我們無法確切知道姚順宇在Gemini 3 Deep Think項目中具體負責了哪些工作,但從時間線上看,他在自己的X上,第一時間宣布了Gemini 3 Deep Think的發布。
我個人認為,姚順宇在Anthropic積累的強化學習經驗,以及他作為物理學家對復雜系統的理解,為Gemini團隊帶來了新的視角和方法。
四、兩個“Shunyu Yao”的平行宇宙
說到Shunyu Yao,其實在AI研究圈里,有兩位知名研究者都叫Shunyu Yao,發音完全一樣,都跟在頂尖的AI公司做研究工作,也都畢業于清華大學。
每次有關于“姚順宇”的新聞,總有人問:“是哪個姚順Yu?”
跟本文的主角不同,另一位姚順宇是正兒八經的計算機背景。
他是清華姚班畢業,普林斯頓大學計算機科學博士,曾在OpenAI工作,目前已加入騰訊。
姚順宇在AI圈的名氣,要比物理學家姚順宇更大。
他提出的ReAct框架(Reasoning and Acting),是近年來最有影響力的提示工程方法之一。
這個框架的核心思想是讓AI“邊思考邊行動”,不是先完成所有推理再執行,而是在推理和行動之間交替進行,就像人類解決問題時的思維過程。
ReAct論文發表于2022年10月,到2025年已經被引用超過4000次,成了提示工程領域的經典工作。
姚順宇的另一項重要貢獻是思維樹(Tree of Thoughts)。
如果說思維鏈是讓AI學會了“一步步思考”,那思維樹就讓 AI 學會了“探索多條思路”。
在面對復雜問題時,AI不再只沿著一條路徑推理,而是可以同時探索多個可能的解決方案,評估每條路徑的前景,然后選擇最有希望的方向深入。
姚順宇在谷歌Scholar上的引用數超過15000次,遠高于物理學家姚順宇的5000次。
但我認為這不奇怪,計算機科學領域的論文引用速度,本來也要比物理學快得多,而且姚順宇的工作更接近應用層面,影響范圍更廣。
但引用數不能完全衡量一個科學家的價值,兩個Shunyu Yao都在各自領域做出了重要貢獻。
如果說姚順宇是從“量子力學”出發來研究 AI,那姚順宇就是從“讓AI像人類一樣思考和行動”的角度切入。
兩個人的研究方法、思維方式、甚至用的數學工具都不一樣,但他們都在用自己的方式,去實現AGI。
姚順宇在騰訊的工作,目前來看,是主要集中在agent上的。他發布的論文《CL-bench》,就是一個用于評估AI agent能力的基準測試。
它相當于一個給AGI研究者們明確一個方向,只要你的研究成果能在CL-bench上拿高分,那就說明你接近AGI。
姚順宇則是更為直接,因為他認為真正的智能需要理解世界的底層規律。
物理學提供了描述宇宙運行的數學語言,從量子力學到統計物理,從信息論到復雜系統,這些都是構建真正智能系統的理論基石。
那么通過物理學,便可以讓AI的智能水平更上一層樓,靠近AGI。
但無論如何,沒有哪一種方法是唯一正確的,沒有哪一個學科能獨自解決所有問題。
物理學家的理論洞察和計算機科學家的工程創新,都是推動AI發展不可或缺的力量。
兩個Shunyu Yao,兩條道路,同一個目標。
就像集齊龍珠可以召喚神龍一樣,或許有這么一家公司,集齊了所有的Shunyu Yao,那么它也就實現了AGI。
本文來自微信公眾號:字母AI,作者:苗正,編輯:王靖
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4835161.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.