網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

騰訊調(diào)整大模型組織架構(gòu)：姚順雨加盟，向總裁劉熾平匯報(bào)

2025-12-18 14:45:40　來源: 量子位

北京舉報(bào)

分享至

henry 發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

官宣了。

就在剛剛，量子位獲悉，騰訊內(nèi)部宣布了大模型組織架構(gòu)調(diào)整，而姚順雨也首次被明確了加盟。

姚順雨是誰？

前OpenAI研究員、清華姚班學(xué)霸、普林斯頓博士、NOI奧賽銀牌、安徽省高考探花，是近幾年大模型 Agent 方向最受關(guān)注的青年研究者之一。

只有28歲。

他是Tree of Thoughts（思維樹）、ReAct等工作的作者，也是SWE-bench、SWE-agent等一系列知名研究的核心貢獻(xiàn)者。

去年一篇《AI下半場》的博文，讓他在學(xué)界與產(chǎn)業(yè)界迅速出圈；而今年9月從OpenAI離職后，他的去向也隨之成為各大 AI 公司關(guān)注的焦點(diǎn)，一度引發(fā)諸多猜測。

如今，一切塵埃落定——

姚順雨確定加盟騰訊，雙重身份：

第一，“CEO/總裁辦公室”首席AI科學(xué)家，向騰訊總裁劉熾平匯報(bào)；

同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人，向技術(shù)工程事業(yè)群總裁盧山匯報(bào)。

騰訊內(nèi)部官宣說了啥

姚順雨內(nèi)部官宣加盟的消息，是隨著騰訊AI組織架構(gòu)一起披露的。

量子位獲悉，騰訊今日內(nèi)部官宣了大模型研發(fā)組織架構(gòu)調(diào)整——

新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部，全面強(qiáng)化其大模型的研發(fā)體系與核心能力。

其中Vincesyao出任“CEO/總裁辦公室”首席AI科學(xué)家，向騰訊總裁劉熾平匯報(bào)；同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人，向技術(shù)工程事業(yè)群總裁盧山匯報(bào)。

而Vincesyao，正是姚順雨。

據(jù)稱，作為騰訊大模型體系的重要一環(huán)，AI Infra部將負(fù)責(zé)大模型訓(xùn)練和推理平臺(tái)技術(shù)能力建設(shè)，聚焦大模型分布式訓(xùn)練、高性能推理服務(wù)等核心技術(shù)能力，構(gòu)建大模型AI Infra核心競爭力，為大模型算法研發(fā)和業(yè)務(wù)場景落地提供穩(wěn)定高效的技術(shù)支持和服務(wù)。

而架構(gòu)升級(jí)后的AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部，將分別負(fù)責(zé)大模型數(shù)據(jù)及評(píng)測體系建設(shè)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)的數(shù)據(jù)智能融合平臺(tái)建設(shè)工作。

王迪繼續(xù)擔(dān)任大語言模型部副總經(jīng)理，向姚順雨匯報(bào)。劉煜宏擔(dān)任AI Data部負(fù)責(zé)人、陳鵬擔(dān)任數(shù)據(jù)計(jì)算平臺(tái)部負(fù)責(zé)人，均向公司副總裁蔣杰匯報(bào)。

騰訊內(nèi)部信中還強(qiáng)調(diào)，AI大模型研究與工程技術(shù)緊密相關(guān)。在過往混元大模型訓(xùn)練以及海量業(yè)務(wù)場景的深度實(shí)踐中，騰訊已經(jīng)積累了系統(tǒng)化的工程能力；此次大模型研發(fā)架構(gòu)升級(jí)，在進(jìn)一步強(qiáng)化騰訊工程化優(yōu)勢同時(shí)，旨在提升AI大模型研究能力，聚焦公司AI戰(zhàn)略布局，提升AI大模型的研發(fā)效率。

過去一年，混元大模型發(fā)布超過30個(gè)新模型。12月5日發(fā)布的混元2.0，顯著改進(jìn)了預(yù)訓(xùn)練數(shù)據(jù)和強(qiáng)化學(xué)習(xí)策略，在復(fù)雜推理與文本生成場景表現(xiàn)國內(nèi)領(lǐng)先。混元3D模型甚至保持著全球領(lǐng)先的水準(zhǔn)，開源社區(qū)下載量超過300萬。

而AI產(chǎn)品和服務(wù)，騰訊也正在展現(xiàn)一貫的競爭力。

在產(chǎn)品和服務(wù)層面，騰訊元寶持續(xù)優(yōu)化用戶體驗(yàn)，上線初期甚至保持了每天一個(gè)版本的迭代頻率，快速贏得了用戶的認(rèn)可，用戶規(guī)模穩(wěn)居國內(nèi)AI應(yīng)用前三，成為最受新中產(chǎn)歡迎的AI原生應(yīng)用。目前騰訊也將元寶的AI能力融入微信、QQ、音樂、會(huì)議等國民級(jí)產(chǎn)品中，讓用戶在不改變習(xí)慣的前提下自然觸碰AI，為用戶提供最自然、門檻最低的服務(wù)體驗(yàn)。

與此同時(shí)，據(jù)稱騰訊公司內(nèi)部正在推進(jìn)一場全面AI化的效率變革。據(jù)騰訊財(cái)報(bào)會(huì)信息，截止目前，騰訊混元大模型已在騰訊會(huì)議、微信、廣告、游戲等內(nèi)部超過900款應(yīng)用和場景中落地。在騰訊公司內(nèi)部，有超90%的騰訊工程師在使用騰訊云代碼助手CodeBuddy，50%新增代碼由AI輔助生成，代碼評(píng)審環(huán)AI參與度達(dá)94%。

而作為高密度人才引進(jìn)的姚順雨，也是騰訊開啟AI攻堅(jiān)的證明。

可以確定的是，這個(gè)時(shí)間點(diǎn)上的騰訊，已經(jīng)明顯開啟了AI進(jìn)程上的提速。

不論是組織變陣、人才推進(jìn)，還是產(chǎn)品代表元寶、開源代表混元3D，都能明顯感覺得到企鵝洶涌。

當(dāng)然，之所以騰訊一舉一動(dòng)備受關(guān)注，核心還是其所擁有的完備AI要素：豐富場景、海量數(shù)據(jù)、生態(tài)資源，以及謀定后動(dòng)的戰(zhàn)略風(fēng)格…

AI船票是什么可能還在被討論，但擁有上述AI要素的騰訊，被認(rèn)為坐在預(yù)留席位的那一桌。

這或許也是姚順雨這樣的TOP人才，難以拒絕offer的原因。

姚順雨其人其論

姚順雨，合肥一中畢業(yè)，NOI奧賽銀牌，高考704分以安徽探花進(jìn)入清華姚班，后在普林斯頓大學(xué)獲得計(jì)算機(jī)博士學(xué)位。

博士期間，他師從GPT-1第二作者Karthik Narasimhan，從事智能體方向研究。博士畢業(yè)后，隨即加入OpenAI。

在科研層面，姚順雨的工作幾乎貫穿了Agent研究的關(guān)鍵節(jié)點(diǎn)。他先后提出CALM（讓語言模型以Agent形式參與語言游戲）、WebShop（用可控的電商環(huán)境系統(tǒng)性評(píng)估Agent 能力）等工作。

隨后，他又陸續(xù)推出了一系列在學(xué)界和工業(yè)界都產(chǎn)生深遠(yuǎn)影響的成果：

ReAct：讓大語言模型同步完成推理與行動(dòng)，是其被引次數(shù)最高的工作。
Tree of Thoughts：通過搜索式思維結(jié)構(gòu)顯著提升模型推理能力。
SWE-bench：面向真實(shí)軟件工程任務(wù)的大模型評(píng)估基準(zhǔn)。
SWE-agent：將LLM系統(tǒng)性用于代碼修復(fù)與開發(fā)的開源 Agent）。

如果說這些工作回答的是“Agent 能不能工作、該怎么工作”，那么在觀點(diǎn)層面，姚順雨更關(guān)心的，是AI接下來該往哪里走。

在2024年8月加入OpenAI 后，姚順雨發(fā)表博文《The Second Half》，提出了一個(gè)被反復(fù)引用的判斷：

AI正處在“中場休息”階段：上半場是訓(xùn)練 > 評(píng)估，下半場將是評(píng)估 > 訓(xùn)練。

在他的劃分中，AI 發(fā)展可以清晰地分為兩個(gè)階段：上半場：以模型和方法為中心，核心任務(wù)是“把模型訓(xùn)出來”。下半場：隨著模型能力趨于成熟，重心轉(zhuǎn)向任務(wù)定義、系統(tǒng)構(gòu)建與評(píng)估體系。

也就是說，AI 的關(guān)鍵問題正在從

“我們能否訓(xùn)練一個(gè)模型解決 XX？”轉(zhuǎn)向“什么問題值得被解決？我們?nèi)绾闻袛?AI 是否真的進(jìn)步了？”

在這個(gè)階段，評(píng)估不再是附屬環(huán)節(jié)，而是決定方向的前置條件。

真正重要的，不是繼續(xù)堆模型規(guī)模，而是讓模型在真實(shí)任務(wù)、真實(shí)系統(tǒng)中經(jīng)得起檢驗(yàn)。

除了“AI 下半場”的判斷之外，姚順雨今年 9 月與張小珺的對談同樣出圈，也進(jìn)一步強(qiáng)化了他一貫的技術(shù)立場。

在那次對談中，他對Agent、應(yīng)用與模型邊界的多項(xiàng)判斷被反復(fù)引用，比如：

Agent 的本質(zhì)不是“會(huì)用工具”，而是“能推理并泛化”
Code 是 Agent 的“手”，是真正的第一性環(huán)境
真正困難的不是“難任務(wù)”，而是“簡單任務(wù)的可靠性”
創(chuàng)業(yè)公司的最大機(jī)會(huì)，不在模型，而在交互方式

這些觀點(diǎn)并非停留在判斷層面，而是與他過往在 ReAct、SWE-agent 等工作中一以貫之的研究路徑高度一致。

如今，這位有產(chǎn)出、有觀點(diǎn)、也有清晰技術(shù)方法論的明星研究員選擇加入騰訊，所帶來的，顯然不只是單點(diǎn)能力補(bǔ)強(qiáng)，而是一整套關(guān)于Agent、系統(tǒng)與真實(shí)任務(wù)的“下半場”解法。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.