henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
官宣了。
就在剛剛,量子位獲悉,騰訊內(nèi)部宣布了大模型組織架構(gòu)調(diào)整,而姚順雨也首次被明確了加盟。
姚順雨是誰?
前OpenAI研究員、清華姚班學(xué)霸、普林斯頓博士、NOI奧賽銀牌、安徽省高考探花,是近幾年大模型 Agent 方向最受關(guān)注的青年研究者之一。
只有28歲。
他是Tree of Thoughts(思維樹)、ReAct等工作的作者,也是SWE-bench、SWE-agent等一系列知名研究的核心貢獻(xiàn)者。
去年一篇《AI下半場》的博文,讓他在學(xué)界與產(chǎn)業(yè)界迅速出圈;而今年9月從OpenAI離職后,他的去向也隨之成為各大 AI 公司關(guān)注的焦點(diǎn),一度引發(fā)諸多猜測。
如今,一切塵埃落定——
姚順雨確定加盟騰訊,雙重身份:
第一,“CEO/總裁辦公室”首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào);
同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人,向技術(shù)工程事業(yè)群總裁盧山匯報(bào)。
騰訊內(nèi)部官宣說了啥
姚順雨內(nèi)部官宣加盟的消息,是隨著騰訊AI組織架構(gòu)一起披露的。
量子位獲悉,騰訊今日內(nèi)部官宣了大模型研發(fā)組織架構(gòu)調(diào)整——
- 新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,全面強(qiáng)化其大模型的研發(fā)體系與核心能力。
其中Vincesyao出任“CEO/總裁辦公室”首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào);同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人,向技術(shù)工程事業(yè)群總裁盧山匯報(bào)。
而Vincesyao,正是姚順雨。
據(jù)稱,作為騰訊大模型體系的重要一環(huán),AI Infra部將負(fù)責(zé)大模型訓(xùn)練和推理平臺(tái)技術(shù)能力建設(shè),聚焦大模型分布式訓(xùn)練、高性能推理服務(wù)等核心技術(shù)能力,構(gòu)建大模型AI Infra核心競爭力,為大模型算法研發(fā)和業(yè)務(wù)場景落地提供穩(wěn)定高效的技術(shù)支持和服務(wù)。
而架構(gòu)升級(jí)后的AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,將分別負(fù)責(zé)大模型數(shù)據(jù)及評(píng)測體系建設(shè)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)的數(shù)據(jù)智能融合平臺(tái)建設(shè)工作。
王迪繼續(xù)擔(dān)任大語言模型部副總經(jīng)理,向姚順雨匯報(bào)。劉煜宏擔(dān)任AI Data部負(fù)責(zé)人、陳鵬擔(dān)任數(shù)據(jù)計(jì)算平臺(tái)部負(fù)責(zé)人,均向公司副總裁蔣杰匯報(bào)。
騰訊內(nèi)部信中還強(qiáng)調(diào),AI大模型研究與工程技術(shù)緊密相關(guān)。在過往混元大模型訓(xùn)練以及海量業(yè)務(wù)場景的深度實(shí)踐中,騰訊已經(jīng)積累了系統(tǒng)化的工程能力;此次大模型研發(fā)架構(gòu)升級(jí),在進(jìn)一步強(qiáng)化騰訊工程化優(yōu)勢同時(shí),旨在提升AI大模型研究能力,聚焦公司AI戰(zhàn)略布局,提升AI大模型的研發(fā)效率。
過去一年,混元大模型發(fā)布超過30個(gè)新模型。12月5日發(fā)布的混元2.0,顯著改進(jìn)了預(yù)訓(xùn)練數(shù)據(jù)和強(qiáng)化學(xué)習(xí)策略,在復(fù)雜推理與文本生成場景表現(xiàn)國內(nèi)領(lǐng)先。混元3D模型甚至保持著全球領(lǐng)先的水準(zhǔn),開源社區(qū)下載量超過300萬。
而AI產(chǎn)品和服務(wù),騰訊也正在展現(xiàn)一貫的競爭力。
在產(chǎn)品和服務(wù)層面,騰訊元寶持續(xù)優(yōu)化用戶體驗(yàn),上線初期甚至保持了每天一個(gè)版本的迭代頻率,快速贏得了用戶的認(rèn)可,用戶規(guī)模穩(wěn)居國內(nèi)AI應(yīng)用前三,成為最受新中產(chǎn)歡迎的AI原生應(yīng)用。目前騰訊也將元寶的AI能力融入微信、QQ、音樂、會(huì)議等國民級(jí)產(chǎn)品中,讓用戶在不改變習(xí)慣的前提下自然觸碰AI,為用戶提供最自然、門檻最低的服務(wù)體驗(yàn)。
與此同時(shí),據(jù)稱騰訊公司內(nèi)部正在推進(jìn)一場全面AI化的效率變革。據(jù)騰訊財(cái)報(bào)會(huì)信息,截止目前,騰訊混元大模型已在騰訊會(huì)議、微信、廣告、游戲等內(nèi)部超過900款應(yīng)用和場景中落地。在騰訊公司內(nèi)部,有超90%的騰訊工程師在使用騰訊云代碼助手CodeBuddy,50%新增代碼由AI輔助生成,代碼評(píng)審環(huán)AI參與度達(dá)94%。
而作為高密度人才引進(jìn)的姚順雨,也是騰訊開啟AI攻堅(jiān)的證明。
可以確定的是,這個(gè)時(shí)間點(diǎn)上的騰訊,已經(jīng)明顯開啟了AI進(jìn)程上的提速。
不論是組織變陣、人才推進(jìn),還是產(chǎn)品代表元寶、開源代表混元3D,都能明顯感覺得到企鵝洶涌。
當(dāng)然,之所以騰訊一舉一動(dòng)備受關(guān)注,核心還是其所擁有的完備AI要素:豐富場景、海量數(shù)據(jù)、生態(tài)資源,以及謀定后動(dòng)的戰(zhàn)略風(fēng)格…
AI船票是什么可能還在被討論,但擁有上述AI要素的騰訊,被認(rèn)為坐在預(yù)留席位的那一桌。
這或許也是姚順雨這樣的TOP人才,難以拒絕offer的原因。
姚順雨其人其論
姚順雨,合肥一中畢業(yè),NOI奧賽銀牌,高考704分以安徽探花進(jìn)入清華姚班,后在普林斯頓大學(xué)獲得計(jì)算機(jī)博士學(xué)位。
![]()
博士期間,他師從GPT-1第二作者Karthik Narasimhan,從事智能體方向研究。博士畢業(yè)后,隨即加入OpenAI。
![]()
在科研層面,姚順雨的工作幾乎貫穿了Agent研究的關(guān)鍵節(jié)點(diǎn)。他先后提出CALM(讓語言模型以Agent形式參與語言游戲)、WebShop(用可控的電商環(huán)境系統(tǒng)性評(píng)估Agent 能力)等工作。
隨后,他又陸續(xù)推出了一系列在學(xué)界和工業(yè)界都產(chǎn)生深遠(yuǎn)影響的成果:
- ReAct:讓大語言模型同步完成推理與行動(dòng),是其被引次數(shù)最高的工作。
- Tree of Thoughts:通過搜索式思維結(jié)構(gòu)顯著提升模型推理能力。
- SWE-bench:面向真實(shí)軟件工程任務(wù)的大模型評(píng)估基準(zhǔn)。
- SWE-agent:將LLM系統(tǒng)性用于代碼修復(fù)與開發(fā)的開源 Agent)。
如果說這些工作回答的是“Agent 能不能工作、該怎么工作”,那么在觀點(diǎn)層面,姚順雨更關(guān)心的,是AI接下來該往哪里走。
在2024年8月加入OpenAI 后,姚順雨發(fā)表博文《The Second Half》,提出了一個(gè)被反復(fù)引用的判斷:
- AI正處在“中場休息”階段:上半場是訓(xùn)練 > 評(píng)估,下半場將是評(píng)估 > 訓(xùn)練。
在他的劃分中,AI 發(fā)展可以清晰地分為兩個(gè)階段:上半場:以模型和方法為中心,核心任務(wù)是“把模型訓(xùn)出來”。下半場:隨著模型能力趨于成熟,重心轉(zhuǎn)向任務(wù)定義、系統(tǒng)構(gòu)建與評(píng)估體系。
也就是說,AI 的關(guān)鍵問題正在從
- “我們能否訓(xùn)練一個(gè)模型解決 XX?”轉(zhuǎn)向“什么問題值得被解決?我們?nèi)绾闻袛?AI 是否真的進(jìn)步了?”
在這個(gè)階段,評(píng)估不再是附屬環(huán)節(jié),而是決定方向的前置條件。
真正重要的,不是繼續(xù)堆模型規(guī)模,而是讓模型在真實(shí)任務(wù)、真實(shí)系統(tǒng)中經(jīng)得起檢驗(yàn)。
除了“AI 下半場”的判斷之外,姚順雨今年 9 月與張小珺的對談同樣出圈,也進(jìn)一步強(qiáng)化了他一貫的技術(shù)立場。
在那次對談中,他對Agent、應(yīng)用與模型邊界的多項(xiàng)判斷被反復(fù)引用,比如:
- Agent 的本質(zhì)不是“會(huì)用工具”,而是“能推理并泛化”
- Code 是 Agent 的“手”,是真正的第一性環(huán)境
- 真正困難的不是“難任務(wù)”,而是“簡單任務(wù)的可靠性”
- 創(chuàng)業(yè)公司的最大機(jī)會(huì),不在模型,而在交互方式
這些觀點(diǎn)并非停留在判斷層面,而是與他過往在 ReAct、SWE-agent 等工作中一以貫之的研究路徑高度一致。
如今,這位有產(chǎn)出、有觀點(diǎn)、也有清晰技術(shù)方法論的明星研究員選擇加入騰訊,所帶來的,顯然不只是單點(diǎn)能力補(bǔ)強(qiáng),而是一整套關(guān)于Agent、系統(tǒng)與真實(shí)任務(wù)的“下半場”解法。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.