AI新浪潮觀察
5min read
騰訊大模型「變陣」:成立 AI Infra 部,姚順雨出任首席 AI 科學家
連然2025/12/17
![]()
摘要
在混元 2.0 發布兩周后,騰訊大模型研發體系完成了一次關鍵的「系統升級」。
頭圖來源:視覺中國
大模型戰事進入深水區,騰訊正在通過調整陣型,來適應更快的速度。
12 月 17 日,騰訊宣布升級大模型研發架構。這次調整最核心的變化在于成立了三個新部門:AI Infra 部、AI Data 部、數據計算平臺部 。
這是騰訊在混元大模型步入 2.0 時代后,對研發體系的一次全面「提速」。
在人事任命上,技術派高管被推向了更核心的位置。Vincesyao 出任「CEO/總裁辦公室」首席 AI 科學家,直接向騰訊總裁劉熾平匯報;同時,他還兼任新成立的 AI Infra 部及大語言模型部負責人,向技術工程事業群(TEG)總裁盧山匯報。
一手抓算法(大語言模型部),一手抓算力基建(AI Infra 部),同時直通公司最高決策層,這一配置表明:在騰訊的戰略棋盤中,大模型的研究與工程落地正在完成深度耦合。
姚順雨,98年的AI頂尖青年科學家
據了解,Vinces Yao就是數月前傳聞入職騰訊的姚順雨,畢業于清華和普林斯頓大學,曾任OpenAI研究員。
據外媒報道,自今年 9 月從 OpenAI 離職加入騰訊以來,姚順雨被高層賦予了極大的權限,以推動內部的文化與組織變革。過去幾個月里,騰訊一改往日在大模型人才戰中的守勢,開始以雙倍薪資激進地從字節跳動等競爭對手處挖角核心研究員,并為應屆博士生開出高出行業標準 50% 的薪資溢價。
![]()
姚順雨10月在X上發帖|圖片來源:X
更深層的變化在于「權力交接」。騰訊正在進行內部重組,降級那些雖擅長工程落地和廣告算法、但缺乏前沿 AI 研究背景的管理者,將指揮棒真正交還給「研究派」。這種去肥增瘦的動作,旨在打破過去「產品經理思維」主導大模型研發的局限。
姚順雨出生于1998年,是人工智能領域的頂尖青年科學家,本科畢業于清華大學計算機系(姚班),后赴普林斯頓大學攻讀計算機科學博士學位,2024年正式加入 OpenAI,專注于智能體(Agents)與深度研究(Deep Research)方向。
他在OpenAI任職及相關研究期間,主要在大模型推理、Agent(智能體)——及評估體系方面取得了核心成果:
提升推理能力:提出了著名的思維樹(Tree of Thoughts, ToT),通過讓大模型進行多路徑推理和反復思考,大幅提升了模型解決復雜問題的能力;
智能體研究:他是 SWE-bench(大模型代碼能力評估數據集)和 SWE-agent(開源AI智能體)的關鍵貢獻者,并參與了 ReAct(推理與行動結合)和 CoALA(智能體認知架構)等開創性工作。
此外,他還在個人社交平臺發布了關于“AI 下半場”的思考,主張AI發展的重心應從單純的訓練轉向定義問題與評估,提出要像產品經理一樣思考“解決什么問題”,認為在當前階段評估比訓練更為重要。
為什么是 AI Infra?
在過去一年的「百模大戰」中,行業逐漸達成一個共識:大模型的競爭,早已超越了單純的算法層面,變成了算力、數據、工程化能力的綜合比拼。
此次騰訊成立 AI Infra 部,也是為了解決「算力效率」這一關鍵命題。
據官方信息,AI Infra 部將作為騰訊大模型體系的重要一環,聚焦于大模型分布式訓練、高性能推理服務等核心技術。其目標非常明確:構建大模型 AI Infra 的核心競爭力,為算法研發和業務場景落地提供穩定、高效的技術底座。
這符合大模型技術演進的規律——當模型參數量級不斷躍升(如騰訊近期發布的混元 2.0),如何讓龐大的 GPU 集群高效運轉,如何在大規模并發下保證推理速度和成本,已經成為決定生死的「隱形戰場」。
騰訊方面表示,在過往混元大模型的訓練及海量業務實踐中,騰訊已積累了系統化的工程能力。此次獨立建制,意在進一步強化這一優勢,提升 AI 大模型的整體研發效率。
除了算力基建,數據質量和評測體系也被提到了新的高度。
此次升級中,新成立的 AI Data 部 將由劉煜宏負責,專注于大模型數據及評測體系建設;而數據計算平臺部則由陳鵬負責,聚焦大數據和機器學習的數據智能融合平臺建設。兩人均向公司副總裁蔣杰匯報。
這意味著,數據處理不再只是算法研發中的附屬流程,而是作為獨立且關鍵的環節被標準化和制度化。
與此同時,王迪將繼續擔任大語言模型部副總經理,向姚順雨匯報,確保模型算法團隊與新成立的基礎設施部門保持緊密協同。
效率變革,從代碼到產品的「AI 化」
過去兩年,盡管擁有微信這樣的國民級應用,騰訊在 AI 模型層卻一度被外界視為「旁觀者」。
一個標志性事件是,今年 2 月騰訊元寶率先接入 DeepSeek R1。雖然這一動作讓元寶的活躍用戶數實現了數量級躍升,但也給騰訊內部敲響了警鐘:自有模型的缺位,甚至導致內部部分業務團隊因混元競爭力不足而猶豫是否接入。
這種焦慮最終轉化為自上而下的壓力。據報道,騰訊總裁劉熾平今年早些時候曾對團隊下達硬指標,要求必須在技術水位上趕超對手。此次變革,正是為了解決此前因組織分散導致的資源內耗,集中力量為算法團隊輸送「彈藥」。
架構調整的最終目的,是為了支撐產品和業務的快速奔跑。
在前不久的 12 月 5 日,騰訊發布了混元 2.0,在預訓練數據和強化學習策略上進行了顯著改進,其 3D 模型甚至保持著全球領先水準,在開源社區下載量突破 300 萬。
在應用層,騰訊元寶上線初期保持了「一天一版本」的迭代頻率,目前用戶規模已穩居國內 AI 應用前三。而在騰訊內部,一場靜水流深的 AI 效率變革正在發生:超過 90% 的騰訊工程師正在使用騰訊云代碼助手 CodeBuddy;50% 的新增代碼由 AI 輔助生成;代碼評審環節的 AI 參與度高達 94% 。
目前,騰訊混元大模型已在騰訊會議、微信、廣告、游戲等內部超過 900 款應用和場景中落地。
近期混元團隊的高密度人才引進與重組,本質上正是為了支撐這種高強度的技術攻堅與業務滲透 。通過成立 AI Infra 等新部門,騰訊正在試圖打通從底層算力、數據處理到上層算法、應用落地的任督二脈,為接下來的 AI 長期競賽備好糧草。
騰訊大模型混元
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.