![]()
新智元報(bào)道
編輯:艾倫
【新智元導(dǎo)讀】華為諾亞方舟實(shí)驗(yàn)室主任王云鶴官宣離職。我們梳理了王云鶴的經(jīng)歷。
王云鶴今日在朋友圈官宣,將辭去華為諾亞方舟實(shí)驗(yàn)室主任職位,告別華為。
![]()
從 2025 年 3 月到今天,王云鶴恰好全面執(zhí)掌了諾亞方舟實(shí)驗(yàn)室整整一年。
華為諾亞方舟實(shí)驗(yàn)室,是華為乃至中國的 AI 研究重鎮(zhèn)。
其人其事
王云鶴本科就讀于西安電子科技大學(xué)數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè),畢業(yè)后進(jìn)入北京大學(xué)智能科學(xué)系攻讀博士學(xué)位,主攻深度學(xué)習(xí)、模型壓縮、機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺等方向。
![]()
2018 年,王云鶴博士畢業(yè)。
彼時(shí),深度學(xué)習(xí)浪潮正席卷整個(gè)信息技術(shù)領(lǐng)域,模型壓縮(即如何以更少的參數(shù)和計(jì)算量實(shí)現(xiàn)相當(dāng)精度)是業(yè)界最熱門也最緊迫的課題之一。
王云鶴在北大期間系統(tǒng)研究了這一領(lǐng)域,積累了若干學(xué)術(shù)成果,隨后順理成章地走向了離這些成果最近的產(chǎn)業(yè)出口。
華為諾亞方舟實(shí)驗(yàn)室于 2012 年創(chuàng)立,隸屬于華為總研究組織「2012 實(shí)驗(yàn)室」,是華為從事 AI 基礎(chǔ)研究的實(shí)驗(yàn)室,研究領(lǐng)域覆蓋計(jì)算機(jī)視覺、自然語言處理、搜索與推薦、決策與推理、人機(jī)交互、AI 基礎(chǔ)理論等。
這里聚集著中國企業(yè) AI 研究院中最高產(chǎn)的一批的論文產(chǎn)出者,也是在華為內(nèi)部最接近「純研究」的一片土地——盡管「純研究」在任何一家以商業(yè)為根本的科技公司里,始終難逃周期性的質(zhì)疑與審視。
博士畢業(yè)當(dāng)年,王云鶴正式加入華為諾亞方舟實(shí)驗(yàn)室,擔(dān)任高級工程師,并于 2020 年開始擔(dān)任該實(shí)驗(yàn)室技術(shù)專家。
在這段積累期里,王云鶴并未讓自己的名字在論文列表里消失。
他參與提出的 GhostNet 輕量級神經(jīng)網(wǎng)絡(luò)架構(gòu)于 2020 年被 CVPR 接受,該架構(gòu)可以在同樣精度下,速度和計(jì)算量均少于此前 SOTA 算法,成為業(yè)界引用頗廣的端側(cè)模型方案。
![]()
https://arxiv.org/pdf/1911.11907
![]()
與此同時(shí),他參與研發(fā)的 AdderNet(加法神經(jīng)網(wǎng)絡(luò))在深度學(xué)習(xí)中以純加法運(yùn)算代替乘法,理論上可大幅降低 AI 芯片的運(yùn)算功耗,也在同年 CVPR 上以口頭報(bào)告形式發(fā)表,引發(fā)了不小的學(xué)術(shù)討論。
![]()
https://arxiv.org/pdf/1912.13200
兩篇論文在同一年同一頂會亮相,論文數(shù)量的密度令人印象深刻。
他已在相關(guān)領(lǐng)域發(fā)表 CCF-A 類學(xué)術(shù)論文 70 余篇,涵蓋 NeurIPS、ICML、CVPR、ICCV、IEEE TPAMI 等頂級會議與期刊,并曾擔(dān)任 NeurIPS 和 ICML 的領(lǐng)域主席,以及 VALSE 的高級領(lǐng)域主席。
70 余篇頂會論文,平均攤開來是每年將近 10 篇的節(jié)奏,這個(gè)數(shù)字在學(xué)術(shù)界無論如何都稱得上高產(chǎn)。
![]()
當(dāng)然,高產(chǎn)既可以是深度思考的結(jié)晶,也可以是高效運(yùn)轉(zhuǎn)的流水線。
這些論文幫助王云鶴在國內(nèi)外 AI 學(xué)術(shù)共同體中建立了相當(dāng)?shù)目梢姸龋瑸樗蘸蟾笪枧_的登場打下了足夠厚實(shí)的名片底色。
核心突破
王云鶴的研究路線,始終圍繞一個(gè)聽起來樸實(shí)、做起來極難的命題:如何在有限算力下讓AI跑得更快、更省。
這一思路與華為在芯片供應(yīng)受限背景下的現(xiàn)實(shí)處境高度吻合——當(dāng)高端 GPU 的獲取通道相繼收窄,算法效率的每一寸提升都不再只是學(xué)術(shù)指標(biāo),而是直接換算成可量化的戰(zhàn)略價(jià)值。
王云鶴就任華為算法應(yīng)用部部長后,負(fù)責(zé)高效 AI 算法的創(chuàng)新研發(fā)以及在華為業(yè)務(wù)中的應(yīng)用,并憑借「大幅提升算力的高效能乘法器和加法神經(jīng)網(wǎng)絡(luò)」獲選華為第四屆「十大發(fā)明」。
華為「十大發(fā)明」是一項(xiàng)內(nèi)部評選獎(jiǎng)項(xiàng),由華為自己設(shè)立、自己評審、自己頒發(fā)。
對于獲獎(jiǎng)?wù)叨裕碇緦用娴母叨日J(rèn)可。
這枚勛章幫助王云鶴在華為內(nèi)部的晉升路徑上踩實(shí)了關(guān)鍵一步。
相比內(nèi)部的榮譽(yù),他與團(tuán)隊(duì)在中國天眼上的工作更具說服力。
他和團(tuán)隊(duì)開發(fā)的高效 AI 算法,應(yīng)用于中國天眼 FAST 的觀測工作中,協(xié)助中科院國家天文臺專家發(fā)現(xiàn)了數(shù)百個(gè)新的快速射電暴樣本。
![]()
快速射電暴是宇宙中最神秘的瞬變現(xiàn)象之一,每次爆發(fā)僅持續(xù)數(shù)毫秒,在海量射電數(shù)據(jù)中如同大海撈針。
將高效算法嵌入基礎(chǔ)天文學(xué)研究,是一次真正意義上的學(xué)科跨界——在這里,王云鶴團(tuán)隊(duì)的工作沒有商業(yè) KPI 的框架,有的只是數(shù)據(jù)、信號與星空。
2023 年底,華為諾亞方舟實(shí)驗(yàn)室與北京大學(xué)等機(jī)構(gòu)聯(lián)合提出了「盤古 π」網(wǎng)絡(luò)架構(gòu),嘗試構(gòu)建更高效的大模型架構(gòu),以解決 Transformer 架構(gòu)中非線性能力不足的問題,顯著降低特征塌陷,王云鶴在此論文中署名第一作者。
![]()
https://arxiv.org/pdf/2312.17276
Transformer 架構(gòu)自 2017 年提出以來,已成為幾乎所有大語言模型的骨干。
隨著模型規(guī)模的暴力擴(kuò)張,深層特征趨于同質(zhì)化的「特征塌陷」問題日益凸顯。
盤古 π 提出了新的激活機(jī)制與結(jié)構(gòu)設(shè)計(jì),在一定程度上為華為的盤古大模型系列提供了理論支撐,也在學(xué)術(shù)層面確立了王云鶴作為大模型架構(gòu)研究者的位置。
第一作者的署名,將這篇論文與他的名字牢牢綁定——在競爭激烈的頂會發(fā)表圈,對第一作者之爭的敏感程度,往往不亞于商場里的利益博弈,只是后者更少被公開談?wù)摗?/p>
登頂掌舵
2025 年 3 月,華為諾亞方舟實(shí)驗(yàn)室進(jìn)行人事調(diào)整,原主任姚駿內(nèi)部轉(zhuǎn)崗,實(shí)驗(yàn)室主任一職由王云鶴接任。
![]()
姚駿
彼時(shí),他年僅 33 歲。
在中國科技企業(yè)的管理層敘事里,「90 后掌門人」是一個(gè)被反復(fù)使用的修辭,兼具媒體友好度與人才自信的雙重功效。
王云鶴的晉升速度確實(shí)不慢:從 2018 年的博士應(yīng)屆生,到 2025 年的實(shí)驗(yàn)室主任,七年時(shí)間完成了從高級工程師到技術(shù)專家、再到算法應(yīng)用部部長、最終執(zhí)掌諾亞方舟的全程攀升。
這條路走得流暢,幾乎沒有停頓。
![]()
流暢的晉升路徑,有時(shí)意味著出色的能力,有時(shí)意味著精準(zhǔn)的站位,有時(shí)兩者皆有,旁人通常難以精確區(qū)分。
王云鶴的崛起折射出中國科技企業(yè)的代際傳承規(guī)律。
相較于前輩學(xué)者型管理者,新生代技術(shù)領(lǐng)袖普遍具備「學(xué)術(shù)根基+產(chǎn)業(yè)實(shí)戰(zhàn)」的雙重基因。
他的前任姚駿曾主導(dǎo)盤古 α 的研發(fā),在那個(gè)以參數(shù)規(guī)模論英雄的時(shí)代留下了清晰的歷史坐標(biāo)。
![]()
而王云鶴接任之后,迅速以盤古大模型 5.5 系列的發(fā)布宣示了自己的存在。
他介紹,盤古 5.5 在長序列處理、低幻覺生成、自適應(yīng)快慢思考、Agent 能力等方面進(jìn)行了創(chuàng)新,重點(diǎn)面向企業(yè)級實(shí)用性與可控性。
這些技術(shù)關(guān)鍵詞排列在一起,構(gòu)成了一份面面俱到的發(fā)布詞。
在自然語言處理領(lǐng)域,盤古發(fā)布了 718B 參數(shù)的超大 MoE 模型「Pangu Ultra」,由 256 個(gè)專家組成,激活參數(shù)量為 39B,借助「通算掩蓋」、「MoGE 專家路由」以及三明治架構(gòu)等技術(shù),實(shí)現(xiàn)了訓(xùn)練效率、推理吞吐和模型精度的大幅提升。
718B 的參數(shù)量在大模型軍備競賽的數(shù)字譜系里已屬頂端。
從加法神經(jīng)網(wǎng)絡(luò)到盤古 π,從 GhostNet 到天眼快速射電暴,再到接掌諾亞方舟,王云鶴的職業(yè)軌跡描繪出一條完美的上升曲線——技術(shù)積累、榮譽(yù)加冕、學(xué)術(shù)背書、組織掌舵,每一個(gè)節(jié)點(diǎn)都踩得恰到好處,每一次亮相都備好了可供引用的成果清單。
在一個(gè)需要不斷自我營銷的時(shí)代,這種精準(zhǔn)的節(jié)奏感本身就是一種能力。
只是,一所真正意義上的基礎(chǔ)研究實(shí)驗(yàn)室,最終檢驗(yàn)的從來不是履歷的完整度,而是那些無法在新聞稿里被簡潔概括的、真正漫長而寂寞的科學(xué)貢獻(xiàn)。
據(jù)悉,王云鶴的下一站,是 Agent 創(chuàng)業(yè)。
諾亞方舟實(shí)驗(yàn)室和王云鶴后續(xù)會誕生哪些變化,讓我們拭目以待。
參考資料:
https://www.linkedin.com/in/yunhewangpku/
https://scholar.google.com/citations?user=isizOkYAAAAJ&hl=zh-CN&oi=ao
https://www.zhihu.com/search?q=%E7%8E%8B%E4%BA%91%E9%B9%A4
https://www.zhihu.com/question/658401579/answer/2002073924675060532
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.