![]()
阿里培養的校招生正在成為通義實驗室研發主力。
文丨陳佳惠
編輯丨賀乾明 管藝雯
我們獨家獲悉,阿里云 CTO、通義實驗室負責人周靖人近期成為阿里巴巴合伙人。
合伙人團隊是阿里的最高集體決策機構。今年 6 月,阿里合伙人團隊剛經歷大幅縮編,人數降至上市以來最低的 17 人。
阿里選拔合伙人,候選人除了在阿里工作 5 年以上、高度認同公司文化、對公司發展有積極貢獻、愿意為公司文化和使命傳承竭盡全力,還需要四分之三以上的合伙人贊同才能當選,也就是 17 位合伙人需要至少 13 人投贊成票。
周靖人已經在阿里工作十年。他畢業于中國科學技術大學,2004 年獲得美國哥倫比亞大學計算機博士學位,后加入微軟擔任研發合伙人。2015 年,他加入阿里出任阿里云首席科學家,之后轉崗多次:剛開始在阿里云負責 iDST(數據科學與技術研究院,達摩院前身),隨后負責電商的搜索推薦廣告,2020 年底轉去螞蟻,一年多之后回到阿里云擔任 CTO、兼達摩院副院長。
我們了解到,周靖人成為阿里合伙人的關鍵因素之一,是他負責的通義實驗室過去一年努力保證了 Qwen 的模型領先地位。阿里管理層給了他高度肯定,評價 “這非常不容易”。
從達摩院到通義實驗室,阿里重組研究組織
2023 年大模型浪潮到來時,阿里正在推進 1+6+N 變革。達摩院作為 “N”,要從阿里云體系分拆出去。在這個過程中,達摩院多個 AI 研發團隊重組成通義實驗室,隸屬于阿里云,由周靖人負責。
同年,吳泳銘正式接任阿里巴巴 CEO,并兼任阿里云董事長、CEO。上任不久,他在內部信中提出把管理團隊變得年輕。
這種傾向在通義實驗室有直接體現。2020 年,達摩院有兩個團隊同時研發大語言模型,分別是黃非負責的 AliceMind 和周暢、林俊旸等人參與的 M6 項目。到 2022 年,阿里把大模型技術路線收斂到 M6 上,改名為 Qwen 系列。
通義實驗室成立后,基礎語言模型千問研發團隊由 1990 年出生的周暢負責。他 2017 年博士畢業于北京大學,以校招生身份加入阿里。資歷更深的黃非團隊,主要負責大模型應用算法,比如通義靈碼(編程模型)、通義星塵(角色扮演模型)。
類似的情況也出現在視覺模型研究方向。除了薄列峰負責的應用視覺團隊,通義實驗室還組建了圖像、視頻生成模型研發的萬相團隊,由 2015 年清華碩士畢業后,同樣以校招生身份加入阿里的劉宇負責。
經過一年追趕,阿里開源的 Qwen 系列大模型在全球開源模型中存在感持續提升。2024 年 10 月,其衍生模型數量達到 8 萬多個,超過更早開源的 Meta Llama 系列。
在通義實驗室組建年輕組織過程中,也出現人才變動。2024 年 7 月,千問模型研發團隊負責人周暢離職,之后加入字節 Seed 團隊。
我們了解到,千問模型團隊中超 80% 為阿里自主培養的校招生。他們在阿里體系內的薪酬線性增長,趕不上字節和大模型創業公司為了爭搶人才給出的溢價。
周暢離職后,其負責的千問模型研發團隊由更年輕的林俊旸負責。林俊旸 2019 年從北京大學碩士畢業,也以校招生身份加入阿里,現在是阿里最年輕的 P10。同時,阿里給千問大模型研發團隊成員都提高一個職級,薪水同步上漲。
“我們一直有激勵團隊。薪酬匹配是需要的,但高薪不是唯一手段。” 周靖人曾接受我們訪談說。
今年,從達摩院并入通義實驗室的多位技術負責人陸續離場。
我們獨家了解到,阿里通義實驗室自然語言處理方向負責人黃非于近期離職。黃非本科畢業于天津大學,2005 年從卡耐基梅隆大學博士畢業,先在 IBM Watson 從事 NLP 相關研究,后加入 Facebook,擔任 AI 翻譯團隊主管。
2018 年,黃非加入成立不久的阿里達摩院,把機器翻譯等技術應用到阿里集團各個業務中,并帶隊研發了阿里早期的大語言模型之一 AliceMind。2023 年,黃非團隊并入通義實驗室。
黃非離職后,他帶的團隊中幾位負責人直接向阿里云 CTO、通義實驗室負責人周靖人匯報。除了黃非,今年從通義實驗室離開的技術研發負責人還有 2 位:
- 鄢志杰,通義實驗室語音團隊負責人。他 2015 年加入阿里達摩院前身 iDST。今年 2 月離職,之后加入騰訊,又從騰訊離職加入京東。
- 薄列峰,通義實驗室應用視覺團隊負責人。他 2022 年 9 月加入阿里達摩院,擔任達摩院 XR 實驗室負責人,今年 4 月底離職,之后加入騰訊。
更激烈的競爭、更高的期待,讓研究團隊靠自驅力工作
我們曾報道,通義實驗室今年有三個最重要的工作目標:一是守住模型排名的領先位置,模型性能、下載量、衍生模型數量都領先;二是要滲透更多商業應用場景;三是 2025 年,整個通義模型的日均調用量目標做到數十倍的增長。
同樣采用開源策略的 DeepSeek 走紅后,智譜、月之暗面、MiniMax、階躍星辰等中國大模型創業公司普遍開源參與競爭,給通義實驗室帶來更大壓力。
同時,通義實驗室和千問 app 在阿里體系內背負了更大的期待。今年 11 月,阿里智能信息事業群推出新款千問 app,明確對標 ChatGPT。千問應用相關的人士稱,這是繼 AI 基建、淘寶閃購后,阿里今年宣布的又一個集團戰略項目。
12 月 9 日,阿里把智能信息與智能互聯兩個事業群重組為千問 C 端事業群,由阿里副總裁吳嘉負責,首要目標是 “將千問打造成為一款超級 app,成為 AI 時代用戶的第一入口”。
據我們了解,千問 app 目前以天為單位進行功能更新,幾百名工程師聚集在阿里巴巴西溪園區 C4 樓封閉開發,正在加速接入阿里體系內淘寶、高德等應用,預計在春節前會有一次大迭代。
千問 app 重要程度提升,需要通義實驗室持續提供能力強大的底層模型。周靖人今年 4 月說,他與吳嘉討論很頻繁,通義的重要目標之一是支持好這些產品,“也能給我們模型研發一些反饋。”
通義實驗室高層并沒有因此給研究人員施加更大的壓力,希望他們靠自驅力工作。
他們都給自己定了較高的目標,比如林俊旸要讓 Qwen 模型對標 Gemini,在國際上的影響力更進一步。
寬松的管理風格也讓他們積極探索更多研究方向,比如千問模型團隊今年新組建具身智能小組。同時千問模型研發團隊也有小組在研究語音、文生圖等模型,而通義實驗室已經有其他團隊在研究類似模型。
通義實驗室今年也至少從外部引入兩位技術負責人。一位是曾在百度、滴滴負責語音識別,后來加入零一萬物的李先剛。他接替鄢志杰負責通義實驗室語音團隊。
另一位是今年 2 月加入阿里智能信息事業群的許主洪。他曾是新加坡管理大學信息系統學院教授、Salesforce 亞太區研究總監。今年 9 月,他轉崗到通義實驗室,負責多模態大模型的研發。
伴隨多位技術管理者的更迭,通義實驗室完成新一輪的核心人才盤整。在這個節點,周靖人入選合伙人,是阿里在組織層面深入持續推進 AI 戰略的直接體現:給予更多信任與資源的同時,也需要他在充滿不確定性的外部競爭中,帶隊拿到更確定的結果。
題圖來源:F1:The Movie
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.