![]()
被動成為新一代 AI 黃埔軍校的字節跳動。
文丨申遠
編輯丨劉梓元
字節 Seed 是對大模型人才最具吸引力的團隊之一,同時也有很多人正在離開字節跳動,最新一個目的地是騰訊。隨著騰訊重新整合大模型組織架構,字節在 Infra 與數據方面的核心人員被招募,除了《智能涌現》報道過的肖學峰、張弛和黃啟,據悉還有負責數據處理的團隊被成批挖走。
這是騰訊在大模型領域的補課,在姚順雨入職之前,騰訊大模型業務分散在不同業務群,這種松散讓大模型研發的多個環節無法緊密銜接,導致訓練數據質量參差不齊、標注不規范,更重要的是底層工程能力欠佳。
這是字節的長處。曾有對字節模型基礎設施建設比較了解的人士表示,字節的工程化能力 “比國內任何一家公司都要強”,這支精干的 Infra 團隊目前由項亮負責,他是一位已經加入字節 10 年的老兵,早在這一輪 AI 浪潮之前,他就負責字節推薦算法研究。
大模型浪潮帶給人們一種錯覺,那就是大模型技術和過往算法有本質不同,但實際上,這種本質區別更多是思路上的而不是技術本身。經驗仍然重要,特別是在基礎設施領域。大量搜廣推背景工程師正在大模型領域,而字節在此已經有了十多年積累。正因如此,這成了外界挖人的重點領域——有這樣規模化豐富經驗的人才實在是太少。
這樣的人員流動不僅局限在國內,據晚點了解,在 OpenAI 和 Meta 的 Infra 團隊中同樣有前字節 Infra 員工的身影。曾屬于 Infra 基礎設施方向重要成員的蔣子恒入職 Meta,早期曾在字節 AML (Applied Machine Learning 應用機器學習,字節負責搜廣推的核心機器學習平臺)工作的 Youlong Cheng 則加入 OpenAI。還有一位負責強化大語言模型訓練擴展與加速的研究員據信已加入 Safe Superintelligence,后者由前 OpenAI 首席科學家 Ilya Sutskever 創建,有一支人數約為 50 人的精簡研究團隊。
字節的另一個優勢領域視覺模型,同樣出現了批量人員流動。晚點此前報道過,視覺多模態生成負責人楊建朝、視覺基礎模型研究負責人馮佳時都已離職。馮佳時 2021 年從新加坡國立大學加入字節,坊間關于他的一個趣聞是在 ChatGPT 爆發后,馮佳時曾給張一鳴講解 AI 前沿技術,他的下一站同樣是騰訊。
從 Linkedin 上可以看到,海外大廠也延攬了不少字節視頻生成與多模態理解圖團隊的研究人員。包括在 OpenAI 語音和多模態方向的 黃清清,Google Deepmind 多模態理解方向的 Chunyuan Li,Meta 多模態模型研發的喬思遠,以及曾在字節負責視頻模型生成的蔣路,現已入職蘋果。
視覺領域成為字節的模型長板并不讓人意外,更早之前從字節視覺技術負責人崗位離職的王長虎創立的愛詩科技剛剛完成 3 億美元的 C 輪融資,這是中國視頻生成領域最大的單筆融資。
除了 Infra 與視頻模型團隊外,事實上字節大模型人才的足跡遍布整個行業。DeepSeek 首位員工李宇琨來自字節搜索團隊,去年底離職的月之暗面強化學習負責人宋鴻涌,有近兩年時間在字節做游戲 AI 強化學習研究,階躍星辰聯創和 CTO 朱亦博,同樣也曾在字節從事 infra 相關內容。
從技術到產品,大模型人才流失復刻了字節產品和運營人才出走的景象,投資人手里流傳著一本花名冊,上面涵蓋字節業務體系關鍵點位的負責人 —— 抖音、今日頭條、剪映和飛書的產品運營曾被認為是最具確定性的投資標的。前抖音產品負責人、PICO 副總裁任利峰創辦了數美萬物,Manus 的聯創之一是飛書海外產品負責人張濤,剪映商業化負責人陳冕創辦了 Lovart,以及曾一度在大模型六小龍任職的張心皓、張前川與明超平。
現在還要加上大模型從業者了,豆包 PC 端業務負責人齊俊元的創業項目,GUI Agent 智能終端投后估值達到數億美元,曾任字節 AI 陪伴產品 “貓箱” 產品負責人的梁琛奇的創業項目也拿到了包括 IDG 和美團在內的投資。
他們是字節人才外溢效應囊括的最新群體。
極致執行與飽和式出擊
三年前字節的 AI 還遠不是這番景象。昆侖萬維創始人周亞輝在 24 年初評價字節過去一年半的 AI 戰略是 40 分,但 9 個月后這個分數就變成了滿分。
這是一個非常 “字節” 的故事,尋找好想法,然后把它執行到極致。過去十多年字節是這樣顛覆許多領域的,最開始是新聞資訊,然后是短視頻,再到小說和短劇,它們圍繞的重點無外乎兩個,極致用戶體驗,還有最高商業化效率。
“AI 是一個能影響世界的機會”,2023 年字節高層判斷,當下這個時代操作系統級別的機會就是 AI + 計算,這是一個怎么夸大都不為過的 “好想法”,因此,它需要字節執行得更極致。在 2023 年中決定靠自有團隊做 AI 后,字節飽和式出擊,從算力芯片到云,從模型研發再到應用。
應用側很好體現了所謂 “飽和”,字節的布局堪稱一超多強。豆包的日活在 2025 年底已經過億,穩居第一,海外版 Dola 日活已經過千萬。除了 AI 助手,字節還推出了 AI Coding 工具 Trae 和 智能體平臺 Coze。
飽和出擊的另一個是發揮協同作用與規模效應,這被寫進了 2025 年字節的 AI 目標中。字節有 50 多條業務線,在 AI 來之前,各個業務部門的孤立狀態正在形成,一個標志是招聘的停滯,2022 年,HR 被告知要控制組織增長的規模。All IN AI 很大程度上串聯起了字節的各條業務線,而大模型本來就是一個比移動互聯網 APP 開發鏈條長得多的行業,受益最大的是云。
2020 年上線的火山引擎比主要的競爭對手晚了 10 年進入這個領域,很長時間都處于不溫不火的狀態。也正因如此,它成了最先最堅決轉向 MaaS(模型即服務)的云廠商,而飽和式投入 AI 給了火山引擎彎道超車的機會。
字節有中國最大的推薦算法模型,早在大模型時代之前,火山就有把數千張 GPU 做成單一集群的經驗。火山引擎有專門團隊參與 Seed 模型研發,而產品部門開發的 AI 應用都通過火山引擎調用自家的模型,這讓火山的 MaaS 服務在最初就有了規模效應。
25 年火山引擎兩次上調收入目標,26 年 MaaS 收入超百億的目標也已經再次上調。4 月,火山引擎宣布豆包大模型調用量超過了 120 萬億 tokens 每天,這個數據在去年 9 月還是 30 萬億,半年增長了 4 倍。
用人才而不是過去的成功經驗,來解決 AI 的本質問題
有些問題不是靠極致執行和飽和式出擊就能解決問題的,在大模型的用戶體驗上,字節就遭遇了瓶頸,原有的方法并不完全奏效。
用戶反饋讓產品更好用這是基本的常識,字節過去的厲害之處是通過算法與產品設計讓這件事在不知不覺中最高效完成,產品從設計上就自帶數據反饋飛輪,每一次下劃、點贊和喜歡按鈕都在實時優化推薦模型,隨著用戶規模的擴大,產品會更加了解用戶,字節和快手這樣的頂尖公司能把反饋壓縮到幾秒鐘內,用戶下劃兩次就能遇到更符合自己口味的新視頻。
字節自己也確實想把這一點也復用在模型開發上。豆包 1.5 Pro 發布的時候官方宣稱:“依托字節在推薦、搜索和廣告領域的 AB Test 經驗,構建了基于大規模用戶反饋的閉環優化系統”。
然而 “模型實際體驗” 和 “模型能力” 不是一回事。應用體驗可以優化,但模型在上線之后參數是固定的,用戶的反饋不能實時更新到模型中去,只能等待下一次模型訓練。每次訓練都是從頭來過,換句話說,移動互聯網時代字節最熟悉的那種產品飛輪效應在大模型領域不存在。
同樣不存在的還有規模化效應,App 的分發邊際成本為 0,但用戶和大模型的每一次互動都在消耗算力,這受制于物理規則、無法被平攤。
上述限制讓字節很難復制移動互聯網時代的成功。豐富的玩法和運營策略,以及大規模投流讓豆包在 2024 年底就成為了 AI 產品中的第一名,然而 2025 年春節,DeepSeek 橫空出世,它的成功牽涉了更本質的東西:模型能力可以讓一個名不見經傳的組織不花一分市場預算就蜚聲全球。實際上 OpenAI 也是靠同樣的邏輯,ChatGPT 爆火甚至讓它們內部始料未及,這本是個實驗性質更多的項目。
在用戶體驗飛輪并不能充分轉動的情況下,極致的商業化效率自然無從談起。最終,關于 AI 的競爭回歸原點,最樸素的基準只有一個,那就是模型能力。某種程度上,不管是大廠還是 “小龍”,所有大模型玩家位于同一起跑線。為此,字節成立一個內部獨立的研究組織,Seed 正是字節人才外溢效應發生的容器。
Seed 與 “最高 AI 人才密度”
Seed 最初是從字節 AI Lab、AML 和搜索團隊等部門抽調人手組建的,它不屬于字節原有業務體系,從最初設計上就直接向字節集團管理層匯報。從一開始,字節就為 Seed 定了一個嚴格標準,保持戰略耐心,堅持不走捷徑(比如蒸餾現成的模型),而是聚焦基礎問題的本質,拿出高水準的模型成果。耐心意味著堅定不移地投入,Seed 僅自有數據團隊就有近千人。
這種堅持很少出現在一個盈利性企業的內部。25 年初,字節挖來了 Google 的吳永輝擔任一號位,他進一步細化了 Seed 的內部結構。Seed Edge 就是在這個時候提出的,它聚焦于需要長期攻關的 AGI 課題。Seed Edge 考核期是三年,相比之下 Seed 本身是半年,而一度堅定奉行 OKR 戰略的字節其他部門則是兩個月。
這種類似國中之國的架構,目標是回歸字節價值觀 “始終創業”,而創業這個詞在字節的心目中和人才緊密相關。字節戰略部門的人士曾對晚點說過,張一鳴認為 “很多事表面上是戰略問題,本質上是人才問題。” 而對處于創業階段的組織來說,對人才的如饑似渴非常重要。
Seed 恰好就是這樣饑渴的組織。23 年底開始,字節開始密集招人,最開始目標集中在高階人才。晚點曾經報道過,當時許多頂尖論文作者都和張一鳴聊過,最終字節招募了來自 Google 的蔣路、面壁的秦禹嘉、零一萬物的黃文灝、智譜的丁銘,以及阿里通義千問模型的前負責人周暢。
周暢博士畢業就加入阿里,是達摩院內部培養起來的應屆生,離職時是通義千問的負責人,那是 2024 年中,一位接近周暢的人士告訴晚點,字節高層一對一和周暢聊過,表達了追求頂尖 AI 技術的決心,而字節在技術布局上的思路也和周暢的觀點更契合,他的研究興趣更多集中在視覺與多模態模型,而不是單純大語言模型,這恰好是字節擅長的領域。
除了高層人才之外,為了快速健全 Seed 架構,字節 HR 在招攬 AI 人才時甚至會相對寬松地批量發放 offer,這是字節招聘的肌肉記憶。字節是組織成長最快的互聯網巨頭,人數達到十萬人用時僅 8 年,相比之下阿里是 19 年,騰訊則長達 23 年,訣竅之一就是開足馬力的 HR 體系,很長一段時間內字節 HR 的唯一工作就是招人,高峰時,字節 HR 對中國最頭部 20 所大學核心專業的學生觸達率在 80% 以上。
2024 年 5 月,字節面向應屆博士生發起 Top Seed 計劃,一年時間延攬 30 多名博士生,他們年薪可達數百萬人民幣。實際上,由于組織架構相對獨立,即使沒有入選 Top Seed,相比字節其他部門,進入 Seed 依舊劃算,在 Seed 更容易獲得更高職級和薪水,甚至還有針對大模型人才發放的津貼,每月最高達 10 余萬。另外,字節還針對頭部高校提供 500 多個大模型相關的實習崗位。
這場劇烈的招聘行動持續了兩年,迅速提升了 Seed 的人才密度。MiniMax 創始人閆俊杰曾說,“客觀來說,字節的 AI 人才密度是最高的。”
人為什么離開?
高速成長的技術人才組織,往往伴隨著活躍的人員流動。一些人選擇離開,去探索新的可能性,這是 Seed 也無法避免的問題。
Seed 自成立以來一直在經歷各種組織架構調整,最初 Seed 只是吸收了 AI Lab 中做 NLP 自然語言處理的小組,隨后是視頻生成相關團隊,Seed 最終整合了原本分散在不同小組的視頻和多模態研發小組,負責人是前面提到的周暢。直到 2025 年底,AI for Science 、具身智能和 Reponsible AI 等小組才徹底并入 Seed。原 AI Lab 負責人,曾經華為諾亞實驗室主任的李航退休返聘,向吳永輝匯報,而具身小組的負責人孔濤則在 2025 年中去職。
外部的競爭更加激烈,隨著越來越多大廠的加入,人工智能行業的人才流動速度顯著加劇。字節的大模型研究人員成為了絕佳標的,事實上幾乎每家公司的高級研究人員都遭遇過挖角,和移動互聯網時代不同的是,同樣的職位,對方能給出的薪資待遇往往是翻倍,職級也會升高一級不止,同時,目標人選越來越年輕。
對大模型行業來說,前沿研究人員的年輕化是一個普遍而明顯的趨勢,他們往往精力充沛,野心勃勃,極度自驅,“每個人都想成就一番事業。” 這個年齡區間甚至下探到了高中,月之暗面 3 月剛剛發表了一篇關于注意力殘差的論文,作者之一是只有 17 歲的高中生陳光宇。
字節恰好擁有許多年輕人,因此面臨更激烈的挖角。
重用年輕人是吳永輝的思路。2025 年初,吳永輝入職,他在內部溝通時表示,加入字節的原因一方面是想做第一流的研究,同時也想打造第一流的 AI 研究團隊。對吳永輝看來,Seed 的人才供給已經不是問題,但重要的是如何才能把人用好,于是解法順理成章變成了培養年輕人。
吳永輝到來之后,Seed 幾乎不再從外部招聘中高級技術管理者,而更多針對年輕人的計劃陸續出爐。去年 3 月,Top Seed 研究實習生計劃公布,最高薪資每天 2000 元,條件下探到本科生和高中生。今年 3 月,字節啟動最大規模實習生招聘,面向全球招聘 7000 人,研發崗位占比近 7 成,而 4 月 Seed 啟動了自己的校招計劃,打算招聘 100 名 27 屆畢業生。
在 Seed 官方對校招計劃的介紹中,畢業不到一年的校招生和尚未畢業的實習生都在深度參與核心模型的技術攻關,我們了解到,一位 2024 年從清華大學畢業的博士生現在同時向周暢和吳永輝匯報,Seedance 2.0 算法負責人就是 2021 年作為校招生入職字節的,他們正逐漸成為大模型研究的主力,與此同時,Seed 組織擴張階段結束,算法和工程技術人員穩定在 1000 多人。
字節的野心
字節不是沒有意識到人員流失的問題。去年底,字節宣布在全球范圍漲薪,而針對大模型人才的豆包股同時曝光。這套虛擬股權激勵體系專門針對大模型人才,透過類似字節期權的回購機制,加強對人才的長期吸引和激勵。
但阻止人員流失更重要的或許是在選擇做一流研究組織和保證產出之間找到更為恰當的平衡,這對每一個 AI 機構來說都是挑戰,Google DeepMind CEO 德米斯·哈薩比斯(Demis Hassabis)曾說,希望組織同時有初創企業的專注活力以及學術界天馬行空的思維,在字節的語境里,或許還應該加上一條,那就是同產品運營之間高效的銜接合作,盡管許多人都認為,高效是創新的敵人。
2026 年 1 月底,字節 CEO 梁汝波在全員會上把 2026 年目標關鍵詞定為勇攀高峰,短期內高峰指的就是豆包,在已經取得 DAU 第一后,豆包的重中之重是 AI 模型能力要做到行業前列,并通過助手整合好已有的產品和服務。2 月,Seedance 2.0 震撼全網,似乎人員流失短期內并沒有影響字節在視頻模型領域的統治力。實際上,就在那篇 Seed 校招的推文中,字節自豪地宣稱,“我們的 AI 業務在 C 端和 B 端均已取得領先優勢。”
當一個組織人才密度足夠高、足夠龐大的時候,人才流動是不可避免的,現在 AI 競爭遠沒有到分出勝負的時候,旅程還在繼續。
題圖來源:《星際迷航》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.