網易首頁 > 網易號 > 正文申請入駐

字節大模型的收斂之年

2026-02-12 16:50:04　來源: 智遠同學

北京舉報

分享至

文：王智遠 | ID:Z201440

2025年2月，DeepSeek刷屏的那個春節，梁汝波在全員會上說了六個字：跟進速度不夠。

一年后的2026年2月，豆包2.0發布前夕，火山引擎拿下了春晚獨家AI云合作伙伴的身份。從「缺席者」到「造浪者」，中間剛好隔了一整年，365天。

這一年里，阿里瘋狂發力，一口氣發了上百個模型；騰訊也動了大動作，重組了AI Infra部；百度更直接，把文心給開源了。

唯獨字節，出牌頻率反而變得特別低，看著有點反常，但它并沒缺席這場競賽，只是把籌碼都押在了大家看不見的地方。

這篇年終復盤，只想回答一個問題：字節看不見的押注，是如何在2026年春節前，變成一發不可收拾的？

01

如果說 2023 到 2024 年，字節大模型走的是「突擊隊」路子，打快仗、搶熱點，快速完成從 0 到 1 的布局，那 2025 年，字節大模型正式進入了「吳永輝時間」。

這位被寄予厚望的新帥上任后，做的第一件事，就驚到了整個字節：他直接給Seed團隊取消了季度OKR，甚至連半年考核都給撤了。

要知道，字節可是出了名的講「字節范兒」、喊「Always Day One」，在這樣一家公司里，取消考核這事兒，簡直就是「政治不正確」。

但吳永輝有他自己的道理：

要是方向從一開始就錯了，讓大家三個月交一次答卷，只會更快把路走死；字節的DNA是「小步快跑、快速迭代」，可這套邏輯，到了大模型領域，根本不好使。

那時候的字節大模型團隊，已經染上了嚴重的「大公司病」。

2025年初，AI Lab、Seed團隊、視覺生成團隊、豆包產品技術部，這四支隊伍就跟四條平行線似的，各有各的匯報線，各搞各的研發節奏，互不相干。

AI Lab由李航帶隊，主打學術研究；Seed團隊歸吳永輝管，重點放在實際應用上；視覺團隊剛從阿里挖來周暢，還在磨合，而豆包的技術負責人朱文佳，更是直接向梁汝波匯報。

大家互相搶資源、隱性競爭，甚至出現過同一個需求，四家團隊各自埋頭做的荒唐事兒。

吳永輝入職后，Seed團隊前后搞了三次組織收斂，一步步把分散的力量擰成一股繩。

2025 年 3月份，AI Lab整體并入Seed，李航開始向吳永輝匯報，原來集團級研究部門的光環沒了，所有研發力量，都歸到了同一個指揮體系下。

到了年中，隨著楊建朝暫休，字節從阿里挖來周暢接手視覺多模態團隊，文生圖 Seedream、文生視頻 Seedance 等多模態團隊的管理權限，同步納入 Seed 整體體系，周暢直接向吳永輝匯報，多模態研發與大模型主干能力實現了同頻調度。

最關鍵的一步，在10月份落地，豆包技術負責人朱文佳，直接匯報對象從梁汝波改成了吳永輝。

這是字節為數不多以「收斂」而非「擴張」為核心目的的組織整合。

過去十年，字節擅長分，抖音分出頭條、飛書、TikTok。但大模型競賽的后半程，比的不是誰開的分支多，是誰的主干粗。

為了讓這根「技術主干」更扎實，吳永輝入職后，一直鼓勵研究員深耕基礎研究、積極輸出頂會論文，2025 年上半年，Seed 團隊在國際頂級學術會議上發布的論文數量，比2024 年同期實現了翻倍增長。

但理想與業務現實之間，終究有需要平衡的鴻溝。

到了三季度，豆包2.0的發布節點越來越近，管理層對發論文也有了新要求：內容必須和正在迭代的核心技術沒關系，不能影響產品上線。

2026年1月，梁汝波在全員會上，把核心關鍵詞改了，從之前的「探索智能上限」，變成了「勇攀高峰」和「AI模型能力要做到行業前列」。

從「探索」到「做到」，這七個字的變化，是2025年字節組織調整的全部答案：它不再滿足于做一個「參與者」，它要做「第一梯隊」，甚至要做「唯一」。

02

組織收斂的效果好不好，最終還得靠產品來檢驗，2025年上半年，豆包在用戶心里的形象，特別分裂。

它聊起天來是真厲害，情緒價值給得足足的，你跟它嘮一宿情感八卦、吐吐槽，它都能接住。

可要是你讓它查機票、比價格，或者完成一個需要多步驟的任務，它大概率只會給你一段通用攻略，然后，熱情地問你還有什么能幫你的嗎，根本解決不了實際問題。

「聊天機器」和「辦事助理」之間，隔著一道實打實的鴻溝。而字節，選了一條最笨、也最扎實的路來填這個坑：死磕「聽懂人話」和「把事辦成」這兩件事。

2025年11月，豆包的語音對話功能，上線了一個看似不起眼、但實際特別難的功能：同一個音色里，能流暢切換粵語、四川話、東北話、陜西話四種方言，還能識別20種方言。

為了做好這個體驗，字節讓同一批聲優，用不同的方言錄制一模一樣的語料。這就意味著，錄音成本直接翻了一倍，后期的標注工作，復雜度更是呈指數級上升。

有人可能會問，為啥要費這么大勁做方言功能？

答案很簡單：打基礎，做基建。中國有超過10億人說方言，這其中，有大量的中老年用戶，不會打字、也不熟悉App的操作邏輯，但他們會對著手機說話。

讓AI學會方言，是為了讓四川的老人、廣東的阿姨能毫無門檻地用起來。這是字節在爭奪「下一個10億用戶」的入場券。

方言降低了開口的門檻，而「Agent（智能體）」則解決動手的問題。

字節在這條坎上的爬升路徑，清晰地寫進了2025年的版本日歷里，2025年6月11日，豆包1.6版本發布，譚待在發布會上，演示了一個讓所有人都眼前一亮的場景：

拍一張購物小票，模型能自動整理成Excel表格；你隨口說一句話，模型能自動操作瀏覽器，幫你完成酒店預訂。他把這次升級的核心，總結成了三個字：「行動力」。

到了12月，豆包1.8版本發布，Agent能力又上了一個臺階，能調用十幾個工具，在多個電商平臺之間來回切換，幫你完成耳機的全網比價，還能選出最優選項。

從「能做一件事」到「能做一系列事」，字節一點點補齊了豆包「辦事能力」的短板。但這也帶來了一個致命的新問題：成本太高。

Agent執行一次任務，消耗的Token數量，是普通聊天的幾十倍。要是單次調用的成本降不下來，哪怕Agent再厲害，也只能停留在實驗室里，根本沒法大規模推廣、給更多人用。

在 2025 年火山引擎春季原動力大會上，譚待曾直言，通過底層技術的持續優化，大模型推理成本未來還有 99% 的下降空間。

這一判斷，也為字節后續的成本戰、技術債清零，定下了核心基調。

03

2025 年 11 月，火山引擎發布官方公告：Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年發布的舊版本模型，將逐步停止服務，引導用戶遷移到最新的 Seed 系列模型。

這是字節 2025 年最激進、卻也最容易被外界忽略的關鍵動作。

公告發布后，客服收到了大量企業開發者的反饋，畢竟對開發者而言，模型版本切換意味著接口重接、代碼重改、全流程回歸測試，成本極高。

但字節硬推了。因為譚待算過一筆賬：

智能體時代已經到來，大模型的調用量只會迎來指數級增長。到那個時候，如果還背著 2023 年的老版本、2024 年的 Pro 版、各類客戶特供版等多套技術架構，成本窟窿只會越來越大，根本填不上。

只有把所有模型的內核統一起來，才能釋放規模飛輪的紅利。這不僅是清零之前的技術債，更是對商業模式的一次徹底重構。

字節的成本優勢，靠「算力精算」，把每一分錢都花在刀刃上。

大模型服務的成本困境，根源很簡單，就是一種浪費：「快車要等慢車」。用戶的輸入請求，有的短到只有10個詞，有的長到10萬詞，把這些請求混在一起處理，系統就得按照最慢的那個來調度，大量的算力就這么被閑置了，特別可惜。

字節的解法是「區間定價」和「PD分離」。

2025年6月，豆包1.6版本，首次推出了「區間定價」：0到32K的輸入區間，價格直接打到0.8元/百萬tokens，綜合成本比1.5版本和DeepSeek R1降低了63%；32K以上的輸入，價格再逐級上浮。

這就跟快遞打包一個道理，要把所有尺寸的包裹混在一起裝，肯定特別浪費空間；要是按尺寸分類打包，至少能省下三分之一的紙箱。

更深層的邏輯是「PD分離」，把處理長文本的「預填充」階段，和生成文本的「解碼」階段拆開，用不同的硬件、不同的策略來處理，效率一下子就提升了好幾倍。

這套邏輯的前提是：所有的優化，只能做一遍。

要是同時維護好幾套架構，每做一次優化，就得在每套架構上都來一遍，邊際成本永遠降不下來；所以說，「舊模型大下架」，是「降價99%」的必要前提，也是字節向全行業發起「成本戰爭」的宣戰書。

數據證明了這一策略的成功。

2025 年 5 月底，豆包日均 Token 調用量已達 16.7 萬億；9月突破30萬億；12月突破50萬億，較2024年同期增長超10倍。IDC報告顯示，2025年上半年中國公有云大模型服務市場，火山引擎份額達到49.2%。

當同行在2025年下半年被迫跟進降價時，字節已經通過清掉技術債，獲得了結構性的成本優勢；這種優勢一旦建立，很難被單純的價格戰顛覆。

04

組織收斂了，技術債清了，成本降下來了，最后一塊拼圖是「節奏」。

字節為什么能從2025年春節的「缺席者」變成2026年春節的「主角」？在我看來，它終于找到了屬于自己的研發節奏，它把春節，變成了自己的iPhone發布會，每年都要搞個大動作。

這套「春節錨定法」，是一種「研發倒逼機制」：

別的公司都是按財季規劃模型發布，字節卻是按春節倒排工期，1月份必須封版，2月份必須上線，前一年夏天，就得把技術路線定死。

2025 年春節的被動，讓字節意識到，靠「突擊隊」模式打游擊、追熱點，永遠只能跟著行業節奏走，永遠無法建立自己的領先優勢。

而 2026 年春節的全面爆發，正是這套節奏管理的第一次大考：春晚獨家 AI 云合作、豆包 2.0、多模態能力的全面升級，這一系列動作，都是吳永輝入職一年來，組織收斂、技術清債、成本優化的集中成果爆發。

據行業媒體披露，2026 年 2 月 14 日，豆包 2.0 將正式發布。這是字節大模型遲到的全面進攻信號，但這場關于通用人工智能的戰役，其實才剛剛開始。

站在 2026 年春節的節點回望與前瞻，字節面前，還有三個更難、更長遠的課題需要解決。

第一個，是「閉源模式的持續性」。

2025年，阿里開源了Qwen3全系列，衍生模型超17萬個，形成了龐大的開源生態；百度開源了文心，甚至連騰訊混元也開始在部分版本上開源。字節是唯一堅持閉源路線的中國大廠。

這套模式能走得通，前提是：

火山引擎的 To B 服務收入，與豆包的 To C 用戶黏性，能持續反哺 Seed 團隊的巨額研發投入，形成「研發 - 落地 - 營收 - 再研發」的正向循環。

如果下一階段開源模型能力追平閉源，開發者還會不會為「獨家調用權」付費？字節賭「體驗優先」，但這是一場孤獨的豪賭。

其次，是固定節點錨定的反作用力。

把研發節奏錨定在春節這一個節點上，好處是目標清晰、全鏈路同頻，代價是每年核心的重磅發布，基本只有一次扣扳機的機會。

2025年春節的缺席是代價，2026年春節打響也是代價；如果2027年春節前被對手刻意狙擊，或者產品不及預期，代價將是巨大的。

最后是「巨頭的底牌」。

騰訊在2025年底重組了AI Infra部，由大模型負責人姚順雨直接管，手里還握著微信這個有12億用戶的超級入口，一旦騰訊決定把大模型全量導入微信，那流量優勢，是字節根本比不了的。

阿里云也沒閑著，2025年9月發布了萬相2.5，12月又把千問接入了萬相2.6。它在開源生態上的厚度，還有在云服務領域的深耕，不是字節用一年時間就能追上的。

還有DeepSeek。沒人知道那家創業公司2026年還能拿出什么黑科技。

一年前梁汝波那句「跟進速度不夠」，在 2025 年被字節整個大模型團隊反復咀嚼，成為了全力奔跑的動力。

2026年春節，字節用一場精密的「造浪」證明了它已經補上了短板，把一支3000人的突擊隊改裝成了有節拍器的正規軍。

但大模型的競賽沒有終點。

本可以做得更好的遺憾，字節用 365 天成功改寫；但「還可以更好」的追求，是這條賽道上永遠劃不掉的命題。字節用365天證明了自己會追趕、會切換，它需要下一個365天，證明自己配得上「長期主義者」這個稱號。

春節總會再來，字節作為進攻者的戰役，才剛剛拉開序幕；不一定對，個人觀察。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

龍蝦之戰進入深水區，產品完成度是下一個賽點

鈦媒體APP 2026-04-18 08:48:14
0 跟貼 0
破防！雷軍15小時京滬續航自證清白，懇求全網幫幫小米

雷科技 2026-04-18 12:38:28
2955 跟貼 2955

網購的2800多元垃圾桶退貨時被申通弄壞商家拒收后天貓極速退款變欠款網購退貨在途風險該誰擔

信網 2026-04-19 14:15:08
571 跟貼 571

馬斯克來抖音賣老干媽了?

量子位 2026-04-19 12:48:21
46 跟貼 46
AI上春晚：一場十四億人的驗收

36氪 2026-02-18 10:56:31
16 跟貼 16

買房邏輯已變，我們如何應對？

搞笑枇杷 2026-04-20 02:44:58
0 跟貼 0

印度油輪在霍爾木茲遭炮擊船員喊話伊朗海軍錄音公布

紅星新聞 2026-04-19 17:03:18
14808 跟貼 14808
Opus 4.7重新登頂榜單，但強得多的GPT-5.5極大概率下周就發

新智元 2026-04-19 19:05:24
7 跟貼 7

川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
開源插件引爆大模型暗戰：Claude?mem爆紅背后，是 AI 大廠最不想公開的賺錢秘密

鈦媒體APP 2026-04-20 08:32:38
0 跟貼 0
三層防御仍然不夠，一條PR標題就能偷走你的API密鑰：AI Agent安全裂痕再現

鈦媒體APP 2026-04-18 10:44:12
0 跟貼 0
百萬Token白燒？Claude官方下場：5招治好上下文腐爛

新智元 2026-04-19 09:09:07
0 跟貼 0
編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
0 跟貼 0
教龍蝦玩手機！打通GUI智能體訓練-評測-部署全流程，一站解決

量子位 2026-04-19 12:23:00
0 跟貼 0
大模型架構的下半場

量子位 2026-04-19 18:11:02
0 跟貼 0
獨家專訪元戎啟行周光：一場關于信任、偏見與未來定義的對話

汽車公社 2026-04-17 20:32:29
0 跟貼 0
姑娘大街上直播跳舞，硬件條件太差了，想復制阿梓的路不可能

葫蘆萌娃 2026-04-16 15:19:14
0 跟貼 0
2026年，大模型訓練的下半場屬于「強化學習云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0
張雪回應用戶反映機車爆缸：不是爆缸，是曲軸箱破裂

星視頻 2026-04-18 00:00:11
8 跟貼 8
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
字節招博士只干一件事：押注AI終局

硬核玩家2哈 2026-04-17 12:04:26
0 跟貼 0
汽車大屏的背后貓膩硬件是你的功能是廠家的！

搞笑桔子 2026-04-18 02:55:46
14 跟貼 14
比賽提前結束，WSBK荷蘭站第二輪正賽張雪機車斬獲第七名

澎湃新聞 2026-04-19 20:28:26
4944 跟貼 4944
當老板與員工展開“蒸餾”對抗

經濟觀察報 2026-04-18 17:48:45
21 跟貼 21
榮耀機器人包攬半馬前三工程師回應

新京報 2026-04-19 12:25:11
4719 跟貼 4719
五一假期火車票開售以來，鐵路12306拒絕出票105.6萬張

環球網資訊 2026-04-19 15:23:04
3913 跟貼 3913
Codex產品負責人：小型團隊不再需要PM，招了就危險了

智東西 2026-04-19 15:43:09
20 跟貼 20
中國公民在俄2死23傷王偉中作批示

新京報 2026-04-19 12:15:11
1287 跟貼 1287
【數智周報】DeepSeek據悉正首次洽談外部資本，估值超100億美元；臺積電CEO：全力擴產仍難以滿足強勁AI需求；斯坦福報告：中美頂級大模型差距“實

鈦媒體APP 2026-04-19 20:06:22
0 跟貼 0
蘇林訪華深度體驗中國高鐵 “半個政治局”都來了

國是直通車 2026-04-20 09:48:04
0 跟貼 0
具身數據戰開打！普通人都能上手，邊采邊篩，只喂機器人愛吃的

量子位 2026-01-12 12:20:02
0 跟貼 0
大廠資深程序員，“未來碼農的優勢可能是比AI更便宜”

新周刊 2026-04-20 09:07:23
0 跟貼 0
更新越頻繁，Claude Code與Codex越像

機器之心Pro 2026-04-20 10:12:15
0 跟貼 0
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
2746 跟貼 2746
網工面試被問IP地址，我當場畫了個盒子

摸魚算法 2026-04-16 12:40:40
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
社評：警惕日本“軍事暴走”風險

環球網資訊 2026-04-20 00:22:16
345 跟貼 345
采用800V架構，標配寶華韋健，靜態體驗沃爾沃EX90

苑叔聊車官方賬號 2026-04-15 21:09:17
3 跟貼 3
自變量機器人完成近20億元B輪融資，小米戰投、紅杉中國領投丨智能涌現獨家

36氪 2026-04-20 09:49:10
0 跟貼 0

智遠同學

暢銷書《復利思維》作者；精神生活與商業探索，關注科技人文、消費電商、品牌營銷、商業認知思維等方面。

678文章數 146關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

藝術

本地

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

字節大模型的收斂之年

01

02

03

04

藍色起源一級火箭完美回收 客戶衛星未入軌

媒體：日本近期一系列危險動作挑釁中國 中國需警惕

媒體：日本近期一系列危險動作挑釁中國 中國需警惕

湖人1比0火箭：老詹比烏度卡像教練

何潤東漲粉百萬！內娛隔空掀桌第一人

月之暗面IPO迷局

29分鐘大定破萬 極氪8X為什么這么多人買？

態度原創

這睡眠質量也太高了

王羲之《換鵝帖》尚在人間，驚艷無比！

12噸巧克力有難，全網化身超級偵探添亂

今年最流行的衣服竟然是它？高級又氣質！

藍色起源一級火箭完美回收客戶衛星未入軌

媒體：日本近期一系列危險動作挑釁中國中國需警惕

媒體：日本近期一系列危險動作挑釁中國中國需警惕

何潤東漲粉百萬！內娛隔空掀桌第一人

29分鐘大定破萬極氪8X為什么這么多人買？

王羲之《換鵝帖》尚在人間，驚艷無比！

12噸巧克力有難，全網化身超級偵探添亂

今年最流行的衣服竟然是它？高級又氣質！