![]()
文:王智遠 | ID:Z201440
2025年2月,DeepSeek刷屏的那個春節,梁汝波在全員會上說了六個字:跟進速度不夠。
一年后的2026年2月,豆包2.0發布前夕,火山引擎拿下了春晚獨家AI云合作伙伴的身份。從「缺席者」到「造浪者」,中間剛好隔了一整年,365天。
這一年里,阿里瘋狂發力,一口氣發了上百個模型;騰訊也動了大動作,重組了AI Infra部;百度更直接,把文心給開源了。
唯獨字節,出牌頻率反而變得特別低,看著有點反常,但它并沒缺席這場競賽,只是把籌碼都押在了大家看不見的地方。
這篇年終復盤,只想回答一個問題:字節看不見的押注,是如何在2026年春節前,變成一發不可收拾的?
01
如果說 2023 到 2024 年,字節大模型走的是「突擊隊」路子,打快仗、搶熱點,快速完成從 0 到 1 的布局,那 2025 年,字節大模型正式進入了「吳永輝時間」。
這位被寄予厚望的新帥上任后,做的第一件事,就驚到了整個字節:他直接給Seed團隊取消了季度OKR,甚至連半年考核都給撤了。
要知道,字節可是出了名的講「字節范兒」、喊「Always Day One」,在這樣一家公司里,取消考核這事兒,簡直就是「政治不正確」。
但吳永輝有他自己的道理:
要是方向從一開始就錯了,讓大家三個月交一次答卷,只會更快把路走死;字節的DNA是「小步快跑、快速迭代」,可這套邏輯,到了大模型領域,根本不好使。
那時候的字節大模型團隊,已經染上了嚴重的「大公司病」。
2025年初,AI Lab、Seed團隊、視覺生成團隊、豆包產品技術部,這四支隊伍就跟四條平行線似的,各有各的匯報線,各搞各的研發節奏,互不相干。
AI Lab由李航帶隊,主打學術研究;Seed團隊歸吳永輝管,重點放在實際應用上;視覺團隊剛從阿里挖來周暢,還在磨合,而豆包的技術負責人朱文佳,更是直接向梁汝波匯報。
大家互相搶資源、隱性競爭,甚至出現過同一個需求,四家團隊各自埋頭做的荒唐事兒。
吳永輝入職后,Seed團隊前后搞了三次組織收斂,一步步把分散的力量擰成一股繩。
2025 年 3月份,AI Lab整體并入Seed,李航開始向吳永輝匯報,原來集團級研究部門的光環沒了,所有研發力量,都歸到了同一個指揮體系下。
到了年中,隨著楊建朝暫休,字節從阿里挖來周暢接手視覺多模態團隊,文生圖 Seedream、文生視頻 Seedance 等多模態團隊的管理權限,同步納入 Seed 整體體系,周暢直接向吳永輝匯報,多模態研發與大模型主干能力實現了同頻調度。
最關鍵的一步,在10月份落地,豆包技術負責人朱文佳,直接匯報對象從梁汝波改成了吳永輝。
這是字節為數不多以「收斂」而非「擴張」為核心目的的組織整合。
過去十年,字節擅長分,抖音分出頭條、飛書、TikTok。但大模型競賽的后半程,比的不是誰開的分支多,是誰的主干粗。
為了讓這根「技術主干」更扎實,吳永輝入職后,一直鼓勵研究員深耕基礎研究、積極輸出頂會論文,2025 年上半年,Seed 團隊在國際頂級學術會議上發布的論文數量,比2024 年同期實現了翻倍增長。
但理想與業務現實之間,終究有需要平衡的鴻溝。
到了三季度,豆包2.0的發布節點越來越近,管理層對發論文也有了新要求:內容必須和正在迭代的核心技術沒關系,不能影響產品上線。
2026年1月,梁汝波在全員會上,把核心關鍵詞改了,從之前的「探索智能上限」,變成了「勇攀高峰」和「AI模型能力要做到行業前列」。
從「探索」到「做到」,這七個字的變化,是2025年字節組織調整的全部答案:它不再滿足于做一個「參與者」,它要做「第一梯隊」,甚至要做「唯一」。
02
組織收斂的效果好不好,最終還得靠產品來檢驗,2025年上半年,豆包在用戶心里的形象,特別分裂。
它聊起天來是真厲害,情緒價值給得足足的,你跟它嘮一宿情感八卦、吐吐槽,它都能接住。
可要是你讓它查機票、比價格,或者完成一個需要多步驟的任務,它大概率只會給你一段通用攻略,然后,熱情地問你還有什么能幫你的嗎,根本解決不了實際問題。
「聊天機器」和「辦事助理」之間,隔著一道實打實的鴻溝。而字節,選了一條最笨、也最扎實的路來填這個坑:死磕「聽懂人話」和「把事辦成」這兩件事。
2025年11月,豆包的語音對話功能,上線了一個看似不起眼、但實際特別難的功能:同一個音色里,能流暢切換粵語、四川話、東北話、陜西話四種方言,還能識別20種方言。
為了做好這個體驗,字節讓同一批聲優,用不同的方言錄制一模一樣的語料。這就意味著,錄音成本直接翻了一倍,后期的標注工作,復雜度更是呈指數級上升。
有人可能會問,為啥要費這么大勁做方言功能?
答案很簡單:打基礎,做基建。中國有超過10億人說方言,這其中,有大量的中老年用戶,不會打字、也不熟悉App的操作邏輯,但他們會對著手機說話。
讓AI學會方言,是為了讓四川的老人、廣東的阿姨能毫無門檻地用起來。這是字節在爭奪「下一個10億用戶」的入場券。
方言降低了開口的門檻,而「Agent(智能體)」則解決動手的問題。
字節在這條坎上的爬升路徑,清晰地寫進了2025年的版本日歷里,2025年6月11日,豆包1.6版本發布,譚待在發布會上,演示了一個讓所有人都眼前一亮的場景:
拍一張購物小票,模型能自動整理成Excel表格;你隨口說一句話,模型能自動操作瀏覽器,幫你完成酒店預訂。他把這次升級的核心,總結成了三個字:「行動力」。
到了12月,豆包1.8版本發布,Agent能力又上了一個臺階,能調用十幾個工具,在多個電商平臺之間來回切換,幫你完成耳機的全網比價,還能選出最優選項。
從「能做一件事」到「能做一系列事」,字節一點點補齊了豆包「辦事能力」的短板。但這也帶來了一個致命的新問題:成本太高。
Agent執行一次任務,消耗的Token數量,是普通聊天的幾十倍。要是單次調用的成本降不下來,哪怕Agent再厲害,也只能停留在實驗室里,根本沒法大規模推廣、給更多人用。
在 2025 年火山引擎春季原動力大會上,譚待曾直言,通過底層技術的持續優化,大模型推理成本未來還有 99% 的下降空間。
這一判斷,也為字節后續的成本戰、技術債清零,定下了核心基調。
03
2025 年 11 月,火山引擎發布官方公告:Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年發布的舊版本模型,將逐步停止服務,引導用戶遷移到最新的 Seed 系列模型。
這是字節 2025 年最激進、卻也最容易被外界忽略的關鍵動作。
公告發布后,客服收到了大量企業開發者的反饋,畢竟對開發者而言,模型版本切換意味著接口重接、代碼重改、全流程回歸測試,成本極高。
但字節硬推了。因為譚待算過一筆賬:
智能體時代已經到來,大模型的調用量只會迎來指數級增長。到那個時候,如果還背著 2023 年的老版本、2024 年的 Pro 版、各類客戶特供版等多套技術架構,成本窟窿只會越來越大,根本填不上。
只有把所有模型的內核統一起來,才能釋放規模飛輪的紅利。這不僅是清零之前的技術債,更是對商業模式的一次徹底重構。
字節的成本優勢,靠「算力精算」,把每一分錢都花在刀刃上。
大模型服務的成本困境,根源很簡單,就是一種浪費:「快車要等慢車」。用戶的輸入請求,有的短到只有10個詞,有的長到10萬詞,把這些請求混在一起處理,系統就得按照最慢的那個來調度,大量的算力就這么被閑置了,特別可惜。
字節的解法是「區間定價」和「PD分離」。
2025年6月,豆包1.6版本,首次推出了「區間定價」:0到32K的輸入區間,價格直接打到0.8元/百萬tokens,綜合成本比1.5版本和DeepSeek R1降低了63%;32K以上的輸入,價格再逐級上浮。
這就跟快遞打包一個道理,要把所有尺寸的包裹混在一起裝,肯定特別浪費空間;要是按尺寸分類打包,至少能省下三分之一的紙箱。
更深層的邏輯是「PD分離」,把處理長文本的「預填充」階段,和生成文本的「解碼」階段拆開,用不同的硬件、不同的策略來處理,效率一下子就提升了好幾倍。
這套邏輯的前提是:所有的優化,只能做一遍。
要是同時維護好幾套架構,每做一次優化,就得在每套架構上都來一遍,邊際成本永遠降不下來;所以說,「舊模型大下架」,是「降價99%」的必要前提,也是字節向全行業發起「成本戰爭」的宣戰書。
數據證明了這一策略的成功。
2025 年 5 月底,豆包日均 Token 調用量已達 16.7 萬億;9月突破30萬億;12月突破50萬億,較2024年同期增長超10倍。IDC報告顯示,2025年上半年中國公有云大模型服務市場,火山引擎份額達到49.2%。
當同行在2025年下半年被迫跟進降價時,字節已經通過清掉技術債,獲得了結構性的成本優勢;這種優勢一旦建立,很難被單純的價格戰顛覆。
04
組織收斂了,技術債清了,成本降下來了,最后一塊拼圖是「節奏」。
字節為什么能從2025年春節的「缺席者」變成2026年春節的「主角」?在我看來,它終于找到了屬于自己的研發節奏,它把春節,變成了自己的iPhone發布會,每年都要搞個大動作。
這套「春節錨定法」,是一種「研發倒逼機制」:
別的公司都是按財季規劃模型發布,字節卻是按春節倒排工期,1月份必須封版,2月份必須上線,前一年夏天,就得把技術路線定死。
2025 年春節的被動,讓字節意識到,靠「突擊隊」模式打游擊、追熱點,永遠只能跟著行業節奏走,永遠無法建立自己的領先優勢。
而 2026 年春節的全面爆發,正是這套節奏管理的第一次大考:春晚獨家 AI 云合作、豆包 2.0、多模態能力的全面升級,這一系列動作,都是吳永輝入職一年來,組織收斂、技術清債、成本優化的集中成果爆發。
據行業媒體披露,2026 年 2 月 14 日,豆包 2.0 將正式發布。這是字節大模型遲到的全面進攻信號,但這場關于通用人工智能的戰役,其實才剛剛開始。
站在 2026 年春節的節點回望與前瞻,字節面前,還有三個更難、更長遠的課題需要解決。
第一個,是「閉源模式的持續性」。
2025年,阿里開源了Qwen3全系列,衍生模型超17萬個,形成了龐大的開源生態;百度開源了文心,甚至連騰訊混元也開始在部分版本上開源。字節是唯一堅持閉源路線的中國大廠。
這套模式能走得通,前提是:
火山引擎的 To B 服務收入,與豆包的 To C 用戶黏性,能持續反哺 Seed 團隊的巨額研發投入,形成「研發 - 落地 - 營收 - 再研發」的正向循環。
如果下一階段開源模型能力追平閉源,開發者還會不會為「獨家調用權」付費?字節賭「體驗優先」,但這是一場孤獨的豪賭。
其次,是固定節點錨定的反作用力。
把研發節奏錨定在春節這一個節點上,好處是目標清晰、全鏈路同頻,代價是每年核心的重磅發布,基本只有一次扣扳機的機會。
2025年春節的缺席是代價,2026年春節打響也是代價;如果2027年春節前被對手刻意狙擊,或者產品不及預期,代價將是巨大的。
最后是「巨頭的底牌」。
騰訊在2025年底重組了AI Infra部,由大模型負責人姚順雨直接管,手里還握著微信這個有12億用戶的超級入口,一旦騰訊決定把大模型全量導入微信,那流量優勢,是字節根本比不了的。
阿里云也沒閑著,2025年9月發布了萬相2.5,12月又把千問接入了萬相2.6。它在開源生態上的厚度,還有在云服務領域的深耕,不是字節用一年時間就能追上的。
還有DeepSeek。沒人知道那家創業公司2026年還能拿出什么黑科技。
一年前梁汝波那句「跟進速度不夠」,在 2025 年被字節整個大模型團隊反復咀嚼,成為了全力奔跑的動力。
2026年春節,字節用一場精密的「造浪」證明了它已經補上了短板,把一支3000人的突擊隊改裝成了有節拍器的正規軍。
但大模型的競賽沒有終點。
本可以做得更好的遺憾,字節用 365 天成功改寫;但「還可以更好」的追求,是這條賽道上永遠劃不掉的命題。字節用365天證明了自己會追趕、會切換,它需要下一個365天,證明自己配得上「長期主義者」這個稱號。
春節總會再來,字節作為進攻者的戰役,才剛剛拉開序幕;不一定對,個人觀察。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.