V4來了
沒有發布會
只有一份改好的文檔
DeepSeek V4 深度解讀
2026年4月24日
4月24日上午10點56分,DeepSeek微信公眾號推送了一條消息。
沒有發布會,沒有技術報告,沒有媒體吹風會。開發者平臺的API文檔頁面悄然刷新——deepseek-v4-flash和deepseek-v4-pro兩個新模型名出現在接口列表里,旁邊多了一行公告:現有的deepseek-chat和deepseek-reasoner將于7月24日停止使用。
就這么發了。
這就是DeepSeek的風格。上次V3發布也是半夜改了個文檔,這一次連時間都沒換——上午推了一條微信,完事。全世界等了半年的V4,落地方式像極了一個程序員改完代碼直接上線,連commit message都懶得寫。
但你細品,這哪里是"懶"?這是一種態度。不造勢、不炫耀、不開發布會、不請媒體吹風——我做好了,放這兒了,你用就是。全球AI行業已經習慣了每次大模型發布都要搞一場秀,DeepSeek偏偏不配合這個劇本。不是做不出發布會的排場,是不覺得那是該做的事。
V4發布文檔的最后一句話是八個字:「不誘于譽,不恐于誹」。這八個字,是讀懂V4全部選擇的鑰匙。
01
百萬上下文,從奢侈品變水電煤
V4不是一個大模型,是兩個。
V4-Pro
V4-Flash
總參數
1.6萬億
激活參數
490億
130億
預訓練數據
33萬億tokens
32萬億tokens
上下文窗口
100萬tokens
100萬tokens
最大輸出
38.4萬tokens
38.4萬tokens
定位
旗艦推理,復雜任務
極致性價比,通用任務
最關鍵的一行:兩個版本標配同樣的100萬token超長上下文。沒有因為你是Flash就砍上下文,這點很DeepSeek。
100萬token意味著什么?不是數字變大,是工作范式變了。一次性吞下數十萬字的并購盡調材料、整本書籍、大型代碼庫——以前需要人工切文檔、分段喂給模型的活,現在直接扔進去。
百萬上下文一旦成為標配,沒有的廠商連牌桌都上不了。這會倒逼閉源廠商跟進,否則將失去"上牌桌"的資格。
而V4-Pro在開源領域已無對手——Codeforces Rating 3206,超越GPT-5.4的3168。處理能力較V3.2提升近8倍。但更狠的是成本。
1M上下文,V3.2時代算力撐到極限才128K。直接拉到100萬,算力和內存都要炸。DeepSeek的解法是——不再硬算,而是換了一種注意力機制。
? CSA + HCA:壓縮篩重點,低成本看全局
- CSA(壓縮序列注意力)
:每4個token的KV緩存合并成一條摘要,每個query只在摘要中選出top-k條計算注意力。先看目錄,再翻重點章節。
- HCA(重度壓縮注意力)
:每128個token合并成一條,對剩余摘要做稠密注意力。只看每章的總結。
- 滑動窗口分支
:處理近距離token的細節依賴。
V4-Pro 效率
算力 27% · 顯存 10%
1M上下文下,單token推理計算量只有V3.2的27%,KV Cache顯存占用僅10%
V4-Flash 效率
算力 10% · 顯存 7%
Flash版更極端,算力和顯存分別壓到V3.2的10%和7%
上下文翻了8倍,算力反而只要原來的1/4,內存只要1/10。百萬上下文從奢侈品變成了水電煤。
注意,Flash版和Pro版標配同樣的100萬上下文——沒有因為你是"經濟版"就砍能力。這個選擇本身就在說話:普惠不是口號,是標配。你要做行業基礎設施,就不能只讓付得起錢的人用。
另一個架構創新值得說:V4采用萬億參數MoE架構,并引入類似Engram的條件內存技術,實現推理邏輯與知識存儲分離,以極低顯存消耗支撐超大模型。模型不是越做越臃腫,而是越做越輕——激活49B,總參1.6T,這就是MoE的魔法。
02
Day 0適配:從備選到核心平臺
這是V4最硬核的信號,沒有之一。
發布當日,華為昇騰、寒武紀、天數智芯等國產芯片廠商即完成了對V4-Pro和V4-Flash的全量適配。
注意這個"Day 0"。以前新模型發布,國產芯片要等數月才能適配,永遠是追趕者。這次,發布當天就能跑——徹底改變了游戲規則。
更關鍵的是:DeepSeek首次在官方技術報告中將華為昇騰與英偉達并列寫入硬件驗證清單。不是"兼容",不是"適配",是并列。國產芯片第一次從"備選方案"躍升為"核心算力平臺"。
? 這意味著什么?
全球第一個萬億參數級模型,在 國產算力底座 上完成了訓練與推理的全鏈路驗證
V4采用FP4(mxFP4)精度,恰好是 昇騰950PR 芯片的原生支持格式
推理與訓練代碼從 CUDA生態遷移至華為CANN框架
4月24日晚7點,華為昇騰CANN官方B站賬號進行 獨家首發直播
CUDA脫鉤不再是一個口號,而是一個已經發生的事實。但更準確地說——這也不是"脫鉤",是"率道而行"。按自己的路走,不被別人的生態綁架。
對金融、能源、政企等對自主可控有剛性需求的行業來說,V4傳遞的信號很明確:性能不打折、部署不被卡脖子。Apache 2.0協議開源 + 優先適配國產芯片,這條技術棧從第一天就為你鋪好了。
當然,Pro版本在昇騰上的吞吐還受限,官方也坦誠"受限于高端算力供給"。但預計下半年昇騰950超節點批量上市后,Pro版價格將大幅下調。
現在只是上半場。
03
漣漪已起,子彈還在飛
定價就不用多說了——價格屠夫又來了。
輸入(緩存命中)
輸入(緩存未命中)
輸出
V4-Flash
0.2元
1元
2元
V4-Pro
1元
12元
24元
單位:元/百萬token
同一天,OpenAI發布GPT-5.5,API定價飆升至每百萬token輸出30美元(約210元人民幣),是前代三倍。V4-Flash的輸出價格是GPT-5.5的1%。
一邊是"開源普惠、成本重構",另一邊是"性能登頂、價格翻倍"。同一天的隔空對撞,AI行業徹底撕裂成了兩條路。
容易被忽略的細節
- Anthropic兼容
:V4上線同時開放了Anthropic兼容端點,成為國內首家同時兼容OpenAI和Anthropic兩大接口標準的AI公司
- 遷移零門檻
:舊模型7月24日停用,Flash已整合上一代兩個獨立接口的能力,遷移只需改個模型名
- 這不是在競爭,這是在挖墻角
但是。
漣漪已經產生,子彈還需要再飛一會兒。別急著all in。幾個冷思考:
1 應用場景會爆發,但需要時間兌現
百萬上下文會淘汰人工切文檔的模式,在法律、金融、代碼管理催生全新工作流。但下半年昇騰950量產、Pro版價格下調之后,推理成本降到新低,全量客服質檢、分鐘級供應鏈監控、個性化教育這些因成本受限的應用才會集中爆發。現在能看到方向,但還沒到收獲期。
2 生態布局窗口已打開,但別把情緒當利潤
V4發布是未來一年行業規則重寫的起點。企業和研發團隊應該立即著手基于DeepSeek生態進行產品研發和布局,以在算力到位、價格落地后搶占先機——但股價可以先漲,業績不能先來。短期情緒沖高是確定的,產業利潤兌現至少等到下半年。
3 關注國產算力的真實交付,不只是概念
V4驗證了AI應用(特別是Agent爆發)對算力的強勁拉動。市場關注點應從情緒轉向產業鏈——國產算力在超節點系統、高速互聯、液冷、電力等基礎設施層面的真實交付能力,才是決定這輪行情能走多遠的關鍵。
4 DeepSeek自身也在變
公司正從一個理想主義的技術烏托邦,轉向重視產品與商業化的務實公司。內部已組建產品團隊探索Agent等形態,開始招募大量產品經理和中文系學生(用于人文數據標注)。V4不是終點,而是DeepSeek從"極客實驗室"到"基礎設施提供商"的轉折點。
不誘于譽,不恐于誹
V4發布文檔的最后一頁,沒有性能參數,沒有對標數據,只留了一句話:
「不誘于譽,不恐于誹,率道而行,端然正己。」
這句話出自《荀子·非十二子》,講的是君子之道——不被贊譽誘惑,不被毀謗恐嚇,循著正道前行,端正自己的行為。
放在V4的語境里,每一個字都不是空話:
不誘于譽 ——做出了1.6萬億參數的模型,不開發布會,不改技術報告,推送一條微信就上線。不造勢,是因為自信不需要造勢。
不恐于誹 ——自認落后閉源3-6個月,坦然寫在文檔里。不遮掩,是因為追趕不是靠嘴,而是靠每一代產品的交付。
率道而行 ——從CUDA切到CANN,從閉源切到Apache 2.0,從高端定價切到平民價格。每一步都逆著行業慣性走,不是因為別人走錯了,而是因為自己認定的道不一樣。
端然正己 ——Pro在昇騰上吞吐受限,直接承認"受限于高端算力供給"。不畫餅,是因為畫餅不如做好下一代。
這是中國企業在中華文化浸潤下表現出的一種特質——不張揚,不回避,踏實做自己的事。硅谷在卷能力上限,DeepSeek在卷成本下限;硅谷在用價格篩選用戶,DeepSeek在用價格打開市場;硅谷在用閉源筑墻,DeepSeek在用開源鋪路。
這不是"中國版ChatGPT"的故事。這是兩條完全不同的路。
漣漪已經產生,但子彈還需要再飛一會兒。V4劃了方向,昇騰950量產兌現算力,價格下調打開應用場景,產業鏈交付能力決定行情縱深——這是一條至少一年的兌現鏈。
方向對了,子彈在飛。別追著子彈跑,站在彈著點等。
本文僅代表作者個人觀點,不構成投資建議。市場有風險,投資需謹慎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.