網易首頁 > 網易號 > 正文申請入駐

等了一年的DeepseekV4終于來了，沒有發布會只有一份改好的文檔

2026-04-24 23:58:08　來源: 靜姐的財富第六感

福建舉報

分享至

V4來了
沒有發布會
只有一份改好的文檔

DeepSeek V4 深度解讀

2026年4月24日

4月24日上午10點56分，DeepSeek微信公眾號推送了一條消息。

沒有發布會，沒有技術報告，沒有媒體吹風會。開發者平臺的API文檔頁面悄然刷新——deepseek-v4-flash和deepseek-v4-pro兩個新模型名出現在接口列表里，旁邊多了一行公告：現有的deepseek-chat和deepseek-reasoner將于7月24日停止使用。

就這么發了。

這就是DeepSeek的風格。上次V3發布也是半夜改了個文檔，這一次連時間都沒換——上午推了一條微信，完事。全世界等了半年的V4，落地方式像極了一個程序員改完代碼直接上線，連commit message都懶得寫。

但你細品，這哪里是"懶"？這是一種態度。不造勢、不炫耀、不開發布會、不請媒體吹風——我做好了，放這兒了，你用就是。全球AI行業已經習慣了每次大模型發布都要搞一場秀，DeepSeek偏偏不配合這個劇本。不是做不出發布會的排場，是不覺得那是該做的事。

V4發布文檔的最后一句話是八個字：「不誘于譽，不恐于誹」。這八個字，是讀懂V4全部選擇的鑰匙。

百萬上下文，從奢侈品變水電煤

V4不是一個大模型，是兩個。

V4-Pro

V4-Flash

總參數

1.6萬億

激活參數

490億

130億

預訓練數據

33萬億tokens

32萬億tokens

上下文窗口

100萬tokens

最大輸出

38.4萬tokens

定位

旗艦推理，復雜任務

極致性價比，通用任務

最關鍵的一行：兩個版本標配同樣的100萬token超長上下文。沒有因為你是Flash就砍上下文，這點很DeepSeek。

100萬token意味著什么？不是數字變大，是工作范式變了。一次性吞下數十萬字的并購盡調材料、整本書籍、大型代碼庫——以前需要人工切文檔、分段喂給模型的活，現在直接扔進去。

百萬上下文一旦成為標配，沒有的廠商連牌桌都上不了。這會倒逼閉源廠商跟進，否則將失去"上牌桌"的資格。

而V4-Pro在開源領域已無對手——Codeforces Rating 3206，超越GPT-5.4的3168。處理能力較V3.2提升近8倍。但更狠的是成本。

1M上下文，V3.2時代算力撐到極限才128K。直接拉到100萬，算力和內存都要炸。DeepSeek的解法是——不再硬算，而是換了一種注意力機制。

? CSA + HCA：壓縮篩重點，低成本看全局

CSA（壓縮序列注意力）
：每4個token的KV緩存合并成一條摘要，每個query只在摘要中選出top-k條計算注意力。先看目錄，再翻重點章節。
HCA（重度壓縮注意力）
：每128個token合并成一條，對剩余摘要做稠密注意力。只看每章的總結。
滑動窗口分支
：處理近距離token的細節依賴。

V4-Pro 效率

算力 27% · 顯存 10%

1M上下文下，單token推理計算量只有V3.2的27%，KV Cache顯存占用僅10%

V4-Flash 效率

算力 10% · 顯存 7%

Flash版更極端，算力和顯存分別壓到V3.2的10%和7%

上下文翻了8倍，算力反而只要原來的1/4，內存只要1/10。百萬上下文從奢侈品變成了水電煤。

注意，Flash版和Pro版標配同樣的100萬上下文——沒有因為你是"經濟版"就砍能力。這個選擇本身就在說話：普惠不是口號，是標配。你要做行業基礎設施，就不能只讓付得起錢的人用。

另一個架構創新值得說：V4采用萬億參數MoE架構，并引入類似Engram的條件內存技術，實現推理邏輯與知識存儲分離，以極低顯存消耗支撐超大模型。模型不是越做越臃腫，而是越做越輕——激活49B，總參1.6T，這就是MoE的魔法。

Day 0適配：從備選到核心平臺

這是V4最硬核的信號，沒有之一。

發布當日，華為昇騰、寒武紀、天數智芯等國產芯片廠商即完成了對V4-Pro和V4-Flash的全量適配。

注意這個"Day 0"。以前新模型發布，國產芯片要等數月才能適配，永遠是追趕者。這次，發布當天就能跑——徹底改變了游戲規則。

更關鍵的是：DeepSeek首次在官方技術報告中將華為昇騰與英偉達并列寫入硬件驗證清單。不是"兼容"，不是"適配"，是并列。國產芯片第一次從"備選方案"躍升為"核心算力平臺"。

? 這意味著什么？

全球第一個萬億參數級模型，在國產算力底座上完成了訓練與推理的全鏈路驗證
V4采用FP4（mxFP4）精度，恰好是昇騰950PR 芯片的原生支持格式
推理與訓練代碼從 CUDA生態遷移至華為CANN框架
4月24日晚7點，華為昇騰CANN官方B站賬號進行獨家首發直播

CUDA脫鉤不再是一個口號，而是一個已經發生的事實。但更準確地說——這也不是"脫鉤"，是"率道而行"。按自己的路走，不被別人的生態綁架。

對金融、能源、政企等對自主可控有剛性需求的行業來說，V4傳遞的信號很明確：性能不打折、部署不被卡脖子。Apache 2.0協議開源 + 優先適配國產芯片，這條技術棧從第一天就為你鋪好了。

當然，Pro版本在昇騰上的吞吐還受限，官方也坦誠"受限于高端算力供給"。但預計下半年昇騰950超節點批量上市后，Pro版價格將大幅下調。

現在只是上半場。

漣漪已起，子彈還在飛

定價就不用多說了——價格屠夫又來了。

輸入（緩存命中）

輸入（緩存未命中）

輸出

V4-Flash

0.2元

1元

2元

V4-Pro

1元

12元

24元

單位：元/百萬token

同一天，OpenAI發布GPT-5.5，API定價飆升至每百萬token輸出30美元（約210元人民幣），是前代三倍。V4-Flash的輸出價格是GPT-5.5的1%。

一邊是"開源普惠、成本重構"，另一邊是"性能登頂、價格翻倍"。同一天的隔空對撞，AI行業徹底撕裂成了兩條路。

容易被忽略的細節

Anthropic兼容
：V4上線同時開放了Anthropic兼容端點，成為國內首家同時兼容OpenAI和Anthropic兩大接口標準的AI公司
遷移零門檻
：舊模型7月24日停用，Flash已整合上一代兩個獨立接口的能力，遷移只需改個模型名
這不是在競爭，這是在挖墻角

但是。

漣漪已經產生，子彈還需要再飛一會兒。別急著all in。幾個冷思考：

1 應用場景會爆發，但需要時間兌現

百萬上下文會淘汰人工切文檔的模式，在法律、金融、代碼管理催生全新工作流。但下半年昇騰950量產、Pro版價格下調之后，推理成本降到新低，全量客服質檢、分鐘級供應鏈監控、個性化教育這些因成本受限的應用才會集中爆發。現在能看到方向，但還沒到收獲期。

2 生態布局窗口已打開，但別把情緒當利潤

V4發布是未來一年行業規則重寫的起點。企業和研發團隊應該立即著手基于DeepSeek生態進行產品研發和布局，以在算力到位、價格落地后搶占先機——但股價可以先漲，業績不能先來。短期情緒沖高是確定的，產業利潤兌現至少等到下半年。

3 關注國產算力的真實交付，不只是概念

V4驗證了AI應用（特別是Agent爆發）對算力的強勁拉動。市場關注點應從情緒轉向產業鏈——國產算力在超節點系統、高速互聯、液冷、電力等基礎設施層面的真實交付能力，才是決定這輪行情能走多遠的關鍵。

4 DeepSeek自身也在變

公司正從一個理想主義的技術烏托邦，轉向重視產品與商業化的務實公司。內部已組建產品團隊探索Agent等形態，開始招募大量產品經理和中文系學生（用于人文數據標注）。V4不是終點，而是DeepSeek從"極客實驗室"到"基礎設施提供商"的轉折點。

不誘于譽，不恐于誹

V4發布文檔的最后一頁，沒有性能參數，沒有對標數據，只留了一句話：

「不誘于譽，不恐于誹，率道而行，端然正己。」

這句話出自《荀子·非十二子》，講的是君子之道——不被贊譽誘惑，不被毀謗恐嚇，循著正道前行，端正自己的行為。

放在V4的語境里，每一個字都不是空話：

不誘于譽 ——做出了1.6萬億參數的模型，不開發布會，不改技術報告，推送一條微信就上線。不造勢，是因為自信不需要造勢。

不恐于誹 ——自認落后閉源3-6個月，坦然寫在文檔里。不遮掩，是因為追趕不是靠嘴，而是靠每一代產品的交付。

率道而行 ——從CUDA切到CANN，從閉源切到Apache 2.0，從高端定價切到平民價格。每一步都逆著行業慣性走，不是因為別人走錯了，而是因為自己認定的道不一樣。

端然正己 ——Pro在昇騰上吞吐受限，直接承認"受限于高端算力供給"。不畫餅，是因為畫餅不如做好下一代。

這是中國企業在中華文化浸潤下表現出的一種特質——不張揚，不回避，踏實做自己的事。硅谷在卷能力上限，DeepSeek在卷成本下限；硅谷在用價格篩選用戶，DeepSeek在用價格打開市場；硅谷在用閉源筑墻，DeepSeek在用開源鋪路。

這不是"中國版ChatGPT"的故事。這是兩條完全不同的路。

漣漪已經產生，但子彈還需要再飛一會兒。V4劃了方向，昇騰950量產兌現算力，價格下調打開應用場景，產業鏈交付能力決定行情縱深——這是一條至少一年的兌現鏈。

方向對了，子彈在飛。別追著子彈跑，站在彈著點等。

本文僅代表作者個人觀點，不構成投資建議。市場有風險，投資需謹慎。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.