網易首頁 > 網易號 > 正文申請入駐

DeepSeek“發牌”，新一輪token價格戰打什么

2026-04-28 22:35:06　來源: 北京商報

北京舉報

分享至

連續兩次降價后，DeepSeek又在4月28日將限時優惠延長至5月31日。

4月的最后一個周末，DeepSeek先對DeepSeek-V4-Pro（以下簡稱"V4-Pro"）限時2.5折，再將全系列模型，輸入緩存命中的價格降至首發價格的1/10。即在促銷期間，V4-Pro輸入緩存命中價格從1元/百萬tokens跌至0.025元/百萬tokens。

此前，國內AI行業正處在漲價周期，大模型公司智譜三度提價，月之暗面新模型的輸入和輸出價格不同程度上漲，云廠商也動作一致，百度智能云、騰訊云、阿里云調價，理由是同一套：全球算力需求激增，硬件成本上漲。

過去一年，大模型從"價格戰"打到"漲價潮"，沒人真正賺到錢，營收和凈虧損齊漲。DeepSeek用0.025元拋出了一個問題，當推理成本可以被持續壓縮，大模型公司的護城河，究竟是更便宜的token，還是更不可替代的價值？

逆行者

DeepSeek的降價來得低調，但并不含蓄。

4月24日，DeepSeek全新系列模型 DeepSeek-V4 的預覽版本正式上線并同步開源。該模型按大小分為兩個版本：V4-Pro參數較大，1.6T；V4-flash參數284B。兩個版本支持的上下文長度都是100萬。"從現在開始，1M（100萬）上下文將是 DeepSeek 所有官方服務的標配"，DeepSeek特別加粗強調。

當天，DeepSeek公布了兩個版本模型的價格，V4-Pro輸入（緩存命中）價格1元/百萬tokens，輸入（緩存未命中）價格12元/百萬tokens，輸出價24元/百萬tokens。同樣情況下，V4-flash的價格分別是0.2元/百萬tokens、1元/百萬tokens和2元/百萬tokens。

次日，降價開始，且不止一次。

4月25日，DeepSeek開啟 V4-Pro 模型的限時特惠活動，API價格享受2.5折優惠，優惠期限至5月5日。4月26日，DeepSeek全系列模型輸入緩存命中的價格降到原價的1/10。

DeepSeek研究員陳德里在社交平臺提醒，"輸入緩存（命中）的折扣是永久的，折扣促銷活動將持續到5月5 日"。

4月28日，DeepSeek又將V4-Pro的2.5折限時優惠，從5月5日延長至5月31日。

按此計算，在5月31日之前，V4-Pro模型百萬tokens的輸入（緩存命中）價格從原來的1元降到了0.025元。5月31日之后，也只有0.1元。這是DeepSeek這波降價活動中，折扣幅度最大的一項。

何為緩存命中，與緩存未命中有什么區別？

一位頭部云廠商工程師向北京商報記者解釋，"簡單說，緩存命中是指模型‘記得’你之前問過類似的內容，可以直接調用記憶回答不參與推理，收費便宜。緩存未命中相反，意思是模型第一次見這個內容，需要從頭算一遍，所以收費貴"。

資本市場快速反應。4月27日，即DeepSeek降價后的第一個交易日，智譜和MiniMax的股價出現不同程度下滑。

0.025元的支撐

這個價格不是憑空出現的。

根據官方技術解讀，DeepSeek-V4開創了一種全新的注意力機制，在 token 維度進行壓縮，結合 DSA 稀疏注意力（DeepSeek Sparse Attention），實現了全球領先的長上下文能力，并且相比于傳統方法大幅降低了對計算和顯存的需求。

這與外部觀察一致。CHIP中國實驗室主任羅國昭向北京商報記者分析稱，DeepSeek V4降價"更大程度上跟模型算法優化、同等性能的算力消耗降低有關，和定位同樣的大模型相比，V4的優勢是在更多參數、更高性能情況下的更低價格"。他也談及硬件成本，但強調"與采購國產芯片只有宏觀的相關性，沒有直接和實時的關聯"。

另一家大模型廠商從業者楚清（化名）則提供了另一種解釋："看上去是DeepSeek在全棧適配國產算力方面領先，所以敢于定低價"。他的觀點建立在DeepSeek模型價位表下的一行小字："受限于高端算力，目前 Pro 的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，V4-Pro的價格會大幅下調"。

一個值得注意的插曲是，4月24日也就是DeepSeek模型上新當天，華為計算宣布：昇騰一直同步支持DeepSeek系列模型，本次通過雙方芯模技術緊密協同，實現昇騰超節點全系列產品支持DeepSeek V4系列模型。

DeepSeek也將華為昇騰和英偉達一起寫進DeepSeek-V4技術報告："我們在英偉達GPU和華為昇騰NPU平臺上驗證了細粒度EP（專家并行）方案。"

4月28日，摩根士丹利亞太研究團隊發布的最新行業報告《China's AI Path: More Bang For The Buck》也提到，中國模型的"性價比"優勢集中體現在：以美國同行15%—20%的推理成本實現同等智能水平。報告將工程效率提升歸因于三大方向：架構層面的稠密模型與MoE、注意力機制改進；后訓練層面的強化學習與模型蒸餾，以及推理基建層面的硬件優化與KV cache（一種緩存機制）效率。新近發布的DeepSeek-V4被視為最新例證。

誰會接招

不過，摩根士丹利還是大幅上調中國兩大前沿AI公司目標價，其中，MiniMax目標價由990港元上調至1100港元，行業評級維持"In-Line"，并明確預期，MiniMax在M3模型升級后將啟動重大價格上調，這或成為下一階段ARR（會計收益率）催化劑。

從企業層面看，DeepSeek的降價暫時沒有等來同行跟進。

4月28日，北京商報記者就會否跟進降價，采訪了智譜、MiniMax、百度智能云、阿里云、騰訊云，截至發稿，以上幾家公司相關人士均未回應。

楚清從技術層面解釋了這種分化的原因："其他公司如果沒有和國產算力提前優化適配的話，短期內成本降不下來。"

文淵智庫創始人王超的判斷更聚焦于價格本身的長期趨勢："token降價是技術的進步，否則不可能實現。最近不管是算力、token、芯片、內存的價格都在上漲，處在一個小周期上漲的階段，但大周期肯定是要下降的。"

作為智能體賽道的一員，獵豹移動董事長兼CEO傅盛更關注另一條路徑的可能性。

他在試用V4系列模型后認為，"V4把國產AI大模型，無論開源還是閉源的性能又提高到一個更高的水平，直逼全球最強模型。雖然還有3—6個月差距，但已經足夠好用了。更重要的是，DeepSeek可能正在引領國產AI走出一條和美國AI不同的道路"。

這些判斷并不矛盾，DeepSeek用技術降本驗證大周期下降的方向，而智譜、MiniMax們在用漲價對沖小周期上漲的壓力，但從業者都明白核心護城河一定不只是價格這一單一要素，DeepSeek已經給出了它的答案，但行業還在沉默中等待更多人表態。

北京商報記者魏蔚

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.