連續兩次降價后,DeepSeek又在4月28日將限時優惠延長至5月31日。
4月的最后一個周末,DeepSeek先對DeepSeek-V4-Pro(以下簡稱"V4-Pro")限時2.5折,再將全系列模型,輸入緩存命中的價格降至首發價格的1/10。即在促銷期間,V4-Pro輸入緩存命中價格從1元/百萬tokens跌至0.025元/百萬tokens。
此前,國內AI行業正處在漲價周期,大模型公司智譜三度提價,月之暗面新模型的輸入和輸出價格不同程度上漲,云廠商也動作一致,百度智能云、騰訊云、阿里云調價,理由是同一套:全球算力需求激增,硬件成本上漲。
過去一年,大模型從"價格戰"打到"漲價潮",沒人真正賺到錢,營收和凈虧損齊漲。DeepSeek用0.025元拋出了一個問題,當推理成本可以被持續壓縮,大模型公司的護城河,究竟是更便宜的token,還是更不可替代的價值?
![]()
逆行者
DeepSeek的降價來得低調,但并不含蓄。
4月24日,DeepSeek全新系列模型 DeepSeek-V4 的預覽版本正式上線并同步開源。該模型按大小分為兩個版本:V4-Pro參數較大,1.6T;V4-flash參數284B。兩個版本支持的上下文長度都是100萬。"從現在開始,1M(100萬)上下文將是 DeepSeek 所有官方服務的標配",DeepSeek特別加粗強調。
當天,DeepSeek公布了兩個版本模型的價格,V4-Pro輸入(緩存命中)價格1元/百萬tokens,輸入(緩存未命中)價格12元/百萬tokens,輸出價24元/百萬tokens。同樣情況下,V4-flash的價格分別是0.2元/百萬tokens、1元/百萬tokens和2元/百萬tokens。
次日,降價開始,且不止一次。
4月25日,DeepSeek開啟 V4-Pro 模型的限時特惠活動,API價格享受2.5折優惠,優惠期限至5月5日。4月26日,DeepSeek全系列模型輸入緩存命中的價格降到原價的1/10。
DeepSeek研究員陳德里在社交平臺提醒,"輸入緩存(命中)的折扣是永久的,折扣促銷活動將持續到5月5 日"。
4月28日,DeepSeek又將V4-Pro的2.5折限時優惠,從5月5日延長至5月31日。
按此計算,在5月31日之前,V4-Pro模型百萬tokens的輸入(緩存命中)價格從原來的1元降到了0.025元。5月31日之后,也只有0.1元。這是DeepSeek這波降價活動中,折扣幅度最大的一項。
何為緩存命中,與緩存未命中有什么區別?
一位頭部云廠商工程師向北京商報記者解釋,"簡單說,緩存命中是指模型‘記得’你之前問過類似的內容,可以直接調用記憶回答不參與推理,收費便宜。緩存未命中相反,意思是模型第一次見這個內容,需要從頭算一遍,所以收費貴"。
資本市場快速反應。4月27日,即DeepSeek降價后的第一個交易日,智譜和MiniMax的股價出現不同程度下滑。
0.025元的支撐
這個價格不是憑空出現的。
根據官方技術解讀,DeepSeek-V4開創了一種全新的注意力機制,在 token 維度進行壓縮,結合 DSA 稀疏注意力(DeepSeek Sparse Attention),實現了全球領先的長上下文能力,并且相比于傳統方法大幅降低了對計算和顯存的需求。
這與外部觀察一致。CHIP中國實驗室主任羅國昭向北京商報記者分析稱,DeepSeek V4降價"更大程度上跟模型算法優化、同等性能的算力消耗降低有關,和定位同樣的大模型相比,V4的優勢是在更多參數、更高性能情況下的更低價格"。他也談及硬件成本,但強調"與采購國產芯片只有宏觀的相關性,沒有直接和實時的關聯"。
另一家大模型廠商從業者楚清(化名)則提供了另一種解釋:"看上去是DeepSeek在全棧適配國產算力方面領先,所以敢于定低價"。他的觀點建立在DeepSeek模型價位表下的一行小字:"受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,V4-Pro的價格會大幅下調"。
一個值得注意的插曲是,4月24日也就是DeepSeek模型上新當天,華為計算宣布:昇騰一直同步支持DeepSeek系列模型,本次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持DeepSeek V4系列模型。
DeepSeek也將華為昇騰和英偉達一起寫進DeepSeek-V4技術報告:"我們在英偉達GPU和華為昇騰NPU平臺上驗證了細粒度EP(專家并行)方案。"
4月28日,摩根士丹利亞太研究團隊發布的最新行業報告《China's AI Path: More Bang For The Buck》也提到,中國模型的"性價比"優勢集中體現在:以美國同行15%—20%的推理成本實現同等智能水平。報告將工程效率提升歸因于三大方向:架構層面的稠密模型與MoE、注意力機制改進;后訓練層面的強化學習與模型蒸餾,以及推理基建層面的硬件優化與KV cache(一種緩存機制)效率。新近發布的DeepSeek-V4被視為最新例證。
誰會接招
不過,摩根士丹利還是大幅上調中國兩大前沿AI公司目標價,其中,MiniMax目標價由990港元上調至1100港元,行業評級維持"In-Line",并明確預期,MiniMax在M3模型升級后將啟動重大價格上調,這或成為下一階段ARR(會計收益率)催化劑。
從企業層面看,DeepSeek的降價暫時沒有等來同行跟進。
4月28日,北京商報記者就會否跟進降價,采訪了智譜、MiniMax、百度智能云、阿里云、騰訊云,截至發稿,以上幾家公司相關人士均未回應。
楚清從技術層面解釋了這種分化的原因:"其他公司如果沒有和國產算力提前優化適配的話,短期內成本降不下來。"
文淵智庫創始人王超的判斷更聚焦于價格本身的長期趨勢:"token降價是技術的進步,否則不可能實現。最近不管是算力、token、芯片、內存的價格都在上漲,處在一個小周期上漲的階段,但大周期肯定是要下降的。"
作為智能體賽道的一員,獵豹移動董事長兼CEO傅盛更關注另一條路徑的可能性。
他在試用V4系列模型后認為,"V4把國產AI大模型,無論開源還是閉源的性能又提高到一個更高的水平,直逼全球最強模型。雖然還有3—6個月差距,但已經足夠好用了。更重要的是,DeepSeek可能正在引領國產AI走出一條和美國AI不同的道路"。
這些判斷并不矛盾,DeepSeek用技術降本驗證大周期下降的方向,而智譜、MiniMax們在用漲價對沖小周期上漲的壓力,但從業者都明白核心護城河一定不只是價格這一單一要素,DeepSeek已經給出了它的答案,但行業還在沉默中等待更多人表態。
北京商報記者 魏蔚
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.