網易首頁 > 網易號 > 正文申請入駐

DeepSeek-V4上線：使用華為芯片訓練，性能比Gemini差3-6個月，價格優勢明顯

2026-04-24 13:17:35　來源: 搜狐科技

北京舉報

分享至

出品｜搜狐科技

作者｜鄭松毅常博碩

編輯| 楊錦

DeepSeek V4，來了！

OpenAI GPT 5.5 前腳剛發布，DeepSeek就亮出了“真家伙”。

就在剛剛，DeepSeek-V4的預覽版本正式上線并同步開源。

據官方介紹，DeepSeek-V4擁有百萬字超長上下文，在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。模型按大小分為兩個版本：

更具產業里程碑意義的是，DeepSeek-V4 從模型設計之初就深度適配國產算力，在華為昇騰芯片生態實測跑通，成為全球首個在國產算力底座上完成訓練與推理的萬億參數級模型，打破對海外芯片與框架的長期依賴。

性能比肩頂級閉源模型

價格比Claude便宜21倍

官方實測數據顯示，DeepSeek-V4-Pro性能比肩頂級閉源模型。

Agent（智能體）能力方面，相比前代模型，DeepSeek-V4-Pro的能力顯著增強。在 Agentic Coding 評測中，V4-Pro 已達到當前開源模型最佳水平，并在其他 Agent 相關評測中同樣表現優異。

DeepSeek介紹，目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型，據評測反饋使用體驗優于 Sonnet 4.5，交付質量接近 Opus 4.6 非思考模式，但仍與Opus 4.6 思考模式存在一定差距。

DeepSeek給出的結論相對克制。在知識與推理任務上，其性能已經超過主流開源模型，并接近Gemini等閉源系統，但仍存在約3到6個月差距。在 agent和代碼任務上，其表現接近甚至部分超過Claude Sonnet。

此外，在數學、STEM、競賽型代碼的測評中，DeepSeek-V4-Pro超越當前所有已公開評測的開源模型（包括月之暗面的K2.6 Thinking、智譜GLM-5.1 Thinking等），取得了比肩世界頂級閉源模型的優異成績。

相較之下，DeepSeek-V4-Flash主打性價比，能夠提供更加快捷、經濟的 API 服務。在 Agent 測評中，DeepSeek-V4-Flash 在簡單任務上與 DeepSeek-V4-Pro 旗鼓相當，但在高難度任務上仍有差距。

據悉，V4-Pro 與 V4-Flash 最大上下文長度為 1M，均同時支持非思考模式與思考模式，其中思考模式支持 reasoning_effort 參數設置思考強度（high/max）。對于復雜的 Agent 場景建議使用思考模式，并設置強度為 max。使用價格如下：

DeepSeek表示，“受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。”

再看看國際友商價格對比，可見DeepSeek的實惠：

混合架構解決工程落地痛點

全面適配國產算力

大模型處理超長文本的最大痛點，從來不是 “能不能裝下”，而是跑不動、記不住、算不起。隨著傳統注意力機制呈平方級復雜度攀升，百萬Token場景下顯存與算力直接 “爆炸”，幾乎無法工程落地。

DeepSeek-V4 的發布，標志著大模型正式走出 “參數競賽”，進入效率優先下一代賽道。

從一口氣審計全量代碼庫、一次性解析千頁合同，到全程記住長時間會議、串聯多輪復雜智能體任務，V4讓AI 真正具備“完整理解、長期記憶、深度推理”的能力，同時把使用成本大幅下拉。

這一切得益于DeepSeek業內首創“CSA （壓縮稀疏注意力） + HCA （重度壓縮注意力）”的混合架構。用一套“分級壓縮 + 分級檢索”思路，把效率拉到極致。這一新方法顯著減少了計算復雜度，提升了長上下文處理的效率。

具體來看，CSA像給長文本做重點精讀。先把每 4 個Token壓縮成一個信息塊，再用稀疏檢索只挑最相關的內容，既保留中段細節，又大幅削減計算量，兼顧精準與效率。HCA像給長文本做大綱速讀，把海量信息濃縮成框架級塊，專門負責全局邏輯。

官方數據顯示：1M Token場景下，V4-Pro 僅需 V3.2 的 27% 推理算力、10% KV 緩存；Flash 版更是低至 10% 算力、7% 緩存。

除了混合注意力，V4 還帶來三項關鍵技術革新，構成完整效率革命：

升級傳統殘差連接，把信號傳播約束在穩定流形上，深層不衰減、訓練不炸數值。

Muon 優化器：替代傳統 AdamW，收斂更快、訓練更穩，完美適配 MoE 大模型與低精度訓練，解決大批次長上下文訓練的抖動難題。

全鏈路工程優化：專家并行細粒度通信重疊、TileLang 內核開發、FP4 量化感知訓練、異構 KV 緩存管理，從計算、通信、存儲全方位降本提速，推理加速最高近2倍。

最受大家關心的，是V4這次是否成功全面適配國產算力？

報告指出，DeepSeek-V4在英偉達 GPU 與華為昇騰 NPU 兩大硬件平臺上，對細粒度 EP 優化方案完成了全面驗證。相較于性能優異的非融合基線方案，該方案在通用推理負載場景下可實現1.50~1.73 倍的加速比。

有業內觀點指出，這代表已經完成華為昇騰平臺的適配和實測落地。但目前對外開源的只有英偉達GPU版本，昇騰適配代碼未開源，屬于閉源適配優化。

值得一提的是，寒武紀在軟硬一體生態中，已經完成基于 vLLM 推理框架完成對 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的適配，適配代碼已開源到 GitHub 社區。

剩下的，就等DeepSeek-V4的實用表現了。還有DeepSeek的首輪融資最終花落誰家，也還是個謎題。

“不誘于譽，不恐于誹，率道而行，端然正己。”

DeepSeek官方在文章最后表示，他們將始終秉持長期主義的原則理念，在嘗試與思考中踏實前行，努力向實現 AGI 的目標不斷靠近。”

運營編輯 |曹倩審核｜孟莎莎

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

昇騰超節點系列產品全面支持DeepSeek V4新模型

財聯社 2026-04-24 15:21:06
0 跟貼 0
AI算力的盡頭，是一塊會變形的板子

DeepTech深科技 2026-04-24 18:14:59
0 跟貼 0

DeepSeek靠近華為，英特爾先別樂

虎嗅APP 2026-04-26 01:17:06
2 跟貼 2

谷歌云CEO：自研TPU構筑競爭護城河，第八代芯片即將發布，外部需求已超供給上限

華爾街見聞官方 2026-04-25 12:00:34
0 跟貼 0
她穿著洞洞鞋登上國際頂級領獎臺，只為每28秒消失的那條命

林紙巾 2026-04-21 13:17:22
0 跟貼 0

海外熱議！中國汽車為啥便宜？真相讓人大吃一驚！

歸環 2026-04-26 03:40:57
0 跟貼 0

馬斯克：全球最大晶圓工廠定了！將采用Intel 14A工藝制造芯片

快科技 2026-04-24 01:05:15
0 跟貼 0
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0

2分鐘看懂地平線發布會：智能汽車正式迎來“龍蝦時刻”

車載娛樂 2026-04-25 11:20:04
3 跟貼 3
男子表示這種舊手機別賣，里面的“金豆”價值不菲，網友：這玩意真是金的嗎

星沙時報 2026-04-24 15:04:12
49 跟貼 49
90后“稚暉君”，任上緯新材董事長！他是原華為天才少年

每日經濟新聞 2025-11-26 14:49:35
1 跟貼 1
DeepSeek過于樸素了

虎嗅APP 2026-04-25 17:32:05
11 跟貼 11
特斯拉一季度凈賺4.77億美元，擬建最大芯片工廠

每日經濟新聞 2026-04-23 17:49:35
0 跟貼 0
中國言出必行拒購H200芯片，美國特朗普政府急了

生活的哲學 2026-04-25 22:38:44
0 跟貼 0
美出口計劃遇阻，美商務部長：中方改變主意，美方想賣卻賣不出去

更大的功夫吧 2026-04-25 23:16:24
0 跟貼 0
10國簽訂反華協議！中方24小時后出手，未經允許不得接受美資

清歡百味 2026-04-26 04:09:51
0 跟貼 0
“不誘于譽，不恐于誹”！DeepSeek致謝近300名研發者，10名“已離職”大將赫然在列

每日經濟新聞 2026-04-25 22:28:14
26 跟貼 26
2026北京車展丨地平線發布星空芯片與新系統開啟整車智能體時代

引擎YQ 2026-04-25 22:42:21
0 跟貼 0
當人民需要旗艦大六座擁有華為賦能的華境S能滿足嗎？

吳佩頻道 2026-04-22 14:52:10
6 跟貼 6
2026北京國際車展，黑芝麻智能芯片專家額日特專訪

時代周報 2026-04-26 01:20:23
0 跟貼 0
速騰聚創2160線激光雷達發布即上車，進階吉利全球戰略供應商

界面新聞 2026-04-24 15:07:07
0 跟貼 0
愛芯元智“芯”耀北京車展：高端戰略落地，M57規模化量產加速

汽車年輪 2026-04-25 21:45:35
0 跟貼 0
余承東華為智駕經常被抹黑，很多智駕事故都是因車主失誤

太平洋汽車 2026-04-23 11:06:50
4323 跟貼 4323
東風+華為乾崑，硬件堆滿，奕境X9要做第二個問界M9？

優視汽車 2026-04-24 18:40:31
0 跟貼 0
華為乾崑ADS 5.0來了，碰撞風險降50%

極果酷玩 2026-04-24 16:38:15
0 跟貼 0
華為乾崑ADS 5來了！首發雙焦面AR-HUD、車位到車位3.0

Nice好車 2026-04-23 21:20:43
0 跟貼 0
實拍智界V9，預售39.98萬的華為9旗艦MPV，尊不尊？

汽車誠試 2026-04-25 22:12:39
1 跟貼 1
華為闊折疊觀感爽炸，Find N6系統更新不停，你們說我怎么選？

數科先驅 2026-04-24 16:44:10
0 跟貼 0
華為乾崑全棧賦能，與汽車央企再出新旗艦！

閆闖說車 2026-04-25 00:02:40
0 跟貼 0
華為ADS 5.0重磅發布！中國智駕實現斷層領跑！

網易科技態度見聞 2026-04-24 18:00:11
0 跟貼 0
搞了半天，中國并沒有買英偉達的H200芯片

夢想總會變成真 2026-04-25 20:24:27
0 跟貼 0
華為乾崑發布ADS 5等重磅黑科技，構建行業最頂技術護城河

愛活網Evolife 2026-04-24 21:59:55
0 跟貼 0
融合感知：從華為乾崑技術大會看輔助駕駛的安全底線

曉見知微 2026-04-25 14:43:28
3 跟貼 3
中國“艙駕融合”芯片來了，汽車從此長出“兩只鉗子”

EV世紀 2026-04-24 19:45:50
0 跟貼 0
ADS 5重磅發布 2026華為乾崑技術大會輔助駕駛生態全面升級

方向對了 2026-04-24 22:06:20
1 跟貼 1
艙駕全域進化！華為乾崑，開啟智能出行新紀元！

1號車盟 2026-04-24 17:50:34
3 跟貼 3
不是格局小而是要認清現實

阿興1 2026-04-24 11:28:03
0 跟貼 0
臺積電亮出新一代芯片技術：擬繞開ASML天價設備

快科技 2026-04-25 04:51:32
0 跟貼 0
華為智駕下放星海V6重塑家用大六座的價值標桿

新車部落 2026-04-25 22:45:44
0 跟貼 0
卷！華為剛官宣的896線激光雷達，這些新車已安排上了

南方都市報 2026-04-25 14:15:12
0 跟貼 0

搜狐科技

搜狐科技官方賬號

4789文章數 9186關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

時尚

房產

家居

公開課

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

DeepSeek-V4上線：使用華為芯片訓練，性能比Gemini差3-6個月，價格優勢明顯

DeepSeek V4發布！黃仁勛預言的"災難"降臨

媒體：美軍在中東罕見高密度集結 伊朗開始調整戰術

媒體：美軍在中東罕見高密度集結 伊朗開始調整戰術

那一刻開始，兩支球隊的命運悄然改變了

《我們的爸爸2》第一季完美爸爸翻車了

90%訂單消失，中東旺季沒了

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

毛澤東寫小字，太瀟灑了

這些穿搭適合春天！外套彩色內搭白色、褲子穿基礎款，舒適大方

新一輪教育大爆發來了！海口，開始瘋狂建學校！

自然肌理 溫潤美學

媒體：美軍在中東罕見高密度集結伊朗開始調整戰術

媒體：美軍在中東罕見高密度集結伊朗開始調整戰術

2026款樂道L90亮相北京車展樂道L80正式官宣

自然肌理溫潤美學