網易首頁 > 網易號 > 正文申請入駐

DeepSeek V4下周登場，美股再次顫抖！「跳過」英偉達，便宜50倍

2026-03-01 12:34:03　來源: 新智元

北京舉報

分享至

新智元報道

編輯：犀牛

【新智元導讀】DeepSeek V4下周登場：原生多模態，繞過英偉達，針對國產芯片深度優化。華爾街最怕的那條邏輯可能又要重演：算力霸權松動，美股先顫抖。

朋友們，見證歷史的時刻又要到了！

《金融時報》報道，DeepSeek V4，下周正式登場！

距離上一次DeepSeek發布重大模型R1，已經過去了整整一年多。

這一年里，AI行業風起云涌，OpenAI連推數代GPT，Anthropic的Claude殺入頂級陣營，谷歌Gemini瘋狂迭代。

整個硅谷都在用數百億美元甚至數千億美元瘋狂「燒錢」。

而DeepSeek呢？

它安安靜靜地待在杭州，沒有發布會，不路演，不炒作。

只做一件事：磨刀。

預計下周發布的V4將是一款支持圖片、視頻和文本生成的原生多模態大模型。

更炸裂的是，V4并沒有選擇跟英偉達做優化適配，而是優先與國產芯片廠商合作，針對國產AI芯片進行了深度調優。

這意味著，DeepSeek V4將不只是一次模型升級，也是一次底層架構的戰略轉向。

是中國AI從「用別人的芯片跑自己的模型」走向「用自己的芯片跑自己的模型」的歷史性一步。

DeepSeek選擇國內重磅會議前夕發布V4，無疑發出了一個信號：中國AI，不只是在追趕，還在定義新的游戲規則。

網友稱，「V4 將對 OpenAI 和 Google 形成巨大壓力。中國沒有放緩，而是在加速。」

「人工智能競賽又提升了一個檔次。」

有網友爆料，DeepSeek V4的API成本將比對手便宜50多倍。

更有網友豪言，美股已經瑟瑟發抖。

V4強在哪？

第一個關鍵詞：多模態。

過去的DeepSeek模型主要是「文字選手」——寫代碼一流，做推理一絕，但圖像和視頻能力一直是短板。

V4徹底補齊了這塊拼圖。

據目前泄露的信息，V4是一個原生多模態模型，能夠同時理解和生成圖片、視頻和文本。

而且，V4 Lite已經在至少一家推理服務商處進行內測，據稱擁有高達100萬token的上下文窗口，表現遠超網頁版和應用版模型。

目前已經在外網瘋傳的一張對比圖顯示，DeepSeek V4 Lite（代號「Sealion-lite」）在不開啟思考模式的情況下，生成的SVG圖像質量已經明顯超越了當前的DeepSeek V3.2思考模型。

有大V發帖稱，V4的編碼性能甚至比當前的GPT和Claude更強。

第二個關鍵詞：國產芯片適配。

這是V4最具戰略意義的突破。

據路透社和《金融時報》報道，DeepSeek這次繞開了英偉達，沒有向這家美國芯片巨頭提供V4的早期接入權限。

這打破了AI行業長期以來的慣例——過去，任何一個頂級大模型發布前，都會先跟英偉達做性能優化。

這一次，DeepSeek選擇了「反向操作」。

DeepSeek用V4告訴全世界：我們不挑芯片，也能跑出世界一流的模型。

當然，客觀地說，英偉達在訓練階段的芯片上依然占據主導地位，尤其是在計算密集型的預訓練環節。

但在推理階段，V4可能已經實現了國產芯片的全面適配。

推理環節是大模型商業化落地最核心的一環，這一步的突破意義不可估量。

第三個關鍵詞：開源。

據知情人士透露，DeepSeek將在V4發布時同步放出一份簡短的技術說明，并在大約一個月后發布一份更全面的技術報告。

這延續了DeepSeek一貫的「開放精神」。

去年R1發布時附帶的那份詳盡技術報告，曾讓全球AI研究者受益匪淺，被視為推理模型領域最重要的開源貢獻之一。

回顧R1

那一天，硅谷真的慌了

要理解V4的分量，必須先回看去年DeepSeek R1發布時的那場「地震」。

2025年1月20日，DeepSeek悄然上線了R1推理模型。

沒有發布會，沒有媒體吹風會，沒有CEO站在臺上揮手致意——就是簡簡單單地把模型放了出來，附帶一份技術報告。

然后，全世界炸了。

R1在多項基準測試上達到了與OpenAI最強模型o1相當甚至超越的水平，而DeepSeek聲稱其訓練成本僅為約560萬美元——這個數字不到GPT-4訓練成本的十分之一。

更要命的是，R1是開源的！

2025年1月27日——這是一個將被載入AI史冊的日子，DeepSeek的手機App超越ChatGPT，成為蘋果App Store下載量第一的免費應用。

同一天，英偉達股價暴跌近17%，單日市值蒸發約5890億美元，創下美國股市單家公司歷史最大單日跌幅紀錄。

博通下跌超過17%，微軟下跌2.1%，整個納斯達克血流成河。

知名風投家馬克·安德森稱DeepSeek為「我見過的最令人驚嘆和印象深刻的突破之一」。

多位美國科技界人士將其比作「斯普特尼克時刻」——1957年蘇聯先于美國將衛星送入太空的那一刻，象征著中國AI實力的強勢崛起。

而華爾街投資人最恐懼的問題浮出水面：如果一家中國公司用十分之一的成本就能做出同等水平的模型，那美國科技巨頭每年砸下的數百億美元基礎設施投資，還值得嗎？

英偉達的高端GPU還會有那么大的需求嗎？

蟄伏一年，DeepSeek都干了什么？

R1之后，DeepSeek進入了長達一年多的「靜默模式」。

沒有新的旗艦模型，只有漸進式更新。

但這并不意味著他們無所作為——恰恰相反，DeepSeek一直在為V4鋪路。

來看看這份更新時間線：

2025年3月：DeepSeek-V3-0324發布。這是V3的一次重要升級，通過吸收R1的強化學習技術改進了后訓練流程，在數學和編程評測上甚至超過了GPT-4.5。
2025年5月：DeepSeek-R1-0528發布。R1的大幅升級版，推理能力顯著增強，代碼生成質量提升，被認為是開源推理模型的新標桿。
2025年8月：DeepSeek-V3.1發布。這是一個里程碑式的更新——V3.1首次將V3和R1的能力融合到一個模型中，支持「思考模式」和「非思考模式」的自由切換，在SWE-bench等基準上比前代提升超40%。此后更新至V3.1-Terminus版本，進一步修復了多語言混合、Agent能力等問題。
2025年9月：DeepSeek-V3.2-Exp發布。引入了全新的稀疏注意力機制（DeepSeek Sparse Attention），為更長上下文和更高效率的推理奠定了架構基礎。
2025年11月：DeepSeekMath V2發布，基于V3.2-Exp-Base構建，在多項數學競賽中達到金牌水平，并驗證了自驗證（self-verification）技術的有效性。
2025年12月：DeepSeek-V3.2正式發布。V3.2-Speciale版本在2025年國際數學奧林匹克（IMO）和國際信息學奧林匹克（IOI）中取得金牌級表現，首次將思考能力整合到工具調用中。
2026年1月：DeepSeek先后發布了關于Manifold-Constrained Hyper-Connections（mHC）和Engram條件記憶技術的研究論文，被業界普遍視為V4的架構基石。mHC改變了信息在模型層間的流動方式，Engram則讓模型能夠選擇性地記憶和調用上下文信息，支持超過100萬token的上下文處理。

每一步，都在為V4的最終亮相做準備。

一場精心策劃的輿論戰？

就在V4即將發布的節骨眼上，美國那邊也沒閑著。

2月24日，Anthropic在X上高調發帖，指控DeepSeek等3家對其Claude模型發動了「工業級蒸餾攻擊」，聲稱這三家中國實驗室創與Claude進行了超過1600萬次對話，以此提取能力來訓練自己的模型。

但諷刺的一幕緊隨其后。

就在Anthropic高調指責「蒸餾」的同一周，網友發現了一個令人瞠目的bug：當你用中文問Claude「你是什么模型」時，它竟然回復：「我是DeepSeek V3。」

甚至通過Anthropic官方API測試，結果還是一樣。

用法語提問時，Claude則回答「我是ChatGPT」。

這一幕的戲劇性實在太強了。

你剛指控別人「蒸餾你」，轉頭自己的模型就在中文環境下認了別人當「爹」。

Anthropic那條推文下面6000多條評論，超過70%都在嘲諷。

Reddit上的討論更加一針見血。

有用戶總結道：這是一場有組織的FUD（恐懼、不確定性和懷疑）營銷。

目的很明確——在V4發布前搶占敘事高地，預先埋下「他們只會作弊抄襲」的框架，無論V4表現多驚艷，公眾的第一反應都會被引導到負面解讀上。

同時通過輿論手段稀釋V4發布的媒體關注度，防止美國科技股再次出現去年R1發布時那樣的兩位數暴跌。

美股再次顫抖？

去年R1發布時，英偉達單日跌去17%，5890億美元灰飛煙滅。

如今V4不僅在模型能力上更進一步（多模態、百萬上下文、原生國產芯片適配），更在戰略層面發出了優先適配國產芯片的明確信號。

如果V4發布后的基準測試再次驗證了DeepSeek的效率優勢——用更少的計算資源達到世界一流水平——那華爾街的投資者勢必要再次面對那個令人不安的問題：AI基礎設施的天量投資，真的有必要嗎？

更值得關注的是，即便是競爭對手陣營的研究人員也在私下承認，DeepSeek V4不可小視。

「可能發布就登頂開源第一」。

DeepSeek V4的發布，不會是一個平靜的事件。

從蠻力到結構

中國AI的進化之路

2023年7月成立，2024年12月發布V3，2025年1月R1震撼全球，一整年持續迭代打磨。

2026年3月V4攜多模態能力與國產芯片適配強勢回歸。

這條路徑揭示了一個深刻的趨勢：中國AI正在從依賴硬件蠻力走向依靠架構創新和工程效率的道路。

美國的出口管制試圖用「卡脖子」的方式遏制中國AI的發展，但DeepSeek的存在本身就是對這種策略最有力的回應。

當你無法獲得最頂級的芯片時，被迫去思考更聰明的方法——更高效的訓練策略、更精妙的架構設計、更極致的資源優化。

而這些創新一旦形成，價值遠超任何一款芯片。

下周，我們拭目以待。

全世界都在看。

參考資料：

https://x.com/koltregaskes/status/2027675290735182007

https://www.ft.com/content/e3366881-0622-40a7-9c34-a0d82e3d573e

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.