![]()
新智元報道
編輯:犀牛
【新智元導讀】DeepSeek V4下周登場:原生多模態,繞過英偉達,針對國產芯片深度優化。華爾街最怕的那條邏輯可能又要重演:算力霸權松動,美股先顫抖。
朋友們,見證歷史的時刻又要到了!
《金融時報》報道,DeepSeek V4,下周正式登場!
![]()
距離上一次DeepSeek發布重大模型R1,已經過去了整整一年多。
這一年里,AI行業風起云涌,OpenAI連推數代GPT,Anthropic的Claude殺入頂級陣營,谷歌Gemini瘋狂迭代。
整個硅谷都在用數百億美元甚至數千億美元瘋狂「燒錢」。
而DeepSeek呢?
它安安靜靜地待在杭州,沒有發布會,不路演,不炒作。
只做一件事:磨刀。
預計下周發布的V4將是一款支持圖片、視頻和文本生成的原生多模態大模型。
更炸裂的是,V4并沒有選擇跟英偉達做優化適配,而是優先與國產芯片廠商合作,針對國產AI芯片進行了深度調優。
這意味著,DeepSeek V4將不只是一次模型升級,也是一次底層架構的戰略轉向。
是中國AI從「用別人的芯片跑自己的模型」走向「用自己的芯片跑自己的模型」的歷史性一步。
DeepSeek選擇國內重磅會議前夕發布V4,無疑發出了一個信號:中國AI,不只是在追趕,還在定義新的游戲規則。
網友稱,「V4 將對 OpenAI 和 Google 形成巨大壓力。中國沒有放緩,而是在加速。」
「人工智能競賽又提升了一個檔次。」
![]()
![]()
有網友爆料,DeepSeek V4的API成本將比對手便宜50多倍。
![]()
更有網友豪言,美股已經瑟瑟發抖。
![]()
![]()
![]()
V4強在哪?
第一個關鍵詞:多模態。
過去的DeepSeek模型主要是「文字選手」——寫代碼一流,做推理一絕,但圖像和視頻能力一直是短板。
V4徹底補齊了這塊拼圖。
據目前泄露的信息,V4是一個原生多模態模型,能夠同時理解和生成圖片、視頻和文本。
而且,V4 Lite已經在至少一家推理服務商處進行內測,據稱擁有高達100萬token的上下文窗口,表現遠超網頁版和應用版模型。
目前已經在外網瘋傳的一張對比圖顯示,DeepSeek V4 Lite(代號「Sealion-lite」)在不開啟思考模式的情況下,生成的SVG圖像質量已經明顯超越了當前的DeepSeek V3.2思考模型。
![]()
有大V發帖稱,V4的編碼性能甚至比當前的GPT和Claude更強。
![]()
第二個關鍵詞:國產芯片適配。
這是V4最具戰略意義的突破。
據路透社和《金融時報》報道,DeepSeek這次繞開了英偉達,沒有向這家美國芯片巨頭提供V4的早期接入權限。
這打破了AI行業長期以來的慣例——過去,任何一個頂級大模型發布前,都會先跟英偉達做性能優化。
這一次,DeepSeek選擇了「反向操作」。
DeepSeek用V4告訴全世界:我們不挑芯片,也能跑出世界一流的模型。
當然,客觀地說,英偉達在訓練階段的芯片上依然占據主導地位,尤其是在計算密集型的預訓練環節。
但在推理階段,V4可能已經實現了國產芯片的全面適配。
推理環節是大模型商業化落地最核心的一環,這一步的突破意義不可估量。
第三個關鍵詞:開源。
據知情人士透露,DeepSeek將在V4發布時同步放出一份簡短的技術說明,并在大約一個月后發布一份更全面的技術報告。
這延續了DeepSeek一貫的「開放精神」。
去年R1發布時附帶的那份詳盡技術報告,曾讓全球AI研究者受益匪淺,被視為推理模型領域最重要的開源貢獻之一。
回顧R1
那一天,硅谷真的慌了
要理解V4的分量,必須先回看去年DeepSeek R1發布時的那場「地震」。
2025年1月20日,DeepSeek悄然上線了R1推理模型。
沒有發布會,沒有媒體吹風會,沒有CEO站在臺上揮手致意——就是簡簡單單地把模型放了出來,附帶一份技術報告。
然后,全世界炸了。
R1在多項基準測試上達到了與OpenAI最強模型o1相當甚至超越的水平,而DeepSeek聲稱其訓練成本僅為約560萬美元——這個數字不到GPT-4訓練成本的十分之一。
更要命的是,R1是開源的!
2025年1月27日——這是一個將被載入AI史冊的日子,DeepSeek的手機App超越ChatGPT,成為蘋果App Store下載量第一的免費應用。
同一天,英偉達股價暴跌近17%,單日市值蒸發約5890億美元,創下美國股市單家公司歷史最大單日跌幅紀錄。
博通下跌超過17%,微軟下跌2.1%,整個納斯達克血流成河。
![]()
知名風投家馬克·安德森稱DeepSeek為「我見過的最令人驚嘆和印象深刻的突破之一」。
多位美國科技界人士將其比作「斯普特尼克時刻」——1957年蘇聯先于美國將衛星送入太空的那一刻,象征著中國AI實力的強勢崛起。
而華爾街投資人最恐懼的問題浮出水面:如果一家中國公司用十分之一的成本就能做出同等水平的模型,那美國科技巨頭每年砸下的數百億美元基礎設施投資,還值得嗎?
英偉達的高端GPU還會有那么大的需求嗎?
蟄伏一年,DeepSeek都干了什么?
R1之后,DeepSeek進入了長達一年多的「靜默模式」。
沒有新的旗艦模型,只有漸進式更新。
但這并不意味著他們無所作為——恰恰相反,DeepSeek一直在為V4鋪路。
來看看這份更新時間線:
2025年3月:DeepSeek-V3-0324發布。這是V3的一次重要升級,通過吸收R1的強化學習技術改進了后訓練流程,在數學和編程評測上甚至超過了GPT-4.5。
2025年5月:DeepSeek-R1-0528發布。R1的大幅升級版,推理能力顯著增強,代碼生成質量提升,被認為是開源推理模型的新標桿。
2025年8月:DeepSeek-V3.1發布。這是一個里程碑式的更新——V3.1首次將V3和R1的能力融合到一個模型中,支持「思考模式」和「非思考模式」的自由切換,在SWE-bench等基準上比前代提升超40%。此后更新至V3.1-Terminus版本,進一步修復了多語言混合、Agent能力等問題。
2025年9月:DeepSeek-V3.2-Exp發布。引入了全新的稀疏注意力機制(DeepSeek Sparse Attention),為更長上下文和更高效率的推理奠定了架構基礎。
2025年11月:DeepSeekMath V2發布,基于V3.2-Exp-Base構建,在多項數學競賽中達到金牌水平,并驗證了自驗證(self-verification)技術的有效性。
2025年12月:DeepSeek-V3.2正式發布。V3.2-Speciale版本在2025年國際數學奧林匹克(IMO)和國際信息學奧林匹克(IOI)中取得金牌級表現,首次將思考能力整合到工具調用中。
2026年1月:DeepSeek先后發布了關于Manifold-Constrained Hyper-Connections(mHC)和Engram條件記憶技術的研究論文,被業界普遍視為V4的架構基石。mHC改變了信息在模型層間的流動方式,Engram則讓模型能夠選擇性地記憶和調用上下文信息,支持超過100萬token的上下文處理。
![]()
每一步,都在為V4的最終亮相做準備。
一場精心策劃的輿論戰?
就在V4即將發布的節骨眼上,美國那邊也沒閑著。
2月24日,Anthropic在X上高調發帖,指控DeepSeek等3家對其Claude模型發動了「工業級蒸餾攻擊」,聲稱這三家中國實驗室創與Claude進行了超過1600萬次對話,以此提取能力來訓練自己的模型。
![]()
但諷刺的一幕緊隨其后。
就在Anthropic高調指責「蒸餾」的同一周,網友發現了一個令人瞠目的bug:當你用中文問Claude「你是什么模型」時,它竟然回復:「我是DeepSeek V3。」
甚至通過Anthropic官方API測試,結果還是一樣。
用法語提問時,Claude則回答「我是ChatGPT」。
這一幕的戲劇性實在太強了。
你剛指控別人「蒸餾你」,轉頭自己的模型就在中文環境下認了別人當「爹」。
Anthropic那條推文下面6000多條評論,超過70%都在嘲諷。
![]()
Reddit上的討論更加一針見血。
有用戶總結道:這是一場有組織的FUD(恐懼、不確定性和懷疑)營銷。
目的很明確——在V4發布前搶占敘事高地,預先埋下「他們只會作弊抄襲」的框架,無論V4表現多驚艷,公眾的第一反應都會被引導到負面解讀上。
同時通過輿論手段稀釋V4發布的媒體關注度,防止美國科技股再次出現去年R1發布時那樣的兩位數暴跌。
美股再次顫抖?
去年R1發布時,英偉達單日跌去17%,5890億美元灰飛煙滅。
![]()
如今V4不僅在模型能力上更進一步(多模態、百萬上下文、原生國產芯片適配),更在戰略層面發出了優先適配國產芯片的明確信號。
如果V4發布后的基準測試再次驗證了DeepSeek的效率優勢——用更少的計算資源達到世界一流水平——那華爾街的投資者勢必要再次面對那個令人不安的問題:AI基礎設施的天量投資,真的有必要嗎?
更值得關注的是,即便是競爭對手陣營的研究人員也在私下承認,DeepSeek V4不可小視。
「可能發布就登頂開源第一」。
DeepSeek V4的發布,不會是一個平靜的事件。
從蠻力到結構
中國AI的進化之路
2023年7月成立,2024年12月發布V3,2025年1月R1震撼全球,一整年持續迭代打磨。
2026年3月V4攜多模態能力與國產芯片適配強勢回歸。
這條路徑揭示了一個深刻的趨勢:中國AI正在從依賴硬件蠻力走向依靠架構創新和工程效率的道路。
美國的出口管制試圖用「卡脖子」的方式遏制中國AI的發展,但DeepSeek的存在本身就是對這種策略最有力的回應。
當你無法獲得最頂級的芯片時,被迫去思考更聰明的方法——更高效的訓練策略、更精妙的架構設計、更極致的資源優化。
而這些創新一旦形成,價值遠超任何一款芯片。
下周,我們拭目以待。
全世界都在看。
參考資料:
https://x.com/koltregaskes/status/2027675290735182007
https://www.ft.com/content/e3366881-0622-40a7-9c34-a0d82e3d573e
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.