DeepSeek首次基于華為芯片訓(xùn)練！美國當(dāng)天就坐不住了：指控中國大模型“抄襲”

2026-04-27 15:27:34　來源: 快科技

河南舉報

分享至

快科技4月27日消息，上周五（24日），DeepSeek正式發(fā)布V4大模型預(yù)覽版。這是全球首個主要針對華為昇騰AI處理器深度優(yōu)化的前沿大模型，全程脫離NVIDIA CUDA體系。

而就在同一天，美國國務(wù)院已向全球各國大使館發(fā)出外交電報，指示其工作人員警告外國政府，指控DeepSeek和其他中國人工智能公司"涉嫌竊取知識產(chǎn)權(quán)"。

DeepSeekV4參數(shù)規(guī)模達(dá)1.6萬億，上下文窗口達(dá)100萬token，分為Pro與Flash兩個版本。Pro版輸出定價每百萬token 24元，F(xiàn)lash版僅2元，遠(yuǎn)低于GPT-5.4、ClaudeOpus4.6等海外閉源模型。官方表示，DeepSeek V4 Pro性能比肩頂級閉源模型。

此次發(fā)布最大突破是徹底切換算力底座。DeepSeek上一代V3依賴2048張NVIDIA H800訓(xùn)練，曾被調(diào)查涉嫌通過第三方采購受限芯片。V4全程采用華為昇騰芯片訓(xùn)練，華為確認(rèn)昇騰全系列超節(jié)點與最新950系列實現(xiàn)首日兼容。DeepSeek透露，下半年昇騰950超節(jié)點批量上市后后，Pro版價格有望進(jìn)一步下調(diào)。

據(jù)知情人士透露，DeepSeek發(fā)布V4之前，沒有向美國芯片公司NVIDIA和AMD提供模型早期訪問權(quán)限，而是率先讓中國企業(yè)華為提前數(shù)周開展軟件適配優(yōu)化工作。"breaking from standard industry practice（打破行業(yè)慣例）。"報道中如此形容這一事件。

畢竟，這是此前無論中國公司還是外國公司的大模型，都沒有采用過的方式。早在去年8月，DeepSeek V3.1就支持了UE8M0FP8Scale參數(shù)精度，并特別表示這一數(shù)據(jù)格式是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計，為脫離CUDA生態(tài)埋下伏筆。

據(jù)悉，DeepSeekV4發(fā)布當(dāng)天，美國國務(wù)院向全球使館發(fā)送外交電報。美方要求駐外人員提醒各國，提防DeepSeek、月之暗面、MiniMax等企業(yè)"竊取并蒸餾美國AI模型"。白宮此前也發(fā)布備忘錄，指責(zé)中方開展工業(yè)化規(guī)模模型蒸餾。OpenAI與Anthropic早前均指控過DeepSeek涉嫌蒸餾其模型。

"不誘于譽(yù)，不恐于誹，率道而行，端然正己。"DeepSeek在官方新聞稿中表示。

"感謝每一位用戶的信任與支持，大家的肯定、建議和期許，是我們不竭探索、持續(xù)進(jìn)步的動力，也讓我們始終堅守初心，專注于不懈的創(chuàng)新。我們將始終秉持長期主義的原則理念，在嘗試與思考中踏實前行，努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近。"

NVIDIA CEO黃仁勛曾公開警告，DeepSeek若在華為芯片上完成首發(fā)，意味著AI模型有望在美國技術(shù)架構(gòu)之外實現(xiàn)最優(yōu)運(yùn)行。如果這款模型針對華為架構(gòu)完成專屬優(yōu)化，會直接讓美國在全球AI競爭中落入劣勢，這對美國是重大損失。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.