快科技4月27日消息,上周五(24日),DeepSeek正式發(fā)布V4大模型預(yù)覽版。這是全球首個主要針對華為昇騰AI處理器深度優(yōu)化的前沿大模型,全程脫離NVIDIA CUDA體系。
而就在同一天,美國國務(wù)院已向全球各國大使館發(fā)出外交電報,指示其工作人員警告外國政府,指控DeepSeek和其他中國人工智能公司"涉嫌竊取知識產(chǎn)權(quán)"。
DeepSeekV4參數(shù)規(guī)模達(dá)1.6萬億,上下文窗口達(dá)100萬token,分為Pro與Flash兩個版本。Pro版輸出定價每百萬token 24元,F(xiàn)lash版僅2元,遠(yuǎn)低于GPT-5.4、ClaudeOpus4.6等海外閉源模型。官方表示,DeepSeek V4 Pro性能比肩頂級閉源模型。
此次發(fā)布最大突破是徹底切換算力底座。DeepSeek上一代V3依賴2048張NVIDIA H800訓(xùn)練,曾被調(diào)查涉嫌通過第三方采購受限芯片。V4全程采用華為昇騰芯片訓(xùn)練,華為確認(rèn)昇騰全系列超節(jié)點與最新950系列實現(xiàn)首日兼容。DeepSeek透露,下半年昇騰950超節(jié)點批量上市后后,Pro版價格有望進(jìn)一步下調(diào)。
據(jù)知情人士透露,DeepSeek發(fā)布V4之前,沒有向美國芯片公司NVIDIA和AMD提供模型早期訪問權(quán)限,而是率先讓中國企業(yè)華為提前數(shù)周開展軟件適配優(yōu)化工作。"breaking from standard industry practice(打破行業(yè)慣例)。"報道中如此形容這一事件。
畢竟,這是此前無論中國公司還是外國公司的大模型,都沒有采用過的方式。早在去年8月,DeepSeek V3.1就支持了UE8M0FP8Scale參數(shù)精度,并特別表示這一數(shù)據(jù)格式是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計,為脫離CUDA生態(tài)埋下伏筆。
據(jù)悉,DeepSeekV4發(fā)布當(dāng)天,美國國務(wù)院向全球使館發(fā)送外交電報。美方要求駐外人員提醒各國,提防DeepSeek、月之暗面、MiniMax等企業(yè)"竊取并蒸餾美國AI模型"。白宮此前也發(fā)布備忘錄,指責(zé)中方開展工業(yè)化規(guī)模模型蒸餾。OpenAI與Anthropic早前均指控過DeepSeek涉嫌蒸餾其模型。
"不誘于譽(yù),不恐于誹,率道而行,端然正己。"DeepSeek在官方新聞稿中表示。
"感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續(xù)進(jìn)步的動力,也讓我們始終堅守初心,專注于不懈的創(chuàng)新。我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近。"
NVIDIA CEO黃仁勛曾公開警告,DeepSeek若在華為芯片上完成首發(fā),意味著AI模型有望在美國技術(shù)架構(gòu)之外實現(xiàn)最優(yōu)運(yùn)行。如果這款模型針對華為架構(gòu)完成專屬優(yōu)化,會直接讓美國在全球AI競爭中落入劣勢,這對美國是重大損失。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.