2026年4月24日,DeepSeek-V4大模型正式發(fā)布并開源,華為云成為首發(fā)適配廠商,同步上線高性能推理服務(wù),大幅降低超長上下文使用門檻。
DeepSeek-V4具備百萬Token超長上下文能力,在Agent智能體、世界知識與推理性能上達到國內(nèi)及開源領(lǐng)域領(lǐng)先水平。本次推出的DeepSeek-V4-Flash版本參數(shù)優(yōu)化至284B,參數(shù)與激活占用更小,推理成本顯著降低,可提供更快捷、經(jīng)濟的API服務(wù),真正實現(xiàn)百萬上下文普惠。
適配期間,華為云從系統(tǒng)、算子、集群三層協(xié)同發(fā)力,在調(diào)度效率、計算效率、數(shù)據(jù)流轉(zhuǎn)效率三大維度全面保障模型快速落地。華為云首發(fā)適配分層注意力壓縮機制,實現(xiàn)KVCache高效管理,并提供TopK、SWA、CFA等10+昇騰高性能融合算子,結(jié)合框架異步調(diào)度、MTP多步投機等優(yōu)化,支持原生1M長上下文高性能推理。
目前,華為云MaaS模型即服務(wù)平臺已開放免部署、一鍵調(diào)用能力,開發(fā)者可直接接入DeepSeek-V4-Flash API,快速構(gòu)建AI應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.