<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      寒武紀Day 0適配DeepSeek V4意味著什么

      0
      分享至


      經濟觀察報 記者 錢玉娟 任曉寧

      4月24日,深度求索(DeepSeek)發(fā)布了旗艦模型V4的預覽版本并同步開源。

      已經上線的DeepSeek V4模型分為Pro和Flash兩個版本,Pro版本的參數(shù)為1.6萬億,激活490億,預訓練數(shù)據(jù)33萬億;而Flash版本的參數(shù)為2840億,激活130億,預訓練數(shù)據(jù)32萬億。兩個版本模型的上下文都是1M(百萬詞元)。

      經歷了長達15個月的“靜默期”和多次更新傳聞,DeepSeek V4終于亮相。然而,這并非一次輕盈的亮相。

      在V4兩個版本模型對API訪問的價格介紹中,DeepSeek用一行小字表明了現(xiàn)實的骨感:受限于高端算力,目前V4 Pro的服務吞吐能力有限,預計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調。

      隨后,華為計算發(fā)文表示,昇騰一直同步支持DeepSeek系列模型,本次雙方更是通過芯模技術協(xié)同,實現(xiàn)了昇騰超節(jié)點的全系列產品支持DeepSeek V4系列模型。

      由華為昇騰代表的國產高端算力,與DeepSeek的模型算法進行協(xié)同適配,不再猶抱琵琶半遮面。

      DeepSeek在同步發(fā)出的V4技術報告中稱:“我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP(專家并行)方案。”這是DeepSeek第一次在正式文檔中把華為昇騰和英偉達并列寫進硬件驗證清單。

      一位從事大模型研究的高校學者還是從DeepSeek的小字說明中判斷:“國產算力支持下的DeepSeek V4大規(guī)模商用仍需時間。”

      該學者早就發(fā)現(xiàn)DeepSeek在產品端的算力緊缺。2026年初至今,DeepSeek曾突發(fā)多次服務中斷,備受關注的便是3月30日—31日的連續(xù)宕機事件。

      在他看來,DeepSeek在一眾國產大模型廠商中,以底層工程極限優(yōu)化著稱,即便在產品服務出現(xiàn)宕機風險時,也未公開提及其在芯片等物理設備方面的缺口問題,而今在新模型亮相之初就袒露算力受限,一定程度上揭示了國產模型廠商在國產算力適配上存在著陣痛。

      Day 0適配

      一位與DeepSeek有模型服務合作的供應商人士認為,V4之所以姍姍來遲,深層原因在于算力架構的重構。

      AI開源社區(qū)與模型托管平臺Hugging Face的亞太生態(tài)負責人王鐵震指出,目前各家國產大模型都在積極展開國產算力適配,而DeepSeek在過去超一年時間的V4研發(fā)中,也在試圖大規(guī)模采用國產芯片替代方案。眼下,DeepSeek除了持續(xù)推進與華為昇騰算力的適配,還與包括寒武紀、沐曦等在內的眾多國產算力廠商展開適配。

      王鐵震透露,行業(yè)內尤其關注國產大模型與國產算力是否達到“Day 0”適配。

      “Day 0 相當于大模型上線的當天,算力已完成全鏈路兼容、性能優(yōu)化、穩(wěn)定性驗證。開發(fā)者開箱即用,零等待、零額外適配即可直接訓練/推理該模型?!币晃粐a芯片廠商內部人士透露,過去只有英偉達的算力芯片能做到與各家模型的Day 0適配,其他GPU往往要滯后數(shù)月。

      就在DeepSeek V4官方信息發(fā)布后,寒武紀通過其官方公眾號表示,已基于vLLM 推理框架完成對DeepSeek V4已上線兩個模型版本的Day 0適配。

      寒武紀與DeepSeek最新模型完成Day 0適配,意味著國產GPU已經具備了與英偉達高端算力芯片同等的生態(tài)響應速度。而前述國產芯片廠商內部人士表示,其所在廠商也在與DeepSeek V4進行產品適配。在此之前,已經完成與十幾個國產大模型的Day 0適配。

      今年初,電信天翼云自主研發(fā)的“息壤”智算平臺宣布完成了國產算力芯片與DeepSeek V3系列大模型的深度適配優(yōu)化,伴隨DeepSeek的模型迭代與更新,智算平臺的優(yōu)化適配也在進行中。

      聚焦中國AI市場,國產大模型此前多依賴英偉達CUDA生態(tài),而今算法要全面適配國產算力,需要對底座架構進行重構。

      前述大模型研究學者與國產芯片廠商內部人士有個共識,算力自主可控是必然趨勢,他們將上述芯模技術底層的重構理解為“算力平替”的過程。從DeepSeek V4耗時長達一年多的研發(fā)進程,不難窺見這個過程的艱難。

      “不只是簡單的代碼遷移,MoE(混合專家模型)架構在國產芯片上的通信延遲優(yōu)化是世界級難題?!蹦愁^部模型廠商的技術工程師分析,DeepSeek選擇在此時坦承吞吐有限,本質上也是在等待國產芯片“超節(jié)點”范式的成熟。

      多模態(tài)缺失

      4月24日上午,在DeepSeek V4預覽版上線后,不僅半導體芯片國產替代板塊個股大漲,與國產算力及DeepSeek相關的概念股均出現(xiàn)異動。

      截至收盤,寒武紀(688256.SH)報1352.5元/股,漲超2.2%。同步走強的還有相關概念股,像龍芯中科(688047.SH)收盤報153.86元/股,同樣漲超2個點。以主營大數(shù)據(jù)服務及數(shù)據(jù)安全的拓爾思(300229.SZ),作為DeepSeek概念股,在24日午前漲至18.9元/股,僅短短5分鐘后便出現(xiàn)下跌,跌幅超過2%?。收盤報18.34元/股,較當日開盤價漲幅不及1%。

      前述頭部模型廠商技術工程師認為,此前傳聞DeepSeek V4會有多模態(tài)版本,可以具備支持圖片、視頻理解與生成等能力,而今上線的預覽版本能力,依然固守文本生成與推理領域。

      形成鮮明對比的是,就在DeepSeek V4上線的前幾個小時,OpenAI發(fā)布了新一代大模型GPT-5.5,其能力展示中特別突出了對工具調用的多模態(tài)視覺理解能力。

      即使不對標GPT、Gemini等海外頭部模型,在2026年的國產大模型戰(zhàn)場上,阿里千問、騰訊混元等均已實現(xiàn)“全模態(tài)一體化”。而V4已上線的兩個模型版本仍走單模態(tài)路線,前述頭部模型廠商技術工程師推測,DeepSeek在多模態(tài)識別能力上或出現(xiàn)短板。

      “多模態(tài)需要指數(shù)級的算力和更復雜的數(shù)據(jù)工程?!彼J為,這極為考驗模型廠商的生態(tài)布局。他所在的頭部大廠不斷挖角DeepSeek的技術人才?!拔覀儓F隊的數(shù)據(jù)負責人就來自DeepSeek。”

      這種核心人才的流失是令人擔憂的。多位受訪者確信DeepSeek在國產模型第一梯隊中的技術護城河,但也提出,繼核心科學家羅福莉入職小米、郭達雅轉投字節(jié)跳動后,內部負責核心數(shù)據(jù)工程、多模態(tài)預訓練的關鍵人士流失,或令其模型在多模態(tài)能力開發(fā)創(chuàng)新方面遇到更大困難。

      前述模型技術工程師分析,模型缺乏多模態(tài)識別能力或將意味著該廠商錯失大量實時視頻交互、視覺分析等高價值商業(yè)場景。

      V4預覽版的發(fā)布,讓市場看到了國產模型與算力在底層架構上的協(xié)同進展,但這并不意味著DeepSeek可以松口氣。在大模型萬億參數(shù)和全模態(tài)競爭的當下,它還需要交出一份答卷,在下半年昇騰950超節(jié)點到位前,頂著多模態(tài)應用技術的壓力,它的模型服務、產品迭代,甚至是人才組織架構,能否保持穩(wěn)定。

      前述模型技術工程師透露,在騰訊、阿里等巨頭有意與DeepSeek接洽首輪外部融資事宜外,近期數(shù)家推動國產替代相關動作的國資型產業(yè)投資基金,也在與DeepSeek展開深度洽談。在其看來,研發(fā)進度緩慢的DeepSeek,在算力資源之外,也對外來資金表現(xiàn)出極度渴求。

      (作者 錢玉娟)

      免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。


      錢玉娟

      TMT新聞部記者 長期關注并報道TMT領域的重大事件,時刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢。擅長企業(yè)模式、人物專訪及行業(yè)深度報道。 重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn 微信號:EstherQ138279

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      35歲男子常用微波爐加熱食物,2年后確診胃癌,醫(yī)生:犯了3個錯

      35歲男子常用微波爐加熱食物,2年后確診胃癌,醫(yī)生:犯了3個錯

      健康科普365
      2026-04-22 15:25:03
      南京新任免4名副市長

      南京新任免4名副市長

      愛下廚的阿釃
      2026-04-24 18:19:48
      山西一原村支書疑因土地糾紛用鏟車推土埋村民,當?shù)鼗貞阂驯恍叹校宦翊迕褚丫瘸?;警方正在全力調查

      山西一原村支書疑因土地糾紛用鏟車推土埋村民,當?shù)鼗貞阂驯恍叹?,被埋村民已救出;警方正在全力調查

      大風新聞
      2026-04-24 15:23:01
      才播了三期,就說他倆一定會離?

      才播了三期,就說他倆一定會離?

      橘子娛樂
      2026-04-24 21:14:22
      經營23年 本田決定撤出韓國汽車市場

      經營23年 本田決定撤出韓國汽車市場

      新京報
      2026-04-24 10:01:05
      緊急提醒!2026敬老卡升級新規(guī),退休老人必看,不升級真的用不了

      緊急提醒!2026敬老卡升級新規(guī),退休老人必看,不升級真的用不了

      頤年齋
      2026-04-24 08:30:18
      日本核心通脹率五個月來首次加速上漲,“恐加劇通脹壓力”

      日本核心通脹率五個月來首次加速上漲,“恐加劇通脹壓力”

      觀察者網
      2026-04-24 12:18:05
      轟的一聲,日本傳來一聲巨大爆響,自衛(wèi)隊傷亡慘重,尸體橫倒豎臥

      轟的一聲,日本傳來一聲巨大爆響,自衛(wèi)隊傷亡慘重,尸體橫倒豎臥

      音樂時光的娛樂
      2026-04-22 15:22:20
      美艦殺進霍爾木茲海峽,排雷封鎖雙管齊下,油價破百大戰(zhàn)一觸即發(fā)?

      美艦殺進霍爾木茲海峽,排雷封鎖雙管齊下,油價破百大戰(zhàn)一觸即發(fā)?

      網易新聞出品
      2026-04-13 21:09:11
      爺爺分遺產,達標500萬,姑媽500萬,我拉著爸爸就走,爺爺喊:站住

      爺爺分遺產,達標500萬,姑媽500萬,我拉著爸爸就走,爺爺喊:站住

      麥子情感故事
      2026-04-24 16:01:19
      寧募遠童,不恤近子!

      寧募遠童,不恤近子!

      胖胖說他不胖
      2026-04-22 11:50:12
      東亞正掉入“人口消亡賽”,問題不只是養(yǎng)不起孩子,社會契約已出現(xiàn)裂縫

      東亞正掉入“人口消亡賽”,問題不只是養(yǎng)不起孩子,社會契約已出現(xiàn)裂縫

      風向觀察
      2026-04-03 08:45:52
      95后男星待播劇角色熱度Top10,陳哲遠/張凌赫亮眼,侯明昊榜首

      95后男星待播劇角色熱度Top10,陳哲遠/張凌赫亮眼,侯明昊榜首

      妙知
      2026-04-23 08:58:32
      巴拉圭還沒與我國建交?首都亞松森為何在邊界上?

      巴拉圭還沒與我國建交?首都亞松森為何在邊界上?

      地圖帝
      2026-04-01 08:57:39
      一碰就枯萎!河南發(fā)現(xiàn)300多株罕見“冥界之花”,每年僅40多天露出地表,是武俠小說中可“起死回生”的仙草

      一碰就枯萎!河南發(fā)現(xiàn)300多株罕見“冥界之花”,每年僅40多天露出地表,是武俠小說中可“起死回生”的仙草

      大象新聞
      2026-04-24 21:49:28
      空姐的圈子真的亂嗎?我做了7年空姐,告訴大家最真實的行業(yè)現(xiàn)狀

      空姐的圈子真的亂嗎?我做了7年空姐,告訴大家最真實的行業(yè)現(xiàn)狀

      千秋文化
      2026-04-17 20:01:45
      都說國外好,今天說點大實話:加拿大和國內,根本是兩個世界

      都說國外好,今天說點大實話:加拿大和國內,根本是兩個世界

      千秋文化
      2026-04-23 20:16:03
      中國“絕不談判”!下令光刻機封鎖,全球有國家急了?

      中國“絕不談判”!下令光刻機封鎖,全球有國家急了?

      小蔑談事
      2026-04-23 17:09:31
      煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

      煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

      開心美食白科
      2026-04-09 09:43:04
      悲催?。?2歲貌美優(yōu)渥剩女征婚,可無房,只求快點和男生結婚生娃

      悲催??!42歲貌美優(yōu)渥剩女征婚,可無房,只求快點和男生結婚生娃

      火山詩話
      2026-04-14 06:51:44
      2026-04-25 03:23:00
      經濟觀察報 incentive-icons
      經濟觀察報
      經濟觀察報是專注于財經新聞與經濟分析的全國性綜合財經類媒體。聚焦商道、商技和商機。
      114268文章數(shù) 1606739關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價格依然"屠夫級"

      頭條要聞

      航班提前起飛10分鐘 大學生把海航告了

      頭條要聞

      航班提前起飛10分鐘 大學生把海航告了

      體育要聞

      上海男籃23連勝+主場全勝 姚明之后最強一季

      娛樂要聞

      停工16個月!趙露思證實接拍新劇

      財經要聞

      LG財閥內斗:百億美元商業(yè)帝國爭奪戰(zhàn)

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

      態(tài)度原創(chuàng)

      藝術
      游戲
      親子
      公開課
      軍事航空

      藝術要聞

      世界最高20座大樓,你見過幾棟?

      《光與影:33號遠征隊》發(fā)售一周年 銷量破800萬

      親子要聞

      小獅子也只是個大寶寶呀,看到小朋友的車車滿眼羨慕

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊陷入互相封鎖僵局

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 超碰人妻97| 久久精品国产中国久久| 1024精品| 亚洲日韩一区二区| 色屁屁www影院免费观看入口| 磴口县| 欧美精品亚洲精品日韩专区| 国产三级制服丝袜| 天天躁日日躁欧美老妇app| 国产精品亚洲综合色区丝瓜| 国产成人精品亚洲日本语言| 无码一区二区三区| 中文字幕人妻丝袜乱一区三区| 国产成人精品av| 日日cao| 国产一区二区波多野结衣| 亚洲成人视屏| 天天天欲色欲色www免费| 2021精品亚洲中文字幕| 一进一出抽搐gif| 亚洲av永久无码精品天堂久久| 石柱| 国产熟妇勾子乱视频| 无码专区—va亚洲v天堂| 囯产精品久久久久久久久久妞妞| 国偷自产一区二区免费视频| 日本高清不卡aⅴ免费网站| 美女一级毛片无遮挡内谢| 亚洲日本中文字幕| 亚洲综合电影| 久久99免费麻辣视频| 国产美女久久久亚洲综合| 无码中文字幕热热久久| 丰满人妻被中出中文字幕| 国产AV一区二区三区| 老妇free性videosxx| 日本免费精品一区二区三区| 精品日韩国产一区二区| 国内精品久久久久影院一蜜桃| 久久国产自拍一区二区三区| 国产精品久久久久影院|