<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      華為云Tokens服務全面接入384超節點,以系統能力打造先進算力

      0
      分享至

      8月27日,在第四屆828 B2B企業節開幕式上,華為云宣布其Tokens服務全面接入CloudMatrix384超節點,通過xDeepServe架構創新,單芯片最高可實現2400TPS、50msTPOT的超高吞吐、低時延的性能,超過業界水平。

      發揮“大雜燴”優勢,以系統能力打造先進算力

      過去18個月,中國AI算力需求呈現指數級增長。數據顯示,2024年初中國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已突破30萬億,1年半的時間增長了300多倍,反映了我國人工智能應用規模快速增長,也對算力基礎設施的需求提出了更大的挑戰。

      在以往按卡時計費的基礎上,今年3月,華為云正式推出了基于MaaS的Tokens服務。針對不同應用、不同場景的性能和時延要求,還提供了在線版、進線版、離線版乃至尊享版等多種服務規格,為大模型、Agent智能體等AI工具提供了更為靈活、便捷、低成本的先進算力。

      而這一次,華為云的Tokens服務正式接入CloudMatrix384,并通過384原生的xDeepServe框架再次實現了吞吐量的突破,從年初的1920TPS提升至2400TPS,TPOT僅為50ms。



      大算力的構建不是單點突破,而是一個從硬件到軟件、從算子到存儲、從推理框架到超節點的全棧創新,充分依托了華為的“大雜燴”能力。

      首先,CloudMatrix384 超節點以全新的計算架構創新,突破性能瓶頸,構筑穩固澎湃的算力根基; CANN昇騰硬件使能,優化算子與高效通信策略,讓云端的算力能夠以最高效的方式被調用和組合;EMS彈性內存存儲打破AI內存墻,突破性地實現“以存強算”, 徹底釋放了每一顆芯片的算力;xDeepServe 分布式推理框架則以極致分離架構Transfomerless讓超節點釋放出更高效算力。

      “拆掉”Transformer,xDeepServe全面激發算力潛能

      作為CloudMatrix384 超節點的原生服務,xDeepServe以Transformerless 的極致分離架構,把MoE大模型拆成可獨立伸縮的 Attention、FFN、Expert三個微模塊,相當于在一臺CloudMatrix384上把“大模型”拆成“積木”,并分派到不同的NPU上同步處理任務。之后,再用基于內存語義的微秒級XCCL通信庫與FlowServe 自研推理引擎把它們重新拼成一個超高吞吐的LLM服務平臺,即Tokens的“超高速流水線”。通過xDeepServe不斷調優,最終實現了從非超節點單卡吞吐600tokens/s至超節點單卡吞吐2400tokens/s的提升。

      作為硬件加速計算的中間層,CANN包含多個算子庫和和XCCL這種高性能通信庫等組件,共同支撐AI模型的高效運行。其中,XCCL作為專為超節點上的大語言模型(LLM)服務而量身打造的高性能通信庫,能夠充分發揮CloudMatrix384擴展后的UB互聯架構(UB fabric)的全部潛力,為 Transformerless的全面分離奠定了帶寬與時延雙重硬底座。

      而作為被重構的“去中心”式分布式引擎,FlowServe把CloudMatrix384 切成完全自治的 DP 小組,每個小組自帶 Tokenizer、執行器、RTC 緩存與網絡棧,完全自給自足,做到千卡并發也不“擁堵”。

      目前,xDeepServe已實現MA分離,而下一步,將把Attention、MoE、Decode全部改成自由流動的數據流,并把同樣的拼圖方法復制到多臺超節點,讓推理吞吐像鋪軌一樣線性延伸,最終或將視線吞吐量的更大突破,讓每塊 NPU 都高效運作,芯片永不排隊,推理永不塞車。

      聚焦主流大模型,不斷提升模型性能

      目前,華為云MaaS服務已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平臺。

      華為云積累了大量模型性能優化、效果調優的技術和能力,從而實現“源于開源,高于開源”,讓更多大模型可以在昇騰云上跑得更快更好。以文生圖大模型來說,在輕微損失畫質的情況下,通過Int8量化、旋轉位置編碼融合算子等方式,在在華為云MaaS平臺實現了2倍于業界主流平臺的出圖速度,最大尺寸支持2K×2K。而在文生視頻大模型上,不僅通過量化方式來提速,還通過通算并行等方式,降低延遲與顯存占用,大幅提升視頻生成速度,相較于友商實現了3.5倍的性能提升。華為云Tokens服務在性能、模型適配、效果調優方面的基礎,也讓更多企業能夠快速開發和構建AI Agent。

      而在應用層,華為云已與超過100家伙伴攜手深入行業場景,共建豐富的Agent,在調研分析、內容創作、智慧辦公、智能運維等領域解決產業難題,讓企業更便捷地擁抱AI創新,加速智能化。

      如基于MaaS平臺推出的今日人才數智員工解決方案,集成了先進的自然語言處理、機器學習和深度學習技術,能實現與用戶的智能交互和任務處理,顯著提升服務效率與客戶滿意度;而北京方寸無憂科技開發的無憂智慧公文解決方案可以提升公文處理效能,實現政企辦公智能化轉型。

      以Token為動力的智能社會已經到來,而華為云將以系統級創新能力和全新的Tokens服務構筑先進算力,助力各行各業加速落地AI。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗處決米爾賈法里

      伊朗處決米爾賈法里

      新京報政事兒
      2026-04-22 08:20:10
      馬刺官宣:文班亞馬臉部重摔地板 觸發腦震蕩保護協議提前退賽

      馬刺官宣:文班亞馬臉部重摔地板 觸發腦震蕩保護協議提前退賽

      醉臥浮生
      2026-04-22 09:17:19
      1935年,如果將瀘定橋炸毀,紅軍可能全軍覆沒,劉文輝為何沒炸?

      1935年,如果將瀘定橋炸毀,紅軍可能全軍覆沒,劉文輝為何沒炸?

      健康快樂丁
      2025-03-29 20:30:04
      濟南一市場賣魚檔口多只老鼠啃食鮮魚,市監回應:已收到相關反映,正在處理當中,涉事魚檔已關停,已對市場進行消殺

      濟南一市場賣魚檔口多只老鼠啃食鮮魚,市監回應:已收到相關反映,正在處理當中,涉事魚檔已關停,已對市場進行消殺

      極目新聞
      2026-04-22 11:09:00
      多米尼加發現世界最大稀土礦,儲量是我國的三倍多,有何影響?

      多米尼加發現世界最大稀土礦,儲量是我國的三倍多,有何影響?

      科普大世界
      2026-04-21 13:14:21
      退休人員速查!1992年前干過這4類工作,每月多領一筆錢,別吃虧

      退休人員速查!1992年前干過這4類工作,每月多領一筆錢,別吃虧

      夜深愛雜談
      2026-04-22 07:30:42
      編造“大蔥免費拿”謠言造成種植戶財產損失,多人被處罰

      編造“大蔥免費拿”謠言造成種植戶財產損失,多人被處罰

      界面新聞
      2026-04-22 10:01:16
      細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

      細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

      可達鴨面面觀
      2026-04-21 16:24:39
      范爭一輸球引發連鎖反應!中國選手未能提前鎖定4強,13冠王攪局

      范爭一輸球引發連鎖反應!中國選手未能提前鎖定4強,13冠王攪局

      劉姚堯的文字城堡
      2026-04-22 08:41:18
      有些品牌的壞,是從娘胎里帶出來的那種壞

      有些品牌的壞,是從娘胎里帶出來的那種壞

      細雨中的呼喊
      2026-04-21 21:19:33
      云南一幼童十余天反復咳痰帶血,氣管內取出8厘米活體蠕動螞蟥

      云南一幼童十余天反復咳痰帶血,氣管內取出8厘米活體蠕動螞蟥

      澎湃新聞
      2026-04-22 11:02:28
      B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

      B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

      17173游戲網
      2026-04-21 13:44:24
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      環保要求“一律關窗”,應急要求“一直開窗”,“工廠開窗還是關窗生產”驚動3部委

      環保要求“一律關窗”,應急要求“一直開窗”,“工廠開窗還是關窗生產”驚動3部委

      法律學堂
      2026-04-21 00:06:18
      不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

      不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

      春序娛樂
      2026-04-22 03:23:34
      中方不再伺候了!對荷光刻機優待全部取消,450億芯片不做了!

      中方不再伺候了!對荷光刻機優待全部取消,450億芯片不做了!

      阿傖說事
      2026-04-22 03:14:04
      45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發爭議

      45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發爭議

      譯言
      2026-04-22 07:23:37
      曾經罵李超人的嘴今天究竟怎么了?

      曾經罵李超人的嘴今天究竟怎么了?

      木蟲
      2026-04-21 06:02:22
      湖人半場僅領先火箭3分:詹姆斯14+6導15-0 杜蘭特20分引14-0追分

      湖人半場僅領先火箭3分:詹姆斯14+6導15-0 杜蘭特20分引14-0追分

      醉臥浮生
      2026-04-22 11:51:23
      余承東:我們成本扛不住了,希望大家早點購買

      余承東:我們成本扛不住了,希望大家早點購買

      映射生活的身影
      2026-04-20 21:53:17
      2026-04-22 12:47:00
      科技talk
      科技talk
      科技領域資深新媒體
      1324文章數 2249關注度
      往期回顧 全部

      科技要聞

      凌晨突發!ChatGPT Images 2.0發布

      頭條要聞

      KTV服務員被指強奸14歲女生 官方通報

      頭條要聞

      KTV服務員被指強奸14歲女生 官方通報

      體育要聞

      一到NBA季后賽,四屆DPOY就成了主角

      娛樂要聞

      復婚無望!baby黃曉明陪小海綿零交流

      財經要聞

      伊朗拒絕出席 特朗普宣布延長停火期限

      汽車要聞

      四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

      態度原創

      游戲
      家居
      本地
      手機
      公開課

      預計680元起 黑旗RE典藏版內容曝光!雕像等超多好禮

      家居要聞

      極簡繪夢 克制和諧

      本地新聞

      春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

      手機要聞

      小米盧偉冰:REDMI K90 Max官方300元的內存補貼會盡量延續

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版