<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      單卡突破1000TFLOPS!摩爾線程旗艦GPU參數(shù)首曝光:對(duì)標(biāo)H100,訓(xùn)練性能大漲30%

      0
      分享至


      芯東西(公眾號(hào):aichip001)
      作者 ZeR0
      編輯 漠影

      芯東西2月12日?qǐng)?bào)道,今日,摩爾線程發(fā)文宣布旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000率先完成對(duì)GLM-5大模型的適配,并首次曝光MTT S5000的硬件參數(shù)。

      MTT S5000支持FP8FP64的全精度計(jì)算,F(xiàn)P8精度下單卡AI算力最高可達(dá)1000TFLOPS,配備80GB顯存,顯存帶寬達(dá)1.6TB/s,卡間互聯(lián)帶寬達(dá)784GB/s

      根據(jù)業(yè)內(nèi)人士消息,MTT S5000實(shí)測(cè)性能對(duì)標(biāo)H100,在多模態(tài)大模型微調(diào)任務(wù)中,部分性能甚至超越H100


      MTT S5000由摩爾線程在2024年推出,專為大模型訓(xùn)練、推理及高性能計(jì)算而設(shè)計(jì)。

      據(jù)接近測(cè)試項(xiàng)目的行業(yè)人士透露,S5000在產(chǎn)品精度上已超越H100更接近英偉達(dá)Blackwell架構(gòu)

      在近期一次數(shù)千億參數(shù)模型的全流程訓(xùn)練驗(yàn)證中,該卡表現(xiàn)出了與H100集群極高的結(jié)果一致性,最終模型關(guān)鍵指標(biāo)誤差僅維持在千分之幾的范圍內(nèi),整體訓(xùn)練效果甚至實(shí)現(xiàn)小幅超越

      另?yè)?jù)來(lái)自互聯(lián)網(wǎng)廠商場(chǎng)景的實(shí)測(cè)信息反饋,S5000在典型端到端推理及訓(xùn)練任務(wù)中,性能可達(dá)競(jìng)品H20的2.5倍左右。

      摩爾線程官網(wǎng)也已上線MTT S5000的詳情頁(yè)面。

      產(chǎn)品形態(tài)上,S5000遵循OAM標(biāo)準(zhǔn)設(shè)計(jì),提供兩種計(jì)算模組形態(tài):

      • 液冷版:專為高密度綠色數(shù)據(jù)中心打造,釋放極致算力密度的同時(shí),顯著降低PUE與能耗;
      • 風(fēng)冷版:適配標(biāo)準(zhǔn)通用服務(wù)器,部署靈活便捷,有效降低運(yùn)維門檻與長(zhǎng)期持有成本。

      同時(shí),摩爾線程推出面向AI和高性能計(jì)算的MGX 8-GPU模塊化平臺(tái):8顆MTT S5000 OAM計(jì)算模組通過(guò)MTLink高速互聯(lián),可為大模型訓(xùn)練、推理及科學(xué)計(jì)算等應(yīng)用場(chǎng)景提供超大規(guī)模算力。


      MCCX D800 X2服務(wù)器是搭載8顆MTT S5000 OAM計(jì)算模組的一體化AI服務(wù)器,提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)的高端配置,可支撐千億、萬(wàn)億參數(shù)大模型高效運(yùn)行。

      該服務(wù)器在散熱、供電、I/O 擴(kuò)展性等方面充分優(yōu)化,支持風(fēng)冷和液冷兩種機(jī)型,可預(yù)裝優(yōu)化訓(xùn)練、推理軟件棧,實(shí)現(xiàn)軟硬件一體化交付,開(kāi)箱即用。


      一、基于第四代MUSA架構(gòu),原生支持FP8精度,訓(xùn)練性能提升30%

      在大模型參數(shù)持續(xù)擴(kuò)張的趨勢(shì)下,F(xiàn)P8計(jì)算精度的支持已成為訓(xùn)練與推理的核心精度標(biāo)準(zhǔn)。相比傳統(tǒng)的BF16/FP16,F(xiàn)P8可將數(shù)據(jù)位寬減半,顯存帶寬壓力降低50%,理論計(jì)算吞吐量翻倍

      MTT S5000是國(guó)內(nèi)最早一批原生支持FP8精度的訓(xùn)練GPU,配置了硬件級(jí)FP8 Tensor Core加速單元。其FP8引擎全面支持DeepSeek、Qwen等前沿架構(gòu),在實(shí)測(cè)中可提升30%以上訓(xùn)練性能。


      S5000采用第四代MUSA架構(gòu)“平湖”,專為大規(guī)模AI訓(xùn)練優(yōu)化,依托MUSA全棧軟件平臺(tái),原生適配PyTorch、Megatron-LM、vLLM及 SGLang等主流框架,讓用戶能夠以“零成本”完成代碼遷移,兼容國(guó)際主流CUDA生態(tài)。


      這款A(yù)I計(jì)算卡深度優(yōu)化了Prefill階段的處理效率,在超長(zhǎng)序列輸入場(chǎng)景下,能顯著加速Prompt預(yù)處理過(guò)程,提供更快的上下文理解與首Token響應(yīng)速度,有效解決大規(guī)模知識(shí)庫(kù)檢索及長(zhǎng)文檔分析中的延遲瓶頸。

      在16k長(zhǎng)序列輸入測(cè)試中,S5000單卡Prefill吞吐量是H20的2.5倍。這意味著在處理長(zhǎng)文本Prompt時(shí),國(guó)產(chǎn)算力具備更快的上下文理解速度。


      這主要得益于其高達(dá)1000TFLOPS的單卡算力。在絕大多數(shù)計(jì)算密集型場(chǎng)景中,該卡不僅能提供更強(qiáng)勁的算力輸出,也在整體性價(jià)比上展現(xiàn)出顯著優(yōu)勢(shì)。

      基于FSDP2框架,MTT S5000已率先完成Wan2.1視頻生成全模型訓(xùn)練驗(yàn)證,2節(jié)點(diǎn)16卡配置下訓(xùn)練吞吐量達(dá)61.83samples/s,模型算力利用率(MFU)達(dá)51%,生成效果在視頻邏輯、畫(huà)質(zhì)細(xì)膩度、動(dòng)態(tài)一致性上均對(duì)齊行業(yè)基準(zhǔn)。


      二、10EFLOPS萬(wàn)卡集群已落地,下游任務(wù)評(píng)測(cè)得分優(yōu)于H100

      基于S5000構(gòu)建的夸娥萬(wàn)卡集群已經(jīng)落地,其浮點(diǎn)運(yùn)算能力達(dá)到10EFLOPS,在Dense模型訓(xùn)練中MFU達(dá)60%,在MoE模型中維持在40%左右,有效訓(xùn)練時(shí)間占比超過(guò)90%,訓(xùn)練線性擴(kuò)展效率達(dá)95%


      依托原生FP8能力,它能夠完整復(fù)現(xiàn)頂尖大模型的訓(xùn)練流程,其中Flash Attention算力利用率超過(guò)95%,多項(xiàng)關(guān)鍵指標(biāo)均達(dá)到國(guó)際主流水平。

      在集群通信層面,S5000采用獨(dú)創(chuàng)的ACE技術(shù),將復(fù)雜通信任務(wù)從計(jì)算核心卸載,實(shí)現(xiàn)計(jì)算與通信的零沖突并行,大幅提升MFU。

      實(shí)測(cè)顯示,從64卡擴(kuò)展至1024卡,其系統(tǒng)保持90%以上的線性擴(kuò)展效率,訓(xùn)練速度隨算力增加幾乎同步倍增。

      第三方驗(yàn)證方面,2026年1月,智源研究院基于S5000千卡集群,完成了前沿具身大腦模型RoboBrain 2.5的端到端訓(xùn)練與對(duì)齊驗(yàn)證。

      結(jié)果顯示,與英偉達(dá)H100集群的訓(xùn)練結(jié)果高度重合,訓(xùn)練損失值(loss)差異僅為0.62%

      根據(jù)摩爾線程官網(wǎng),在S5000集群上訓(xùn)練DeepSeek-236B,前3萬(wàn)步訓(xùn)練過(guò)程中,Loss曲線與H100集群的相對(duì)精度誤差僅為0.6%。同等數(shù)據(jù)量下,其下游任務(wù)評(píng)測(cè)得分優(yōu)于H100,驗(yàn)證了萬(wàn)卡集群的高精度。


      GPU集群的可靠性、可用性和可維護(hù)性(RAS)是支撐大規(guī)模AI訓(xùn)練任務(wù)持續(xù)穩(wěn)定運(yùn)行的核心基礎(chǔ)設(shè)施能力。

      S5000從芯片級(jí)到系統(tǒng)級(jí)構(gòu)建了完整的RAS體系,支持故障感知、上報(bào)與錯(cuò)誤隔離,可快速定位并替換故障節(jié)點(diǎn)、慢節(jié)點(diǎn)及靜默數(shù)據(jù)損壞節(jié)點(diǎn),并具備主動(dòng)檢測(cè)與修復(fù)功能,長(zhǎng)期守護(hù)集群健康,確保性能穩(wěn)定與結(jié)果正確。

      三、刷新國(guó)產(chǎn)GPU大模型推理紀(jì)錄,科學(xué)計(jì)算性能完勝H100

      S5000在推理場(chǎng)景同樣表現(xiàn)優(yōu)異。2025年12月,摩爾線程聯(lián)合硅基流動(dòng),基于S5000完成對(duì)DeepSeek-V3 671B滿血版的深度適配與性能測(cè)試,實(shí)測(cè)單卡Prefill吞吐超4000tokens/s,Decode吞吐超1000tokens/s,刷新了國(guó)產(chǎn)GPU的推理紀(jì)錄。


      針對(duì)Agent間的高頻通訊與復(fù)雜代碼塊的瞬時(shí)生成需求,S5000在DeepSeek等前沿模型的推理實(shí)測(cè)中,實(shí)現(xiàn)了遠(yuǎn)超行業(yè)基準(zhǔn)的token生成速率

      S5000針對(duì)文生視頻模型進(jìn)行了深度優(yōu)化,基于原生FP8硬件加速能力,在大幅提升推理速度的同時(shí),確保生成內(nèi)容精度無(wú)損,單機(jī)性能達(dá)到H100的64%-79%,兼顧高性能輸出與高投入產(chǎn)出比(ROI)。


      同時(shí),S5000憑借原生FP64雙精度計(jì)算能力,通過(guò)與國(guó)家級(jí)實(shí)驗(yàn)室的深度合作與調(diào)優(yōu),在關(guān)鍵科學(xué)計(jì)算領(lǐng)域?qū)崿F(xiàn)性能提升。在SPONGE模擬引擎中,其性能達(dá)到H100的1.7倍;在分子對(duì)接工具DSDP的實(shí)測(cè)中,其計(jì)算效能展現(xiàn)出壓倒性優(yōu)勢(shì),性能達(dá)到H100的8.1倍


      此外,作為一款全功能GPU,S5000集成了高性能的多媒體編解碼引擎,硬件原生支持H264、H265、VP9、AV1、AVS2、AVS+、VP8等格式。


      結(jié)語(yǔ):國(guó)產(chǎn)GPU已經(jīng)扛起大模型訓(xùn)練的重任

      根據(jù)摩爾線程官網(wǎng)披露信息,無(wú)論是構(gòu)建萬(wàn)卡級(jí)超大規(guī)模訓(xùn)練集群,還是部署高并發(fā)、低延遲的在線推理服務(wù),MTT S5000均展現(xiàn)出對(duì)標(biāo)國(guó)際主流旗艦產(chǎn)品的卓越性能與穩(wěn)定性。

      作為目前國(guó)內(nèi)少數(shù)具備完整大模型訓(xùn)練能力的AI計(jì)算卡之一,MTT S5000提供了一套可行的國(guó)產(chǎn)算力替代方案,從FP8精度支持、單卡1000EFLOPS算力等參數(shù)到經(jīng)過(guò)萬(wàn)卡集群實(shí)訓(xùn)、第三方機(jī)構(gòu)驗(yàn)證的實(shí)戰(zhàn)成績(jī),都證明了國(guó)產(chǎn)GPU不僅能做好推理,而且已經(jīng)能支撐起大規(guī)模模型訓(xùn)練的計(jì)算需求。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      驚艷!劉亦菲這張照片,被稱最接近本人的一張圖!

      驚艷!劉亦菲這張照片,被稱最接近本人的一張圖!

      隨性的海浪
      2026-02-26 18:19:37
      搞民族歧視的,除了看守所,還有殯葬業(yè)!

      搞民族歧視的,除了看守所,還有殯葬業(yè)!

      疫苗與科學(xué)
      2026-02-27 07:42:27
      希拉里向國(guó)會(huì)作證 稱對(duì)愛(ài)潑斯坦案“不知情”

      希拉里向國(guó)會(huì)作證 稱對(duì)愛(ài)潑斯坦案“不知情”

      新華社
      2026-02-27 09:30:05
      一級(jí)軍士長(zhǎng)的地位有多高?相當(dāng)于什么級(jí)別?為何師長(zhǎng)見(jiàn)了都得敬禮

      一級(jí)軍士長(zhǎng)的地位有多高?相當(dāng)于什么級(jí)別?為何師長(zhǎng)見(jiàn)了都得敬禮

      觀銳器
      2026-02-26 22:20:40
      董璇大年初九回婆家,一家21口合照,張維伊外婆感動(dòng)的熱淚盈眶

      董璇大年初九回婆家,一家21口合照,張維伊外婆感動(dòng)的熱淚盈眶

      觀察鑒娛
      2026-02-27 09:30:13
      先奔印度再來(lái)北京?專家直言:默茨犯下大錯(cuò),德國(guó)已錯(cuò)失窗口

      先奔印度再來(lái)北京?專家直言:默茨犯下大錯(cuò),德國(guó)已錯(cuò)失窗口

      牛鍋巴小釩
      2026-02-27 08:57:44
      隨著中國(guó)男籃掀翻日本,韓國(guó)遭首敗,世預(yù)賽最新形勢(shì):亂成一鍋粥

      隨著中國(guó)男籃掀翻日本,韓國(guó)遭首敗,世預(yù)賽最新形勢(shì):亂成一鍋粥

      侃球熊弟
      2026-02-26 21:05:46
      他是上海足球名宿,豪取4個(gè)中超冠軍,36歲退役,如今接班徐根寶

      他是上海足球名宿,豪取4個(gè)中超冠軍,36歲退役,如今接班徐根寶

      寒士之言本尊
      2026-02-25 19:08:24
      美菲軍演突發(fā)意外

      美菲軍演突發(fā)意外

      陸棄
      2026-02-26 08:30:03
      中方高規(guī)格招待,默茨接過(guò)鮮花,走進(jìn)人民大會(huì)堂前,他喊出9個(gè)字

      中方高規(guī)格招待,默茨接過(guò)鮮花,走進(jìn)人民大會(huì)堂前,他喊出9個(gè)字

      福建平子
      2026-02-27 09:16:12
      富士康“賭輸”了!郭臺(tái)銘做夢(mèng)也沒(méi)有想到,“制裁”會(huì)來(lái)的這么快

      富士康“賭輸”了!郭臺(tái)銘做夢(mèng)也沒(méi)有想到,“制裁”會(huì)來(lái)的這么快

      混沌錄
      2025-08-22 18:23:58
      1980年鄧小平說(shuō):毛主席的錯(cuò)誤,要毫不含糊地批評(píng),但要實(shí)事求是

      1980年鄧小平說(shuō):毛主席的錯(cuò)誤,要毫不含糊地批評(píng),但要實(shí)事求是

      帝哥說(shuō)史
      2026-02-25 06:30:03
      只有一張光盤(pán),容量卻仿佛裝下了整個(gè)中世紀(jì),它當(dāng)年的逼格甚至蓋過(guò)了最終幻想

      只有一張光盤(pán),容量卻仿佛裝下了整個(gè)中世紀(jì),它當(dāng)年的逼格甚至蓋過(guò)了最終幻想

      小怪吃美食
      2026-02-27 01:43:34
      WTT新加坡大滿貫:2月27賽程公布!國(guó)乒再戰(zhàn)早田、橋本、雨果

      WTT新加坡大滿貫:2月27賽程公布!國(guó)乒再戰(zhàn)早田、橋本、雨果

      全言作品
      2026-02-27 06:40:03
      美荷兩國(guó)曾同時(shí)發(fā)聲,對(duì)中國(guó)獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評(píng)

      美荷兩國(guó)曾同時(shí)發(fā)聲,對(duì)中國(guó)獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評(píng)

      來(lái)科點(diǎn)譜
      2026-02-27 07:32:59
      南大學(xué)霸夫妻在蘇州創(chuàng)業(yè),拿下近億元B+輪融資

      南大學(xué)霸夫妻在蘇州創(chuàng)業(yè),拿下近億元B+輪融資

      創(chuàng)客公社-江蘇第一創(chuàng)投媒體
      2026-02-26 20:11:16
      個(gè)稅年度匯算開(kāi)始,這些坑你可別跳進(jìn)去

      個(gè)稅年度匯算開(kāi)始,這些坑你可別跳進(jìn)去

      賈話連篇
      2026-02-26 17:55:13
      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

      小李子體育
      2026-02-26 02:37:04
      一號(hào)文件:農(nóng)村迎來(lái)3大調(diào)整,涉及家家戶戶,農(nóng)民朋友要早準(zhǔn)備

      一號(hào)文件:農(nóng)村迎來(lái)3大調(diào)整,涉及家家戶戶,農(nóng)民朋友要早準(zhǔn)備

      愛(ài)下廚的阿椅
      2026-02-27 08:50:40
      江西女子用公驢器官泡酒,三個(gè)月后給丈夫喝,不料發(fā)生意外

      江西女子用公驢器官泡酒,三個(gè)月后給丈夫喝,不料發(fā)生意外

      古怪奇談錄
      2025-06-28 13:49:02
      2026-02-27 10:16:49
      芯東西 incentive-icons
      芯東西
      專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
      2212文章數(shù) 8150關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      賺大了!網(wǎng)友網(wǎng)購(gòu)一條32GB DDR5內(nèi)存 打開(kāi)包裹目瞪口呆:竟收到十條

      頭條要聞

      牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

      頭條要聞

      牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂(lè)要聞

      向華強(qiáng)公開(kāi)表態(tài) 財(cái)產(chǎn)留給兒媳婦郭碧婷

      財(cái)經(jīng)要聞

      魅族手機(jī),終成棄子?

      科技要聞

      英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

      汽車要聞

      40歲的吉利,不惑于內(nèi)外

      態(tài)度原創(chuàng)

      旅游
      親子
      時(shí)尚
      藝術(shù)
      健康

      旅游要聞

      云南寧洱有個(gè)“搬”出來(lái)的幸福漁村

      親子要聞

      不知道是真是假,社會(huì)百態(tài)與未來(lái)觀點(diǎn)

      今年春天最美搭配:西裝+半裙,怎么穿都好看!

      藝術(shù)要聞

      莫言獲諾貝爾文學(xué)獎(jiǎng),爭(zhēng)議背后的真相是什么?

      轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版