![]()
摩爾線程AI旗艦級(jí)計(jì)算卡MTT S5000性能首次曝光,這是摩爾線程2024年推出的、專(zhuān)為大模型訓(xùn)練、推理及高性能計(jì)算而設(shè)計(jì)的訓(xùn)推一體全功能GPU智算卡。
摩爾線程在其官網(wǎng)中,首次公布了S5000的硬件參數(shù):支持FP8到FP64的全精度計(jì)算,其單卡AI算力(FP8)最高可達(dá)1 PFLOPS,顯存容量為80GB,顯存帶寬達(dá)到1.6TB/s,卡間互聯(lián)帶寬為784GB/s。業(yè)內(nèi)人士表示,MTT S5000實(shí)測(cè)性能對(duì)標(biāo)H100,在多模態(tài)大模型微調(diào)任務(wù)中,部分性能甚至超越H100。
![]()
在芯片架構(gòu)層面,S5000采用第四代MUSA架構(gòu)“平湖”,專(zhuān)為大規(guī)模AI訓(xùn)練優(yōu)化,依托MUSA全棧軟件平臺(tái),原生適配PyTorch、Megatron-LM、vLLM及SGLang等主流框架,讓用戶(hù)能夠以“零成本”完成代碼遷移,兼容國(guó)際主流CUDA生態(tài)。
在計(jì)算精度方面,S5000作為國(guó)內(nèi)一批最早原生支持FP8精度的訓(xùn)練GPU,配置了硬件級(jí)FP8 Tensor Core加速單元。相比傳統(tǒng)的BF16/FP16,F(xiàn)P8可將數(shù)據(jù)位寬減半,顯存帶寬壓力降低50%,理論計(jì)算吞吐量翻倍。其FP8引擎全面支持DeepSeek、Qwen等前沿架構(gòu),可提升30%以上訓(xùn)練性能。
基于S5000構(gòu)建的夸娥萬(wàn)卡集群已經(jīng)落地,其浮點(diǎn)運(yùn)算能力達(dá)到10Exa-Flops,在Dense模型訓(xùn)練中MFU達(dá)60%,在MoE模型中維持在40%左右,有效訓(xùn)練時(shí)間占比超過(guò)90%,訓(xùn)練線性擴(kuò)展效率達(dá)95%。依托原生FP8能力,它能夠完整復(fù)現(xiàn)頂尖大模型的訓(xùn)練流程,其中Flash Attention算力利用率超過(guò)95%,多項(xiàng)關(guān)鍵指標(biāo)均達(dá)到國(guó)際主流水平。
在集群通信層面,S5000采用獨(dú)創(chuàng)的ACE技術(shù),將復(fù)雜通信任務(wù)從計(jì)算核心卸載,實(shí)現(xiàn)計(jì)算與通信的零沖突并行,大幅提升模型算力利用率(MFU)。實(shí)測(cè)顯示,從64卡擴(kuò)展至1024卡,系統(tǒng)保持90%以上的線性擴(kuò)展效率,訓(xùn)練速度隨算力增加幾乎同步倍增。
2026年1月,智源研究院基于S5000千卡集群,完成了前沿具身大腦模型RoboBrain 2.5的端到端訓(xùn)練與對(duì)齊驗(yàn)證。結(jié)果顯示,與英偉達(dá)H100集群的訓(xùn)練結(jié)果高度重合,訓(xùn)練損失值(loss)差異僅為0.62%。
除了訓(xùn)練,S5000在推理場(chǎng)景同樣表現(xiàn)優(yōu)異。2025年12月,摩爾線程聯(lián)合硅基流動(dòng),基于S5000完成了對(duì)DeepSeek-V3 671B滿血版的深度適配與性能測(cè)試,實(shí)測(cè)單卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,這一成績(jī)刷新了國(guó)產(chǎn)GPU的推理紀(jì)錄。
—— 芯榜 ——
芯榜成立于 2015 年,是半導(dǎo)體垂直領(lǐng)域的產(chǎn)業(yè)媒體與數(shù)字化服務(wù)平臺(tái)。全網(wǎng)覆蓋超 100 萬(wàn)垂直行業(yè)用戶(hù),核心提供專(zhuān)業(yè)榜單發(fā)布、原創(chuàng)訪談、產(chǎn)業(yè)報(bào)告、峰會(huì)活動(dòng)及研究咨詢(xún)等服務(wù)。已合作近千家半導(dǎo)體生態(tài)企業(yè),聯(lián)動(dòng)多家基金公司與產(chǎn)業(yè)媒體,助力硬科技產(chǎn)業(yè)發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.