馬年農歷春節前夕,國產智算卡再度迎來好消息!單卡FP8算力終于沖上1000TFLOPS了。
雖然國產GPU廠商摩爾線程在兩年前就推出了專門面向大模型訓練、推理及高性能計算設計的全功能GPU智算卡MTT S5000,但是具體的架構、參數和性能一直并未對外公布。
近日,摩爾線程首度公開了其旗艦產品S5000的詳細參數:基于“平湖”架構,單卡FP8算力突破1000T,集成80GB顯存,1.6TB/s帶寬,FP8到FP64全精度覆蓋,訓練精度緊咬H100,差距不到1%!
![]()
這不僅是國產GPU首次在單卡吞吐量上摸到國際頂尖門檻,更是為萬億參數大模型提供了真正可用的自主算力底座。
一、 核心參數對標:1000TFLOPS與全精度覆蓋
MTT S5000在設計之初便定位于“訓推一體”的全功能基座,其硬件參數展現了極強的競爭優勢:
●算力峰值: S5000單卡AI算力(FP8)最高可達 1000TFLOPS(即1 PFLOPS)。這一數據標志著國產GPU在單卡吞吐量上已可與國際主流一較高下。
●計算精度: 該卡實現了從 FP8、BF16、FP16到FP32、FP64 的全精度計算支持。業內實測顯示,S5000在產品計算精度上已超越英偉達H100,并在高精度計算能力上直追其最新的Blackwell架構。
●存儲規格: 配置 80GB顯存,顯存帶寬達 1.6TB/s。這一指標確保了在處理超大規模參數模型(如DeepSeek-V3)時,數據讀取不會成為瓶頸。
●互聯帶寬: 卡間互聯帶寬達到 784GB/s,支持萬卡規模的高效協同,極大提升了分布式訓練的效率。
二、 架構優勢:第四代MUSA與原生FP8引擎
S5000參數表現卓越的背后,是摩爾線程自主研發的 第四代MUSA架構“平湖”。
作為國內首批原生支持 FP8精度 的訓練GPU,S5000內置了硬件級FP8 Tensor Core加速單元。相比傳統的BF16/FP16,FP8能將數據位寬減半,使顯存帶寬壓力降低50%,理論計算吞吐量直接翻倍。實測證明,在DeepSeek、Qwen等前沿模型架構下,S5000的FP8引擎可提升 30%以上的訓練性能。
![]()
此外,S5000搭載了獨創的 ACE(異步計算引擎)技術。該技術能將復雜的通信任務從計算核心中卸載,實現計算與通信的零沖突并行。實測顯示,從64卡擴展至1024卡,系統始終保持90%以上的線性擴展效率,確保了算力參數能充分轉化為實戰性能。
![]()
三、 性能實測:高精度訓練對標H100
在典型任務實測中,S5000的參數優勢轉化成為顯著的效率:
●對比H20:在互聯網廠商的端到端任務測試中,S5000的綜合性能表現約為英偉達H20的 2.5倍。
![]()
●對比H100: 智源研究院基于S5000千卡集群訓練具身大腦模型RoboBrain 2.5,其訓練損失值(loss)與H100集群的差異僅為 0.62%,關鍵指標誤差在千分之幾,實現了對頂尖算力的高度對齊。
值得一提的是,S5000在推理場景同樣表現優異。比如在2025年12月,摩爾線程聯合硅基流動基于MTT S5000完成了對DeepSeek-V3 671B滿血版的深度適配與性能測試。
![]()
實測S5000單卡Prefill吞吐超過4000 tokens/s,Decode吞吐超過1000 tokens/s,刷新了國產GPU的推理紀錄。
四、 生態落地:智譜GLM-5的Day-0適配驗證
參數的強大最終體現在對頂尖模型的支撐能力上。近日,在智譜正式發布大模型 GLM-5 的當天,摩爾線程宣布MTT S5000已圓滿完成對該模型的 Day-0全流程適配與驗證。
依托MUSA全棧軟件平臺對SGLang、PyTorch、vLLM等主流框架的原生適配,S5000不僅能實現CUDA生態代碼的“零成本”遷移,更憑借其80GB顯存和1.6TB/s帶寬的參數底蘊,為GLM-5等萬億參數模型的快速迭代提供了堅實的國產算力支撐。
值得注意的是,雖然S5000是2024年就已推出的產品,但其選擇在2026年初首次公開詳細性能參數,這一時機頗耐人尋味——是否正是摩爾線程為新一代“花港”架構的S6000系列預熱的前奏?作為2025年12月發布的全功能GPU新架構,“花港”不僅支持FP4到FP64的全精度計算,更實現了計算密度提升50%、能效比躍升10倍的突破。基于新架構,專攻AI訓推的“華山”與高性能渲染的“廬山”芯片是否已蓄勢待發?S5000的不俗表現,加上“花港”架構所展現的技術縱深,已為國產算力的持續進化打開更多想象空間。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.