本文來源:時代財經(jīng) 作者:郭美婷
上市15天后,摩爾線程(摩爾線程-U,688795.SH)向外界秀出了自己的“肌肉”。
12月20日-21日,摩爾線程首屆MUSA開發(fā)者大會(MDC 2025)舉辦,摩爾線程創(chuàng)始人、董事長兼CEO張建中一連公布了一系列技術(shù)與產(chǎn)品進展,其中包括全新架構(gòu)“花港”,基于該架構(gòu)的“華山”、“廬山”芯片,智能SoC芯片“長江”,以及夸娥萬卡智算集群和AI算力本MTT AIBOOK等。
![]()
圖源:截圖自摩爾線程直播
業(yè)界慣將摩爾線程比作“中國的英偉達”,在發(fā)布會上,張建中也未避諱提到與英偉達的對比。以最新發(fā)布的“華山”芯片為例,張建中表示,“華山”的訪存帶寬、浮點算力和高速互聯(lián)帶寬三個指標能力介于英偉達的最新架構(gòu)Blackwell和上一代架構(gòu)Hopper之間,而訪存容量則高于二者。
![]()
圖源:截圖自摩爾線程直播
“過去,大部分大模型開發(fā)者不敢用國內(nèi)的卡訓(xùn)練,怕訓(xùn)練的結(jié)果不好。”張建中說,“我們可以有信心地跟大家講,如果你以前是在Hopper上做訓(xùn)練,你今天用我們的S5000去訓(xùn)練你的大語言模型,效果只會比它好,不會比它差。”
在現(xiàn)場,多位摩爾線程的合作企業(yè)和開發(fā)者告訴時代財經(jīng),得益于MUSA框架對CUDA的兼容性,遷移至MUSA生態(tài)的難度相較于其他國產(chǎn)芯片更低,但遷移后仍會存在接口適配、功能適應(yīng)等問題,“(生態(tài))還處于爬坡階段。”一位企業(yè)開發(fā)者提到。不過,未來隨著廠商積極推進適配優(yōu)化以及生態(tài)內(nèi)的聯(lián)動加強,生態(tài)成熟度也將持續(xù)提升。
新架構(gòu)和新芯片
從發(fā)布節(jié)奏來看,摩爾線程基本保持一年一迭代的節(jié)奏。從2022年的蘇堤開始,到春曉、曲院、平湖,此次發(fā)布會上,摩爾線程發(fā)布了新一代全功能GPU架構(gòu)“花港”。
據(jù)了解,“花港”基于新一代指令集,支持FP4到FP64的全精度計算,算力密度相比上一代提升50%,效能提升10倍,支持十萬卡以上規(guī)模智算集群。
![]()
圖源:截圖自摩爾線程直播
張建中透露,基于該架構(gòu),摩爾線程公布兩款芯片技術(shù)路線。一款是“華山”,專注AI訓(xùn)推一體與超大規(guī)模智能計算,集成新一代異步編程與全精度張量計算單元,支持從FP4至FP64的全精度計算;另一款是“廬山”,專攻高性能圖形渲染,AI計算性能提升64倍,幾何處理性能提升16倍,光線追蹤性能提升50倍,并在紋理填充、原子訪存能力及顯存容量方面有所增強。
此外,大會發(fā)布了夸娥萬卡智算集群,浮點運算能力達到10Exa-Flops,訓(xùn)練算力利用率(MFU)在Dense大模型上達60%,MOE大模型上達40%,有效訓(xùn)練時間占比超過90%,訓(xùn)練線性擴展效率達95%,與國際主流生態(tài)兼容。張建中表示,2024年摩爾線程推出第一代千卡集群,今年達到1萬卡,接下來還要做10萬卡、50萬卡、100萬卡。
摩爾線程針對大模型訓(xùn)練的挑戰(zhàn),打造出的夸娥萬卡智算集群及其配套技術(shù)方案,可以通過軟硬件協(xié)同優(yōu)化保障訓(xùn)練穩(wěn)定性與精度。張建中表示,摩爾線程選取 DeepSeek V3、DeepSeek R1等主流模型,采用FP8精度進行訓(xùn)練復(fù)現(xiàn)。結(jié)果顯示,其訓(xùn)練loss曲線與Hopper系列顯卡基本上一致,而從實際測評結(jié)果來看,相同數(shù)據(jù)量、相同模型的情況下,摩爾線程的訓(xùn)練效果更優(yōu)于國際主流顯卡。
除了芯片和智算產(chǎn)品外,摩爾線程還發(fā)布了搭載智能SoC芯片“長江”的AI算力本MTT AIBOOK,提供了50TOPS的端側(cè)AI算力,支持包括MT AIOS(Linux)、Windows虛擬機、Android 容器和國產(chǎn)操作系統(tǒng)等多系統(tǒng)切換,支持開發(fā)者在不同環(huán)境下開發(fā)各種國產(chǎn)應(yīng)用場景。“我們把AI原生的應(yīng)用場景都內(nèi)置在這一臺AIBOOK中,它是一臺多系統(tǒng)隨意切換的,結(jié)合開發(fā)、娛樂、辦公于一體的(算力本)。”張建中表示。
生態(tài)是關(guān)鍵
“開發(fā)者是生態(tài)建設(shè)的關(guān)鍵,國產(chǎn)芯片平臺必須構(gòu)建起友好、易用的開發(fā)環(huán)境,以有效服務(wù)開發(fā)者社群。”中國工程院院士、清華大學(xué)計算機系教授鄭緯民在此次大會上表示。
“生態(tài)體系是GPU行業(yè)的核心護城河與價值所在。”張建中也坦言。
針對生態(tài),摩爾線程在大會上透露,其搭建的摩爾學(xué)院有近20萬名開發(fā)者與學(xué)習(xí)者,同時宣布建設(shè)MUSA生態(tài)中心,發(fā)布MUSA開發(fā)者計劃。
事實上,此次發(fā)布的MTT AIBOOK本身就是一個連接開發(fā)者與MUSA生態(tài)的入口。據(jù)摩爾線程現(xiàn)場介紹,客戶合作初期需要平臺驗證芯片的適配度,為此他們需要借助專用設(shè)備部署算法、開發(fā)待推理的模型,而MTT AIBOOK恰好滿足了這一需求場景。
![]()
圖源:時代財經(jīng)攝
另外,張建中表示,摩爾線程準備做MUSACode代碼生成大模型,MUSACode可以做到自動化的從CUDA轉(zhuǎn)到MUSA,目前已經(jīng)做到可編譯率93%,準確率90%以上。
在MUSA生態(tài)加速建設(shè)的過程中,大量基于傳統(tǒng)芯片架構(gòu)的開發(fā)者與企業(yè),正面臨不少要從原來的生態(tài),遷移到MUSA生態(tài)的情況。
摩爾線程展區(qū)現(xiàn)場工作人員介紹,在傳統(tǒng)遷移場景下,開發(fā)者面臨的最大成本是代碼遷移成本。由于不同硬件體系、架構(gòu)體系對應(yīng)的編程語法結(jié)構(gòu)與算子庫調(diào)用方式存在差異,遷移過程中需適配新的開發(fā)規(guī)范。為此,摩爾線程推出了相應(yīng)的配套工具,可實現(xiàn)代碼的自動化遷移,無需開發(fā)者人工重寫代碼,僅需進行簡單的文本調(diào)整,即可實現(xiàn)近乎零成本的遷移。
第二類成本則是調(diào)試(debug)成本。目前,摩爾線程正逐步實現(xiàn)算子的百分之百替代適配。當開發(fā)者原項目中調(diào)用的各類算子,均能無縫適配MUSA生態(tài)對應(yīng)的算子,且無運行報錯時,調(diào)試工作即可完成。總體而言,開發(fā)者遷移過程中的最大成本實則為時間成本。
時代財經(jīng)在展區(qū)內(nèi)了解到,近年來,全鏈國產(chǎn)化愈發(fā)成為眾多企業(yè)的發(fā)展趨勢。
一家初創(chuàng)企業(yè)表示,選擇摩爾線程的原因之一,是看中其全功能GPU定位,因為這意味著其搭建的生態(tài)能夠吸引的合作伙伴可能覆蓋各行各業(yè)。“它目前比英偉達是有性價比的。”該初創(chuàng)企業(yè)相關(guān)負責(zé)人表示,對于開發(fā)者而言,選擇契合自身現(xiàn)階段需求的產(chǎn)品即可滿足使用要求,價格性價比也更高。
另一家工業(yè)機器人企業(yè)研發(fā)人員稱,初期與摩爾線程適配時,也存在生態(tài)差別、接口不一等不適應(yīng)的情況,不過經(jīng)由兩邊的討論協(xié)商,這些難點都得到了一一解決。“硬件支持上一定是快速做到,只有接口適配,才能在后續(xù)進行其他功能的開發(fā)。”
尚陽科技在兩年前開始適配摩爾線程的MUSA生態(tài),通過摩爾線程全功能GPU,其打造了企業(yè)級智能體引擎Useek曜芯智問。尚陽科技董事長李向陽向時代財經(jīng)提到了摩爾線程的GPU全功能的定位,其能夠?qū)崿F(xiàn)了圖形處理與計算功能等的一體化集成,部分性能對標英偉達產(chǎn)品。同時,此前多數(shù)開發(fā)者使用英偉達芯片,其調(diào)用算力所依賴的框架為CUDA,而MUSA框架在對CUDA的兼容性上表現(xiàn)優(yōu)異,這一點與其他平臺存在顯著差異,也是其核心優(yōu)勢所在。得益于MUSA框架具備深度兼容特性,開發(fā)者向該平臺遷移項目時,操作流程將更為簡便。李向陽稱,目前他最關(guān)注的是MUSA生態(tài)未來在細節(jié)功能的適配上的進展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.