網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

上市15天，摩爾線程劍指英偉達(dá)腹地

摩爾線程劍指英偉達(dá)腹地

2025-12-21 06:37:08　來(lái)源: 虎嗅APP

北京舉報(bào)

分享至

出品 | 虎嗅科技組

作者 | 丸都山

編輯 | 苗正卿

頭圖 | 摩爾線程

在資本市場(chǎng)的熱度趨于平靜之時(shí)，摩爾線程又在產(chǎn)業(yè)端將人們的視線拉回。

12月20日，摩爾線程舉行了首屆“MUSA開發(fā)者大會(huì)”，發(fā)布全新一代全功能GPU架構(gòu)“花港”，以及基于“花港”架構(gòu)打造的AI訓(xùn)推一體芯片“華山”，以及專用于高性能圖形渲染的芯片“廬山”。

此外，摩爾線程創(chuàng)始人張建中在現(xiàn)場(chǎng)還公布了“夸娥萬(wàn)卡智算集群”，以及未來(lái)即將發(fā)布的MTT C256超節(jié)點(diǎn)結(jié)構(gòu)規(guī)劃。

如果說(shuō)上述內(nèi)容還屬于“可預(yù)測(cè)的”技術(shù)迭代內(nèi)，那么諸如中間語(yǔ)言MTX，以及光刻計(jì)算庫(kù)、量子計(jì)算融合框架等技術(shù)，就真的完全在人意料之外了。

當(dāng)然，也可以說(shuō)這些技術(shù)并非摩爾線程首次提出的，畢竟后面這幾項(xiàng)或多或少都在GTC大會(huì)上出現(xiàn)過(guò)，但從國(guó)產(chǎn)GPU公司體量來(lái)看，敢于全方位地去搭建生態(tài)，這本身就是件值得肯定的事。

對(duì)于正處于“情感估值”與“理性審視”交織中的摩爾線程來(lái)說(shuō)，這場(chǎng)開發(fā)者大會(huì)也是在向外界傳達(dá)一個(gè)明確的信號(hào)，即無(wú)論行業(yè)作何評(píng)價(jià)，摩爾線程都會(huì)堅(jiān)持以MUSA為核心，去打造類似英偉達(dá)CUDA的生態(tài)護(hù)城河。

與英偉達(dá)中門對(duì)狙？

先來(lái)說(shuō)說(shuō)本次開發(fā)者大會(huì)上，讓筆者最為震驚的一項(xiàng)技術(shù)：中間語(yǔ)言MTX。

它屬于MUSA 5.0軟件棧的一部分，對(duì)于MUSA統(tǒng)一架構(gòu)，關(guān)注過(guò)摩爾線程的人或多或少都了解過(guò)，這是摩爾線程自主研發(fā)的覆蓋從芯片架構(gòu)、指令集編程模型到軟件運(yùn)行庫(kù)及驅(qū)動(dòng)程序框架的全棧技術(shù)體系。

在此前幾次版本迭代中，MUSA主要集中在編程生態(tài)的擴(kuò)充，比容兼容更多編程語(yǔ)言，或是豐富算子庫(kù)上，而今天提到的“中間語(yǔ)言MTX”屬首次出現(xiàn)。

簡(jiǎn)單解釋下中間語(yǔ)言MTX是什么。它的核心作用是兼容不同代際GPU的指令架構(gòu)，讓開發(fā)者無(wú)需為每一代新GPU重新適配代碼，大幅降低開發(fā)者適配成本，同時(shí)為上層軟件生態(tài)提供穩(wěn)定的底層支撐。

用個(gè)更直觀的例子來(lái)說(shuō)明下：在英偉達(dá)CUDA生態(tài)下，其核心底層組件之一，就是這個(gè)中間語(yǔ)言技術(shù)，英偉達(dá)將其命名為“PTX”，依托PTX中間語(yǔ)言，開發(fā)者在2018年為Turing架構(gòu)芯片編譯的代碼，至今仍可通過(guò)驅(qū)動(dòng)即時(shí)編譯在2025年的Blackwell芯片上運(yùn)行。

那么做這個(gè)“中間語(yǔ)言”難嗎？應(yīng)該說(shuō)非常難，而且耗時(shí)耗力，同樣以英偉達(dá)的PTX為例，在2007年隨CUDA 1.0發(fā)布后，大部分版本都需要新增對(duì)應(yīng)硬件的專屬指令（如Tensor Core相關(guān)指令），同時(shí)保持對(duì)舊版本的兼容，最終形成“高級(jí)語(yǔ)言→PTX→硬件二進(jìn)制指令”的成熟編譯鏈路。

對(duì)于開發(fā)者來(lái)說(shuō)，因?yàn)橹虚g語(yǔ)言PTX的存在，更加沒理由拒絕CUDA，因?yàn)樵谟ミ_(dá)之前，就沒有芯片廠商考慮過(guò)“向前兼容”的問(wèn)題。

不過(guò)，對(duì)于國(guó)內(nèi)GPU廠商而言，開發(fā)一個(gè)中間語(yǔ)言的難度肯定要遠(yuǎn)大于英偉達(dá)，因此在今天之前，筆者從不認(rèn)為真會(huì)有國(guó)內(nèi)廠商去做這件事。

而按照張建中在今天開發(fā)者大會(huì)上的表態(tài)，在明年上半年，摩爾線程自研的MTX就將向開發(fā)者開放。

相較于英偉達(dá)的18年磨一劍，可以預(yù)見的是，摩爾線程的MTX在適用性上一定不如前者，不過(guò)敢于邁出這一步，還是足夠令人刮目相看。

畢竟，在GPU行業(yè)中，有著英偉達(dá)這座大山，“不做生態(tài)”已經(jīng)成為了某種程度上的政治正確。

新架構(gòu)，提升顯著

從2022年基于MUSA統(tǒng)一架構(gòu)的“蘇堤”問(wèn)世算起，摩爾線程先后推出了四代GPU架構(gòu)，而本次發(fā)布的“花港”架構(gòu)基本上可以看作是升級(jí)幅度最大的一代。

首先是計(jì)算性能的顯著提升。基于新一代指令集，“花港”架構(gòu)較前代“平湖”的算力密度提升50%，同時(shí)能效大幅優(yōu)化，且支持從FP4到FP64的全精度端到端的全精度端到端計(jì)算。

其次是異步編程與超大規(guī)模互聯(lián)的支持。新一代異步編程模型，能夠更好地優(yōu)化任務(wù)調(diào)度與并行極致，而通過(guò)自研的MTLink高速互聯(lián)技術(shù)，將支持十萬(wàn)卡以上規(guī)模的智算集群擴(kuò)展。

值得一提的是，在開發(fā)者大會(huì)現(xiàn)場(chǎng)，張建中還明確表示，新一代“花港”架構(gòu)將內(nèi)置AI生成式渲染結(jié)構(gòu)，并且完整支持DirectX 12 Ultimate。

據(jù)此基本可以判斷出，摩爾線程的消費(fèi)級(jí)顯卡接下來(lái)一定會(huì)得到迭代，而且極大概率是一款基于“花港”架構(gòu)打造的產(chǎn)品。在“消費(fèi)級(jí)顯卡”這個(gè)小眾且最艱難的賽道上，摩爾線程依然沒有放棄。

基于“花港”架構(gòu)，摩爾線程在今天發(fā)布了兩款芯片：“廬山”與“華山”。

先說(shuō)說(shuō)定位于“AI訓(xùn)推一體”芯片的“廬山”。除了上文提到的新一代異步編程與全精度張量計(jì)算單元外，這枚芯片還有個(gè)特殊之處是能夠適配多種“類以太協(xié)議”，同時(shí)又適配多種Scale-Up switch。

這意味著“廬山”芯片不僅能在MTlink下使用，也可以兼容國(guó)內(nèi)其他廠商的協(xié)議，而據(jù)張建中在現(xiàn)場(chǎng)的介紹，“廬山”最高支持在1024片超節(jié)點(diǎn)的擴(kuò)展。

應(yīng)該說(shuō)，盡管摩爾線程執(zhí)著于打造自研生態(tài)，但并沒有把路走窄。

另外一枚用于高性能圖形渲染的芯片“廬山”，其圖像性能對(duì)比MMT S80，在集成了AI生成式渲染后，AI計(jì)算性能提升64倍，UtiTE統(tǒng)一渲染架構(gòu)讓幾何處理性能提升16倍，全新的硬件光追引擎，讓光線追蹤性能提升50倍。

除了芯片外，本次MUSA開發(fā)者大會(huì)還正式發(fā)布了“夸娥萬(wàn)卡智算集群”。該集群具備全精度、全功能通用計(jì)算能力，在萬(wàn)卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。

繼續(xù)拓展生態(tài)邊界

今年，國(guó)內(nèi)GPU行業(yè)的敘事逐漸從“能用”轉(zhuǎn)移到“好用”，尤其在H200解禁對(duì)華出口后，國(guó)內(nèi)從業(yè)者更加感受到了緊迫。

在芯片“好用”這個(gè)問(wèn)題上，摩爾線程答案仍聚焦于“生態(tài)”二字，不僅要實(shí)現(xiàn)生態(tài)自立，也在主動(dòng)探索生態(tài)邊界。

比如在今天的開發(fā)者大會(huì)上，摩爾線程推出的“長(zhǎng)江”SoC。這款芯片主要面向端側(cè)，通過(guò)CPU+GPU+NPU的組合，最高可提供50 TOPS的異構(gòu)AI算力。

據(jù)張建中介紹，摩爾線程將推出基于“長(zhǎng)江”SoC、AI芯片模組MTT E300和夸娥智算集群打造的MT Robot具身智能解決方案。

通過(guò)這個(gè)組合能夠看出，該款方案最大的特點(diǎn)是能夠協(xié)調(diào)“端—邊—云”算力。據(jù)悉，MT Robot已經(jīng)用在了農(nóng)業(yè)場(chǎng)景中。

另外值得一提的是，摩爾線程還基于這款SoC打造了一款名為“MTT AIBOOK”的AI算力本，未來(lái)還將推出一款迷你型計(jì)算設(shè)備MTT AI Cube。

而在具身智能方面，除了MT Robot外，摩爾線程還發(fā)布了MT Lambda具身智能仿真訓(xùn)練平臺(tái)。

該平臺(tái)在定位上有些類似于英偉達(dá)的Issac Sim，但又不完全一樣。MT Lambda核心聚焦于“全棧融合”，旨在將物理引擎、渲染引擎與AI引擎深度整合，打破了傳統(tǒng)具身智能研發(fā)中“開發(fā)、仿真、訓(xùn)練”各環(huán)節(jié)割裂的痛點(diǎn)，以提升研發(fā)效率。

此外，MT Lambda也可以直接部署到MT Robot上，以形成軟硬件的高效協(xié)同。

從摩爾線程在具身智能賽道上的生態(tài)拓展可以看出，在目前任何一個(gè)與“計(jì)算”有關(guān)的行業(yè)中，摩爾線程都試圖通過(guò)“全棧軟硬件架構(gòu)+全場(chǎng)景產(chǎn)品”的布局占據(jù)身位，每一步都在拓展生態(tài)的邊界，同時(shí)每一步都面臨著實(shí)打?qū)嵉奶魬?zhàn)。

某種意義上，這也是在走一遍英偉達(dá)來(lái)時(shí)的路，面對(duì)后者近20年沉淀出的生態(tài)霸權(quán)，摩爾線程能否搭建起另一條國(guó)產(chǎn)生態(tài)護(hù)城河，答案終究需要時(shí)間來(lái)檢驗(yàn)。

本文來(lái)自虎嗅，原文鏈接：https://www.huxiu.com/article/4819257.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.