![]()
出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
頭圖 | 摩爾線程
在資本市場(chǎng)的熱度趨于平靜之時(shí),摩爾線程又在產(chǎn)業(yè)端將人們的視線拉回。
12月20日,摩爾線程舉行了首屆“MUSA開發(fā)者大會(huì)”,發(fā)布全新一代全功能GPU架構(gòu)“花港”,以及基于“花港”架構(gòu)打造的AI訓(xùn)推一體芯片“華山”,以及專用于高性能圖形渲染的芯片“廬山”。
![]()
此外,摩爾線程創(chuàng)始人張建中在現(xiàn)場(chǎng)還公布了“夸娥萬(wàn)卡智算集群”,以及未來(lái)即將發(fā)布的MTT C256超節(jié)點(diǎn)結(jié)構(gòu)規(guī)劃。
如果說(shuō)上述內(nèi)容還屬于“可預(yù)測(cè)的”技術(shù)迭代內(nèi),那么諸如中間語(yǔ)言MTX,以及光刻計(jì)算庫(kù)、量子計(jì)算融合框架等技術(shù),就真的完全在人意料之外了。
當(dāng)然,也可以說(shuō)這些技術(shù)并非摩爾線程首次提出的,畢竟后面這幾項(xiàng)或多或少都在GTC大會(huì)上出現(xiàn)過(guò),但從國(guó)產(chǎn)GPU公司體量來(lái)看,敢于全方位地去搭建生態(tài),這本身就是件值得肯定的事。
對(duì)于正處于“情感估值”與“理性審視”交織中的摩爾線程來(lái)說(shuō),這場(chǎng)開發(fā)者大會(huì)也是在向外界傳達(dá)一個(gè)明確的信號(hào),即無(wú)論行業(yè)作何評(píng)價(jià),摩爾線程都會(huì)堅(jiān)持以MUSA為核心,去打造類似英偉達(dá)CUDA的生態(tài)護(hù)城河。
與英偉達(dá)中門對(duì)狙?
先來(lái)說(shuō)說(shuō)本次開發(fā)者大會(huì)上,讓筆者最為震驚的一項(xiàng)技術(shù):中間語(yǔ)言MTX。
它屬于MUSA 5.0軟件棧的一部分,對(duì)于MUSA統(tǒng)一架構(gòu),關(guān)注過(guò)摩爾線程的人或多或少都了解過(guò),這是摩爾線程自主研發(fā)的覆蓋從芯片架構(gòu)、指令集編程模型到軟件運(yùn)行庫(kù)及驅(qū)動(dòng)程序框架的全棧技術(shù)體系。
在此前幾次版本迭代中,MUSA主要集中在編程生態(tài)的擴(kuò)充,比容兼容更多編程語(yǔ)言,或是豐富算子庫(kù)上,而今天提到的“中間語(yǔ)言MTX”屬首次出現(xiàn)。
![]()
簡(jiǎn)單解釋下中間語(yǔ)言MTX是什么。它的核心作用是兼容不同代際GPU的指令架構(gòu),讓開發(fā)者無(wú)需為每一代新GPU重新適配代碼,大幅降低開發(fā)者適配成本,同時(shí)為上層軟件生態(tài)提供穩(wěn)定的底層支撐。
用個(gè)更直觀的例子來(lái)說(shuō)明下:在英偉達(dá)CUDA生態(tài)下,其核心底層組件之一,就是這個(gè)中間語(yǔ)言技術(shù),英偉達(dá)將其命名為“PTX”,依托PTX中間語(yǔ)言,開發(fā)者在2018年為Turing架構(gòu)芯片編譯的代碼,至今仍可通過(guò)驅(qū)動(dòng)即時(shí)編譯在2025年的Blackwell芯片上運(yùn)行。
那么做這個(gè)“中間語(yǔ)言”難嗎?應(yīng)該說(shuō)非常難,而且耗時(shí)耗力,同樣以英偉達(dá)的PTX為例,在2007年隨CUDA 1.0發(fā)布后,大部分版本都需要新增對(duì)應(yīng)硬件的專屬指令(如Tensor Core相關(guān)指令),同時(shí)保持對(duì)舊版本的兼容,最終形成“高級(jí)語(yǔ)言→PTX→硬件二進(jìn)制指令”的成熟編譯鏈路。
對(duì)于開發(fā)者來(lái)說(shuō),因?yàn)橹虚g語(yǔ)言PTX的存在,更加沒理由拒絕CUDA,因?yàn)樵谟ミ_(dá)之前,就沒有芯片廠商考慮過(guò)“向前兼容”的問(wèn)題。
不過(guò),對(duì)于國(guó)內(nèi)GPU廠商而言,開發(fā)一個(gè)中間語(yǔ)言的難度肯定要遠(yuǎn)大于英偉達(dá),因此在今天之前,筆者從不認(rèn)為真會(huì)有國(guó)內(nèi)廠商去做這件事。
而按照張建中在今天開發(fā)者大會(huì)上的表態(tài),在明年上半年,摩爾線程自研的MTX就將向開發(fā)者開放。
相較于英偉達(dá)的18年磨一劍,可以預(yù)見的是,摩爾線程的MTX在適用性上一定不如前者,不過(guò)敢于邁出這一步,還是足夠令人刮目相看。
畢竟,在GPU行業(yè)中,有著英偉達(dá)這座大山,“不做生態(tài)”已經(jīng)成為了某種程度上的政治正確。
新架構(gòu),提升顯著
從2022年基于MUSA統(tǒng)一架構(gòu)的“蘇堤”問(wèn)世算起,摩爾線程先后推出了四代GPU架構(gòu),而本次發(fā)布的“花港”架構(gòu)基本上可以看作是升級(jí)幅度最大的一代。
首先是計(jì)算性能的顯著提升。基于新一代指令集,“花港”架構(gòu)較前代“平湖”的算力密度提升50%,同時(shí)能效大幅優(yōu)化,且支持從FP4到FP64的全精度端到端的全精度端到端計(jì)算。
其次是異步編程與超大規(guī)模互聯(lián)的支持。新一代異步編程模型,能夠更好地優(yōu)化任務(wù)調(diào)度與并行極致,而通過(guò)自研的MTLink高速互聯(lián)技術(shù),將支持十萬(wàn)卡以上規(guī)模的智算集群擴(kuò)展。
![]()
值得一提的是,在開發(fā)者大會(huì)現(xiàn)場(chǎng),張建中還明確表示,新一代“花港”架構(gòu)將內(nèi)置AI生成式渲染結(jié)構(gòu),并且完整支持DirectX 12 Ultimate。
據(jù)此基本可以判斷出,摩爾線程的消費(fèi)級(jí)顯卡接下來(lái)一定會(huì)得到迭代,而且極大概率是一款基于“花港”架構(gòu)打造的產(chǎn)品。在“消費(fèi)級(jí)顯卡”這個(gè)小眾且最艱難的賽道上,摩爾線程依然沒有放棄。
基于“花港”架構(gòu),摩爾線程在今天發(fā)布了兩款芯片:“廬山”與“華山”。
先說(shuō)說(shuō)定位于“AI訓(xùn)推一體”芯片的“廬山”。除了上文提到的新一代異步編程與全精度張量計(jì)算單元外,這枚芯片還有個(gè)特殊之處是能夠適配多種“類以太協(xié)議”,同時(shí)又適配多種Scale-Up switch。
這意味著“廬山”芯片不僅能在MTlink下使用,也可以兼容國(guó)內(nèi)其他廠商的協(xié)議,而據(jù)張建中在現(xiàn)場(chǎng)的介紹,“廬山”最高支持在1024片超節(jié)點(diǎn)的擴(kuò)展。
應(yīng)該說(shuō),盡管摩爾線程執(zhí)著于打造自研生態(tài),但并沒有把路走窄。
另外一枚用于高性能圖形渲染的芯片“廬山”,其圖像性能對(duì)比MMT S80,在集成了AI生成式渲染后,AI計(jì)算性能提升64倍,UtiTE統(tǒng)一渲染架構(gòu)讓幾何處理性能提升16倍,全新的硬件光追引擎,讓光線追蹤性能提升50倍。
![]()
除了芯片外,本次MUSA開發(fā)者大會(huì)還正式發(fā)布了“夸娥萬(wàn)卡智算集群”。該集群具備全精度、全功能通用計(jì)算能力,在萬(wàn)卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。
![]()
繼續(xù)拓展生態(tài)邊界
今年,國(guó)內(nèi)GPU行業(yè)的敘事逐漸從“能用”轉(zhuǎn)移到“好用”,尤其在H200解禁對(duì)華出口后,國(guó)內(nèi)從業(yè)者更加感受到了緊迫。
在芯片“好用”這個(gè)問(wèn)題上,摩爾線程答案仍聚焦于“生態(tài)”二字,不僅要實(shí)現(xiàn)生態(tài)自立,也在主動(dòng)探索生態(tài)邊界。
比如在今天的開發(fā)者大會(huì)上,摩爾線程推出的“長(zhǎng)江”SoC。這款芯片主要面向端側(cè),通過(guò)CPU+GPU+NPU的組合,最高可提供50 TOPS的異構(gòu)AI算力。
![]()
據(jù)張建中介紹,摩爾線程將推出基于“長(zhǎng)江”SoC、AI芯片模組MTT E300和夸娥智算集群打造的MT Robot具身智能解決方案。
通過(guò)這個(gè)組合能夠看出,該款方案最大的特點(diǎn)是能夠協(xié)調(diào)“端—邊—云”算力。據(jù)悉,MT Robot已經(jīng)用在了農(nóng)業(yè)場(chǎng)景中。
另外值得一提的是,摩爾線程還基于這款SoC打造了一款名為“MTT AIBOOK”的AI算力本,未來(lái)還將推出一款迷你型計(jì)算設(shè)備MTT AI Cube。
![]()
而在具身智能方面,除了MT Robot外,摩爾線程還發(fā)布了MT Lambda具身智能仿真訓(xùn)練平臺(tái)。
該平臺(tái)在定位上有些類似于英偉達(dá)的Issac Sim,但又不完全一樣。MT Lambda核心聚焦于“全棧融合”,旨在將物理引擎、渲染引擎與AI引擎深度整合,打破了傳統(tǒng)具身智能研發(fā)中“開發(fā)、仿真、訓(xùn)練”各環(huán)節(jié)割裂的痛點(diǎn),以提升研發(fā)效率。
此外,MT Lambda也可以直接部署到MT Robot上,以形成軟硬件的高效協(xié)同。
從摩爾線程在具身智能賽道上的生態(tài)拓展可以看出,在目前任何一個(gè)與“計(jì)算”有關(guān)的行業(yè)中,摩爾線程都試圖通過(guò)“全棧軟硬件架構(gòu)+全場(chǎng)景產(chǎn)品”的布局占據(jù)身位,每一步都在拓展生態(tài)的邊界,同時(shí)每一步都面臨著實(shí)打?qū)嵉奶魬?zhàn)。
某種意義上,這也是在走一遍英偉達(dá)來(lái)時(shí)的路,面對(duì)后者近20年沉淀出的生態(tài)霸權(quán),摩爾線程能否搭建起另一條國(guó)產(chǎn)生態(tài)護(hù)城河,答案終究需要時(shí)間來(lái)檢驗(yàn)。
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4819257.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.