通信世界網(wǎng)消息(CWW)在光纖光纜價(jià)格持續(xù)上漲、算力基礎(chǔ)設(shè)施成本不斷攀升的背景下,AI產(chǎn)業(yè)正經(jīng)歷一場(chǎng)從“規(guī)模擴(kuò)張”向“效率優(yōu)先”的轉(zhuǎn)變。
在此背景下,中科曙光于3月26日在中關(guān)村論壇現(xiàn)場(chǎng)發(fā)布了世界首個(gè)無(wú)線纜箱式超節(jié)點(diǎn)scaleX40,并同步開(kāi)啟預(yù)售。這款產(chǎn)品的意義,并不只在于性能提升,更在于它試圖回答一個(gè)關(guān)鍵問(wèn)題:如何讓超節(jié)點(diǎn)從少數(shù)人的“奢品/象征”,變成多數(shù)人的“標(biāo)配”。
圍繞這一產(chǎn)品發(fā)布,中科曙光高級(jí)副總裁李斌與曙光信息產(chǎn)業(yè)(北京)有限公司副總裁李柳在工信智媒體記者接受采訪時(shí),對(duì)其背后的技術(shù)邏輯與行業(yè)判斷進(jìn)行了系統(tǒng)闡釋。
scaleX40為何“去線纜”?
在算力基礎(chǔ)設(shè)施建設(shè)中,光纖一直是核心互連技術(shù)之一。但近年來(lái),其成本持續(xù)上行。“這背后是多重因素疊加。”李柳表示,一方面,算力基礎(chǔ)設(shè)施規(guī)模不斷擴(kuò)大,帶動(dòng)光纖需求增長(zhǎng);另一方面,國(guó)際局勢(shì)變化以及多行業(yè)廣泛應(yīng)用,也在進(jìn)一步推高資源消耗。
但在scaleX40的設(shè)計(jì)中,“無(wú)線纜”并不僅僅是為了節(jié)省成本。李柳強(qiáng)調(diào),產(chǎn)品采用正交架構(gòu)設(shè)計(jì),核心目標(biāo)是通過(guò)性能優(yōu)化對(duì)沖成本壓力。“減少節(jié)點(diǎn)之間復(fù)雜的互連和外部線纜傳輸,本質(zhì)上是在降低網(wǎng)絡(luò)層面的故障點(diǎn)。”
在大規(guī)模算力系統(tǒng)中,網(wǎng)絡(luò)往往是最容易出現(xiàn)問(wèn)題的環(huán)節(jié)之一。通過(guò)減少互連復(fù)雜度,不僅可以降低故障率,也能夠提升系統(tǒng)穩(wěn)定性與可維護(hù)性,從而保障推理與訓(xùn)練過(guò)程的連續(xù)性。“故障率的降低和效率的提升,最終都會(huì)反映在投入產(chǎn)出比上。”李柳表示。
補(bǔ)位推理時(shí)代:scaleX40重構(gòu)“超節(jié)點(diǎn)”定位
如果說(shuō)“無(wú)線纜”解決的是架構(gòu)問(wèn)題,那么scaleX40更核心的意義,在于對(duì)“超節(jié)點(diǎn)”的重新定義。
“過(guò)去大家對(duì)超節(jié)點(diǎn)的認(rèn)知,是幾百卡互連的高配系統(tǒng),主要服務(wù)頂級(jí)訓(xùn)練場(chǎng)景。”李斌表示,但在當(dāng)前以推理為主的應(yīng)用階段,這類(lèi)產(chǎn)品顯得“過(guò)于超前”,而主流推理設(shè)備又難以支撐規(guī)模化服務(wù)需求。
scaleX40的推出,正是試圖填補(bǔ)這一“市場(chǎng)缺位”。這一判斷,建立在AI算力使用模式的變化之上。隨著大模型從訓(xùn)練走向應(yīng)用,推理需求快速增長(zhǎng),算力系統(tǒng)開(kāi)始從“算力供給”轉(zhuǎn)向“服務(wù)供給”。
在這一過(guò)程中,“token”成為新的關(guān)鍵衡量指標(biāo)。“未來(lái)更重要的,不是系統(tǒng)有多少算力,而是能否以更經(jīng)濟(jì)的方式產(chǎn)出token。”李斌指出,這意味著算力系統(tǒng)需要同時(shí)兼顧響應(yīng)速度與并發(fā)能力,在多維度上實(shí)現(xiàn)平衡。
讓超節(jié)點(diǎn)走向“標(biāo)配”
讓超節(jié)點(diǎn)成為“多數(shù)人的標(biāo)配”,不僅取決于性能,也取決于使用門(mén)檻。李斌介紹,傳統(tǒng)超節(jié)點(diǎn)通常以整柜形式售賣(mài),采用高度定制化設(shè)計(jì),對(duì)機(jī)房供電、散熱等條件要求較高,部署和運(yùn)維復(fù)雜。而scaleX40采用標(biāo)準(zhǔn)箱式設(shè)計(jì),可直接部署在標(biāo)準(zhǔn)機(jī)柜中,接入標(biāo)準(zhǔn)機(jī)房的供電與冷卻體系。“我們的目標(biāo),是把它從一個(gè)定制化系統(tǒng),變成可以規(guī)模化復(fù)制的標(biāo)準(zhǔn)產(chǎn)品。”李斌表示。
這一改變,使超節(jié)點(diǎn)從“高門(mén)檻基礎(chǔ)設(shè)施”轉(zhuǎn)向“可部署能力單元”,不僅降低了部署復(fù)雜度,也縮短了上線周期。在具體配置上,scaleX40選擇“40卡”作為關(guān)鍵形態(tài)。“這不是一個(gè)絕對(duì)標(biāo)準(zhǔn),而是當(dāng)前場(chǎng)景下的一個(gè)‘甜點(diǎn)區(qū)間’。”李斌表示,相較于常見(jiàn)的32卡配置,40卡可以提供更高性能,同時(shí)為未來(lái)預(yù)留一定算力冗余,更適合實(shí)際生產(chǎn)環(huán)境。
此外,在推理場(chǎng)景中,算力系統(tǒng)通常通過(guò)多節(jié)點(diǎn)集群部署,實(shí)現(xiàn)能力的線性擴(kuò)展。因此,單個(gè)40卡節(jié)點(diǎn)既是獨(dú)立單元,也是構(gòu)建大規(guī)模“算力工廠”的基礎(chǔ)模塊。
scaleX40背后的算力競(jìng)爭(zhēng)邏輯
scaleX40的發(fā)布,也折射出算力產(chǎn)業(yè)競(jìng)爭(zhēng)邏輯的變化。
隨著AI應(yīng)用不斷深化,算力正在從資源要素,轉(zhuǎn)變?yōu)榭梢?guī)模化生產(chǎn)的能力。token成為標(biāo)準(zhǔn)化產(chǎn)出,而算力系統(tǒng)則逐漸演變?yōu)椤吧a(chǎn)系統(tǒng)”。
在這一背景下,競(jìng)爭(zhēng)的核心,不再只是“算力規(guī)模”,而是“單位成本下的token產(chǎn)出效率”。
李斌表示,這一轉(zhuǎn)變也推動(dòng)技術(shù)創(chuàng)新從單點(diǎn)突破走向系統(tǒng)級(jí)協(xié)同,從芯片、硬件到系統(tǒng)軟件,再到模型與應(yīng)用,通過(guò)全鏈條協(xié)同優(yōu)化,實(shí)現(xiàn)整體效率提升。“我們更強(qiáng)調(diào)的是系統(tǒng)能力,而不是單一部件的能力。”他說(shuō)。
從這一意義上看,scaleX40不僅是一款產(chǎn)品,更是一種嘗試。在推理時(shí)代,為算力基礎(chǔ)設(shè)施尋找一種新的平衡方式。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.