公眾號記得加星標??,第一時間看推送不會錯過。
UALink 聯(lián)盟是由多家科技巨頭組成的團體,致力于制定 GPU 網(wǎng)絡標準,以提供英偉達 NVLink 和 NVSwitch 的替代方案。該聯(lián)盟已經(jīng)發(fā)布了新的規(guī)范,但距離芯片出貨還有數(shù)月時間。
英偉達已在高速網(wǎng)絡和交換機市場占據(jù)主導地位,這些網(wǎng)絡和交換機是協(xié)同運行數(shù)百個GPU所必需的。該公司的產(chǎn)品價格不菲,而且與其它供應商的GPU兼容性也并非總是良好。以太網(wǎng)可以勝任連接各種GPU集群的任務,并且由于其普及性,也是一種頗具吸引力的替代方案,盡管這種歷史悠久的標準在性能上無法與英偉達的網(wǎng)絡產(chǎn)品相媲美。
UALink聯(lián)盟希望打造一種替代英偉達互連技術的方案,該方案能夠兼容任何加速器,并達到英偉達的性能水平。該聯(lián)盟認為,專注于托管人工智能系統(tǒng)的新興“新云”將非常樂意構建一種能夠處理其部署的任何GPU的互連技術。
該組織的計劃是制定開放規(guī)范,供成員將其應用于芯片和設備中。理論上,最終結果將與以太網(wǎng)生態(tài)系統(tǒng)非常相似——供應商和其他利益相關者共同制定規(guī)范,然后開發(fā)兼容的產(chǎn)品,同時各自努力使自己的產(chǎn)品脫穎而出。
UALink 規(guī)范 1.0 版于 2025 年 8 月發(fā)布。該聯(lián)盟今天發(fā)布了 2.0 版。
最大的變化在于新的 200G 數(shù)據(jù)鏈路層和物理層 (DL/PL) 規(guī)范,它將 UALink 通用規(guī)范拆分為兩個工作流:一個負責該組織的協(xié)議和傳輸層,另一個負責 I/O 技術。正如 UALink 聯(lián)盟主席 Kurtis Bowman 向The Register解釋的那樣,這意味著該組織可以同時為當今的 200G 網(wǎng)絡、即將推出的 400G 網(wǎng)絡以及未來物理層的任何發(fā)展做好準備。
該組織還發(fā)布了通用規(guī)范 2.0 版,其中增加了對網(wǎng)絡內(nèi)計算的支持。網(wǎng)絡內(nèi)計算是一種減少 GPU 之間調(diào)度任務所需發(fā)送消息數(shù)量的技術。消息傳輸占用的帶寬減少,意味著有更多帶寬可用于數(shù)據(jù)傳輸,從而加快 AI 工作負載的運行速度。
UALink 可管理性規(guī)范 1.0 是另一項新舉措,這意味著 gRPC 網(wǎng)絡管理接口、YANG、SAI 和 Redfish 等工具的用戶可以將它們與 UALink 網(wǎng)絡一起使用。
此外,還將出臺芯片規(guī)范,規(guī)定如何將 UALink 芯片集成到片上系統(tǒng)中,這意味著無需獨立芯片即可將 UALink 嵌入到更多設備中。
并非供應商現(xiàn)在就能獲得 UALink 芯片——鮑曼告訴我們,符合該組織 1.0 規(guī)范的芯片將于 2026 年下半年到達實驗室,2027 年面世,并在同年晚些時候應用于產(chǎn)品。
到那時,UALink 將會發(fā)布 3.0 版本規(guī)范——遠早于 2.0 版本芯片的發(fā)布。
Bowman承認,1.0和2.0版本不會成為Nvidia的完全競爭對手,只有到3.0版本(大約明年這個時候發(fā)布)時,UALink才能在性能和發(fā)布節(jié)奏方面達到與Nvidia相同的水平。
因此,UALink 看起來可能有點異想天開,但 Bowman 認為這種嘗試是值得的,因為許多人工智能公司不想構建孤立的系統(tǒng)或被束縛于單一供應商。
英偉達上季度的毛利率超過70%,這表明客戶愿意為NVLink和NVSwitch支付高價。UALink聯(lián)盟希望其方案能夠提供在價格和功能方面都具有競爭力的產(chǎn)品。
與此同時,英偉達并未止步不前。去年,該公司推出了NVLink Fusion,將其互連技術的應用范圍擴展到英偉達 GPU 以外的領域。
UALink聯(lián)盟發(fā)布了4項規(guī)范
開發(fā)面向下一代人工智能工作負載的開放式可擴展互連技術的行業(yè)標準組織UALink聯(lián)盟(UALink Consortium)今日宣布正式批準下一代UALink規(guī)范。該規(guī)范包含三大新增內(nèi)容:網(wǎng)絡內(nèi)計算、芯片定義和可管理性。新規(guī)范支持在多工作負載環(huán)境中部署UALink解決方案,同時有助于提升UALink技術的效率、人工智能工作負載的性能以及部署的便捷性。
UALink聯(lián)盟為大規(guī)模加速器連接提供標準化基礎,助力推動創(chuàng)新,提升部署靈活性,并滿足下一代人工智能工作負載快速增長的性能需求。此次新規(guī)范的更新得益于UALink聯(lián)盟的開放式治理模式,該模式在促進創(chuàng)新的同時,構建了穩(wěn)健的多廠商供應鏈,為系統(tǒng)設計人員和云服務提供商提供了必要的靈活性,使其能夠部署可互操作的解決方案,而無需擔心廠商鎖定。
“隨著人工智能工作負載的發(fā)展速度不斷超越傳統(tǒng)互連的開發(fā)周期,我們很高興推出UALink規(guī)范的重要更新,”UALink聯(lián)盟董事會主席Kurtis Bowman表示。“此次更新引入的UALink技術進步將使業(yè)界能夠快速高效地將UALink解決方案集成到其架構中。UALink聯(lián)盟將繼續(xù)致力于通過開放的行業(yè)標準技術推進人工智能基礎設施的發(fā)展,從而促進下一代人工智能應用的市場化。”
新的 UALink 規(guī)范:
(1)UALink 通用規(guī)范 2.0
為 UALink 技術引入網(wǎng)絡內(nèi)計算,促進加速器之間的計算和通信。
降低延遲,節(jié)省帶寬,提高 UALink 系統(tǒng)在復雜和多工作負載環(huán)境下的 AI 解決方案分布式訓練和推理的擴展效率。
(2)UALink 200G 數(shù)據(jù)鏈路層和物理層 (DL/PL) 規(guī)范 2.0
將 DL/PL 規(guī)范從 UALink 通用規(guī)范中分離出來,使 UALink 能夠隨著行業(yè)對新的物理層和速度的需求而快速發(fā)展,而無需更改其他規(guī)范。
(3)UALink 可管理性規(guī)范 1.0
介紹UALink,它是一個具有集中控制和管理平面的系統(tǒng)。
利用標準化的協(xié)議、模型和 API,如 gNMI、Yang、SAI 和 Redfish。
(4)UALink Chiplet 規(guī)范 1.0
定義了將 UALink 技術集成到基于芯片的 SoC 中的必要信息,包括接口、外形尺寸、流控制和芯片管理標準化。
完全符合 UCIe 3.0 規(guī)范,可簡化與現(xiàn)有芯片生態(tài)系統(tǒng)的集成。
(來源:半導體行業(yè)觀察綜合)
*免責聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導體行業(yè)觀察。
今天是《半導體行業(yè)觀察》為您分享的第4370內(nèi)容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.