繼CPO、NPO、LPO之后,光通信行業(yè)又有了新的熱點(diǎn)——XPO。
2026年3月11日,光通信行業(yè)名企Arista Networks聯(lián)合超過(guò)45家行業(yè)企業(yè),發(fā)布白皮書(shū),提出了一種全新的可插拔光模塊標(biāo)準(zhǔn)——XPO。
![]()
《XPO:重新定義AI網(wǎng)絡(luò)的可插拔光模塊》白皮書(shū)
幾天后,3月17-19日,素有 行業(yè)“技術(shù)風(fēng)向標(biāo)”之稱的OFC( 全球光纖通信大會(huì))在美國(guó)召開(kāi)。在會(huì)上, TeraHop、新易盛、Coherent、華工正源、光迅科技、劍橋科技、Amphenol等廠商,紛紛展示了各自的XPO方案,吸引了大量觀眾圍觀。
XPO,一躍成為行業(yè)熱門(mén)話題,也成為資本市場(chǎng)的關(guān)注焦點(diǎn)。
那么,到底什么是XPO?它和CPO/NPO有什么區(qū)別,又會(huì)帶來(lái)哪些優(yōu)勢(shì)?
█什么是XPO
XPO的英文全稱,叫做eXtra-dense Pluggable Optics,超高密度可插拔光學(xué)。其實(shí)就是一種光模塊方案。
![]()
XPO光模塊外觀(正面及背面)注意,有8個(gè)MPO光接口
XPO擁有64條200Gbps PAM4高速電氣通道,單模塊帶寬達(dá)到12.8Tbps,是傳統(tǒng)1.6Tbps OSFP(八通道小型可插拔)光模塊的8倍。未來(lái),采用400Gbps信號(hào)(已有明確的路徑圖),XPO的單模塊帶寬更可以達(dá)到25.6Tbps。
![]()
XPO ×1 = OSFP ×8
XPO的模塊尺寸是60.8mm×111.8mm×21.3mm,模塊寬度是OSFP的2.7倍。
帶寬×8,面板面積×2.7。換算一下,XPO的整個(gè)前面板帶寬密度,大約提升了4倍。
OSFP模塊,開(kāi)放機(jī)架1U的空間,最多塞入32個(gè)模塊,達(dá)到51.2Tbps交換容量。
而XPO模塊,開(kāi)放機(jī)架1U的空間,能塞入16個(gè)模塊,但交換容量卻能達(dá)到204.8Tbps,是OSFP的4倍。
![]()
這更意味著,客戶在構(gòu)建大型智算中心時(shí),交換機(jī)機(jī)柜的數(shù)量縮減75%。這將大量減少機(jī)房占地面積,降低場(chǎng)地租金以及基礎(chǔ)設(shè)施建設(shè)成本(包括配電、管道和安裝費(fèi)用)。
例如,一個(gè)400MW的十萬(wàn)卡級(jí)智算中心(128000塊GPU),如果使用OSFP模塊,需要約1408個(gè)交換機(jī)機(jī)架。而使用XPO模塊,只需要352個(gè)機(jī)架。
![]()
高密度的交換端口,也有利于構(gòu)建層級(jí)更少的組網(wǎng)(Scale Out,橫向擴(kuò)展),減少數(shù)據(jù)傳輸跳數(shù),并降低延遲。
█XPO的架構(gòu)特點(diǎn)
那么,XPO為什么能實(shí)現(xiàn)這么高的集成密度呢?
答案就在XPO的結(jié)構(gòu)設(shè)計(jì)上。
液冷散熱
Arista公司將XPO的架構(gòu)稱之為“Belly-to-Belly(肚皮對(duì)肚皮)”。
XPO沒(méi)有采用傳統(tǒng)的單PCB布局,而是設(shè)計(jì)了兩塊獨(dú)立的32通道PCB板(槳板),中間夾著一塊液冷冷板,有點(diǎn)像“奧利奧餅干”。
![]()
PCB上的高功率發(fā)熱元件,例如發(fā)射線路、激光驅(qū)動(dòng)器、DSP數(shù)字信號(hào)處理器,安裝在面向冷板的內(nèi)側(cè)(熱面)。低功率元件,例如接收線路和控制邏輯,安裝在外側(cè)(冷面)。
液冷冷板,通過(guò)直接接觸的方式,為上下兩塊PCB提供散熱。
![]()
根據(jù)數(shù)據(jù)顯示,XPO的液冷冷板可以扛住超過(guò)400W的模塊功耗。如果使用40-45°C溫水液冷,XPO可以實(shí)現(xiàn)比氣冷方案低20-25°C的降溫效果。
同時(shí),冷卻液的溫度變化平緩,大幅降低了熱應(yīng)力。兩大因素共同作用,能夠顯著降低元件的故障率。
XPO模塊尾部的兩根金屬棒,是盲插快速斷開(kāi)連接器,用于冷卻液的進(jìn)和出:
![]()
連接器具有500次插拔循環(huán)設(shè)計(jì)壽命,而且防漏。它可以直接與主機(jī)系統(tǒng)的冷卻歧管整合,讓模塊插拔非常輕松。
連接器的流量也支持動(dòng)態(tài)調(diào)節(jié),0.25~0.7升/分鐘,根據(jù)模塊功耗自動(dòng)適配。
采用液冷,也需要關(guān)注利用率。
通常來(lái)說(shuō),當(dāng)機(jī)架的功率密度超過(guò)120kW時(shí),采用液冷是更加劃算的。如果采用OSFP,交換機(jī)架的功率密度大概只有32kW,液冷利用率不足。如果采用XPO,功率密度約為128kW,可以充分利用液冷的冷卻能力,攤薄液冷、供電等基礎(chǔ)設(shè)施的資本投入。
釋放拉片
XPO模組上有一個(gè)非常醒目的扳手:
![]()
這是機(jī)械彈射架構(gòu)的釋放拉片。XPO的高速電氣觸點(diǎn)很多,插拔需要很大的力量。
基于這個(gè)釋放拉片設(shè)計(jì),可以提供1:11的機(jī)械杠桿作用,使操作人員能夠在不使用專用工具的情況下插拔XPO模塊,同時(shí)確保數(shù)百個(gè)信號(hào)引腳的可靠電氣接觸。
大電壓小電流
在電流方面,XPO也有改進(jìn)。
傳統(tǒng)可插拔光模塊使用3.3V DC直流輸入。對(duì)于高功率光模塊來(lái)說(shuō),電流會(huì)很高(功率=電壓×電流)。例如,一個(gè)400W的光模塊,在3.3V電壓下,電流會(huì)超過(guò)120A。
這就需要物理上很大的電源連接器和厚重的銅走線,存在很多限制。
XPO直接從機(jī)架母線引入46-53V(標(biāo)稱48-50V)DC直流輸入,然后在光模塊的槳板上做48V轉(zhuǎn)3.3V的轉(zhuǎn)換。相同的400W光模塊,所需的電流降低到不到10A。
![]()
這樣一來(lái),電流需求大幅降低,電源連接器可以做得更小,主板上那些笨重的、按最壞情況配置的穩(wěn)壓器也不需要了。
將電壓轉(zhuǎn)換功能從主板遷移至XPO模塊內(nèi)部,可以大幅減少主板所需的組件數(shù)量,進(jìn)而提升交換機(jī)系統(tǒng)的整體可靠性(電壓調(diào)節(jié)器如果發(fā)生故障,僅影響單個(gè)模塊,不會(huì)中斷整個(gè)交換機(jī))。
干凈線性通道
XPO架構(gòu)在設(shè)計(jì)的時(shí)候,非常注重消除信號(hào)串?dāng)_。
它把發(fā)射和接收信號(hào)嚴(yán)格分離到槳板的兩側(cè),實(shí)現(xiàn)所謂的“干凈線性通道”,最小化串?dāng)_,并最大化信號(hào)完整性。
高速信號(hào)和電源/控制信號(hào)(I2C/I3C、復(fù)位、中斷等)完全物理隔離。低速信號(hào)全都走獨(dú)立的專用卡邊連接器,防止電源噪聲影響高速數(shù)據(jù)通道。
生態(tài)復(fù)用
XPO模塊在生態(tài)上也有優(yōu)勢(shì)。它可以直接沿用現(xiàn)有硅光和光學(xué)元件,無(wú)需重新開(kāi)發(fā)芯片,有利于快速產(chǎn)業(yè)化。
XPO的轉(zhuǎn)接卡面積很大,設(shè)計(jì)空間很充裕。它可以支持當(dāng)前已存在或正在開(kāi)發(fā)中的任何光模塊方案,包括1600G-DR、FR、LR、SR、ZR、ZR+、Coherent-Lite等等。
█XPO的技術(shù)挑戰(zhàn)
XPO優(yōu)點(diǎn)很多,但也有缺點(diǎn)。
一方面,XPO的功耗太高。為了達(dá)到12.8T的速率,XPO的功耗飆升到了400W左右。作為對(duì)比,目前主流的1.6T模塊功耗約25W,按比例算,XPO的總功耗是16倍,單位功耗是2倍(帶寬是8倍)。CPO的話,功耗能下降70%。
另一方面,XPO依賴原生集成液冷系統(tǒng)。這對(duì)部署條件提出了要求,也帶來(lái)了設(shè)計(jì)、可靠性和成本方面的挑戰(zhàn)。
第三,相比NPO和CPO,XPO 將光引擎放在了PCB板邊,離交換芯片更遠(yuǎn), 電氣路徑更長(zhǎng), 信號(hào)損耗更大。為了維持信號(hào)質(zhì)量,SerDes(串行器/解串器)功耗也會(huì)增加。
第四,XPO對(duì)PCB主板材料要求更高。為了驅(qū)動(dòng)長(zhǎng)距離的高速信號(hào),XPO必須使用超低損耗的PCB材料。這會(huì)增加制造成本。PCB面積增加,也需要考慮強(qiáng)度和剛度問(wèn)題。PCB上金手指區(qū)域觸點(diǎn)很多很密集,需要考慮精度控制、橫向翹曲、材料膨脹系數(shù)等問(wèn)題。
█如何看待XPO
總的來(lái)說(shuō),XPO的核心優(yōu)勢(shì),就是在可插拔的基礎(chǔ)上,實(shí)現(xiàn)了超高密度、超大帶寬。
它憑借架構(gòu)上的巧妙設(shè)計(jì),很好地解決了散熱和可靠性問(wèn)題。在產(chǎn)業(yè)生態(tài)和工程化方面,也有一定的優(yōu)勢(shì)。
一直以來(lái),業(yè)界都普遍認(rèn)為,只有CPO(光引擎和交換芯片封裝在一起,不可插拔)這種高度整合的方案,才能實(shí)現(xiàn)“帶寬提升+功耗可控”。
![]()
來(lái)源:中金研究院
但云廠商運(yùn)維團(tuán)隊(duì)對(duì)于CPO并不買(mǎi)賬。他們認(rèn)為,CPO不能靈活替換光模塊,如果壞了,就要整個(gè)主板換掉,不僅費(fèi)事,也費(fèi)錢(qián)。
XPO,其實(shí)就是妥協(xié)的產(chǎn)物。通過(guò)一些設(shè)計(jì)改進(jìn),勉強(qiáng)可以滿足“帶寬提升+可插拔”的需求,代價(jià)就是功耗更大。
事實(shí)證明,這種妥協(xié)還是很受行業(yè)歡迎的。
Arista能夠在短時(shí)間內(nèi)就拉來(lái)了45家企業(yè)(包括光學(xué)模塊制造商、硅芯片供應(yīng)商、連接器廠商、系統(tǒng)集成商、云服務(wù)提供商) ,共同組建XPO MSA(多源協(xié)議組織),就說(shuō)明了大家都認(rèn)可這個(gè)方案。
![]()
部分XPO MSA聯(lián)盟成員
XPO走技術(shù)開(kāi)放路線,也是正確的選擇,非常容易形成生態(tài),加速技術(shù)的成熟和規(guī)模化普及,也不用擔(dān)心技術(shù)被某一家企業(yè)所壟斷。
傳統(tǒng)的可插拔光模塊,到了800G和1.6T級(jí)別,已經(jīng)是極致了。到3.2T級(jí)別,理論上還是要依賴于CPO。但CPO這種共封裝,對(duì)工藝要求更高,量產(chǎn)難度大,良品率低,成本更高。
從短期來(lái)看,采用XPO或NPO進(jìn)行過(guò)渡,是一個(gè)非常不錯(cuò)的選擇。XPO采用可插拔架構(gòu),可以幫助云廠商迅速提升數(shù)據(jù)中心的單端口帶寬,還能節(jié)約不少成本。
目前,業(yè)界普遍認(rèn)為,CPO是長(zhǎng)期的必然趨勢(shì),但XPO/NPO是中期的現(xiàn)實(shí)妥協(xié)。至于XPO到底能不能被市場(chǎng)所接受,究竟有多久的生命周期,仍有待進(jìn)一步觀察。
參考文獻(xiàn):
1、 《XPO:重新定義AI網(wǎng)絡(luò)的可插拔光模塊》白皮書(shū),Arista;
2、《 XPO橫空出世,12.8Tbps液冷光模塊來(lái)了!》,云深知網(wǎng)絡(luò);
3、《 Arista XPO白皮書(shū)解析》,傅里葉的貓;
4、各企業(yè)官網(wǎng)、OFC官網(wǎng)。
來(lái)源:鮮棗課堂
編輯:檸七
轉(zhuǎn)載內(nèi)容僅代表作者觀點(diǎn)
不代表中科院物理所立場(chǎng)
如需轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.