(本文改編自
TechNews
在剛結(jié)束的SC25超高速運算大會上,GPU大廠英偉達(dá)(Nvidia)宣布,包括Lambda和CoreWeave在內(nèi)的GPU運算設(shè)施營運商,以及得克薩斯州高階數(shù)據(jù)中心(TACC),將采用其Quantum-X Photonics CPO交換機。
而面對英偉達(dá)在CPO領(lǐng)域的強勢競爭,博通(Broadcom)也展示了其采用Tomahawk 5和Tomahawk 6的CPO交換機。雖然CPO交換技術(shù)的應(yīng)用預(yù)計將在2026年爆發(fā),但其發(fā)展過程卻是經(jīng)歷了漫長的旅程。
什么是CPO?
CPO全稱Co-Packaged Optics(共封裝光學(xué)),是一種將光模塊(光學(xué)器件,負(fù)責(zé)光信號傳輸)與交換機芯片(電信號處理核心)共封裝在同一物理封裝內(nèi)的技術(shù)方案。
隨著數(shù)據(jù)中心、6G通信、AI算力集群對帶寬需求爆發(fā)式增長(如400G/800G/1.6T以太網(wǎng)普及),傳統(tǒng)分離式光模塊與交換機的連接方式面臨兩大瓶頸:一是信號損耗,電信號在高速線纜中傳輸時,頻率越高損耗越大,限制傳輸距離與速率;二是能耗與體積,分離式架構(gòu)需額外的接口電路、線纜,導(dǎo)致能耗高、占用空間大,無法滿足高密度部署需求。
CPO通過“芯片級集成”可解決上述問題:光模塊直接與交換機芯片的硅光接口對接,電信號傳輸路徑縮短至毫米級,大幅降低損耗、提升速率,同時減少能耗和物理體積,是支撐下一代超算、AI數(shù)據(jù)中心、6G核心網(wǎng)的關(guān)鍵技術(shù)之一。
向CPO轉(zhuǎn)變的核心因素
根據(jù)外媒報道,推動向CPO轉(zhuǎn)變的核心因素可以用一句話概括,那就是“速度與電力(speed and power)”。AI網(wǎng)絡(luò)需要極高的傳輸速度,目前已達(dá)800Gbps,而英偉達(dá)已經(jīng)規(guī)劃通過其下一代ConnectX-9 NICs邁向1.6Tbps的傳輸速度。然而,在如此高的速度下,直接連接銅纜傳輸距離僅能達(dá)到一米或兩米,并通常需要昂貴的重定時器(retimers)。若要連接數(shù)萬甚至數(shù)十萬個GPU,可能需要數(shù)十萬個高功耗的可插拔收發(fā)器(pluggable transceivers)。單個收發(fā)器的功耗取決于傳輸速度,通常在9到15瓦之間。但在AI后端網(wǎng)絡(luò)中使用的大型無阻塞網(wǎng)絡(luò)中,總功耗迅速累積成巨大的負(fù)擔(dān)。
CPO技術(shù)的出現(xiàn),能夠大幅降低能耗。英偉達(dá)估計其Photonics交換機的能源效率提高了多達(dá)3.5倍。而博通的數(shù)據(jù)則顯示,該技術(shù)可將光學(xué)組件的功耗降低65%。對于一個擁有128,000個GPU的計算集群來說,僅轉(zhuǎn)換到CPO交換機,就可以將可插拔收發(fā)器的數(shù)量從近50萬個減少到約128,000個。
![]()
CPO面臨的可靠性瓶頸
如前所述,共封裝光學(xué)技術(shù)就是將傳統(tǒng)上位于可插拔收發(fā)器中的光學(xué)組件,轉(zhuǎn)移至設(shè)備內(nèi)部。透過一系列光子芯片(photonic chiplets),與交換機的ASIC一同封裝。光纖對不再連接到QSFP和可插拔模塊上,而是直接連接到交換機的前面板。而過去,CPO采用的最大障礙之一是可靠性,以及故障時可能帶來的爆發(fā)半徑。也就是在傳統(tǒng)交換機中,一個光學(xué)可插拔模塊故障只會損失一個界面。但對于CPO,如果一個光子芯片故障,可能導(dǎo)致8個、16個甚至32個或更多接口的丟失。
為了解決這一問題,包括博通和英偉達(dá)在內(nèi)的大多數(shù)CPO供貨商選擇使用外部激光模塊。激光是光學(xué)收發(fā)器中最容易發(fā)生故障的組件之一,將其保持在較大的可插拔形式中,不僅方便用戶維修,還能在發(fā)生故障時,透過增強其他激光的輸出功率來進(jìn)行補償。
根據(jù)博通和Meta的早期測試顯示,CPO技術(shù)透過消除光學(xué)組件與交換機ASIC之間的電氣接口數(shù)量,不僅提供了更好的延遲,而且可靠性也顯著提高。上個月,Meta透露,他們已在其數(shù)據(jù)中心部署了代號為Bailly的博通51.2Tbps共封裝光學(xué)交換機,并記錄了在400Gbps等效傳輸速度下,累積一百萬設(shè)備小時的無鏈路抖動運行記錄。英偉達(dá)也聲稱,其光子網(wǎng)平臺的彈性提高了10倍,允許訓(xùn)練工作負(fù)載運行時間延長五倍而不會中斷。
英偉達(dá)與博通的CPO技術(shù)博弈
當(dāng)前,英偉達(dá)的Quantum-X Photonics平臺專注于InfiniBand,采用全液冷設(shè)計,配備144個800Gbps InfiniBand接口,總帶寬達(dá)到115.2Tbps。這些交換機即將部署在TACC、Lambda和CoreWeave的計算基礎(chǔ)設(shè)施中。對于偏好以太網(wǎng)的客戶,英偉達(dá)的Spectrum-X Photonics交換機將于2026年推出。它們將提供多種配置,以最大化基數(shù)為目標(biāo)的型號,擁有512或2,048個200Gbps界面。至于那些想要追求最大性能的客戶,英偉達(dá)則提供128或512個800Gbps接口的選項。
![]()
競爭對手博通同樣展示了在CPO領(lǐng)域的實力。Micas Networks已經(jīng)開始出貨采用博通較舊的Tomahawk 5 ASICs和Bailly CPO技術(shù)的51.2Tbps CPO交換機。博通還展示了其最新一代Davisson CPO平臺,該平臺采用102.4Tbps Tomahawk 6交換機ASIC,可支持多達(dá)512個200Gbps接口。
雖然英偉達(dá)目前的光學(xué)重點仍集中在CPO交換機上,但博通和其他公司正計劃很快將共封裝光學(xué)技術(shù)導(dǎo)入AI芯片本身。2024年,博通在Hot Chips大會上詳細(xì)介紹了一款針對大型擴展計算領(lǐng)域的6.4Tbps光學(xué)引擎。
其他正在將光學(xué)I/O導(dǎo)入加速器的公司包括Celestial AI、Ayar Labs和Lightmatter。而在SC25大會上,Ayar Labs也展示了與世芯(Alchip)合作開發(fā)的參考設(shè)計,該設(shè)計使用UCIe-S和UCIe-A互連,將8個TeraPHY芯片整合到單一封裝中,最終將為芯片間連接提供高達(dá)200Tbps的雙向帶寬。
Lightmatter則從兩個方向著手研發(fā)光學(xué)I/O。首先是一個CPO芯片,該公司聲稱可提供高達(dá)32Tbps(使用56Gbps NRZ)或64Tbps(使用112Gbps PAM4)的帶寬。此外,Lightmatter開發(fā)了一種名為Passage M1000的硅光子中介層(silicon photonic interposer),目的在利用光子互連技術(shù)將多個芯片鏈合在一起,用于芯片對芯片和封裝對封裝的通信。預(yù)計這些先進(jìn)的技術(shù),最終可能會完全消除對可插拔光學(xué)組件的需求,并為更高效、包含數(shù)千個加速器協(xié)同運作的擴展計算領(lǐng)域開創(chuàng)發(fā)展性。
結(jié)語
英偉達(dá)與博通青睞CPO,本質(zhì)是瞄準(zhǔn)AI與超算時代“高速率、低功耗、高密度”的核心需求。CPO通過光電共封裝破解傳統(tǒng)架構(gòu)的傳輸與能耗瓶頸,更在可靠性上實現(xiàn)關(guān)鍵突破,成為2026年有望爆發(fā)的核心技術(shù)。雙雄的布局不僅推動CPO在交換機領(lǐng)域落地,更加速其向芯片級滲透,而行業(yè)競爭與技術(shù)迭代將共同推動光電子集成革命,為下一代算力基礎(chǔ)設(shè)施筑牢根基。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.