![]()
在AI時代,延遲對數據中心網絡來說是一個日益重要的指標。對于AI訓練而言,低延遲有助于確保訓練集群中的所有圖形處理單元(GPU)和節點得到有效利用,最大化減少閑置時間并提升整體訓練效率。對于AI推理來說,低延遲更為關鍵,因為它需要實時或接近實時的響應。
隨著GPU集群規模擴展到數百、數千甚至數百萬個GPU,電力、空間和可用性的限制正迫使AI集群分布在多個城域和區域數據中心。"跨越擴展"這一術語現在正在進入詞匯表,用來描述數據中心之間的AI網絡連接;然而,這些數據中心的位置及其之間的距離都受到延遲的限制。
光纖與延遲
數據中心延遲的一個關鍵組成部分是光在光纖電纜中傳播所需的時間。隨著距離在城域、區域、長距離和海底網絡中的增加,這成為越來越主要的因素,網絡設備中的延遲變得微不足道。因此,這種光纖延遲是距離和每公里光纖延遲的函數。銷售數據中心互聯服務的網絡運營商,如波長服務、暗光纖和管理光纖網絡(MOFN),通過擁有最短的光纖路由來區別于競爭對手。
每公里光纖延遲是光纖折射率的函數。當今的光纖最初在1960年代推出,迄今為止已部署超過70億公里。雖然它們繼續演進,具有更低的損耗和更好的性能,但它們都有硅芯。硅芯光纖(SCF)的折射率約為1.5,這意味著光速比真空中的光慢約30%。
空心光纖改變游戲規則
空心光纖(HCF)是一種具有根本不同架構的新方法。顧名思義,纖芯是空心的,充滿空氣或更典型的氣體。因此,其折射率約為1,這意味著光傳播速度比SCF快50%,將延遲減少約30%。對于AI跨越擴展應用,這將數據中心之間的最大距離增加50%,數據中心占地面積增加125%。這為運營商提供了更多靈活性,可以將數據中心設置在房地產成本更低、能獲得重要電力和冷卻水資源的區域。
更低的功耗
在AI時代,另一個重要指標是功耗。除了使數據中心能夠設置在更接近低成本電源的地方外,HCF還可以顯著降低光網絡功耗。它實現這一點的一種方式是通過更低的損耗。SCF中的光損耗已穩定在約0.14分貝/公里。最先進的HCF顯示最小損耗約為0.05分貝/公里,研究人員正在努力實現更低的損耗。更低的損耗減少了對耗電量大的光放大的需求。較短距離的數據中心互聯(DCI)應用可能不再需要光放大;中等距離DCI可能不再需要數據中心之間的光放大;更長距離DCI可能需要更少、間距更大的在線放大器(ILA)站點。HCF還受益于低色散和非線性損傷。長期來看,這可能意味著更簡單因此更低功耗的相干光引擎。低損耗還可能轉化為數據中心內HCF應用的更低功耗。
制造和成本挑戰仍然存在
除了低延遲和降低功耗外,HCF還有潛力通過更寬的頻譜和改善的波長頻譜效率來增加光纖容量。然而,在HCF能夠在商業環境中廣泛部署之前,仍有重大挑戰需要解決。這些包括成本、可制造性、供應商多樣性,以及與測試、拼接、連接器、維修和與SCF耦合相關的操作因素。
數據中心應用采用
盡管存在挑戰,最近光學行業會議上的公告表明,在這些領域都取得了很大進展。幾家主要云服務提供商和HCF供應商已宣布部署和合作伙伴關系,以擴大制造規模。這些初始部署主要針對AI數據中心之間的城域規模跨越應用,但隨著HCF成本下降和制造規模增加,低延遲和低損耗使得數據中心內HCF采用成為下一個可能的用例,海底部署是HCF生態系統的長期目標。
Q&A
Q1:空心光纖比傳統光纖有什么優勢?
A:空心光纖的核心優勢在于大幅降低延遲和功耗。由于其纖芯是空心的,充滿空氣或氣體,折射率約為1,使得光傳播速度比傳統硅芯光纖快50%,延遲減少約30%。同時,空心光纖的光損耗更低,約為0.05分貝/公里,遠低于傳統光纖的0.14分貝/公里。
Q2:空心光纖如何影響AI數據中心的部署?
A:空心光纖將數據中心之間的最大距離增加50%,數據中心占地面積增加125%。這為運營商提供更多靈活性,可以將數據中心設置在房地產成本更低、能獲得重要電力和冷卻水資源的區域,對AI集群的跨區域部署具有重要意義。
Q3:空心光纖目前面臨什么挑戰?
A:空心光纖在商業化部署前仍面臨重大挑戰,主要包括成本、可制造性、供應商多樣性等問題。此外還有操作層面的挑戰,如測試、拼接、連接器、維修以及與傳統硅芯光纖的耦合等技術問題需要解決。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.