據多家媒體報道,中科曙光于烏鎮互聯網大會正式發布全球首個單機柜級640卡超節點——scaleX640。該產品基于AI計算開放架構設計,在算力密度實現20倍驚人突破的同時,還能完全兼容主流AI生態,支持多品牌國產加速卡,以深度開放協同模式全方位帶動中國算力體系升級。
![]()
就在不久前的GTC大會,英偉達展示了一套完整的AI工業革命基礎設施圖卷,并給出下一步戰略前瞻:通過“極致協同設計”來打破物理定律的限制,將AI推理(Inference)這個新的計算核心成本降至最低,從而持續驅動AI工業發展的良性循環。
顯然,隨著智算服務器從模塊化走向高密度集成化,計算系統的高質量協同成為算力降本增效的主賽道。而在算力集成度和開放普惠之路上,這次國產超節點跑在了前列。
據了解,中科曙光此前就協同產業鏈上下游發布了AI計算開放架構,意在基于統一的接口規范,使用標準化、商品化的軟硬件技術,代替定制化、專有化的系統,進而降低計算成本,實現產業多方共贏和用戶終端算力普惠。
在AI計算開放架構基礎上,國產超節點可以把計算、存儲、網絡、供電、冷卻、管理、軟件等子系統,以GPU為核心進行一體化緊耦合設計,構成更大規模、更高效的超級集群系統,曙光scaleX640已表現出“超強性能、極致效率、全面開放、超高可靠”多項優勢特征。
· 超強性能:scaleX640采用“一拖二”高密架構設計,實現單機柜640卡超高速總線互連,雙scaleX640超節點組成1280卡計算單元,柜間通過高速網絡互連,液體冷凝換熱裝置CDM為千卡級計算單元提供高達1.72MW的超級散熱能力;
· 極致效率:通過軟硬協同全局優化,該產品實現MOE大模型訓練效率與高通量推理吞吐性能大幅提升30-40%(相比傳統架構);通過采用超高速正交架構、超高密度刀片、浸沒相變液冷等多技術融合創新設計,成為業界最高集成度的液冷超節點,單機柜算力密度相比業界其他超節點最大提升20倍,PUE值低至1.04;
· 全面開放:基于AI計算開放架構,scaleX640適配支持多品牌AI加速卡,為用戶提供更多靈活選擇。并且該架構全面兼容主流AI計算軟件生態,適配優化400+主流大模型,支持AI模型、業務應用快速無縫遷移與深度優化;
· 超高可靠:從單機RAS特性到集群智能運維與故障恢復機制,產品采用多維可靠性設計,通過30天+長穩運行可靠性測試驗證,保障十萬卡級超大規模集群擴展部署。
盡管 scaleX640 超節點已實現跨代級突破,但真正值得關注的是——開放式超節點的攻堅難度遠高于單體一體化架構。相較于昇騰 384 等單卡集成路線,開放架構不僅鏈接更多設備、更多廠商、更多軟硬件棧,更牽涉跨廠商技術對齊、長鏈路產業協同與軟硬件體系磨合,在國產標準不完備、自主生態仍在起步階段的背景下,這是一條更難、也更有未來牽引力的路。
![]()
據悉,中科曙光作為國內少數完成“芯-端-云-算”全產業鏈布局的廠商,業務布局廣泛覆蓋上游芯片、服務器硬件、IO存儲到中游云計算平臺、大數據平臺、算力服務平臺以及下游云服務提供商,這也為國產超節點從單點突破到系統創新創造了有力條件。
公開資料顯示,中科曙光依托國家先進計算產業創新中心,已與產業上下游伙伴建成“AI計算開放架構聯合實驗室”,深度推進產業鏈跨層優化協作。
其后續計劃開展底層基礎軟件與工具鏈協同優化、模型-硬件協同設計與深度優化、異構算力資源統一調度與管理、開放標準與接口的制定和推廣、關鍵場景跨層優化驗證與示范等一系列工作,以此聯動國產化全棧力量突破“硬件墻”、“軟件墻”、“生態墻”等壁壘。
可以看到,在英偉達等國際巨頭開始著眼“系統協同”之際,中國算力廠商正在積極張開懷抱,攜手構筑國產計算體系的一體化生態底座,率先奪得AI工業革命基礎設施制高點。
考慮到美方對高端GPU持續性的嚴格管制,國產超節點“換道超車”頗具前瞻性。據月初最新消息,美國總統唐納德·特朗普表示,“英偉達的最先進芯片將僅供美國公司使用,中國及其他國家無法獲得。”基于此,中國廠商更應放棄幻想,積極培育本土產業內生動力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.