![]()
![]()
撰文 | 李信馬
題圖 | AI生圖
當全球還在為大模型的“幻覺”頭疼時,另一場更嚴肅的AI革命正在實驗室里悄然發生——不只是生成文本和圖片,而是去計算生命的密碼和材料的極限。
AI4S計算集群,是為“AI for Science”(科學智能)設計的計算基礎設施。
大家一般更熟悉的概念,是“超級計算機”,簡單解釋下兩者之間的區別,超級計算機是通過并行計算來加速已知科學公式的求解過程,比如氣象預報、核模擬、流體力學等;AI4S計算集群則不同,不僅要“算得更快”,而且利用AI技術,從海量科學數據(比如分子結構、基因序列、材料性質)中加速新結構、新規律的發現。
因此,兩者在技術設計上有明顯的不同,AI4S不是現有超算的簡單改造,而是從芯片、互聯網絡、存算協同到調度系統全棧重新設計的新一代基礎設施。
![]()
伴隨人工智能技術發展,AI4S正成為全球科技競爭焦點。2025年11月24日,美國正式啟動“創世紀計劃”,目標是用 AI 重塑科學研究,該計劃也被白宮稱為“自阿波羅計劃以來規模最大的聯邦科學任務”。我國早在2023年4月,就由科技部主導部署了一體化算力服務平臺——國家超算互聯網,來整合全國超算中心資源構建算力網絡,并在2024年4月正式上線。“十五五”規劃中,也明確提出要以人工智能引領科研范式變革,搶占人工智能產業應用制高點。
中科曙光是中國核心信息基礎設施的領軍企業,是我國少數擁有從硬件、整機到算力服務、基礎設施全棧自研能力的科技公司。2025年12月,中科曙光發布了scaleX萬卡超集群;2026年2月,3萬卡上線國家超算互聯網核心節點。
4月14日,中科曙光提供的6萬卡科學智能計算集群系統,在位于鄭州的國家超算互聯網核心節點投入使用。伴隨著該集群的落地運行,國家超算互聯網平臺構建起了國內規模最大的AI4S計算基礎設施,總計鏈接超300萬CPU核和超20萬GPU卡,并接入全國一體化算網調度體系,來為全國高校、科研院所和企業提供普惠化AI4S算力服務。
當天DoNews也受邀參加了發布會,會上,中國科學院院士、河南省科學院院長徐紅星表示:“該集群落地,不僅是一次技術成果展示,更是我國人工智能技術與科研創新深度融合的里程碑。”
AI4S計算集群為什么重要?會后的采訪中,清華大學智能產業研究院(AIR)助理教授李琨介紹,AI4S已經超越純科研范疇,是新一輪科技革命與產業變革的核心驅動力。它不僅關乎著基礎科學的突破,也直接決定了新材料、新藥物、新能源等未來產業的主導權歸屬,深刻影響國家經濟競爭力和綜合國力的表現。尤其在當今大國之間科技競爭日趨激烈背景下,AI4S已經成為衡量國家綜合實力和戰略科技力量的關鍵指標。
在生物、材料等多領域進行的大規模并行計算測試中,依托曙光AI4S計算集群,3萬卡規模蛋白質折疊模擬較傳統算法加速1000倍;4.5萬卡規模實現萬億原子液態水分子動力學模擬,在打破世界模擬規模紀錄的同時效率提升3個數量級以上;湍流直接模擬規模擴展至百萬億網格,大幅提升了科研效率。
![]()
“從原本以超算為代表的超算架構,慢慢地配上AI加速單元這種混合異構的智算架構,也就是現在說的‘超智融合’。傳統的計算任務或者科學應用沒有辦法很好地利用上新型的硬件算力,這是一個非常大的挑戰。隨著AI不斷地賦能科學應用,未來AI4S解決的問題更多不是加速型的,而是把之前不能解的問題變成能解的,這種情況下如何通過AI把好算力用到刀刃上,也是一個非常大的挑戰。”李琨說。
中科曙光高級副總裁李斌表示,把AI方法用在科學和工程領域一定是正確的,產業化前景也是無比巨大的,在生物醫藥、半導體、新材料、電池、清潔能源等領域,一旦有技術突破都會帶來更大規模的市場。但AI4S并不是萬能的,因為AI方法有不可解釋性,還有泛化的問題,它需要跟傳統方法相結合;另一方面,隨著大模型基礎能力的提升,特別是智能體技術發展,對AI4S的發展也會有極大的促進作用,降低門檻和極大地提高效率。
那怎么評價AI4S計算集群的能力?中科曙光給出的答案是“六大核心要求”。對應剛剛上線的6萬卡科學智能計算集群系統,就是:
強大算力:實現6萬卡集群部署。
全面精度:可支持8/16/32/64位寬的全精度計算,高效處理高維函數和復雜科學問題。
高速互連:通過國內首款類InfiniBand無損高速網絡scaleFabric系列產品,滿足AI4S計算集群對高帶寬、低時延網絡的極致需求。
存算協同:通過“超級隧道”、AI數據加速等設計,實現從芯片、系統到應用的三層傳輸協同,避免存儲IO瓶頸。
靈活調度:智能調度機制,使系統可根據任務需求靈活匹配、調度集群的計算存儲網絡等資源,并發作業調度效率超每秒萬次。
穩定可靠:依托智能化運維、數字孿生系統以及浸沒相變液冷技術,讓系統可用性達到99.99%,保障集群長周期穩定運行。
![]()
坦誠講,對于計算集群,我們首要關心的問題一定是芯片,也要正視目前中國與海外之間的差距。李斌表示,國產芯片制程工藝上存在代差,可以一方面在芯片封裝、結構工藝上挖一些潛力,還有就是通過系統端去優化,以及工程化能力的優化等來彌補差距。此外,由于工藝相對落后一些,要達到同樣的性能芯片功耗就會更高,通過一些技術來解決芯片的供電和散熱問題,也能縮短差距。
此前在光合組織2025人工智能創新大會(HAIC2025)上,中科曙光發布scaleX萬卡超集群時,李斌曾表示該集群在超節點架構、高速互連網絡、存儲性能優化、系統管理調度等方面實現了多項創新突破,部分技術與能力已超越海外同類產品研發路線圖的2027年NVL576里程節點。
在當天的一個演示案例中,中科曙光的AI4S計算集群和英偉達的A800集群相比,訓練Loss下降曲線高度重合,下游測試中,9項基準測試的結果也高度一致。此外,據工作人員介紹,公司產品的部分性能指標已超越英偉達集群。
目前,從產業生態來看,國內AI4S已經形成了上游算力與數據,中游平臺與模型,下游科研與工業應用的完整鏈條。李斌表示,未來幾年AI4S可能需要更多關注世界模型和物理AI,世界模型依賴的數據需要物理規律約束,而物理規律約束的數據又需要傳統計算來產生,這會進一步增強傳統計算和超算的融合,對未來的算力結構也會有一些影響。
隨著國家算力基礎設施被用互聯網理念重構,算力成為“普惠服務”,將進一步支撐中國在全球AI和科技競爭中占據主動——這不僅關乎幾家公司的市值,更關乎未來科技革命里我們的話語權。
注:文中演講配圖均來自現場拍攝
![]()
![]()
![]()
![]()
![]()
「創新無邊界」是我們的slogan,我們不局限于對互聯網行業的追蹤與探索,更要向未來、向未知的方向大膽邁進。因此,「打造行業新標桿、解讀商業新動向」是我們秉持的方向之一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.