![]()
過去幾年,國產GPU的發展常常被簡化為一個問題:“性能趕上英偉達了嗎?”但真正決定算力自主的,從來不是單顆芯片跑分多高,而是能不能從底層芯片、驅動、軟件到整套集群系統都自己說了算。
最近,摩爾線程推出“花港”GPU架構和“夸娥”智算集群,正是在回答這個更關鍵的問題——國產GPU能否構建自己的全棧能力?
“花港”不是又一塊堆參數的芯片,而是一次面向AI時代的重新設計。
傳統GPU最初為圖形渲染而生,后來被AI“借用”。而“花港”從一開始就把大模型訓練和推理的需求納入架構考量。比如,它優化了計算單元與內存之間的數據通路,減少大模型運行時的數據搬運瓶頸;同時通過自研指令集和編譯器,讓上層軟件能更高效地調用硬件資源。這種軟硬一體的思路,讓芯片不再是“通用加速器”,而是為AI量身打造的引擎。
更重要的是,“花港”強調通用性與兼容性的平衡。它不僅支持主流AI框架如PyTorch和TensorFlow,還向下兼容圖形渲染任務,這意味著同一塊芯片既能用于訓練大模型,也能支撐游戲、設計等傳統GPU應用場景。這種“一芯多用”的策略,有助于降低生態建設初期的門檻,也為未來商業化鋪平道路。
但光有好芯片還不夠,就像再好的發動機,沒有整車也跑不起來。摩爾線程的“夸娥”集群,就是這輛“整車”。它不只是把幾十甚至上千塊GPU簡單連在一起,而是整合了高速互聯、任務調度、故障容錯和能效管理的一整套系統。據公開信息,“夸娥”已支持千卡規模部署,并在真實客戶環境中穩定運行。這意味著國產GPU首次具備了支撐大規模AI訓練的能力——過去,這類任務幾乎完全依賴英偉達的DGX系統和NVLink互聯技術。
“夸娥”的另一個亮點在于其開放性和可擴展性。它采用模塊化設計,可根據不同行業需求靈活配置算力規模,既適用于科研機構的小型實驗集群,也能滿足互聯網公司動輒千卡的大模型訓練。同時,其調度系統支持異構計算資源整合,未來還能兼容其他國產芯片,避免形成新的“孤島”。
更重要的是,“花港+夸娥”的組合,代表了一條真正可控的技術路徑。
從芯片設計、驅動開發、編程框架適配,到集群調度和運維工具,摩爾線程正在搭建一條不依賴外部斷供風險的完整鏈條。這不僅關乎國家安全,也直接影響中國AI產業的成本和迭代速度。當一家公司訓練千億參數模型不再需要排隊等海外GPU、也不必受制于閉源工具鏈,創新效率自然大幅提升。
當然,挑戰依然不小。英偉達的優勢不僅在于硬件,更在于CUDA生態十年積累的開發者習慣、豐富的庫函數和廣泛的兼容性。摩爾線程要吸引開發者遷移,必須持續打磨工具鏈,降低使用門檻,并聯合高校、云廠商和行業用戶共同豐富應用場景。生態建設無法速成,但方向已經明確:未來的競爭,是系統級能力的競爭,不是單一芯片的軍備競賽。
值得肯定的是,摩爾線程并未閉門造車。它正積極與國內操作系統、云計算平臺和AI企業合作,推動軟硬件協同優化。這種“共建生態”的姿態,比單純追求技術指標更具長遠價值。
在杰哥看來,從“能造芯片”到“能建系統”,摩爾線程邁出的這一步,或許不會立刻撼動全球格局,但它為中國算力基礎設施打下了關鍵的地基。真正的自主可控,不是某一天突然實現的,而是在一次次從底層到應用的閉環驗證中逐漸夯實的。
“花港”與“夸娥”的意義,正在于此——它們不只是產品,更是一種信號:國產GPU,開始認真做“系統”了。而這,才是算力自主真正的起點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.