2025年末,國產GPU行業迎來上市熱潮。
從已登陸科創板的摩爾線程、沐曦股份,到即將登陸港股的天數智芯、壁仞科技,再到啟動上市輔導的燧原科技,國產GPU企業正集體沖刺資本市場,借助資本力量加速技術突破與生態構建,開啟自主算力突圍新篇章。

又一家GPU企業要來了
12月19日,上海天數智芯半導體股份有限公司(簡稱:天數智芯)已通過證監會港股上市備案和港交所聆訊。
天數智芯成立于2015年,核心業務聚焦自主可控、國際領先的通用GPU產品研發。在業務布局上,公司深耕通用GPU賽道,主打科學計算與AI訓練、推理場景,推出的“智鎧”系列芯片及配套加速卡、算力集群方案,已實現對超算中心、云計算廠商、AI企業及科研機構等多類客戶的覆蓋,在國產高性能計算GPU領域具備顯著的技術積累與場景落地優勢。
成立以來,公司已完成多輪融資,股東陣容涵蓋多家知名投資機構及產業資本,包括大鉦資本、Princeville Capital、上海電氣香港、邦盛資本、沄柏資本、粵民投資管、聯通資本、金融街資本、厚樸投資、中關村科學城科技成長基金、上海國盛、熙誠致遠、新興資產、鼎祥資本、鼎禮資本、粵港澳產融、上海自貿區股權基金等。

國產GPU企業在努力
縮小與國際巨頭的差距
高性能GPU的研發難度極高,需要突破硬件架構、制程工藝、軟件生態等多重壁壘。國產GPU企業在技術攻關方面各展所長,努力縮小與國際巨頭的差距。
硬件突破:在硬件性能上,國產GPU近年實現了快速追趕。壁仞科技的BR100芯片采用7nm工藝,集成770億晶體管,峰值算力達到國際廠商在售旗艦產品的3倍以上,創下國內互連帶寬紀錄。摩爾線程的最新產品MTT S5000(7nm制程)單精度算力約32 TFLOPS,接近英偉達A100的一半性能。
沐曦股份的曦云C500單卡算力同樣對標A100,并率先實現支持128B參數的大模型全量訓練,證明了國產GPU在大模型訓練場景的可行性。燧原科技的邃思2.0訓練卡算力達40 TFLOPS,在云端大模型訓練中也占有一席之地。
總體來看,國產GPU在算力密度、能效比等方面正逐步逼近國際先進水平。例如,有報告指出,華為昇騰910B推理性能已達英偉達H20的85%-95%,沐曦C600在中文NLP訓練場景超越A100,壁仞BR100實現高算力密度突破。
架構創新:為了提升性能,國產GPU在架構設計上也進行了大膽創新。壁仞科技的BR100采用自主研發的“壁立仞”架構,引入了Chiplet(芯粒)和2.5D CoWoS封裝等先進技術,實現高性能與高良率的兼顧。摩爾線程自研MUSA架構,支持AI計算與圖形渲染雙功能,使單芯片能夠同時滿足不同應用需求,降低了遷移CUDA生態的成本。
沐曦股份的XCORE架構則注重內存帶寬和互連,采用MetaXLink超節點互聯技術,單鏈路帶寬高達1.2 TB/s,大幅提升多卡并行能力。這些架構創新為國產GPU提供了差異化競爭優勢。
軟件生態:然而,硬件性能的提升只是基礎,軟件生態的構建才是決定國產GPU能否真正站穩市場的關鍵。目前,英偉達憑借CUDA生態占據了絕對主導地位,全球80%以上的大模型都是基于CUDA訓練的。
因此,國產GPU企業正努力打造自己的軟件生態,包括開發兼容CUDA的編程框架、優化主流AI框架支持等。例如,摩爾線程發布了MUSA并行計算開發環境,宣稱全面支持國產x86處理器和麒麟操作系統,大幅完善了國產GPU的軟件適配。
沐曦股份則開源了MXMACA軟件棧,兼容CUDA,目前已支持6000+應用的遷移。壁仞科技自主研發了BIRENSUPA軟件平臺,包括驅動層、編程平臺、框架層和應用解決方案,覆蓋從底層硬件到上層應用的全棧,支持各類AI應用場景。
燧原科技同樣注重生態建設,推出了DeepSpark開源社區,吸引開發者參與,以加快生態培育。
總體而言,國產GPU企業正從“能用”逐步邁向“好用”,在硬件性能、架構創新和生態適配方面均取得了顯著進展。正如業內分析所言,“國產GPU的生態突圍已經給出答案”,但要真正撼動英偉達的霸主地位,還需在生態成熟度、開發者規模等方面繼續發力。
綜合自福布斯中國、DOIT傳媒
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.