![]()
文:任澤平團隊
2025 年,全球 AI爆發點燃算力需求。當前的全球算力格局,呈現出一超多強、競爭加劇的態勢。英偉達憑借 CUDA 生態的護城河和 H/B 系列芯片,基本壟斷了全球AI算力。
但與此同時,國產算力產業快速崛起、國產替代,從華為昇騰、寒武紀,到沐曦、摩爾線程等加速發展,國產算力正在蓄勢爆發。
1 英偉達的背后是美國AI戰略和國家力量
英偉達作為全球龍頭GPU公司,其核心是“三大業務+CUDA生態”,承載著美國AI和半導體戰略構想。
英偉達的三大主要業務:
業務一:數據中心業務。直接服務于全球AI基礎設施建設,包含計算、網絡、系統級平臺,其銷售模式也不再只是售賣芯片,而是為各行業提供全棧解決方案。產品包括Blackwell架構GPU、Hopper架構GPU、NVLink、InfiniBand、Spectrum-X以太網等。
業務二:消費顯卡業務。從純游戲市場轉型成為融合AI入口,其新一代發布顯卡在迎合傳統游戲市場的基礎上,側重于AI大模型的能力,可以滿足本地化AI部署需求,成為開發者生態擴大基礎。主要是GeForce RTX系列和Project Digits等AI PC產品。
業務三:具身智能應用。被英偉達視作未來增長引擎,主要有機器人、智能駕駛、世界模型三大類。比如,機器人基礎模型的Isaac GR00T系列,用于仿真與開發平臺的Omniverse(數字孿生)、Isaac Sim,還有AI模型與引擎的Cosmos世界模型、Cosmos Reason VLM、Newton物理引擎。
CUDA生態是英偉達壟斷GPU行業的核心護城河。CUDA是英偉達自2007年就搭建的軟件編程模型,綁定其GPU產品,隨著GPU發展迭代,其功能和應用范圍也不斷擴大,開發者的投入與CUDA深度綁定,構建了一個龐大的、自我循環、自我強化的生態平臺。
英偉達的背后是美國政府加強半導體產業鏈、確保AI技術主導權的戰略構想。美國對英偉達的支持已經從市場層面的扶持,升級為國家力量的系統性工程。不僅將英偉達直接納入多個國家戰略計劃和科研基礎設施,為其提供大規模、高價值的訂單,還保障供應鏈安全并享受豁免優惠,比如促成半導體上游關鍵企業遷移美國本土等。同時,也在確保美國本土企業優先獲得英偉達最新算力,鞏固其領先地位,加速技術迭代與生態擴張。
![]()
2 中國需要自己的英偉達
中國需要自己的“英偉達”,核心原因遠不止于制造一款高性能GPU。
從國家戰略角度,關乎當下科技自主權,產業鏈安全,以及全球AI競賽領導權。
從產業角度,是加速推動半導體行業全鏈條國產化,從成熟制程邁向高性能芯片的自主可控。
從企業的角度,是需要具有持續技術創新力和產品實力的中國GPU龍頭領軍。
當前中國GPU力量正在崛起,GPU實現國產替代是大勢所趨。2024年中國半導體自給率達到24%,同比增長4pct;其中AI領域半導體自給率已達到三分之一,相較于2023年顯著提升,仍有大幅提升空間。
長期看,中國的優勢在完善的產業鏈、龐大市場和應用空間,實現芯片行業的大規模降本和全產業鏈突破只是時間問題。以光伏與新能源汽車產業為例。20年前,光伏技術掌握在歐美企業手中,價格昂貴。中國企業通過技術引進再創新,發揮制造優勢和規模效應降本,最終實現了絕對領先。新能源汽車最早也是美國領先,在三電技術上實現突破后,中國新能源車企憑借完整的工業體系和敏銳的市場洞察,形成了產業鏈整合,主導全球新能源汽車行業。
芯片行業的挑戰更復雜,但中國從技術追趕到全球領先的邏輯不會改變。
一是國家戰略確保AI產業發展自主權,政策強力推動。從“十四五”規劃重視芯片自給率,2024年七部門《關于推動未來產業創新發展的實施意見》加快GPU領域突破;到2025年下半年的《電子信息制造業2025-2026方案》強調推動AI終端創新應用;同期證監會推出科創板“1+6”新政引導AI和芯片企業發展,產業和市場政策組合夯實國產替代基礎。
二是市場高增速催化。據測算,2024年起全球云AI市場規模復合年增長率達到28%,到2027年將達2390億美元,中國市場需求占全球1/3,市場增量約800億美元。先是公有云和國資智算中心實現規模化替代,國產GPU獲得穩定份額后,未來3-5年完善軟件生態和工藝進步,形成更廣泛的全市場競爭力。
三是企業競爭力提升。中國芯片產業的各環節企業都在技術突破期。華為以全棧自研的解決方案引領國產替代;摩爾線程從消費級GPU切入AI智算;中興通訊的5nm制程ASIC開始流片;中微公司介質刻蝕機已進入臺積電5nm產線;中芯國際步入先進制程良率和產能突破期。中國半導體產業的快速進步已成趨勢。
3 中國AI芯片:從0到1,快速崛起
根據年市場份額和出貨表現,中國AI芯片市場的“七小龍”初現端倪:華為昇騰、昆侖芯、寒武紀、天數智芯、燧原科技、沐曦股份、摩爾線程。但是市場的競爭格局遠未定型,國產算力仍處于征途中。
AI芯片有通用型和專用型兩種。通用型芯片是“通才”,利用并行處理能力來加速各種計算任務,不局限于特定的應用領域,旨在提供一個靈活的、可編程的平臺,能夠適應多種不同的計算需求。通用型AI芯片主要指通用GPU,代表企業英偉達,芯片型號有B200、H200等。專用型芯片是“專才”,是專為特定應用或領域定制的計算架構,旨在針對某一特定任務進行優化,優勢在于執行該任務時性能極強、能效比極高、成本可能更低;劣勢是功能固化、靈活性差。專用型AI芯片有ASIC和FPGA兩種,ASIC討論度更高,代表廠商是谷歌,其TPU就是一種ASIC芯片。
總體格局上,GPU占據絕對的AI主流地位,ASIC則是崛起中的支線力量。全球AI芯片市場由GPU巨頭英偉達壟斷,是絕對的行業領導者,占據超過80%的全球市場份額。ASIC架構則是快速發展的一股支線力量,代表廠商是谷歌,其在全球ASIC出貨量占比超70%,今年11月谷歌第七代TPU發布,迅速造成對英偉達GPU壟斷敘事的沖擊:內部,谷歌Gemini3 Pro大模型使用自研TPU訓練;外部,盡管其TPU 暫未向外部客戶直接銷售,僅通過谷歌云提供服務,但是與Meta的合作意向已經達成,后者計劃2026年通過谷歌云租用算力,從2027年起在自己的數據中心部署谷歌TPU。
在全球AI競爭加劇和算力基礎設施自主性需求日益迫切的雙重背景下,中國本土AI芯片企業也加速發展,但總體上仍處于“從0到1”的初期階段,尚未形成明朗的競爭格局,GPU和ASIC兩種架構并行發展、各有側重。
我國本土AI芯片企業中,GPU路線的有沐曦、海光信息、天數智芯、壁仞科技、摩爾線程;ASIC路線的有華為海思(華為系)、寒武紀、昆侖芯(百度系)、平頭哥(阿里系)、燧原科技。
都是Fabless模式,即公司主體負責芯片的研發、設計與銷售,生產環節由專業的外協廠商完成,主要包括晶圓代工廠和封裝測試廠,也包括板卡加工服務等等。
![]()
中國本土AI芯片企業在全球市場份額合計不足1%,當下主要是國產替代邏輯。IDC數據顯示,本土AI芯片廠商的國內市場占有率正在快速提升,2024年出貨量82萬張,滲透率約30%;相較2023年15%的國產滲透率有明顯提升。
分類看,GPU服務器在中國加速服務器市場依然是主導地位,占比近70%;ASIC 和 FPGA等非GPU加速服務器高速增長,占比約30%。
按企業看,華為昇騰銷量64萬,在中國AI芯片市場占23%,是本土第一品牌;昆侖芯(百度系)6.9萬、天數智芯3.8萬、寒武紀2.6萬、沐曦2.4萬、燧原科技1.3萬,其他品牌銷量未過萬。
![]()
![]()
綜合來看,在ASIC路線上,華為昇騰領先。通用GPU路線并未形成鮮明的格局,沐曦股份營收小幅領先。
華為昇騰可以說是國產算力的“定海神針”,定位是 ASIC專用型計算架構。作為擁有全棧自研能力的巨頭,其昇騰 910B/C系列已在大型智算中心規模化部署。華為升騰的核心競爭力是 CANN 異構計算架構,已建立起堅固的閉環生態。2024年,華為昇騰在中國 A 芯片市場份額達 23%,穩居本土第一品牌。
寒武紀,作為國內最早的AI芯片上市企業,寒武紀深耕專用架構ASIC/DSA。核心競爭力是云邊端一體化開發環境,在特定算子下能效比極高。2024年智能芯片及加速卡收入約11.7億元,主要服務于政府智算中心及特定行業。
昆侖芯脫胎于百度AI芯片部門,是典型的“大廠底座”與“應用驅動”派代表 。憑借自研的XPU架構,屬于ASIC/DSA路線,深度適配百度文心大模型及飛槳等生態,在自然語言處理、搜索推薦等垂直場景擁有極高的迭代效率 。2024年其在中國AI芯片出貨量占比約3%,位列本土品牌前三,是國產算力排位賽中從互聯網內循環跨向通用市場大循環的標桿。
燧原科技也是國產算力陣營中深耕“專才”路線的典型,背靠第一大股東騰訊提供的強大應用生態資源,在政務MaaS(模型即服務)等實戰場景中展現出優勢。作為主攻ASIC/DSA專用計算架構的代表,燧原科技于2024年占據了約1%的市場份額。
沐曦股份定位是通用 GPU 架構,核心團隊有高端GPU設計背景。沐曦的優勢是走自研架構+高度兼容 CUDA路線,主打的是平滑遷移,讓開發者能以最低成本從英偉達陣營切換過來。其主力產品曦云c500系列,綜合性能對標英偉達A100,在2024年實現7.2億元的收入,占主營業務收入97%以上。但產品結構單一也有一定短板。2024年智算推理系列(曦思 N 系列)的收入占比不到 1%,高度依賴訓推一體芯片的銷售。同時,公司仍處于巨額虧損階段,盈虧平衡點最早也要到 2026 年才能看到。
摩爾線程定位全功能 GPU,兼顧圖形渲染消費級顯卡與AI計算。優勢是依托 MUSA的架構,讓產品一卡多用:既能做動畫渲染、游戲畫面、虛擬場景,又能搞定訓練 AI大模型、跑AIGC生成內容,還能萬卡集群、相當于萬卡一起干活。但短板是2024年營業收入約4.38 億元,雖有增長,但遠低于寒武紀和海光信息等成熟廠商。由于戰線拉得太長,在每個細分市場都要面對英偉達及國產專項廠商的競爭,是其隱憂。
天數智芯是通用架構路線的堅定踐行者。2024年其憑借約1%的市場份額躋身本土品牌出貨量前五,展現出較早的商業化落地能力。在技術路徑上,天數智芯堅持GPGPU設計,通過兼容AMD ROCm等開源生態來降低開發者的遷移門檻,產品全面覆蓋AI訓練、推理及大規模通用計算場景。
![]()
4 GPU國產化關鍵是產業自主和軟件生態
中國GPU國產化要突破的重點領域有兩類:一是產業上,從EDA、IP、設備、材料到晶圓代工的半導體產業鏈都需要攻堅。二是軟件端,面對CUDA生態近20年的“護城河”。國產替代非一朝一夕,高端芯片領域挑戰依然艱巨。
![]()
4.1 EDA和IP:點工具突破、GPU核心仍薄弱
EDA(電子設計自動化)和IP(半導體知識產權)處于半導體產業最上游。EDA是芯片設計的一整套工具鏈,設計師用其進行數字設計、模擬、驗證概念,并最終生成芯片制造圖紙。IP是已驗證過的成熟模塊,芯片公司以自研、購買、或獲得授權使用IP的方式來搭建各項功能,在EDA的輔助下集成為芯片圖紙。
EDA和IP自主是芯片產業國產化的基石。目前先進制程芯片所采用的FinFET正逐步升級為下一代的GAAFET架構,有更優秀的靜電特性和功耗、頻率,是發展2nm芯片的關鍵。而先進制程芯片的數字設計、線路布局、驗證等環節高度依賴最新EDA工具和IP。IP能加快設計和迭代的速度,先進制程芯片設計也依賴IP的更新。
全球EDA市場主要由三家美國公司:新思科技(Synopsys)、鏗騰電子(Cadence)、西門子EDA(Siemens EDA,原明導國際)主導。2024年三家的市場份額分別為31%、30%、13%。中國EDA的主要參與者包括華大九天、概倫電子、廣立微、芯和半導體、芯華章與鴻芯微納。
IP市場,安謀(ARM,軟銀旗下)和新思兩家占有全球2/3的份額,鏗騰和Alphawave(高通收購)合計9%。其中,安謀主要市場在移動計算,后三者主要市場在高性能計算。國內半導體IP的主要參與者有芯原股份、芯耀輝、銳成芯微、芯來科技、寒武紀、平頭哥(阿里旗下)。
EDA的突破在于“點工具”,比如原理圖和PCB設計工具上已經完全自主,在模擬芯片EDA領域,也已經有國內廠商實現了全流程自主,但數字芯片、系統級芯片的全流程領域還存在空缺。由于設計一顆先進制程芯片需要上百種工具協同,而國際EDA工具與臺積電的工藝設計套件深度綁定,因此EDA自主化和晶圓代工的國產替代需同步實現。
IP的挑戰在于架構創新和生態獨立。常見IP有處理器核心、接口IP、基礎IP、GPU專用IP。其中,接口IP過去主要由新思和鏗騰提供,現在是國產替代較快的環節,并有國內IP授權給多家國內外芯片公司的成功案例。
同時,GPU IP自研起步,通常國內GPU廠商采用“IP授權”模式開發芯片,但隨著下游芯片設計企業對本土IP采購意愿增強,GPU核心IP自研是大勢所趨,但生態壁壘也很明顯。由于GPU設計的特殊性,不同模塊的IP來源通常分散。以英偉達為例,其流處理器架構、并行計算架構、張量核心等關鍵IP都由自主設計,但部分特定功能也需要采用第三方IP來開發。目前,實現純粹國產GPU核心IP還不具條件,而高性能的GPU架構設計也才起步,自主GPU IP生態搭建是長期工程,國內需要加緊人才培育和市場經驗積累。
4.2 晶圓制造和設備:良率、產能、光刻設備攻堅
芯片制造商也被稱為晶圓代工廠(Foundry),職責是將設計圖紙上的芯片實際制造出來。也是整個半導體產業中價值含量最高、流程最復雜、資本開支最大的環節。
根據2025年Q2數據,全球近七成的晶圓代工市場由臺積電(TSMC)獨占,三星市占率達到7.3%,中芯國際升至全球第三,市占率5.1%,華虹集團也躋身全球第六,份額2.5%。目前,中芯國際、華虹半導體已具備28nm及以上芯片的大規模、高良率的制造能力,能滿足大部分中低端GPU和國產GPU初代產品的制造需求,總體看28nm及以上的產能自給率已超過40%。
14nm及以下的先進制程代工還需突破,中芯國際是國產GPU產能的主要來源,目前中芯國際已實現14nm量產,但良率和產能有限。由于無法獲取EUV光刻機,且材料方面的超高純度化學品、光刻膠等仍依賴進口,因此7nm、5nm等更先進制程的研發和量產仍需攻堅。好在國產DUV(深紫外)光刻設備研發已經落地。由深圳市政府投資的俞亮昇,已成功研發DUV光刻設備,目前正在測試階段,預計其進入產線后將在一定程度上降低對海外光刻設備的依賴,先進制程仍需要EUV光刻設備。
光刻設備的戰略價值和技術壁壘極高,是芯片圖案轉移的核心,和薄膜沉積、刻蝕設備同屬于半導體三大前道環節。全球主要供應商是阿斯麥(ASML),市場份額占比高達82.1%,其次是佳能(Canon)和尼康(Nikon)市占率分別為10.2%、7.7%。國內主要光刻設備研發參與者有上海微電子、新凱來、以及長光所。
雖然利用現有DUV光刻機,采用“多重曝光”技術仍可以生產7nm及以下的芯片,但會導致生產成本上升、生產時間延長以及良率降低。因此,長期看實現EUV光刻設備自主還是關鍵,重點在于如何解決頂級設備對全球供應鏈依賴的問題。光刻機被稱為“工業明珠”,打造靠的是全球頂尖技術的合力。比如,阿斯麥的氣體來自美國、光源有日本供應、鏡頭來自德國,因此,光刻設備的國產化替代考驗的不僅是單點技術突破,更是細分產業鏈的完備和自主可控。
4.3 GPU軟件生態:核心挑戰在于打破CUDA壁壘
CUDA是英偉達壟斷GPU行業的核心護城河,也是GPU自主攻堅最大的壁壘。截止2024年底,CUDA已擁有超過500萬開發者,服務于全球85%以上的數據中心,90%的AI框架基于CUDA開發,95%的AI訓練任務依賴CUDA工具鏈。
CUDA全稱“統一計算設備架構”,其作用是讓圖形編程之外的領域也能最大程度利用GPU。CUDA的組成結構主要有三個部分:開發庫、運行期環境、驅動。開發庫的作用是讓開發者可以快速建立起自己的應用,并且開發者也可以在CUDA的技術基礎上搭建出定制化的開發庫。運行期環境主要提供應用開發接口和運行期組件,基本上涵蓋通用GPU開發所需要的所有功能和資源接口。驅動部分即是英偉達顯卡的驅動,雖然不同版本系列GPU有不同,但本質上是為英偉達自家的硬件設備建立的抽象層,提供訪問接口。
CUDA和英偉達硬件綁定擴張,已經成為事實上的GPU軟件行業標準。隨著GPU發展迭代,其功能和應用范圍也不斷擴大。開發者的投入與CUDA深度綁定,協同優化,在多代技術躍遷下構建了一個龐大的、自我循環、自我強化的生態平臺。
當前,國內GPU生態和英偉達CUDA差距在于兩方面。
一是用戶適配成本高。由于國內的GPU生態起步晚,且碎片化,基礎軟件不統一。各家廠商自建生態,形成了互不相通的技術壁壘,導致用戶適配成本高,軟件迭代時間和成本增加,制約了產業效率和競爭力。
二是缺乏高階工具。CUDA生態GPU的特點是穩定、高效、易用,而國產GPU常面臨硬件“紙面”算力與實際應用輸出存在差距的問題,本質上是缺乏成熟的高階軟件棧,效能被軟件短板所抵消。
好在國內廠商都意識到軟件生態的重要性。目前主要存在兩種方案路線。一是兼容CUDA路線,通過軟件層轉換,降低開發者的遷移門檻。但這種方式存在性能損耗和長期開發風險。二是構建獨立生態路線,比如華為的CANN、摩爾線程的MUSA等,目的是打造自主的開發者體系但需要巨大的投入和耐心,核心在于能否吸引開發者長期在其平臺上創造價值。
雖然許多國內企業已形成“高性能用進口、安全可控用國產”的雙供應鏈策略,為國產GPU提供了政務、金融、特定行業的應用空間。但通用、高性能領域仍需要自主廠商發力。
CUDA的護城河深厚,但并非不可挑戰。中國擁有全球最豐富的AI應用場景,利用龐大的市場優勢,通過開放協同的策略,最終有希望走出一條從兼容遷移到逐步自主的GPU生態標準。
在全球供應鏈動蕩的背景下,擁有自主可控的算力已成為國家戰略。中國本土AI芯片企業這一戰略最核心的承載者,其價值首先在于戰略安全,而非短期市場份額。近期中國本土AI芯片實現0到1的突破,并且正加速成長。未來,他們的首要目標并非在全球與英偉達正面交鋒,而是先服務于中國本土的國產化替代市場。當然,挑戰依然嚴峻,7納米及更先進制程的獲取、CUDA生態的銅墻鐵壁、以及如何在保障性能的同時將集群功耗和成本優化到最佳水平,都需要長期攻堅。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.