![]()
芯東西(公眾號:aichip001)
作者 程茜
編輯 漠影
芯東西12日17日報道,今天,上海GPU龍頭沐曦股份在上交所科創板敲鐘,開盤價為700.00元/股,截至午間休市股價大漲687.79%,總市值達到3298.82億元,將全球算力產業的競爭推向全新高度。
近一段時間以來,全球算力產業都處于重磅事件密集爆發期。
海外,非GPU賽道的谷歌TPU狂攬千億級訂單,在GPU壟斷的算力市場撕開缺口,上周博通CEO爆料Anthropic向博通下總計210億美元(折合人民幣約1486億元)訂單,還疊加Meta等科技巨頭的采購意向;GPU層面,因害怕失去中國市場,美國批準英偉達H200 AI芯片對華出售。
反觀國內,算力產業熱度同樣持續攀升,北京AI芯片明星企業清微智能拿下超20億元大額融資,背后是業界少見的投資陣容。此外還有國內AI芯片創企密集披露并購、上市計劃,本土算力生態加速成型。
上述海內外算力產業的密集動向,共同指向一個不可逆的行業變革:全球算力市場長期由英偉達GPU壟斷的市場格局正在松動。
在大模型發展初期,市場對通用算力的強需求讓英偉達GPU迅速占據絕對主導地位,幾乎形成“無GPU不訓練”的行業局面。
如今,一方面谷歌TPU、亞馬遜Trainium3等非GPU芯片在一些場景對GPU實現規模化替代,國內市場2025年上半年非GPU算力卡占比已達30%,寒武紀MLU、昆侖芯ASIC、清微智能可重構芯片(RPU)等產品已形成差異化優勢。
另一方面在投資市場,英特爾被傳計劃以16億美元(約合人民幣112.9億元)(含債務)收購非GPU路線AI芯片獨角獸SambaNova,挽救自己在AI時代落下的競爭力,還有非GPU路線獨角獸Groq兩年間拿下超30億美元(折合人民幣約213億元)融資。
![]()
▲海外非GPU路線企業最新動向匯總
可以看到,非GPU芯片勢力崛起已勢不可擋。
在此背景下,全球算力產業下一步將往哪走?非GPU路線能有多大市場空間?未來會百花齊放還是一支獨大?非GPU賽道哪條路線有望最先沖出重圍?我們試圖通過拆解全球算力格局及國內幾家頭部企業的技術路線,找到這些問題的答案。
一、全球算力產業的下一程,將面臨路徑分化
從需求端、底層技術、全球算力生態構建的三個核心維度來看,全球算力產業格局變革具有一定的必要性及急迫性。
首先在需求端,今年被稱作大模型落地元年,推理場景算力需求增加,單純堆砌GPU的粗放模式已經難以適配當前大模型規模化落地需求,這正倒逼企業尋找更高效的算力解決方案。
同時,AI深入千行百業使得行業多元、細分需求接連出現,如AI視頻生成、AI醫療診斷、工業數字孿生等場景對算力能效比、適配性的要求各不相同。疊加企業主動分散供應鏈風險、規避單一廠商依賴,非GPU算力產品迎來關鍵的市場切入契機。
其次是技術端,傳統馮·諾依曼架構的存算分離矛盾凸顯,其設計邏輯已難以突破硬件性能的物理邊界,需要架構革新突破瓶頸。
非GPU路線實現多點突破,如谷歌TPU專用架構、國產可重構芯片的動態適配能力等,已經在特定場景下形成性能與成本優勢。
最后是生態層面,打破單一架構生態壟斷已經成為行業共識,國產開源框架正通過兼容適配、自主優化,快速構建本土生態協同體系。
因此全球算力產業正在朝著打破單一架構,不同路徑百花齊放的局面發展。
就在近日新華社發布的一則報道提到:“在AI芯片領域,北京已經形成了自主可控的“芯片矩陣”,昆侖芯、寒武紀、摩爾線程、清微智能……一系列國產明星產品性能領先。”
這之中既有GPU路線的摩爾線程,還有非GPU中ASIC路線的昆侖芯、寒武紀,以及非GPU中可重構計算的清微智能。四家企業分屬不同技術路線的發展態勢,恰恰印證了北京在AI芯片賽道多元布局、保障供應鏈安全的遠見。
在這些明顯的行業趨勢背后,我們還能捕捉到驅動行業發展的幾大核心趨勢:
第一是GPU與非GPU兩大技術路線正并行發展。GPU路線憑借成熟的生態兼容性和通用計算能力,在需要兼顧圖形渲染、科學計算與AI訓練的場景中將持續發揮優勢;非GPU路線,則隨著大模型的快速演進,在AI推理領域率先展現出強勁增長潛力。其中可重構架構憑借通用計算能力,已經在AI主流場景中占據重要地位。第二,全球算力產業的重心不再唯硬件性能論,而是朝著軟件、模型、場景適配等的全棧布局發展,通過協同創新讓算力資源被充分釋放出來,避免算力資源限制,并針對不同硬件架構對模型進行壓縮、量化、適配。這一趨勢本質上是要實現算力效能最大化。第三是中國廠商的話語權正在提升。在算力領域長期由歐美廠商主導的市場格局下,中國企業在非GPU賽道展現出不容小覷的競爭力。
綜上,全球算力產業的下一程必然會走向路徑分化。
二、非GPU路線市場穩步上升,國內滲透率高于全球
全球知名市研機構Gartner預計,到2027年,針對AI推理應用的算力需求將導致AI加速器(通常指非GPU的AI專用芯片)的出貨量超越GPU。
與此同時,在全球算力產業中,非GPU路線正在快速成長為與GPU分庭抗禮的核心力量,算力市場雙軌并行的格局有了雛形。
全球知名市研機構IDC發布的報告顯示,今年上半年,中國非GPU芯片市場在加速計算領域增長顯著。2025年上半年,中國非GPU服務器市場占比約為30%,預計到2028年市場占有率將接近50%。
![]()
AI在千行百業的加速滲透對這一趨勢有著極大的推動作用。
英偉達創始人、CEO黃仁勛曾經在采訪中透露,中國的AI應用發展速度極快,其社會接納新技術的節奏非常快。這是一個讓他深感擔憂的領域,因為歸根結底,這場工業革命的勝負將取決于AI應用層面的發展,取決于誰能成為技術普及的引領者。
相比于GPU,非GPU技術路線在成本、能效比、場景適配性上更為契合當下AI主流應用場景。
其硬件采購與運維成本更低,更適配中小企業及大規模分布式部署需求;能通過定制化架構實現低功耗與高精度的平衡,實現更優能效比;適配自動駕駛、工業物聯網等邊緣端場景的算力需求;同時具備更強的實時性、穩定性與靈活性,適配差異化AI任務。
尤其在智算中心、大模型部署、云計算、泛機器人、智能駕駛等主流AI應用場景中,非GPU路線有適配特定負載的高能效比、更低的全生命周期成本、更強的國產供應鏈自主可控性,且能通過從0到1的定制化架構實現大模型推理高吞吐與低延遲,兼容多業務負載。
對于規模達千億乃至萬億級的AI市場而言,非GPU方案必然會占據一席之地。
不過,客觀來講,非GPU發展尚沒有GPU成熟,大部分非GPU芯片生態成熟度不足,缺乏完善的軟件工具鏈、豐富的開源框架支持。再加上其發展處于早期,對企業的早期研發投入能力也是不小的考驗。
這也從側面印證,GPU與非GPU兩條技術路徑各有優劣,并非簡單的替代關系。
三、拆解國內頭部芯片企業布局,可重構賽道勢頭正猛
想要探究當前國內非GPU賽道的發展格局,可以聚焦幾家核心企業作為切入點。
北京AI產業具有代表性,2024年其AI核心產業規模已經達到近3500億元,占全國近一半,助攻這一產業發展的底層芯片玩家更為關鍵。
因此新華社報道提到的昆侖芯、寒武紀、摩爾線程、清微智能,這四家北京芯片代表企業,正是國內AI產業蓬勃發展的生動縮影,透過它們的發展軌跡,更能清晰窺見國內AI芯片產業格局的深刻變革。
![]()
▲北京四家芯片代表企業2025年上半年出貨量位居國內前列
這四家企業中,摩爾線程為GPU陣營,其余三家均為非GPU陣營,其中寒武紀、昆侖芯主攻ASIC路線,清微智能以可重構架構實現通用計算為核心發力方向。
值得注意的是,這并不是當下非GPU賽道的全部路線,不過這幾家受到北京市認可的企業極具代表性,既展現出國產非GPU的布局脈絡,也凸顯了政府層面的有力支持。
因為GPU的技術優勢已經在業界有廣泛認知,因此我們主要拆解了另外兩條非GPU路線。
ASIC架構是一種為特定用途定制設計的集成電路,谷歌TPU就是ASIC芯片。ASIC最核心的優勢就是性能、功耗,再加上支持深度定制的特性使得其在AI應用浪潮中得以大展拳腳。
寒武紀的ASIC芯片采用自研架構,構建了覆蓋云端、邊緣端和終端的完整產品線。以其首款采用Chiplet技術的芯片思元370為例,該芯片最大算力高達256TOPS(INT8),是寒武紀第二代產品思元270算力的2倍。
昆侖芯基于其自研XPU架構,昆侖芯R200可提供高達256 TOPS(INT8)和128 TFLOPS FP16的算力,性能可達主流GPU的1.5倍。在實際部署中,其單機4卡R200方案可實現4800 tokens/s的推理吞吐量,滿足千億參數大模型的實時交互需求。
這些實例足以印證,AI領域中非GPU架構對GPU的規模化替代進程已全面開啟。
不過ASIC的不足之處在于,因為需要定制化所以其從需求定義到量產交付的每個環節都需投入大量時間與資源,不僅如此,ASIC架構一旦固化便難以調整,面對算法快速迭代的場景,往往需要重新流片,進一步拉高研發風險與周期成本。
相比之下,兼容GPU、ASIC路線優勢的可重構計算路線發展勢頭更猛,核心在于它踩中了AI產業從算力集中到場景細分轉型的行業趨勢,可以解決GPU通用但低效、ASIC高效但硬件固化的痛點,且通過底層架構創新實現了性能與性價比的平衡。相比行業同類型產品實現成本整體降低50%、能效比提升3倍。截至今年12月,清微智能的可重構芯片累計出貨量已超3000萬顆,2025年其算力卡訂單累計超3萬張,在全國十余座千卡規模智算中心實現規模化落地。
![]()
▲清微智能AI算力芯片TX81
此外,可重構數據流技術路線還與AI計算需求天然適配。在實現芯片高效互聯這一核心環節上,可重構數據流派自研的TSM-LINK算力網格技術,支持多芯片點對點直連,可實現數據的高效傳輸,從根源上規避傳統交換機架構存在的帶寬瓶頸與通信延遲問題。而GPU架構在適配晶圓級芯片集成時,只能依賴外部交換機完成互聯,性能損耗與延遲問題難以避免。
在芯片設計層面,可重構數據流架構從底層架構設計階段就具備三維擴展的天然優勢,能夠與晶圓級芯片技術、3.5D堆疊等先進立體封裝技術深度結合,形成清晰且可持續的升級迭代路徑。據悉,清微明年推出的下一代芯片會帶來大幅度性能躍升,有望實現對國際主流前沿AI芯片的彎道超車。
![]()
▲GPU與非GPU技術路線基本性能對比
因此從本質上來看,可重構計算路線不是對GPU、ASIC的替代,而是通過找到其中的平衡,取兩家之所長,契合了AI規模化落地的核心需求。
結語:算力產業進入多元共生新時代
總的來看,當下AI算力領域格局已較為清晰:GPU憑借成熟生態與極致并行計算能力,在通用大模型訓練、圖形渲染等核心場景仍占據不可撼動的統治地位,但正面臨功耗攀升、成本高的結構性挑戰;而非GPU路線則憑借更高能效比、更低全生命周期成本及自主可控優勢,在AI推理、專用算力需求等主流AI應用領域快速崛起,共同推動算力體系向多元化、異構融合方向演進。
以大模型、生成式AI為代表的新一輪AI浪潮催生出前所未有的AI算力需求,同時國產大模型企業強勢突圍,帶動了國內AI算力需求的持續增長,中國AI算力產業迎來新的機遇和挑戰。
當下,國產非GPU企業異軍突起,正與國內大模型廠商形成合力,為國內AI算力產業注入新的活力。目前來看,非GPU技術路線盡管相比GPU并不成熟,但因其天然優勢與AI應用落地相契合,正迸發出強大生命力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.