文 | 孫永杰
近日,美國政府宣布放寬對英偉達H200 AI芯片的對華出口管制,這一決定本應為中美科技合作注入新活力。然而,中國商務部及網信管理部門隨后明確,將繼續對進口高端芯片實施更為嚴格的安全與合規審查,并在新建數據中心審批中強調優先采用國產算力方案,如華為Ascend系列AI芯片。這一被外界概括為“原則上限用、慎用”的回應,引發了產業界的廣泛討論。表面上看,這種態度似乎體現了中國對國產AI芯片能力的信心,實則是中美在AI算力領域的復雜博弈。
H200的性能真相,不可忽視的系統級代差壓制
在當前國內的輿論語境中,常有一種“國產芯片已能平替英偉達”的樂觀情緒,依據則是“參數對照式”的對比,例如看制程、TFLOPS、顯存容量,然后得出“差距正在縮小”的判斷。這種分析在早期硬件競賽中尚有意義,但在當下的大模型時代,已經越來越難以解釋真實差距。
究其原因,大模型訓練早已不是“單卡性能競賽”,而是一場關于規模、穩定性與系統協同能力的長期工程,而隨著模型參數從百億級邁向萬億級,任何局部短板都會在系統層面被迅速放大。
正是在這樣的背景下,近年來,國際研究機構和云服務商越來越多地引入類似TPP(Total Processing Performance)總處理性能的綜合指標,用以衡量在真實訓練場景中,單位時間、單位資源所能進行的有效計算量。這類指標往往會“懲罰”通信效率不足、內存瓶頸突出或軟件調度不成熟的AI算力系統。而若以此為標準,H200對國產AI芯片形成的其實是系統級的代際壓制。
根據美國對外關系委員會(CFR)的題為《China’s AI Chip Deficit: Why Huawei Can’t Catch Nvidia and U.S. Export Controls Should Remain》的分析報告顯示,英偉達的領先地位不僅源于其計算核心,更在于其構建的“全棧式”硬件集成。具體到H200,作為Hopper架構的巔峰之作,其TPP指標高達15,832。相比之下,作為國產算力標桿的華為昇騰910C,雖然在設計上極力追趕,但受限于國內制程工藝的物理上限,其TPP指標約為12,032,而這種差距在處理萬億參數級的大模型時還會被呈指數級放大。
此外,H200配備了高達141GB的HBM3e內存,帶寬達到驚人的4.8TB/s,這比國產芯片普遍采用的HBM2e高出一個代際,使得在實際的混合精度訓練中,H200的有效算力釋放效率往往是國產芯片的5-6倍。這意味著,同樣的模型訓練任務,使用英偉達集群可能只需要3個月,而國產集群可能需要18個月甚至更久,且面臨更高的硬件故障率。
![]()
最后是在互連效率與軟件生態上,英偉達NVLink與CUDA構成的護城河更是難以逾越的鴻溝。正基于此,H200的系統級互連能力使得8卡、72卡乃至整個機架能夠像一個單一處理器一樣協同工作,通信損耗極低。相較之下,中國所謂的“萬卡集群”目前仍處于“物理數量達標、邏輯調度低效”的階段(據稱國產芯片在跨節點通信時性能損耗高達30%以上),導致其集群算力優勢大打折扣。
除上述外,如CFR報告所言,華為及其國內同行還面臨美國對先進封裝(CoWoS)和HBM3e供應鏈的嚴密封鎖,使得到2027年,隨著Blackwell系列的全面普及,英偉達頂配芯片的性能預計將達到華為同期昇騰芯片的17倍,集群算力差距更可能拉大到21—49倍。而正是這種“領先一個身位”的策略,實質上是將中國鎖死在“邏輯上能運行、工程上難超越”的次級算力圈層中。
![]()
從這一意義上說,H200 的優勢并非體現在“是否遙遙領先”的情緒化判斷,而在于其是否具備支撐下一代基礎模型長期、穩定訓練的系統能力。在這一維度上,中國整體仍處于追趕區間。
中國“謹慎對待”背后,現實局限與策略選擇的博弈
既然H200在系統層面仍具明顯優勢,中國為何在政策層面表現出相對謹慎甚至克制的態度?在我們看來,這并非簡單的技術自信,而更多源于現實局限與策略選擇的綜合考量。
首先需要指出的是,國內頭部AI企業或團隊獲取先進算力的實際路徑,已不完全等同于公開、合規的商業進口渠道。近年來,國際執法部門披露的一些案件顯示,全球高端芯片流通中確實存在復雜的灰色網絡。盡管這類現象并非中國獨有,但客觀上影響了部分機構對“次優合規方案”性價比的判斷。當然,這一因素更多屬于邊際影響,而非主流供給路徑,仍需理性看待。
此外,長期以來,國內普遍認為中國在電力和能源基礎設施方面具備結構性優勢,這在一定階段內確實為算力擴張提供了條件。
然而,Epoch AI最新的報告《Is almost everyone wrong about America’s AI power problem?》則給出了不同結論。該報告分析稱,雖然美國電網陳舊、審批緩慢,但美國正利用極其靈活的資本手段進行“能源突擊”。
例如,xAI可以在幾周內通過快速部署大規模天然氣輪機解決電力需求,而微軟、谷歌等巨頭正通過重啟核電站、推進小型核反應堆(SMR)等方式逆轉電力瓶頸。對此,Epoch AI認為,美國擁有龐大的需求響應能力(容量達76-126 GW),完全有能力支撐未來100 GW以上的AI算力電力需求。由此看,我們業內眼中的所謂中國電力紅利其實更像是一種“階段性紅利”,而非制約美國的長期結構性壁壘。
![]()
最后,也是最殘酷的差距在于先進制程的“產量控制”。據OECD 2025年《THE CHIP LANDSCAPE》的報告,在7nm及以下制程的邏輯芯片產能上,美國與中國臺灣陣營仍占據80%以上的市場份額。具體表現為中國先進邏輯芯片產能僅為0.39百萬WSPM,美國為0.84、中國臺灣1.55,而到2030年,美國將新增0.62百萬WSPM先進邏輯芯片,中國僅為0.38。
與此同時,由于缺乏EUV光刻設備,中國先進邏輯芯片產能只能高度依賴多重曝光工藝,導致國產芯片不僅性能落后,其量產良率也極低(據稱是我們20%-40%對比臺積電的90%以上),進而導致單顆國產芯片的生產成本甚至高于英偉達的市場售價。在這一背景下,通過政策手段為國產算力爭取應用空間,更多是一種現實局限下的產業保護與培育策略。
應對與破局,從“單點替代”走向生態重構
如果說我們前述解釋了“差距為何存在”,那么真正決定未來走向的,是中國如何應對這一差距。而在此過程中,一個值得警惕的傾向是,算力問題在國內的輿論中常被簡化為“某一家國產芯片企業能否追上英偉達”。其實這種敘事除了容易制造情緒,更可能掩蓋了重要的現實,那就是算力體系從來不是由單一企業支撐,而是一個高度復雜,跨越芯片、系統、軟件和組織方式的系統工程。
基于此,面對中美AI算力的全方位代差,中國AI產業的應對策略亟待從“單向平替”到“生態重構”的根本性轉變。
眾所周知,過去幾年,國內過分押注某單一“國家隊”芯片雖然取得了階段性成果,但也暴露出生態路徑單一、風險集中等問題。因此,未來的破局方向,更可能在于多路徑并行的生態構建。
例如近期摩爾線程(Moore Threads)、沐曦(Muxi)、壁仞(Biren)等國產GPU新勢力的密集上市,就反映了國家對“多路徑探索”戰略的認可。而這些企業通過在圖形渲染、國產集群適配以及針對特定算法(如DeepSeek的MLA架構等)的深度優化,正在構建一個比單一企業更具韌性的生態體系。
![]()
沐曦股份主要產品分類,來源:沐曦股份公司官網,愛建證券研究所
同理,除了上述所謂國產AI芯片的新勢力外,以海光信息為代表的“老牌國家隊”則展現出一種更為成熟的破局邏輯,即在保持底層自主可控的同時,最大限度兼容主流軟件與開發范式,通過與大量ISV的協同,降低生態遷移成本。而這類“兼容主流、逐步替代”的路徑,可能在中長期內為國產算力提供緩沖空間。
除上述之外,中國此前通過DeepSeek在算法層面展現出的“以小博大”的能力,則是彌補我們算力代差的最后變量。當硬件TPP落后時,通過極致的算法重構(如MoE、MLA優化)來提升存量算力的利用效率,是中國AI算力通往“DeepSeek時刻”的關鍵。
由此可見,未來的希望不在于某一家企業超越英偉達,必須是全產業鏈的共同努力,即在老牌國家隊的生態托底、新勢力的技術突圍以及模型廠商的算法優化下,共同構建一個不被外部定義和具備產業韌性的自主AI算力生態體系。
寫在最后:綜上,我們認為,美國是否階段性放松H200 的出口限制,并不足以從根本上改變中美AI算力競爭格局,而中國是否采購H200,也難以單獨決定自身AI發展的長期方向。真正關鍵的,并非某一代芯片的得失,而在于能否持續構建一個高效、開放且具備自我演進能力的算力體系。
從這個角度看,H200更像是一面鏡子,既映射出中美在AI算力上的現實位置,也提醒我們結構性差距的來源所在。算力競賽并非短跑,其結果取決于誰能更有效地整合技術、產業與生態資源,并在長期不確定環境中保持系統韌性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.