英偉達再次交出了超預期的財報,但定義下一階段預期的關鍵變量,懸念保留到了3月中旬的GTC 2026峰會。下一代AI芯片路線圖、Groq技術資產整合,以及與中國市場合作邊界,關系到英偉達下一階段的轉型之路。
英偉達還是那個英偉達。超預期本身已被市場預期。老黃很善于整這個。四季度,公司營收681億美元,顯著超越華爾街預期的662億美元;對下一季度的營收指引為780億美元,同樣顯著超越預期。新一代Blackwell架構芯片產能持續爬坡,推動公司數據中心業務增長75%,超過公司整體營收增速,公司毛利率也回升至75.2%。
![]()
英偉達市場地位再次得到鞏固。當打的Blackwell芯片,已經部署了至少9GW(吉瓦)。相比傳統分散部署的GPU集群,GB300 NVL72這種高度集成、系統級設計的方案,每瓦性能提升了50倍,每token成本降低了35倍;近四個月內,對CUDA軟件持續優化,讓GB200 NVL72性能提升了5倍。黃仁勛證實,OpenAI最新的GPT-5.3-Codex,正是GB NVL72系統訓練的。這開啟了Agentic AI時代,強化了“算力即收入”敘事。
財報發布后,英偉達股價一度上漲4%,但隨著電話會的進行,英偉達股價漲幅收窄。對于下一階段的布局,黃仁勛賣足了關子,要留到GTC大會;而對中國市場的前景,黃仁勛依舊語焉不詳。
開放競爭
在迎來超預期財報的同時,英偉達也迎來了更強的挑戰。在電話會議上,黃仁勛好幾次提到與Meta的合作,有種與AMD隔空較勁的意味。AMD剛從Meta手里簽下一項跨年、跨代的算力訂單,與上次綁定OpenAI一樣,以約占當前10%的股權,換取多達6GW的訂單。它們也是英偉達的大客戶。在年初的CES上,蘇姿豐宣布下半年推出MI455,對抗Rubin平臺,2027年上市的MI500硬剛英偉達下一代Feyman架構。
如果只看算力性能,也許同期的英偉達芯片,都要超過競爭對手。但是,AI已經進入推理時代,不同應用場景需要針對不同約束條件優化;模型廠商正在尋找新的技術路徑,也將改變芯片適配市場格局。
這正是過去一年英偉達GPU敘事出現松動的底層原因。谷歌TPU越來越能打,吸引了OpenAI與Anthropic。近期,前谷歌TPU資深工程師創立的MatX,融資5億美元。英偉達剛收購前谷歌TPU資深工程師創立的Groq,市場非常想知道,黃仁勛將如何將其整合到自己的生態內。但Groq的人才并非全部被英偉達收入了囊中。Groq前高管創立的Positron,號稱能讓每瓦效能達到Rubin架構的5倍;還有不少Groq工程師流向了同樣側重內存架構創新的d-Matrix。
英偉達的風險敞口已經擴大。在這次電話會議上,黃仁勛沒說的是,用英偉達芯片訓練出來的GPT-5.3-Codex,在推出之后一周,OpenAI就上線了更輕量版的Codex-Spark。后者是這家AI巨頭首個運行在英偉達競爭對手Cerebras芯片上的模型,響應速度更快,達到1000token/秒。這將為Cerebras芯片支持OpenAI未來的模型做好準備。Cerebras創始人Andrew Feldman稱,Codex-Spark是為實時軟件開發而打造的,在編程領域,響應速度本身就是產品。也許他也可以模仿黃仁勛的口吻說,“速度即收入”。
此外,推理并行、智能體并行等等已經出現的新趨勢,或仍藏在實驗室或論文里的新嘗試,都會改變推理負載結構,從單純的解碼吞吐,轉向更強調內存管理、緩存復用與系統調度能力。這種變化,正在對AI推理芯片的設計重點提出新的要求。
而且,隨著AI推理逐步落地,vLLM和SGLang等主流大模型推理庫逐步支持谷歌TPU、亞馬遜Trainium,以及AMD的MI系列芯片。更關鍵的是,這些開源推理引擎和模型,正在逐漸抽象底層硬件差異,開發者不必基于GPU底層編程,可能壓縮英偉達GPU在開發入口層面的CUDA生態溢價。
在電話會議上,Melius Research的Ben Reitzes很直接地提問,英偉達75%的毛利率是否能夠長期保持下去。黃仁勛的回答是,“如果能向客戶交付代際性能飛躍的話”。英偉達想要維持75%以上的毛利率,就意味著售價必須是成本(COGS)的4倍。而客戶的自研芯片,想讓TCO(總擁有成本)低于英偉達的GPU,事實上并不需要追平英偉達芯片的性能,畢竟,它可以只為此支付成本價;推理時代的規模效應,使這種成本攤銷更具現實基礎。
無疑,英偉達正在推動自身轉型。這包括推出Triton推理服務器與KV緩存調度等工具,將競爭重心從編程接口,延伸至系統級性能與部署效率。KV緩存調度,有助于避免重復生成KV緩存,減少推理成本開銷。英偉達也計劃推出新的推理定制芯片CPX。此外,在年初的CES上,黃仁勛還介紹過,Rubin架構芯片將引入全新的內存存儲平臺,實現推理上下文在十億級規模下的擴展。
在電話會議上,黃仁勛稱,首批Vera Rubin樣品已經發給客戶驗證,有望下半年量產出貨。但無論是Vera CPU,還是Rubin GPU,更多細節會在3月16日的GTC 2026上揭曉;也許,還會有Feynman架構。
同樣的,多位分析師追問了數次,英偉達將如何整合近期收購的Groq,都被黃仁勛“我有一些很棒的想法”,“你來GTC大會就知道了”擋了回來。市場期待,就像英偉達收購Mellanox那樣,最終Groq的技術資產也將擴展英偉達的生態。最近一個財年,英偉達網絡業務營收超310億美元,是收購整合Mellanox技術資產當年的10倍以上。
開源生態
如果說,市場還可以等待三周后的GTC 2026,英偉達最終仍將通過產品和戰略回應市場預期,那么中國市場的預期,則并非英偉達自身可以控制的變量。
在電話會議上,英偉達確認,雖然美國政府批準了向中國客戶提供少量H200產品,但尚未產生任何收入,相關產品是否最終能夠順利進入中國市場仍存在不確定性。公司在最新指引中依然未計入來自中國數據中心業務的潛在收入,只是表態稱,在倡導美國在全球競爭的能力基礎上,“我們將繼續與美國和中國政府接觸”。
今年1月,在美國商務部放寬了對華出口H200芯片的限制后,英偉達在中國市場的命運,又交到了美國國務院、國防部和能源部的手中。15日,美國商務部工業與安全局(BIS)發布最終規則(Final rule,編號2026-00789),將特定先進AI芯片對華出口從“推定拒絕”,修改為滿足合規條件下的“逐案審查”。21日,美國眾議院通過《AI守望法案》(AI OverWatch Act),要求國會向審查導彈出口那樣,審查先進AI芯片的出口許可證。
最新BIS的合規要求包括:證明這些芯片不會擠占美國客戶現在與未來的產能;出口數量不超過美國出貨的一定比例;H200芯片在離境前必須經由符合資質的第三方查驗;執行嚴格的“了解你的客戶”(KYC)程序,篩查并防止未經授權的遠程訪問;申請人必須掌握部署于中國境內H200的任何預期(intended)的最終用戶,以排除“推定拒絕”實體,或敏感用途;基于H200芯片訓練的模型權重與算法,無法被“推定拒絕”實體或“未披露主體”或敏感用途訪問。
![]()
在這一監管框架下,開源模型廠商若使用H200進行訓練,將面臨非常高的合規不確定性。因為一旦模型權重公開,申請人難以證明其不會被受限實體獲取或遠程訪問。各類“推定拒絕”實體名單的最終審核,也涉及美國政府間多個部門。路透社報道稱,中國客戶暫未向英偉達下達H200芯片的訂單。美國商務部官員在國會聽證會上證實,截至24日,H200銷售記錄為零。
在電話會議上,英偉達對這一結果的表述為,“我們在中國的競爭對手,在近期IPO的支持下取得了進展,從長遠來看,有潛力顛覆全球AI產業的結構。”這句話的意思,不僅僅是英偉達的收入在中國清零,而是對長期的全球競爭力的擔憂。
開源模型已經成為AI生態的關鍵力量。行業分析師Dylan Patel認為,當中國無法再使用英偉達AI芯片時,開源模型就不會再針對CUDA架構優化,轉而優先適配國產AI芯片,這不僅會削弱英偉達的護城河,更會讓中國形成獨立的協同生態。而當這個中國主導的生態成熟后,就會進一步擴展到全球市場。這才是英偉達最核心的顧慮。
這一顧慮正在成為現實。據路透社稱,對于即將更新的DeepSeek-V4,英偉達和AMD并未如常提前獲得訪問權限,而多家中國AI芯片廠商已經提前數周參與適配。
英偉達的GTC,曾經是全球AI生態的交匯點。在ChatGPT尚未發布的時候,DeepSeek就站在GTC的舞臺上演講,連續三屆,成為這一生態的重要參與者,直至去年首次缺席。
三周之后,GTC的舞臺仍將熱鬧,然而,市場將從對Rubin與Groq的披露中收獲更多信心,還是對全球AI生態分化趨勢的重新評估,仍有待揭曉。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.