網易首頁 > 網易號 > 正文申請入駐

黃仁勛要把Groq驚喜留到GTC，但DeepSeek缺席會是驚嚇

2026-02-26 22:48:59　來源: 未盡研究

上海舉報

分享至

英偉達再次交出了超預期的財報，但定義下一階段預期的關鍵變量，懸念保留到了3月中旬的GTC 2026峰會。下一代AI芯片路線圖、Groq技術資產整合，以及與中國市場合作邊界，關系到英偉達下一階段的轉型之路。

英偉達還是那個英偉達。超預期本身已被市場預期。老黃很善于整這個。四季度，公司營收681億美元，顯著超越華爾街預期的662億美元；對下一季度的營收指引為780億美元，同樣顯著超越預期。新一代Blackwell架構芯片產能持續爬坡，推動公司數據中心業務增長75%，超過公司整體營收增速，公司毛利率也回升至75.2%。

英偉達市場地位再次得到鞏固。當打的Blackwell芯片，已經部署了至少9GW（吉瓦）。相比傳統分散部署的GPU集群，GB300 NVL72這種高度集成、系統級設計的方案，每瓦性能提升了50倍，每token成本降低了35倍；近四個月內，對CUDA軟件持續優化，讓GB200 NVL72性能提升了5倍。黃仁勛證實，OpenAI最新的GPT-5.3-Codex，正是GB NVL72系統訓練的。這開啟了Agentic AI時代，強化了“算力即收入”敘事。

財報發布后，英偉達股價一度上漲4%，但隨著電話會的進行，英偉達股價漲幅收窄。對于下一階段的布局，黃仁勛賣足了關子，要留到GTC大會；而對中國市場的前景，黃仁勛依舊語焉不詳。

開放競爭

在迎來超預期財報的同時，英偉達也迎來了更強的挑戰。在電話會議上，黃仁勛好幾次提到與Meta的合作，有種與AMD隔空較勁的意味。AMD剛從Meta手里簽下一項跨年、跨代的算力訂單，與上次綁定OpenAI一樣，以約占當前10%的股權，換取多達6GW的訂單。它們也是英偉達的大客戶。在年初的CES上，蘇姿豐宣布下半年推出MI455，對抗Rubin平臺，2027年上市的MI500硬剛英偉達下一代Feyman架構。

如果只看算力性能，也許同期的英偉達芯片，都要超過競爭對手。但是，AI已經進入推理時代，不同應用場景需要針對不同約束條件優化；模型廠商正在尋找新的技術路徑，也將改變芯片適配市場格局。

這正是過去一年英偉達GPU敘事出現松動的底層原因。谷歌TPU越來越能打，吸引了OpenAI與Anthropic。近期，前谷歌TPU資深工程師創立的MatX，融資5億美元。英偉達剛收購前谷歌TPU資深工程師創立的Groq，市場非常想知道，黃仁勛將如何將其整合到自己的生態內。但Groq的人才并非全部被英偉達收入了囊中。Groq前高管創立的Positron，號稱能讓每瓦效能達到Rubin架構的5倍；還有不少Groq工程師流向了同樣側重內存架構創新的d-Matrix。

英偉達的風險敞口已經擴大。在這次電話會議上，黃仁勛沒說的是，用英偉達芯片訓練出來的GPT-5.3-Codex，在推出之后一周，OpenAI就上線了更輕量版的Codex-Spark。后者是這家AI巨頭首個運行在英偉達競爭對手Cerebras芯片上的模型，響應速度更快，達到1000token/秒。這將為Cerebras芯片支持OpenAI未來的模型做好準備。Cerebras創始人Andrew Feldman稱，Codex-Spark是為實時軟件開發而打造的，在編程領域，響應速度本身就是產品。也許他也可以模仿黃仁勛的口吻說，“速度即收入”。

此外，推理并行、智能體并行等等已經出現的新趨勢，或仍藏在實驗室或論文里的新嘗試，都會改變推理負載結構，從單純的解碼吞吐，轉向更強調內存管理、緩存復用與系統調度能力。這種變化，正在對AI推理芯片的設計重點提出新的要求。

而且，隨著AI推理逐步落地，vLLM和SGLang等主流大模型推理庫逐步支持谷歌TPU、亞馬遜Trainium，以及AMD的MI系列芯片。更關鍵的是，這些開源推理引擎和模型，正在逐漸抽象底層硬件差異，開發者不必基于GPU底層編程，可能壓縮英偉達GPU在開發入口層面的CUDA生態溢價。

在電話會議上，Melius Research的Ben Reitzes很直接地提問，英偉達75%的毛利率是否能夠長期保持下去。黃仁勛的回答是，“如果能向客戶交付代際性能飛躍的話”。英偉達想要維持75%以上的毛利率，就意味著售價必須是成本（COGS）的4倍。而客戶的自研芯片，想讓TCO（總擁有成本）低于英偉達的GPU，事實上并不需要追平英偉達芯片的性能，畢竟，它可以只為此支付成本價；推理時代的規模效應，使這種成本攤銷更具現實基礎。

無疑，英偉達正在推動自身轉型。這包括推出Triton推理服務器與KV緩存調度等工具，將競爭重心從編程接口，延伸至系統級性能與部署效率。KV緩存調度，有助于避免重復生成KV緩存，減少推理成本開銷。英偉達也計劃推出新的推理定制芯片CPX。此外，在年初的CES上，黃仁勛還介紹過，Rubin架構芯片將引入全新的內存存儲平臺，實現推理上下文在十億級規模下的擴展。

在電話會議上，黃仁勛稱，首批Vera Rubin樣品已經發給客戶驗證，有望下半年量產出貨。但無論是Vera CPU，還是Rubin GPU，更多細節會在3月16日的GTC 2026上揭曉；也許，還會有Feynman架構。

同樣的，多位分析師追問了數次，英偉達將如何整合近期收購的Groq，都被黃仁勛“我有一些很棒的想法”，“你來GTC大會就知道了”擋了回來。市場期待，就像英偉達收購Mellanox那樣，最終Groq的技術資產也將擴展英偉達的生態。最近一個財年，英偉達網絡業務營收超310億美元，是收購整合Mellanox技術資產當年的10倍以上。

開源生態

如果說，市場還可以等待三周后的GTC 2026，英偉達最終仍將通過產品和戰略回應市場預期，那么中國市場的預期，則并非英偉達自身可以控制的變量。

在電話會議上，英偉達確認，雖然美國政府批準了向中國客戶提供少量H200產品，但尚未產生任何收入，相關產品是否最終能夠順利進入中國市場仍存在不確定性。公司在最新指引中依然未計入來自中國數據中心業務的潛在收入，只是表態稱，在倡導美國在全球競爭的能力基礎上，“我們將繼續與美國和中國政府接觸”。

今年1月，在美國商務部放寬了對華出口H200芯片的限制后，英偉達在中國市場的命運，又交到了美國國務院、國防部和能源部的手中。15日，美國商務部工業與安全局（BIS）發布最終規則（Final rule，編號2026-00789），將特定先進AI芯片對華出口從“推定拒絕”，修改為滿足合規條件下的“逐案審查”。21日，美國眾議院通過《AI守望法案》（AI OverWatch Act），要求國會向審查導彈出口那樣，審查先進AI芯片的出口許可證。

最新BIS的合規要求包括：證明這些芯片不會擠占美國客戶現在與未來的產能；出口數量不超過美國出貨的一定比例；H200芯片在離境前必須經由符合資質的第三方查驗；執行嚴格的“了解你的客戶”（KYC）程序，篩查并防止未經授權的遠程訪問；申請人必須掌握部署于中國境內H200的任何預期（intended）的最終用戶，以排除“推定拒絕”實體，或敏感用途；基于H200芯片訓練的模型權重與算法，無法被“推定拒絕”實體或“未披露主體”或敏感用途訪問。

在這一監管框架下，開源模型廠商若使用H200進行訓練，將面臨非常高的合規不確定性。因為一旦模型權重公開，申請人難以證明其不會被受限實體獲取或遠程訪問。各類“推定拒絕”實體名單的最終審核，也涉及美國政府間多個部門。路透社報道稱，中國客戶暫未向英偉達下達H200芯片的訂單。美國商務部官員在國會聽證會上證實，截至24日，H200銷售記錄為零。

在電話會議上，英偉達對這一結果的表述為，“我們在中國的競爭對手，在近期IPO的支持下取得了進展，從長遠來看，有潛力顛覆全球AI產業的結構。”這句話的意思，不僅僅是英偉達的收入在中國清零，而是對長期的全球競爭力的擔憂。

開源模型已經成為AI生態的關鍵力量。行業分析師Dylan Patel認為，當中國無法再使用英偉達AI芯片時，開源模型就不會再針對CUDA架構優化，轉而優先適配國產AI芯片，這不僅會削弱英偉達的護城河，更會讓中國形成獨立的協同生態。而當這個中國主導的生態成熟后，就會進一步擴展到全球市場。這才是英偉達最核心的顧慮。

這一顧慮正在成為現實。據路透社稱，對于即將更新的DeepSeek-V4，英偉達和AMD并未如常提前獲得訪問權限，而多家中國AI芯片廠商已經提前數周參與適配。

英偉達的GTC，曾經是全球AI生態的交匯點。在ChatGPT尚未發布的時候，DeepSeek就站在GTC的舞臺上演講，連續三屆，成為這一生態的重要參與者，直至去年首次缺席。

三周之后，GTC的舞臺仍將熱鬧，然而，市場將從對Rubin與Groq的披露中收獲更多信心，還是對全球AI生態分化趨勢的重新評估，仍有待揭曉。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.