![]()
作者:趙雨潤(“商業潤點”商業洞察專欄主理人/新消費&AI投資人/企業家高管教練/香港大學營銷學客座講師)
![]()
在最近的GTC 2026大會上,黃仁勛發布了關于AI進入"推算"時代的重要演講,揭示了從訓練到推理的產業拐點。
在這篇文章中,我將提煉演講的三大主要內容:Token工廠經濟學、推理架構革命以及給創業者和職場人的具體啟示。
硅谷SAP中心,黃仁勛宣告了AI產業的根本轉折:過去都在瘋狂"造模型",現在開始真正"用模型"了。
英偉達創始人給出的數字震動全球——到2027年,僅英偉達旗艦算力芯片就能帶來至少1萬億美元收入。這不僅是數字飛躍,更是AI從實驗室到工業生產的標志性拐點。
為什么拐點發生在現在?
這個轉折由三個關鍵節點引爆。ChatGPT讓AI從理解到生成;O1模型帶來推理能力,讓AI能思考規劃;ClaudeCode這樣的智能體實現了質的突破——能讀文件、寫代碼、編譯測試。AI從工具變成了員工。
三步走下來,計算需求爆炸。黃仁勛透露:AI思考消耗的Token增加了1萬倍,使用量增長100倍,總計算需求則是100萬倍增長。
更關鍵的是算力結構變遷。根據斯坦福《2025年人工智能指數報告》:2023年訓練占70%,推理占30%;2025年訓練45%,推理55%;2026年達到訓練30%、推理70%的真正拐點;2028年推理占比將高達73%。
未來三年,每10美元AI算力投入中,有7美元花在推理上。這個結構性變化正在改寫整個芯片市場的競爭規則。
![]()
Token工廠經濟學:每瓦特Token數的商業革命
黃仁勛提出核心概念:"未來的數據中心是生產Token的工廠。" Token是AI生成的基本單位。
這套"Token工廠經濟學"的底層邏輯:數據中心受電力限制,1吉瓦工廠永遠不可能變成2吉瓦。在這個物理約束下,誰的每瓦特Token吞吐量最高,誰的生產成本最低。
黃仁勛將未來AI服務分為五個層級:免費獲客層、中級3-6美元/百萬Token層、高級6-15美元層、尊享45美元層、極致150美元研究層。
頂級研究服務,一個團隊每天消耗5000萬個Token,月成本超過20萬美元。但對前沿科研來說,這些Token帶來的突破價值遠超成本。
更值得關注的是,Token預算已經開始進入企業日常運營。
硅谷招人時,"這份工作附帶多少Token額度"已寫入offer。
未來每個工程師都需要年度Token預算,基礎薪水幾十萬美元,公司還要額外給相當于半個基礎薪水價值的Token,讓他們獲得10倍生產力提升。
Vera Rubin與Groq LPU:推理架構的雙輪驅動
硬件層面,黃仁勛發布了新一代AI計算系統Vera Rubin平臺。核心突破在于推理效率:相比上一代Blackwell,推理吞吐量/瓦特提升10倍,Token成本降至原來十分之一。
真正革命性的是與Groq團隊的整合。英偉達去年以200億美元收購Groq核心技術,推出了LPU推理專用芯片。
黃仁勛提出"非對稱分離推理"架構:海量計算的"預填充"交給Vera Rubin,延遲敏感的"解碼"交給Groq LPU。兩者結合后,特定工作負載推理吞吐量/功耗比可提升35倍。
Groq LPU內置230MB片上SRAM,帶寬80TB/s,首Token延遲低于0.1秒。這種架構讓AI實現1000 Token/秒以上的超高速生成,滿足實時交互需求。
創業者機會:推理時代的三大掘金方向
這個轉折點為創業者提供了前所未有的機會,我提煉出三個立即可行的方向。
第一,垂直場景AI優化服務。
以智能眼鏡為例,70%的人買后吃灰,核心是缺乏針對具體場景的深度優化。創業者可以做"廚電行業智能滲透率提升"服務,把AI眼鏡從擺設變成實用工具。
避坑:必須極度垂直,不做通用方案;提供端到端解決方案;充分考慮部署成本。
第二,邊緣計算推理部署。
AI正在走出云端,進入工廠、汽車、機器人。這些場景對延遲要求極高,云端推理行不通。
創業方向:提供"邊緣AI推理盒子",把大模型壓縮到本地設備運行。比如智能工廠質檢,傳統云端分析延遲幾百毫秒,本地設備可降到10毫秒以內。
避坑:看實際推理精度,不看壓縮率;重視功耗約束;針對具體行業做定制。
第三,AI成本監控與優化平臺。
隨著企業AI使用量激增,Token成本管理成為新痛點。很多公司發現AI應用的月開銷從幾萬飆升到幾十萬美元,卻不知錢花在哪。
創業方向:做"SaaS化AI成本監控平臺",幫企業實時追蹤Token消耗,識別異常使用,提供優化建議。
避坑:不只做數據展示,要做智能診斷;高度重視數據安全;不只服務大企業。
職場人士轉型:推理時代的生存法則
對于普通職場人,這場變革意味著需要掌握三項核心能力。
第一,算力成本意識。
需要知道不同模型的Token價格,了解如何通過批量處理、緩存優化來降低成本。
學習路徑:了解主流模型定價,學習"上下文窗口"、"輸出Token"等概念。建立成本監控習慣。
第二,模型部署與調優能力。
需要能把模型部署到生產環境,根據業務需求做調優。
學習路徑:掌握Docker容器化,學習Kubernetes管理,深入模型服務框架。
第三,數據-算力協同思維。
需要知道如何準備高質量訓練數據,如何設計高效推理流程,如何平衡精度和速度。
具體做法:學習數據預處理技術,了解模型量化原理,掌握推理優化技巧。
Token工廠的未來:從硅谷到千行百業
黃仁勛描繪了更宏大的圖景:AI工廠將滲透所有行業,每家工業公司都將變成機器人公司,每家SaaS公司都將變成智能體即服務公司。
這意味著AI推理不再只是屏幕代碼,而是進入物理世界,接管實時任務,承擔安全責任。從智能工廠質檢,到自動駕駛決策,再到醫療影像診斷,AI正在成為核心生產力。
對于小微創業者,這個轉折點提供了前所未有的機會。
不再需要訓練萬億參數大模型,而是專注于具體行業的推理優化,用黃仁勛的Token工廠思維,為企業提供降本增效的解決方案。
黃仁勛用一場技術革命告訴我們:延遲每降1毫秒,AI邊界就拓寬一公里;每瓦特Token吞吐量提升10倍,行業價值就翻10倍。
當延遲消失、成本降低、效率提升,AI時代才真正開始。
現在的問題是:你準備好跟上這場毫秒級的革命了嗎?
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.