生成式AI的爆炸式普及正在重塑整個半導(dǎo)體行業(yè)的競爭格局。AI芯片市場的核心戰(zhàn)場,正從模型訓(xùn)練階段向推理階段發(fā)生結(jié)構(gòu)性遷移——這一轉(zhuǎn)變不僅關(guān)乎芯片設(shè)計優(yōu)先級,更將深刻影響基礎(chǔ)設(shè)施投資邏輯、商業(yè)模式以及半導(dǎo)體供應(yīng)鏈的長期走向。
推理需求的激增已有明確信號。吉卜力風(fēng)格圖像生成等病毒式應(yīng)用場景的爆發(fā),令OpenAI的GPU資源陷入全面飽和。OpenAI首席執(zhí)行官Sam Altman公開表示,從未見過如此快速的用量增長,GPT-4.5因此不得不分階段發(fā)布,初期僅向付費用戶開放。Meta等AI頭部企業(yè)同樣面臨類似的算力瓶頸。與此同時,OpenAI正自主研發(fā)AI芯片,目標(biāo)是在2026年前后實現(xiàn)量產(chǎn),以降低對英偉達(dá)的依賴;其與微軟聯(lián)合推進(jìn)的"星際之門"超級數(shù)據(jù)中心項目,據(jù)報道涉及高達(dá)5000億美元的投資規(guī)模。
這一系列動向表明,AI推理正在成為與數(shù)據(jù)中心、云基礎(chǔ)設(shè)施、半導(dǎo)體并列的戰(zhàn)略支柱。對投資者而言,這意味著AI算力投資的價值重心正在發(fā)生位移:訓(xùn)練芯片代表一次性資本開支,而推理芯片則對應(yīng)持續(xù)性的收入消耗模型——AI正從技術(shù)工具演變?yōu)榘戳坑嬞M的算力引擎。
![]()
訓(xùn)練與推理:兩種截然不同的算力需求
理解這場結(jié)構(gòu)性轉(zhuǎn)變,需要首先厘清訓(xùn)練與推理在工作負(fù)載上的本質(zhì)差異。
訓(xùn)練階段以Google 2017年發(fā)布的Transformer架構(gòu)為基礎(chǔ),要求對海量數(shù)據(jù)集進(jìn)行前向與反向傳播,持續(xù)更新模型權(quán)重,涉及極大規(guī)模的矩陣運算、梯度計算與參數(shù)更新,通常需要在多GPU或TPU集群上進(jìn)行數(shù)周乃至數(shù)月的分布式計算。訓(xùn)練芯片因此必須具備高密度計算核心、大容量高帶寬內(nèi)存(如HBM)以及多芯片橫向擴展能力。
推理階段則在結(jié)構(gòu)上更為簡潔:僅需前向傳播,無需梯度更新或反向傳播,所需算力通常比訓(xùn)練低一個數(shù)量級。然而,推理的真正挑戰(zhàn)在于三重約束——低延遲(用戶期待即時響應(yīng))、高吞吐(服務(wù)商須處理海量并發(fā)查詢)、低成本(每次查詢的單位成本直接影響商業(yè)可行性)。這些需求與訓(xùn)練階段"不計延遲、追求極致性能"的邏輯截然相反,也決定了推理芯片在架構(gòu)設(shè)計上必須走向差異化路徑:能效優(yōu)先、數(shù)據(jù)移動優(yōu)化、內(nèi)存層級與帶寬利用率最大化,以及硬件與軟件的協(xié)同優(yōu)化。
![]()
超大規(guī)模云廠商與初創(chuàng)企業(yè)加速布局推理芯片
正是基于上述架構(gòu)差異,越來越多的企業(yè)選擇繞開英偉達(dá)在訓(xùn)練GPU市場的正面競爭,轉(zhuǎn)而構(gòu)建專為推理優(yōu)化的定制芯片。
超大規(guī)模云廠商方面,谷歌推出TPU(訓(xùn)練)與Edge TPU(邊緣推理),亞馬遜部署Inferentia與Trainium,Meta開發(fā)MTIA(Meta Training and Inference Accelerator)。初創(chuàng)企業(yè)陣營同樣活躍,Groq、Tenstorrent、Cerebras、SambaNova等公司均在數(shù)據(jù)流架構(gòu)、芯片面積分配、功耗效率、內(nèi)存訪問模式及計算核心設(shè)計等維度上尋求差異化突破,目標(biāo)直指在推理效率與成本結(jié)構(gòu)上超越通用GPU。
這一競爭格局的形成,與AI應(yīng)用場景的演進(jìn)密切相關(guān)。隨著AI從簡單問答向智能體系統(tǒng)(Agentic AI)演進(jìn)——能夠規(guī)劃任務(wù)、執(zhí)行工作流、調(diào)用工具乃至替代部分人工勞動——推理需求將不僅持續(xù)增長,更將加速擴張。智能體系統(tǒng)對低延遲、高內(nèi)存帶寬和持續(xù)算力的要求,將進(jìn)一步推動推理專用芯片的戰(zhàn)略價值提升。
英偉達(dá):從訓(xùn)練時代領(lǐng)導(dǎo)者向推理時代規(guī)則制定者轉(zhuǎn)型
面對這場結(jié)構(gòu)性轉(zhuǎn)變,英偉達(dá)并非被動應(yīng)對,而是主動擴張其在推理市場的布局。
其最新架構(gòu)Blackwell的核心設(shè)計目標(biāo),正是在提升吞吐量的同時降低每個token的生成成本。這一邏輯構(gòu)成了一個正向飛輪:成本下降→使用量增加→需求擴大→基礎(chǔ)設(shè)施規(guī)模提升,從而驅(qū)動AI經(jīng)濟的指數(shù)級增長。在系統(tǒng)層面,英偉達(dá)通過NVL72等大規(guī)模緊密集成GPU集群,構(gòu)建能夠處理更長上下文窗口、更復(fù)雜推理任務(wù)和多步驟AI工作流的"AI工廠"架構(gòu),推動AI基礎(chǔ)設(shè)施向集中化、高密度、系統(tǒng)驅(qū)動方向演進(jìn)。
然而,英偉達(dá)真正的護(hù)城河并不僅僅在于硬件。從CUDA到TensorRT-LLM及推理優(yōu)化軟件棧,英偉達(dá)正將自身從芯片供應(yīng)商轉(zhuǎn)型為全棧AI基礎(chǔ)設(shè)施提供商。微軟、甲骨文、CoreWeave等云服務(wù)商持續(xù)向這一架構(gòu)靠攏,進(jìn)一步強化了其生態(tài)系統(tǒng)的高轉(zhuǎn)換成本與行業(yè)標(biāo)準(zhǔn)化效應(yīng)。客戶購買的不再只是GPU,而是一整套AI工廠平臺。
盡管如此,推理市場的競爭烈度正在顯著上升。推理芯片已不再是訓(xùn)練GPU的次級選項,而是正在成為AI云服務(wù)、邊緣設(shè)備、嵌入式系統(tǒng)和實時應(yīng)用的主要算力引擎。在硬件演進(jìn)與應(yīng)用擴張的雙重驅(qū)動下,AI芯片競爭的核心命題正在發(fā)生根本轉(zhuǎn)變:從"誰能訓(xùn)練最大的模型",轉(zhuǎn)向"誰能以最高效率在規(guī)模化場景中運行模型"。
結(jié)構(gòu)性轉(zhuǎn)變重塑半導(dǎo)體產(chǎn)業(yè)競爭格局
這場從訓(xùn)練到推理的遷移,其影響已超越芯片設(shè)計本身,正在向AI系統(tǒng)架構(gòu)、商業(yè)部署策略和供應(yīng)鏈結(jié)構(gòu)三個維度深度滲透。
在商業(yè)模式層面,AI的經(jīng)濟邏輯正在發(fā)生根本性重構(gòu)。訓(xùn)練對應(yīng)資本開支,推理對應(yīng)持續(xù)性收入——算力正從技術(shù)指標(biāo)直接與營收掛鉤,GPU正從硬件設(shè)備演變?yōu)閠oken生成機器。這一范式轉(zhuǎn)變意味著,推理基礎(chǔ)設(shè)施的規(guī)模與效率,將直接決定AI企業(yè)的盈利能力與競爭壁壘。
在供應(yīng)鏈層面,后訓(xùn)練時代的崛起——包括微調(diào)、LoRA、適配器等技術(shù)的廣泛應(yīng)用,以及動態(tài)提示結(jié)構(gòu)調(diào)整、多模型協(xié)作等推理增強手段——正在大幅提升對推理算力的依賴程度,推動NPU、ASIC、FPGA等多元化推理硬件需求快速擴張。
對投資者而言,這場結(jié)構(gòu)性轉(zhuǎn)變提示了一個清晰的市場信號:AI基礎(chǔ)設(shè)施投資的價值重心正在從訓(xùn)練端向推理端遷移,能夠在推理效率、成本控制與規(guī)模化部署三個維度同時取得優(yōu)勢的企業(yè),將在下一階段的AI算力競爭中占據(jù)主動。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.