所有人都在說大模型牛,那支撐大模型跑起來的根兒到底是什么?
是芯片,
更準(zhǔn)確說,是一整條環(huán)環(huán)相扣、卡脖子卡到你懷疑人生的AI半導(dǎo)體價值鏈。
![]()
整個AI半導(dǎo)體產(chǎn)業(yè)鏈,就是全球化分工+寡頭壟斷。
每個核心環(huán)節(jié)就那么兩三家公司說了算,缺一個環(huán)節(jié)整個產(chǎn)業(yè)都停擺;
現(xiàn)在產(chǎn)業(yè)鏈的重心已經(jīng)從「大模型訓(xùn)練」往「推理」跑,未來十年推理市場才是真正的主戰(zhàn)場;
最后,邊緣AI肯定來,只是時間問題,去中心化是計算產(chǎn)業(yè)逃不開的規(guī)律。
1. 上游設(shè)計:AI芯片的靈魂,卡設(shè)計的不是芯片廠,是工具廠
設(shè)計環(huán)節(jié)是AI芯片的起點,決定了這塊芯片「能做什么、能做多好」,整個環(huán)節(jié)分成三層,每層都有寡頭拿捏著。
第一層是協(xié)同設(shè)計的「橋梁玩家」,代表就是博通、美滿電子。
很多人不知道它們,覺得它們不做AI主芯片就沒存在感,其實不對——AI服務(wù)器里,算力、存儲、網(wǎng)絡(luò)要連起來,就得靠它們做高速接口、互聯(lián)芯片、存儲控制器,這些配套做不好,你堆再多GPU也跑不快,整個AI集群的性能上限就是它們定的。
第二層就是大家熟悉的AI芯片設(shè)計商,既有英偉達(dá)、AMD、英特爾這種傳統(tǒng)巨頭,也有谷歌、亞馬遜、微軟這些云廠親自下場自研。
這個格局怎么來的?
很簡單,AI時代芯片必須和大模型、云服務(wù)綁在一起玩,傳統(tǒng)巨頭靠架構(gòu)能力壟斷了通用算力,云廠為什么要自己做?還不是不想被英偉達(dá)卡脖子,軟硬一起優(yōu)化能直接降算力成本,把自己大模型和云服務(wù)的命脈捏在自己手里。
第三層就是絕大多數(shù)人都沒聽過,但卻是最底層的「卡脖子門檻」:
EDA工具和IP核,相當(dāng)于芯片設(shè)計的「水電煤」,沒有它們,你連先進(jìn)制程芯片的圖都畫不出來。
EDA現(xiàn)在就是新思(synopsys)、楷登(cadence)、西門子(mentor)三家壟斷,從前端設(shè)計、仿真到后端布線,全流程全包,你想用別家的都沒得用,3nm、2nm芯片離開EDA根本做不出來。
IP核就是現(xiàn)成的芯片模塊化內(nèi)核,現(xiàn)在ARM就是絕對老大,低功耗適配性又好,不管是手機還是邊緣AI芯片,基本都用ARM的,芯片廠拿過來改改就能用,快得很。
2. 中游制造:AI芯片的肉身,這才是壁壘最高的「算力工廠」
設(shè)計畫好了餅,能不能做出來,全看制造。整個制造環(huán)節(jié)是全球技術(shù)壁壘最高的產(chǎn)業(yè),缺一個零件都不行,我們一層一層說。
![]()
半導(dǎo)體制造核心設(shè)備廠商分布圖
首先是制造的「工業(yè)母機」:晶圓制造設(shè)備,四大核心品類全是寡頭壟斷:
光刻:ASML一家獨大,EUV光刻機是3nm以下制程唯一能用的,說它卡了全AI產(chǎn)業(yè)的脖子一點不夸張
刻蝕沉積:泛林、東京電子、應(yīng)用材料三家說了算,一個雕芯片結(jié)構(gòu),一個鋪材料,制程精度全看它們
檢測:KLA一家獨大,生產(chǎn)過程中找缺陷,控良率全靠它
然后就是晶圓代工,臺積電、三星、英特爾三家,臺積電直接壟斷了全球90%以上的先進(jìn)制程代工,現(xiàn)在英偉達(dá)H100、AMD的MI300、谷歌云廠商的高端AI芯片,全在臺積電產(chǎn),臺積電的產(chǎn)能,直接決定了全球高端AI算力能供多少貨,承上啟下的核心就是它。
接下來很多人以前忽略的環(huán)節(jié):先進(jìn)封裝,現(xiàn)在已經(jīng)從配角變成了核心卡點。
以前封裝就是給芯片套個殼保護一下,現(xiàn)在不一樣了,AI芯片要堆算力,單芯片做不下了,就得用臺積電CoWoS這種先進(jìn)封裝,用芯粒堆疊的方式把多塊芯片拼在一起,算力密度和帶寬直接往上翻。之前英偉達(dá)H100交付跟不上,就是因為臺積電CoWoS產(chǎn)能不夠,你說這個環(huán)節(jié)重要不重要?
最后就是那些隱形的配套:材料、測試設(shè)備,材料是信越、SUMCO這些廠商壟斷,測試是愛德萬、泰瑞達(dá)雙寡頭,缺了哪個,芯片都量不了產(chǎn)。
3. 下游終端:算力最終交付,現(xiàn)在重心已經(jīng)變了
芯片做出來了,最終就是賣給不同場景用,現(xiàn)在整個市場已經(jīng)從訓(xùn)練往推理轉(zhuǎn),格局完全變了,我們分三類說。
第一類:通用GPU和ASIC,現(xiàn)在訓(xùn)練和通用推理的絕對主力,這個賽道就是英偉達(dá)的天下,H100/H200幾乎壟斷,你知道嗎?英偉達(dá)數(shù)據(jù)中心40%的收入已經(jīng)來自AI推理了,它不止吃訓(xùn)練的飯,推理市場它已經(jīng)是老大了。
現(xiàn)在最能打的對手就是AMD,MI300X顯存更大,大批次推理吞吐量更高,大小批次場景成本都更優(yōu),目標(biāo)就是今年干到50億美元AI營收,盯著的就是推理這塊大蛋糕。
而且說個實話,英偉達(dá)的壁壘真不是只靠GPU硬件,CUDA生態(tài)、NVLink高速互聯(lián)、整套系統(tǒng)解決方案,這才是別人很難抄走的,新手玩家想直接硬剛真的很難。
第二類:推理專用芯片,這是現(xiàn)在AI產(chǎn)業(yè)鏈最火的新戰(zhàn)場,一堆初創(chuàng)公司拿著融資往里沖,比如Tenstorrent、Groq這些。
![]()
為什么這么火?
因為生成式AI要落地賺錢,最大的瓶頸就是推理成本——你大模型能不能賺錢,就看單次推理花多少錢、延遲有多高。
這些專用芯片就是沖著這個來的,專門針對推理做架構(gòu),在特定場景下,能效比比通用GPU高很多,成本也更低,靠性價比搶市場。
但難點也很明顯,英偉達(dá)的生態(tài)墻擺在那,云廠商自己也做自研芯片,這些初創(chuàng)公司只能扎進(jìn)細(xì)分場景,做出來絕對的成本優(yōu)勢才能活下來。
第三類:邊緣AI芯片,這是未來最大的增量市場,也是AI的去中心化革命。
現(xiàn)在核心玩家既有蘋果、高通、谷歌這種消費電子巨頭,也有英偉達(dá)、英特爾,還有一堆初創(chuàng)公司。
邊緣推理其實是雙贏:把推理放到用戶終端跑,企業(yè)不用花那么多錢建數(shù)據(jù)中心,省了大把成本;用戶用起來延遲更低,數(shù)據(jù)也不用上傳,隱私更好。
![]()
現(xiàn)在這個事的可行性越來越高了,小語言模型的能力越來越強,比如o1-mini,跑在終端完全夠用。
其實計算產(chǎn)業(yè)發(fā)展從來都是這個規(guī)律:大型機干掉大型機,然后小型機起來,然后PC,然后智能手機,都是高端算力解決了大部分人不需要的問題,最后就會往輕量化、去中心化走。
等哪天大模型能力「夠用了」,小模型+終端NPU成熟了,邊緣AI直接就起來了,消費電子會是最大的落地場景,整個價值鏈都會被重構(gòu)。
4. 講透核心邏輯:未來AI半導(dǎo)體的變局在哪?
看完整個價值鏈,我們總結(jié)四個核心規(guī)律,你搞懂了就能看懂未來AI產(chǎn)業(yè)的走向:
第一,全球化分工+寡頭壟斷是永遠(yuǎn)的特征,每個核心環(huán)節(jié)就那么兩三家說了算,斷一個環(huán)節(jié)整個產(chǎn)業(yè)鏈都要地震,這就是為什么各國都在搶產(chǎn)業(yè)鏈核心話語權(quán),根本不是為了面子,是為了不被卡脖子。
第二,重心已經(jīng)從訓(xùn)練轉(zhuǎn)向推理了,過去幾年大家都搶著訓(xùn)大模型,把英偉達(dá)捧上了天,未來大模型都落地了,推理的算力需求會是訓(xùn)練的幾十倍,絕對是未來十年的主戰(zhàn)場。甚至那些原來訓(xùn)模型的高端硬件,升級之后都會轉(zhuǎn)去做推理,這個市場只會越來越大。
第三,競爭核心從單芯片參數(shù),變成了全棧生態(tài)和總成本,你參數(shù)做得再好沒用,客戶最后算的是全生命周期的總成本和好不好用。英偉達(dá)的領(lǐng)先從來不是只堆參數(shù),是整套方案給你準(zhǔn)備好了,別人要搶市場,就得先過生態(tài)這關(guān)。
第四,邊緣AI不是會不會來,是什么時候來,等小模型夠用,終端算力跟得上,AI肯定從全集中在云端,變成「云端+邊緣」分布式,那時候原來的價值分配就變了,終端廠商和邊緣芯片公司話語權(quán)會大很多。
5. 最后說句實在的
AI半導(dǎo)體價值鏈,就是整個AI產(chǎn)業(yè)的底層權(quán)力地圖,現(xiàn)在AI剛從技術(shù)突破往規(guī)模化商用走,每個環(huán)節(jié)都在洗牌。
不管是巨頭堆生態(tài),還是初創(chuàng)公司玩架構(gòu)創(chuàng)新,最后都繞不開「更高性能、更低成本」這個核心命題。誰能捏住核心環(huán)節(jié)的技術(shù)壁壘,給客戶掏出真金白銀的成本優(yōu)勢,誰就能在這場算力軍備競賽里,站到最后。
作為普通人,你記住這幾個方向就夠了:推理是下一個風(fēng)口,邊緣AI是未來十年的大增量,產(chǎn)業(yè)鏈自主可控是長期確定性方向,跟著這個方向走,踩坑的概率會小很多。
參考:
https://www.zionmarketresearch.com/report/edge-artificial-intelligence-chips-market
https://iot-analytics.com/leading-generative-ai-companies/
https://www.generativevalue.com/p/the-inference-landscape
文章來源于 歪睿老哥 ,作者 歪睿老哥
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.