每經(jīng)記者:涂穎浩 每經(jīng)編輯:陳旭
當(dāng)ChatGPT點(diǎn)燃的全球AI訓(xùn)練競(jìng)賽逐漸開(kāi)始白熱化,一個(gè)更深層次的產(chǎn)業(yè)變革正在悄然發(fā)生。2025年,被業(yè)界普遍視為“AI應(yīng)用大爆發(fā)的元年”,智能體(Agent)正從概念走向現(xiàn)實(shí)。而在應(yīng)用爆發(fā)的背后,是百倍增長(zhǎng)的推理算力需求與高昂成本之間的尖銳矛盾。在這場(chǎng)由“訓(xùn)練”轉(zhuǎn)向“推理”的算力范式革命中,中國(guó)AI芯片產(chǎn)業(yè)能否抓住歷史性機(jī)遇?
在日前舉辦的雪球嘉年華會(huì)議期間,云天勵(lì)飛(SH688343)董事長(zhǎng)兼CEO陳寧在接受《每日經(jīng)濟(jì)新聞》記者專訪時(shí)表示,人工智能就像當(dāng)年第一臺(tái)蒸汽機(jī)、第一個(gè)燈泡、第一臺(tái)計(jì)算機(jī),可以說(shuō)人工智能是未來(lái)五年科技突破的關(guān)鍵。他認(rèn)為,中國(guó)在算法上已能夠?qū)⒏澜缦冗M(jìn)水平之間的差距縮短至數(shù)月,甚至在應(yīng)用、數(shù)據(jù)、能源、系統(tǒng)集成方面更有優(yōu)勢(shì)。
在陳寧看來(lái),推理芯片賽道是中國(guó)實(shí)現(xiàn)“超車”的關(guān)鍵。這場(chǎng)關(guān)于重新定義算力的競(jìng)賽才剛剛吹響號(hào)角,中國(guó)第一次與全球站在相近的起跑線。“我們有機(jī)會(huì),也必須抓住這個(gè)機(jī)會(huì)。”
![]()
陳寧在雪球嘉年華上發(fā)表演講 圖片來(lái)源:受訪者
從訓(xùn)練到推理——AI產(chǎn)業(yè)的分水嶺與中國(guó)的“愛(ài)迪生”機(jī)會(huì)
在陳寧看來(lái),人工智能產(chǎn)業(yè)的發(fā)展可以清晰地劃分為三個(gè)階段。
第一階段是2012年至2020年的“智能感知”時(shí)代,以小模型驅(qū)動(dòng)特定場(chǎng)景的解決方案為主,市場(chǎng)的特點(diǎn)就是碎片化,難以規(guī)模化復(fù)制。
第二階段是2020年至2025年的“AIGC”時(shí)代,大模型展現(xiàn)出驚人的內(nèi)容生成能力,但除了英偉達(dá)這家“賣鏟人”,整個(gè)行業(yè)仍在巨額投入中尋找盈利閉環(huán)。
“但2025年,我們進(jìn)入了第三個(gè)階段——‘Agentic AI’時(shí)代。”陳寧強(qiáng)調(diào)。無(wú)論是豆包手機(jī)、AI眼鏡還是人形機(jī)器人,其本質(zhì)都是將大模型、操作系統(tǒng)與硬件載體深度融合的智能體。它們能獨(dú)立完成復(fù)雜任務(wù),替代部分工作崗位,這才是AI引發(fā)產(chǎn)業(yè)革命的真正形態(tài)。這個(gè)時(shí)代的核心特征是應(yīng)用爆發(fā),而應(yīng)用背后所需的算力,從以訓(xùn)練為主正轉(zhuǎn)向以推理為主。
“這是一個(gè)根本性的轉(zhuǎn)折。”陳寧表示,訓(xùn)練追求極致性能和迭代速度,而推理要大規(guī)模商業(yè)化,必須講求市場(chǎng)經(jīng)濟(jì),追求極高的性價(jià)比。
他以19世紀(jì)初英國(guó)化學(xué)家戴維發(fā)明了世界上第一個(gè)實(shí)驗(yàn)性電燈為例,直到70多年后,愛(ài)迪生通過(guò)商業(yè)化改良、降低成本并建設(shè)了電網(wǎng),才真正將電力革命推向千家萬(wàn)戶。
陳寧笑言,黃仁勛可能成為AI領(lǐng)域的戴維,因?yàn)樗x了訓(xùn)練時(shí)代;而推理時(shí)代的‘愛(ài)迪生們’正在涌現(xiàn),這也從另一個(gè)角度決定了誰(shuí)才能真正主導(dǎo)一場(chǎng)產(chǎn)業(yè)革命。
正是這一轉(zhuǎn)變,打破了英偉達(dá)憑借CUDA(英偉達(dá)給自家GPU量身打造的專屬工具)生態(tài)和GPGPU(通用圖形處理器)在訓(xùn)練時(shí)代建立的壟斷格局。
陳寧表示,此前黃仁勛長(zhǎng)期堅(jiān)持“通用計(jì)算”理念,認(rèn)為算法迭代極快,專用推理芯片容易過(guò)時(shí),主張通過(guò)GPU的通用性來(lái)覆蓋推理需求。但市場(chǎng)規(guī)律證明了推理賽道的不可替代性。谷歌在最新的TPU(張量處理器)戰(zhàn)略中明確了“訓(xùn)推分離”的趨勢(shì),加碼推理專用的算力權(quán)重,博通為Meta、OpenAI定制推理芯片,都證明了獨(dú)立推理賽道的崛起,并展現(xiàn)出巨大潛力。
對(duì)于中國(guó)而言,這意味著一場(chǎng)難得的“超車”機(jī)遇。陳寧坦言,在訓(xùn)練賽道上,由于先進(jìn)制程受限、CUDA生態(tài)壁壘高筑,中國(guó)追趕英偉達(dá)差距較大,風(fēng)險(xiǎn)也越來(lái)越大。但在推理賽道上,全球都剛剛起步,游戲規(guī)則不同。“推理更接近應(yīng)用場(chǎng)景,要為用戶提供更高性價(jià)比的產(chǎn)品,這正是中國(guó)產(chǎn)業(yè)所擅長(zhǎng)的。”他判斷,推理芯片的崛起將是中國(guó)科技復(fù)興的巨大機(jī)遇。
需把“百萬(wàn) token”推理綜合成本降到“一分錢(qián)”級(jí)別
面對(duì)推理時(shí)代的全新需求與挑戰(zhàn),陳寧認(rèn)為,一味簡(jiǎn)單模仿英偉達(dá)的GPGPU架構(gòu)并非出路。推理任務(wù)的計(jì)算范式發(fā)生了根本變化,尤其是“Prefill”(預(yù)填充)和“Decode”(解碼)兩個(gè)階段對(duì)算力和帶寬的需求截然不同,傳統(tǒng)架構(gòu)必然面臨瓶頸。
為此,云天勵(lì)飛提出了新的“GPNPU”架構(gòu),旨在融合三大核心能力:首先是頂層結(jié)合GPGPU的SIMT編程范式,具有通用靈活的調(diào)度架構(gòu),這樣可以更便利兼容CUDA的生態(tài);其次是結(jié)合指令集微架構(gòu)設(shè)計(jì)能力,去優(yōu)化GPGPU里面的矩陣類計(jì)算的硬件;與此同時(shí),基于國(guó)產(chǎn)工藝和全國(guó)產(chǎn)產(chǎn)業(yè)鏈融合一系列先進(jìn)封裝技術(shù),打破內(nèi)存瓶頸,降低內(nèi)存成本。
GPNPU的目標(biāo)是在計(jì)算算力、存儲(chǔ)帶寬、存儲(chǔ)容量三者間實(shí)現(xiàn)更優(yōu)配比,滿足面向未來(lái)推理時(shí)代多元化異構(gòu)推理算力的需求。無(wú)論是單位硅芯片面積的計(jì)算性能上,還是模型迭代的遷移成本上,包括算子優(yōu)化提升的硬件利用率,尤其是通過(guò)高能效、低功耗等一系列的芯片技術(shù)降低運(yùn)營(yíng)過(guò)程中能源成本,能真正實(shí)現(xiàn)全方位降低用戶的TCO(總體擁有成本)。
展望未來(lái),陳寧描繪了推理算力需求的爆炸性場(chǎng)景。他以豆包大模型為例,其日均Token(文本處理的最小單元)處理量已達(dá)50萬(wàn)億且增速驚人。
他給出“粗算”的假設(shè),即便以50萬(wàn)億為基準(zhǔn)不再增長(zhǎng),面向大規(guī)模在線推理的資本開(kāi)支與運(yùn)營(yíng)開(kāi)支也會(huì)非常可觀。
與此同時(shí),有媒體亦報(bào)道稱字節(jié)跳動(dòng)2026年AI 基建相關(guān)資本開(kāi)支預(yù)算約1600億元,反映出頭部廠商對(duì)推理基礎(chǔ)設(shè)施的投入強(qiáng)度正在顯著抬升。
陳寧進(jìn)一步判斷,若token規(guī)模短期繼續(xù)上行,明年上半年可能觸及100萬(wàn)億,而在單位能效不發(fā)生顯著改善的情況下,電力與散熱等基礎(chǔ)設(shè)施壓力可能出現(xiàn)“千倍級(jí)”的數(shù)量級(jí)躍遷。
為支撐AI的規(guī)模化產(chǎn)業(yè)化,他提出需要在較短周期內(nèi)把“百萬(wàn) token”的推理綜合成本降低到“一分錢(qián)”級(jí)別。而這需要通過(guò)架構(gòu)革命(如存算一體)和工藝創(chuàng)新才能實(shí)現(xiàn),這也正是中國(guó)企業(yè)的機(jī)會(huì)所在。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.