當(dāng)豆包大模型的日調(diào)用量悄無聲息地跨過50萬億tokens大關(guān)時,很多人還沒意識到,這串?dāng)?shù)字背后是一場靜默的“電力”革命。算力,這個AI世界的“電能”,其生產(chǎn)與消耗的方式正在被徹底重構(gòu)。
![]()
在不久前的雪球嘉年華上,云天勵飛董事長兼CEO陳寧的分享,點破了這場變革的核心:我們正從打造“發(fā)電廠”(訓(xùn)練)的時代,快步跑入經(jīng)營“電網(wǎng)”(推理)的時代[citation]。他認為,2025年這個所謂“AI應(yīng)用爆發(fā)元年”,真正的里程碑是智能體(Agent)從展示柜走向生產(chǎn)線,而這直接引爆了百倍于以往的推理算力需求。
推理:一個“精打細算”的新賽場
過去的AI競賽,充滿了英雄主義式的比拼——堆參數(shù)、拼制程、刷榜單,目標(biāo)是在實驗室里鍛造出最強大的“大腦”。這就像不計成本地研發(fā)一輛極限速度最快的F1賽車。英偉達憑借CUDA生態(tài),成為了這個賽道上無可爭議的“引擎供應(yīng)商”。
但智能體時代的需求變了。當(dāng)AI要像“數(shù)字員工”一樣,為成千上萬人同時處理寫郵件、做分析、調(diào)數(shù)據(jù)這些日常任務(wù)時,關(guān)鍵就不再是單次回答能多炫酷,而是能否持續(xù)、穩(wěn)定、便宜地提供服務(wù)。這更像是運營一個龐大的網(wǎng)約車車隊,客戶不在乎你的車極速有多高,只關(guān)心每公里成本是否足夠低、叫車響應(yīng)是否足夠快。
“訓(xùn)練追求極致性能,而推理要商業(yè)化,必須講求市場經(jīng)濟,追求極高的性價比。”陳寧的這句話,道破了算力產(chǎn)業(yè)重心遷移的商業(yè)本質(zhì)。也正是這個轉(zhuǎn)折,為中國芯片產(chǎn)業(yè)撕開了一道難得的口子。
![]()
中國的“愛迪生”時刻?
在訓(xùn)練賽道上追趕,我們不得不面對先進制程受限和CUDA生態(tài)高墻的現(xiàn)實,差距是客觀存在的。然而,推理賽道呈現(xiàn)的是另一番景象。全球都剛起步,游戲規(guī)則從“拼絕對性能”轉(zhuǎn)向了“拼系統(tǒng)工程優(yōu)化能力”——如何在真實的成本、功耗約束下,把算力效率榨取到極致。
這恰恰是中國產(chǎn)業(yè)所擅長的領(lǐng)域。我們擅長在給定的框架內(nèi),通過架構(gòu)創(chuàng)新、工程優(yōu)化和完整的供應(yīng)鏈協(xié)作,做出最具性價比的產(chǎn)品。事實上,市場已經(jīng)給出了信號:谷歌明確“訓(xùn)推分離”,博通為科技巨頭定制推理芯片,都預(yù)示著一個獨立而龐大的推理芯片市場正在崛起。
機會窗口或許已經(jīng)打開。一些國內(nèi)企業(yè)不再盲目跟隨“堆算力”的舊敘事,而是開始圍繞推理的真實負載設(shè)計芯片。例如,中國電信研究院與北京大學(xué)合作,通過算法和架構(gòu)的協(xié)同創(chuàng)新,成功將某些大模型的硬件部署成本降低了超過80%。這正是一種典型的、在推理賽道上“精打細算”的突圍思路。
降本之戰(zhàn):從“一分錢”的目標(biāo)到千倍的壓力
成本,是橫在AI規(guī)模化面前最現(xiàn)實的一座山。陳寧提出了一個清晰的目標(biāo):要在較短時間內(nèi),把“百萬token”的推理綜合成本打到“一分錢”級別。這聽起來像個技術(shù)宣言,但其背后是嚴(yán)峻的產(chǎn)業(yè)壓力。
我們可以簡單算一筆賬:如果豆包大模型日均50萬億token的處理量不再增長,其所需的資本和運營開支已是天文數(shù)字;而若規(guī)模繼續(xù)攀升,明年的計算量可能觸及百萬億級。屆時,對電力、散熱等基礎(chǔ)設(shè)施的需求,可能會出現(xiàn)令人咋舌的“千倍級”躍遷。不把單位成本降下來,AI的應(yīng)用爆發(fā)根本無從談起。
這場降本攻堅戰(zhàn)中,單純的硬件“軍備競賽”效果有限。真正的突破點在于 “架構(gòu)革命” 。陳寧介紹了云天勵飛提出的GPNPU架構(gòu)思路,其核心不是模仿,而是取舍——在兼容主流開發(fā)生態(tài)的同時,針對推理任務(wù)中“預(yù)填充”和“解碼”等不同階段對算力、帶寬的差異化需求,進行軟硬件一體的深度優(yōu)化。目標(biāo)是在計算、存儲和帶寬之間找到最佳配比,從系統(tǒng)層面降低用戶的總體擁有成本。
![]()
尾聲:一場關(guān)于“現(xiàn)實感”的競賽
說到底,AI產(chǎn)業(yè)正在經(jīng)歷一場從“技術(shù)理想”走向“商業(yè)現(xiàn)實”的深刻轉(zhuǎn)變。國家層面的藍圖已經(jīng)繪就,到2027年,AI智能體在重點領(lǐng)域的滲透率要超過70%。實現(xiàn)這個目標(biāo),靠的不是實驗室里的benchmark(性能基準(zhǔn)測試)冠軍,而是能在工廠、辦公室、家庭里穩(wěn)定工作,且賬單不會讓人窒息的“實干家”。
推理芯片的賽道,比的正是這種賦予AI以“現(xiàn)實感”的能力。在這里,中國公司第一次與全球競爭者站在了相近的起跑線上。這場競賽的終局,或許不是誕生一個替代英偉達的單一巨頭,而是成長起一批能在政務(wù)、金融、工業(yè)等“糧食產(chǎn)區(qū)”深耕,提供穩(wěn)定、可靠、劃算算力服務(wù)的新力量。
當(dāng)智能體開始真正接管我們的一部分工作,或許我們不會記得驅(qū)動它的芯片型號,但整個社會運轉(zhuǎn)效率的提升和成本的降低,會成為這場“算力范式遷移”最有力的注腳。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.