當(dāng)前,全球AI產(chǎn)業(yè)的發(fā)展焦點(diǎn)已經(jīng)發(fā)生了關(guān)鍵轉(zhuǎn)變:從純粹比拼模型性能,進(jìn)入到了智能體能否大規(guī)模落地應(yīng)用的“生死競速”階段。業(yè)內(nèi)人士暢想,未來AI要如同“水電煤”般的基礎(chǔ)資源普惠。而打通智能體產(chǎn)業(yè)化落地“最后一公里”的核心命脈在于“成本”,這直接關(guān)系到AI企業(yè)能否盈利、整個行業(yè)能否實(shí)現(xiàn)突破。
為什么成本如此關(guān)鍵?
我們可以回顧互聯(lián)網(wǎng)的發(fā)展歷程。從按Kb計(jì)費(fèi)的撥號上網(wǎng),到百兆光纖成為家庭標(biāo)配,再到4G/5G時代數(shù)據(jù)流量成本趨近于零——每一次“提速降費(fèi)”都催生了全新生態(tài)的爆發(fā),比如視頻流媒體和移動支付。AI時代正處在類似的拐點(diǎn)上。
token,即大模型用來處理文本的基本碎片單元。它是計(jì)費(fèi)的尺度,也是AI組詞造句的零件。你用的token越多,消耗的計(jì)算資源就越多,成本也就越高。隨著技術(shù)進(jìn)步讓每個token的單位價格下降,企業(yè)開始將AI用于更復(fù)雜、更消耗資源的場景。例如,從簡單的問答對話,發(fā)展到具備長上下文理解、多步規(guī)劃和自我反思能力的智能體。這導(dǎo)致單個任務(wù)所需的token量呈指數(shù)級增長。
經(jīng)濟(jì)學(xué)中有個著名的“杰文斯悖論”,說的是:技術(shù)進(jìn)步讓某種資源的利用效率大大提高,但結(jié)果不是節(jié)省了這種資源,而是因?yàn)槭褂闷饋砀阋恕⒏奖悖瑢?dǎo)致它的總消耗量反而大幅增加了。這種情況在token經(jīng)濟(jì)中正在上演。如果token成本的下降速度,趕不上消耗量的飆升,企業(yè)的總支出反而會越來越高。
![]()
多方數(shù)據(jù)給出了驗(yàn)證。火山引擎最新披露的數(shù)據(jù)顯示,截至今年12月,字節(jié)跳動旗下豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍,相比2024年5月剛推出時的日均調(diào)用量增長達(dá)417倍;谷歌在10月披露,其各平臺每月處理的token用量已達(dá)1300萬億,相當(dāng)于日均43.3萬億,而一年前月均僅為9.7萬億。即便每百萬token成本只降低1美元,每月就能節(jié)省上億美元。
那么如今市場上主流大模型的token成本是多少呢?以輸出百萬token為例,Claude、Grok等模型的價格普遍在10-15美元,國內(nèi)大模型雖然相對便宜,也多在10元以上。阻礙token成本下降的核心矛盾在于:大模型推理的工作負(fù)載特性與訓(xùn)練階段完全不同,而許多系統(tǒng)仍沿用為訓(xùn)練設(shè)計(jì)的舊架構(gòu),導(dǎo)致算力、內(nèi)存和網(wǎng)絡(luò)資源無法同時高效利用,造成“高配低效”的困境。
![]()
在今年的人工智能計(jì)算大會(AICC)上,浪潮信息便針對降低token成本這一關(guān)鍵問題,推出了元腦HC1000超擴(kuò)展AI服務(wù)器,實(shí)現(xiàn)每百萬token成本首次擊破1元。其核心突破正是從計(jì)算架構(gòu)層面進(jìn)行根本性重構(gòu),采用全對稱DirectCom極速架構(gòu)。該架構(gòu)像修“立體直達(dá)高速公路”一樣重構(gòu)服務(wù)器內(nèi)部通信,消滅擁堵和繞路。通過精細(xì)的資源調(diào)度避免算力浪費(fèi),使得處理每個token的硬件效率和能耗比達(dá)到極致。
![]()
而這還只是剛開始。浪潮信息首席AI戰(zhàn)略官劉軍強(qiáng)調(diào),1元/每百萬token的成本突破僅是階段性勝利,面對未來token消耗量指數(shù)級增長、復(fù)雜任務(wù)token需求激增數(shù)十倍的必然趨勢,現(xiàn)有成本水平仍難支撐AI的普惠落地。“token成本就是競爭力,它直接決定了智能體的盈利能力。要讓AI真正進(jìn)入規(guī)模化普惠階段,token成本必須在現(xiàn)有基礎(chǔ)上繼續(xù)實(shí)現(xiàn)數(shù)量級的下降。”這就要求整個AI產(chǎn)業(yè)的產(chǎn)品技術(shù)創(chuàng)新,要從當(dāng)前的規(guī)模導(dǎo)向轉(zhuǎn)為效率導(dǎo)向,從根本上重新思考和設(shè)計(jì)AI計(jì)算系統(tǒng),發(fā)展AI專用計(jì)算架構(gòu),探索開發(fā)大模型芯片,推動算法硬件化的專用計(jì)算架構(gòu)創(chuàng)新,實(shí)現(xiàn)軟硬件深度優(yōu)化,這將是未來的發(fā)展方向。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.