網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

給AI裝上手和腳，這賬能算平嗎？

2026-02-27 13:05:36　來(lái)源: 智遠(yuǎn)同學(xué)

北京舉報(bào)

分享至

文：王智遠(yuǎn) | ID:Z201440

大模型市場(chǎng)，直接來(lái)了一個(gè)「新物種大分叉」。

全球最大AI模型API聚合平臺(tái)OpenRouter給出數(shù)據(jù)： 9號(hào)到15號(hào)這一周，中國(guó)大模型的調(diào)用量沖到了4.12萬(wàn)億Token第一次超過(guò)美國(guó)模型的2.94萬(wàn)億Token

調(diào)用量前五的模型里，中國(guó)直接占了四個(gè)：MiniMax的M2.5、月之暗面的KimiK2.5、智譜GLM-5、DeepSeek V3.2。

市場(chǎng)已經(jīng)徹底分成兩撥人：BAT正在「向內(nèi)收縮」，把模型塞進(jìn)搜索、電商、辦公這些老業(yè)務(wù)里；新勢(shì)力Kimi、智譜、MiniMax則「向外長(zhǎng)手」，靠成百上千個(gè)Agent死磕開(kāi)發(fā)者生態(tài)。

這是商業(yè)底層邏輯的徹底分家，大家都在算一筆名為投資回報(bào)率的生死賬。

01

先得搞清楚一件事：這4.12萬(wàn)億Token的調(diào)用量，到底是誰(shuí)在用？

要光看新聞標(biāo)題，肯定以為中國(guó)老百姓突然愛(ài)上跟AI嘮嗑了；OpenRouter的用戶構(gòu)成很有意思，上面美國(guó)開(kāi)發(fā)者占了47.17%，中國(guó)開(kāi)發(fā)者只有6.01%。

這4.12萬(wàn)億Token，主要是全球那幫程序員「用腳投票」投出來(lái)的，跟咱們?cè)诙兑羲⒌降哪切〢I聊天沒(méi)啥關(guān)系。

所以，Token調(diào)用量比DAU實(shí)在多了，日活用戶能被紅包砸出來(lái)，能被春節(jié)營(yíng)銷(xiāo)堆出來(lái)，但開(kāi)發(fā)者的API調(diào)用是真金白銀在燒。

他們?cè)谏a(chǎn)環(huán)境里跑你的模型，寫(xiě)代碼、做測(cè)試、跑任務(wù)，每一分Token背后都是算力成本，也對(duì)應(yīng)著某種商業(yè)預(yù)期，沒(méi)人會(huì)花錢(qián)跑沒(méi)用的東西。

那全球程序員為啥突然瘋狂調(diào)用中國(guó)模型？兩個(gè)原因：性能能打 + 便宜到離譜。

MiniMax M2.5上線一周直接沖上調(diào)用量榜首，它在代碼編寫(xiě)、搜索這些硬核領(lǐng)域的表現(xiàn)，已經(jīng)能跟OpenAI和Anthropic的主力產(chǎn)品掰手腕。

Kimi K2.5更狠，能同時(shí)調(diào)度100個(gè)《Agent分身》干活，把復(fù)雜任務(wù)的效率干到3到10倍；智譜GLM-5帶著200K的超長(zhǎng)上下文窗口殺出來(lái)，專(zhuān)門(mén)給需要長(zhǎng)時(shí)間跑的任務(wù)用。這些都是真家伙，不是湊合用的平替。

再說(shuō)成本。這才是最狠的。咱們直接看數(shù)字：

MiniMax M2.5：輸入0.3美元/百萬(wàn)Token，輸出1.1美元
智譜GLM-5：輸入0.3美元，輸出2.55美元
Claude Opus4.6：輸入5美元，輸出25美元

算下來(lái)，中國(guó)模型成本只有海外巨頭的1/10到1/20；這個(gè)價(jià)差直接把程序員的經(jīng)濟(jì)賬給重算了。同樣的任務(wù)，用Claude燒100塊錢(qián)，用MiniMax可能5塊錢(qián)就搞定了。

中國(guó)廠商憑啥能把價(jià)格打到這么低？核心是技術(shù)架構(gòu)；大家都在用《混合專(zhuān)家》MoE架構(gòu)，根據(jù)具體任務(wù)，只調(diào)用其中一小部分專(zhuān)家出來(lái)干活，這是工程效率的極致優(yōu)化。

再加上阿里云這種平臺(tái)，把四大頂級(jí)開(kāi)源模型打包，推出7塊9的首月訂閱，直接把程序員的試錯(cuò)成本壓到地板價(jià)。

問(wèn)題來(lái)了：便宜就一定有人用嗎？也不只是便宜，這就得說(shuō)更深層的變化了：Agent場(chǎng)景爆發(fā)，讓Token消耗的邏輯徹底變了。

Chatbot那會(huì)兒，用戶問(wèn)一句模型答一句，Token消耗是線性的；現(xiàn)在智能體開(kāi)始落地，事情復(fù)雜了，Agent接到一個(gè)任務(wù)，每一步都在《腦子里反復(fù)推演》。

這種《推理密度》增加，讓單次任務(wù)的Token消耗呈指數(shù)級(jí)上升；中信證券算過(guò)，智能體執(zhí)行任務(wù)時(shí)，整體Token消耗可能提升十倍以上，對(duì)應(yīng)的算力需求得漲百倍以上。

OpenRouter的數(shù)據(jù)也證實(shí)了這點(diǎn)：

平臺(tái)上超過(guò)70%的Token消耗，來(lái)自互聯(lián)網(wǎng)大廠、中大型企業(yè)、專(zhuān)業(yè)程序員的生產(chǎn)環(huán)境；在100K到1M Token這個(gè)區(qū)間，也就是智能體工作流最典型的消耗區(qū)間，MiniMax M2.5的調(diào)用量遙遙領(lǐng)先。

所以，這波Token爆發(fā)是真需求還是假繁榮？

我的判斷是：真需求，它證明了中國(guó)這幫新玩家在《手和腳》的戰(zhàn)略方向上，確實(shí)踩中了全球程序員的真實(shí)痛點(diǎn)。

用頂級(jí)的性能加地板的價(jià)格，去滿足正在爆發(fā)的Agent需求，程序員用Token投了信任票。

02

但這只是開(kāi)始。Token怎么變成錢(qián)？

智譜三年半虧了62個(gè)億，MiniMax三年零三個(gè)季度虧了13.2億美元（差不多95億人民幣），而且，算力成本占研發(fā)開(kāi)支的70%到80%。這是什么概念？

每賺1塊錢(qián)，要付出5塊多的算力成本。典型的越賣(mài)越虧。新玩家們必須回答一個(gè)問(wèn)題：怎么讓客戶為價(jià)值付費(fèi)？

答案指向同一個(gè)方向：按效果付費(fèi)。行業(yè)里管這個(gè)叫RaaS，Results-as-a-Service。

什么意思呢？我打個(gè)比方：

Token是什么？算力的計(jì)量單位，客戶花錢(qián)買(mǎi)AI服務(wù)，真正想要通過(guò)一次審核、減少一次拒付、多一筆訂單。

現(xiàn)在API定價(jià)，偏偏掛在Token上；這就好比你請(qǐng)人搬磚，最后按他流了多少汗收費(fèi)；汗流得多不一定磚搬得多，磚搬得多也不一定汗流得多，這賬能算明白嗎？

有點(diǎn)類(lèi)似于，把油門(mén)直接接到里程表上；是為車(chē)真正跑了多遠(yuǎn)付費(fèi)；油門(mén)踩得再狠，車(chē)沒(méi)動(dòng)，不收錢(qián)；車(chē)跑了10公里，就收10公里的錢(qián)。

智象未來(lái)CTO姚霆有句話我印象挺深：

商業(yè)模式創(chuàng)新，是從售賣(mài)API提升到售賣(mài)結(jié)果。以前B端C端都是積分制，本質(zhì)是把價(jià)值折算成積分，現(xiàn)在大家開(kāi)始探索按照結(jié)果來(lái)付費(fèi)。

這邏輯一換，整個(gè)行為系統(tǒng)都變了。

當(dāng)價(jià)格掛在Token上，模型廠商的團(tuán)隊(duì)會(huì)拼命追求更短的提示詞、更多的緩存命中，因?yàn)檫@樣能降低成本；但當(dāng)價(jià)格掛在結(jié)果上，團(tuán)隊(duì)自然會(huì)去追更高的通過(guò)率、更高的轉(zhuǎn)化率，因?yàn)橹挥薪Y(jié)果好了才能收到錢(qián)。

一個(gè)是向內(nèi)控成本，一個(gè)是向外創(chuàng)價(jià)值，兩條路，走著走著就分叉了。

這么做哪些場(chǎng)景先跑通了？

先說(shuō)電商直播。這塊走得最快。中科深智做的AI直播全托管，從投流素材生成到AI直播轉(zhuǎn)化全包了，企業(yè)可以零成本開(kāi)播，最后按GMV分成。

什么叫GMV分成？賣(mài)出去的東西里抽個(gè)點(diǎn)。賣(mài)不出去，不收錢(qián)。

他們透露了一個(gè)有意思的數(shù)據(jù)：AI直播跟頭部IP主播比確實(shí)還有差距，但在素人直播這個(gè)層級(jí)，已經(jīng)比真人強(qiáng)了。有個(gè)客戶，某電商公司，跟大MCN機(jī)構(gòu)合作的時(shí)候日均GMV大概15萬(wàn)左右。

同等投流ROI的情況下，AI直播能做到這個(gè)數(shù)的40%到50%，同時(shí)人力成本省了70%以上；同樣的投放預(yù)算，產(chǎn)出打?qū)φ郏杀臼∑叱桑@賬怎么算都劃算。

再說(shuō)金融營(yíng)銷(xiāo)。這個(gè)試得也挺激進(jìn)。

我看到一個(gè)案例，螞蟻數(shù)科推了個(gè)智能托管模式，銀行只管給業(yè)務(wù)目標(biāo)、預(yù)算和客群，剩下的全交給智能體自己玩；投什么渠道、出什么素材、怎么平衡ROI，全是AI自己調(diào)。最后按交易規(guī)模增長(zhǎng)的千分之二到千分之四收費(fèi)。

有意思的是，現(xiàn)在合作金融機(jī)構(gòu)里，區(qū)域性銀行占了三分之二。為什么？

因?yàn)榇笮杏凶约旱募夹g(shù)團(tuán)隊(duì)，什么都想自己干；區(qū)域性銀行沒(méi)這條件，反而更愿意接受交鑰匙工程，你給我結(jié)果就行，過(guò)程我不關(guān)心。

工業(yè)領(lǐng)域也有嘗試，但更謹(jǐn)慎一些。設(shè)備預(yù)測(cè)性檢修、節(jié)能優(yōu)化這些場(chǎng)景，有人開(kāi)始按實(shí)際節(jié)能效果收費(fèi)。

中工互娛的智振說(shuō)得挺實(shí)在：小單點(diǎn)項(xiàng)目幾萬(wàn)到幾十萬(wàn)，可以按效果收費(fèi)；但大額復(fù)雜項(xiàng)目，幾百萬(wàn)上千萬(wàn)那種，因?yàn)樾Чy衡量了，暫時(shí)還是傳統(tǒng)模式。這也合理，客戶不敢賭，廠商也不敢賭。

說(shuō)到這兒你可能想問(wèn)，那為什么是現(xiàn)在才火起來(lái)？

我琢磨著有兩個(gè)原因。一個(gè)技術(shù)真的能打了，另一個(gè)是采購(gòu)主體變了。

以前賣(mài)軟件，通常科技部門(mén)負(fù)責(zé)買(mǎi)，科技部門(mén)的人不背業(yè)務(wù)結(jié)果的KPI，現(xiàn)在業(yè)務(wù)部門(mén)開(kāi)始直接參與采購(gòu)，營(yíng)銷(xiāo)部買(mǎi)AI是為了多獲客，財(cái)務(wù)部買(mǎi)AI是為了降成本，他們天然就愿意為可量化的增長(zhǎng)付費(fèi)。

現(xiàn)在到了一定的臨界點(diǎn)。但你可能會(huì)說(shuō)：按效果付費(fèi)這么美好，那趕緊全換啊。

最大的問(wèn)題是效果歸因。

企業(yè)業(yè)務(wù)增長(zhǎng)是市場(chǎng)、運(yùn)營(yíng)、產(chǎn)品一堆因素共同作用的結(jié)果，目前用一套工作流、一個(gè)Agent還沒(méi)辦法拆分到各部門(mén)。

也就說(shuō)，運(yùn)營(yíng)說(shuō)是因?yàn)槲腋懔瞬ɑ顒?dòng)，市場(chǎng)說(shuō)因?yàn)槲彝读藦V告，AI說(shuō)是因?yàn)槲业闹悄荏w優(yōu)化了轉(zhuǎn)化率，到底誰(shuí)的功勞？怎么精確算出AI貢獻(xiàn)了多少？

目前行業(yè)沒(méi)有統(tǒng)一標(biāo)準(zhǔn)，基本只能一事一議。

前幾天，銷(xiāo)售易徐曦舉了個(gè)例子：CRM全鏈條上，按結(jié)果付費(fèi)的點(diǎn)其實(shí)很多；線索轉(zhuǎn)化了可以付費(fèi)，商機(jī)成交了可以付費(fèi)。

以前產(chǎn)品設(shè)計(jì)把功能全打包在一起，沒(méi)法拆開(kāi)算；現(xiàn)在想改成按結(jié)果付費(fèi)，得重新包裝SKU，重新設(shè)計(jì)定價(jià)模型，甚至重新簽合同。這是整個(gè)商業(yè)邏輯的重構(gòu)。

還有責(zé)任劃分、效果量化，全是坑。更要命的是，按效果付費(fèi)，廠商得先墊錢(qián)。AI跑起來(lái)要燒算力，Agent干活要時(shí)間，最后效果沒(méi)出來(lái)，一分錢(qián)收不到。這對(duì)現(xiàn)金流是巨大的考驗(yàn)。

一邊是客戶愿不愿意為《可能有效果》買(mǎi)單，一邊是廠商扛不扛得住《先干活后收錢(qián)》的賬期。兩邊都在賭。

按效果付費(fèi)這條路，確實(shí)有人在走了；電商直播、金融營(yíng)銷(xiāo)、招采審查，都跑出了一些樣板間。對(duì)于新玩家來(lái)說(shuō)，這條路必須走，因?yàn)橘u(mài)Token的賬，不太行。

03

那這筆賬到底能不能算平？什么時(shí)候算平？規(guī)模經(jīng)濟(jì)拐點(diǎn)在哪？

興業(yè)證券的研報(bào)提到一個(gè)概念叫「杰文斯悖論」。啥意思？當(dāng)一項(xiàng)資源的價(jià)格下降時(shí)，它的使用量反而會(huì)增加，最終總消耗不降反升。

過(guò)去三年，主流模型的單位Token推理成本降了99%以上。聽(tīng)著是好事吧？成本低了，利潤(rùn)空間大了。但結(jié)果呢？

調(diào)用量暴漲，算力總賬單越滾越大。這就像超市搞促銷(xiāo)，打折了，買(mǎi)的人多了，最后花的總錢(qián)反而比不打折的時(shí)候還多。

海豚投研算過(guò)一筆更宏觀的賬：

2026年主流芯片設(shè)計(jì)商的收入預(yù)期是3700億美元，對(duì)應(yīng)的云計(jì)算中心資本開(kāi)支是6400億。這6400億要在5年內(nèi)攤銷(xiāo)完，云廠商得靠這些算力創(chuàng)造出1.2萬(wàn)億美元的收入才能回本。

再往下游推，最終用戶得靠AI創(chuàng)造出2.4萬(wàn)億美元的經(jīng)濟(jì)價(jià)值，相當(dāng)于美國(guó)GDP的7.5%。這個(gè)賬，能算平嗎？

黃仁勛倒是特樂(lè)觀。

他說(shuō)「算力即收入」，認(rèn)為AI已經(jīng)到拐點(diǎn)了，企業(yè)對(duì)智能體的采用率正在激增。英偉達(dá)最新的財(cái)報(bào)也確實(shí)亮眼，Q4營(yíng)收681億美元，同比增長(zhǎng)73%，數(shù)據(jù)中心貢獻(xiàn)了90%以上。

但市場(chǎng)反應(yīng)很有意思：財(cái)報(bào)發(fā)布后，英偉達(dá)股價(jià)先漲4%，然后轉(zhuǎn)跌。這猶豫是對(duì)「下一步往哪走」的重新定價(jià)。

為什么猶豫？

因?yàn)樗懔π枨蟮倪壿嬚谧儭?/strong>以前大家搶訓(xùn)練芯片，訓(xùn)練是一錘子買(mǎi)賣(mài)，看誰(shuí)的算力堆得高。現(xiàn)在風(fēng)向轉(zhuǎn)到推理了，推理是持續(xù)性消耗，看的是單位Token的成本、能效、場(chǎng)景適配度。

這個(gè)轉(zhuǎn)變意味著什么？門(mén)檻降低了，競(jìng)爭(zhēng)格局可能要變了。

英偉達(dá)最核心的幾個(gè)云巨頭客戶，現(xiàn)在都在兩條腿走路：一邊繼續(xù)買(mǎi)英偉達(dá)的標(biāo)準(zhǔn)GPU，另一邊瘋狂搞自研，或者扶持第三方做專(zhuān)用推理芯片。

微軟、亞馬遜、谷歌、Meta四家云廠商2026年的資本支出加起來(lái)接近7000億美元，這么大個(gè)蛋糕，沒(méi)人愿意讓一家全吃了。

那再回到咱們關(guān)注的中國(guó)新玩家。他們算力賬長(zhǎng)什么樣？

首都在線是智譜的核心算力供應(yīng)商，慶陽(yáng)、宿遷、天津的GPU集群一直在擴(kuò)；弘信電子在打通東數(shù)西算的通道，綠色算力直供智譜、百川智能。

潤(rùn)澤科技搞的大規(guī)模智算中心，支撐字節(jié)跳動(dòng)的萬(wàn)億級(jí)Token吞吐，這些都在卡位低成本算力樞紐。

但問(wèn)題沒(méi)變：算力成本占研發(fā)開(kāi)支的70%到80%，這是實(shí)打?qū)嵉摹?strong>每賺1塊錢(qián)，要付出5塊多的算力成本。什么時(shí)候，這個(gè)比例能降到50%以下？什么時(shí)候算力成本能被收入追上？

這才是規(guī)模經(jīng)濟(jì)的拐點(diǎn)。

有人可能會(huì)說(shuō)，成本不是一直在降嗎？對(duì)，單位成本在降，但調(diào)用量漲得更快。前面那個(gè)「杰文斯悖論」說(shuō)的就是，便宜了，用的人多了，最后花的總錢(qián)反而更多。

對(duì)AI公司來(lái)說(shuō)，這是「越賣(mài)越虧」的數(shù)學(xué)本質(zhì)。

黃仁勛說(shuō)「計(jì)算需求呈指數(shù)級(jí)增長(zhǎng)」，這話沒(méi)錯(cuò)。但指數(shù)增長(zhǎng)的是收入還是成本，決定了誰(shuí)能活下來(lái)。

所以，算力成本的吞噬效應(yīng)，是這幫新玩家最大的財(cái)務(wù)風(fēng)險(xiǎn)；按效果付費(fèi)跑通了客戶愿買(mǎi)單的邏輯，但沒(méi)解決廠商「先干活后收錢(qián)」的現(xiàn)金流壓力。

換句話說(shuō)，規(guī)模經(jīng)濟(jì)的拐點(diǎn)取決于另一個(gè)指標(biāo)：每花1塊錢(qián)算力，能收回多少錢(qián)。這個(gè)比例什么時(shí)候能超過(guò)1，什么時(shí)候規(guī)模經(jīng)濟(jì)才真正兌現(xiàn)。

誰(shuí)能先從泥潭里爬出來(lái)？

就看接下來(lái)一兩年，誰(shuí)能在更多場(chǎng)景里跑通效果付費(fèi)，誰(shuí)的單位Token創(chuàng)造的價(jià)值最高。這才是那筆「生死賬」的最終答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.