<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      給AI裝上手和腳,這賬能算平嗎?

      0
      分享至


      文:王智遠(yuǎn) | ID:Z201440

      大模型市場,直接來了一個「新物種大分叉」。

      全球最大AI模型API聚合平臺OpenRouter給出數(shù)據(jù): 9號到15號這一周,中國大模型的調(diào)用量沖到了4.12萬億Token第一次超過美國模型的2.94萬億Token

      調(diào)用量前五的模型里,中國直接占了四個:MiniMax的M2.5、月之暗面的KimiK2.5、智譜GLM-5、DeepSeek V3.2。

      市場已經(jīng)徹底分成兩撥人:BAT正在「向內(nèi)收縮」,把模型塞進(jìn)搜索、電商、辦公這些老業(yè)務(wù)里;新勢力Kimi、智譜、MiniMax則「向外長手」,靠成百上千個Agent死磕開發(fā)者生態(tài)。

      這是商業(yè)底層邏輯的徹底分家,大家都在算一筆名為投資回報率的生死賬。

      01

      先得搞清楚一件事:這4.12萬億Token的調(diào)用量,到底是誰在用?

      要光看新聞標(biāo)題,肯定以為中國老百姓突然愛上跟AI嘮嗑了;OpenRouter的用戶構(gòu)成很有意思,上面美國開發(fā)者占了47.17%,中國開發(fā)者只有6.01%。

      這4.12萬億Token,主要是全球那幫程序員「用腳投票」投出來的,跟咱們在抖音刷到的那些AI聊天沒啥關(guān)系。

      所以,Token調(diào)用量比DAU實在多了,日活用戶能被紅包砸出來,能被春節(jié)營銷堆出來,但開發(fā)者的API調(diào)用是真金白銀在燒。

      他們在生產(chǎn)環(huán)境里跑你的模型,寫代碼、做測試、跑任務(wù),每一分Token背后都是算力成本,也對應(yīng)著某種商業(yè)預(yù)期,沒人會花錢跑沒用的東西。

      那全球程序員為啥突然瘋狂調(diào)用中國模型?兩個原因:性能能打 + 便宜到離譜。

      MiniMax M2.5上線一周直接沖上調(diào)用量榜首,它在代碼編寫、搜索這些硬核領(lǐng)域的表現(xiàn),已經(jīng)能跟OpenAI和Anthropic的主力產(chǎn)品掰手腕。

      Kimi K2.5更狠,能同時調(diào)度100個《Agent分身》干活,把復(fù)雜任務(wù)的效率干到3到10倍;智譜GLM-5帶著200K的超長上下文窗口殺出來,專門給需要長時間跑的任務(wù)用。這些都是真家伙,不是湊合用的平替。

      再說成本。這才是最狠的。咱們直接看數(shù)字:

      • MiniMax M2.5:輸入0.3美元/百萬Token,輸出1.1美元
      • 智譜GLM-5:輸入0.3美元,輸出2.55美元
      • Claude Opus4.6:輸入5美元,輸出25美元

      算下來,中國模型成本只有海外巨頭的1/10到1/20;這個價差直接把程序員的經(jīng)濟(jì)賬給重算了。同樣的任務(wù),用Claude燒100塊錢,用MiniMax可能5塊錢就搞定了。

      中國廠商憑啥能把價格打到這么低?核心是技術(shù)架構(gòu);大家都在用《混合專家》MoE架構(gòu),根據(jù)具體任務(wù),只調(diào)用其中一小部分專家出來干活,這是工程效率的極致優(yōu)化。

      再加上阿里云這種平臺,把四大頂級開源模型打包,推出7塊9的首月訂閱,直接把程序員的試錯成本壓到地板價。

      問題來了:便宜就一定有人用嗎?也不只是便宜,這就得說更深層的變化了:Agent場景爆發(fā),讓Token消耗的邏輯徹底變了。

      Chatbot那會兒,用戶問一句模型答一句,Token消耗是線性的;現(xiàn)在智能體開始落地,事情復(fù)雜了,Agent接到一個任務(wù),每一步都在《腦子里反復(fù)推演》。

      這種《推理密度》增加,讓單次任務(wù)的Token消耗呈指數(shù)級上升;中信證券算過,智能體執(zhí)行任務(wù)時,整體Token消耗可能提升十倍以上,對應(yīng)的算力需求得漲百倍以上。

      OpenRouter的數(shù)據(jù)也證實了這點:

      平臺上超過70%的Token消耗,來自互聯(lián)網(wǎng)大廠、中大型企業(yè)、專業(yè)程序員的生產(chǎn)環(huán)境;在100K到1M Token這個區(qū)間,也就是智能體工作流最典型的消耗區(qū)間,MiniMax M2.5的調(diào)用量遙遙領(lǐng)先。

      所以,這波Token爆發(fā)是真需求還是假繁榮?

      我的判斷是:真需求,它證明了中國這幫新玩家在《手和腳》的戰(zhàn)略方向上,確實踩中了全球程序員的真實痛點。

      用頂級的性能加地板的價格,去滿足正在爆發(fā)的Agent需求,程序員用Token投了信任票。

      02

      但這只是開始。Token怎么變成錢?

      智譜三年半虧了62個億,MiniMax三年零三個季度虧了13.2億美元(差不多95億人民幣),而且,算力成本占研發(fā)開支的70%到80%。這是什么概念?

      每賺1塊錢,要付出5塊多的算力成本。典型的越賣越虧。新玩家們必須回答一個問題:怎么讓客戶為價值付費?

      答案指向同一個方向:按效果付費。行業(yè)里管這個叫RaaS,Results-as-a-Service。

      什么意思呢?我打個比方:

      Token是什么?算力的計量單位,客戶花錢買AI服務(wù),真正想要通過一次審核、減少一次拒付、多一筆訂單。

      現(xiàn)在API定價,偏偏掛在Token上;這就好比你請人搬磚,最后按他流了多少汗收費;汗流得多不一定磚搬得多,磚搬得多也不一定汗流得多,這賬能算明白嗎?

      有點類似于,把油門直接接到里程表上;是為車真正跑了多遠(yuǎn)付費;油門踩得再狠,車沒動,不收錢;車跑了10公里,就收10公里的錢。

      智象未來CTO姚霆有句話我印象挺深:

      商業(yè)模式創(chuàng)新,是從售賣API提升到售賣結(jié)果。以前B端C端都是積分制,本質(zhì)是把價值折算成積分,現(xiàn)在大家開始探索按照結(jié)果來付費。

      這邏輯一換,整個行為系統(tǒng)都變了。

      當(dāng)價格掛在Token上,模型廠商的團(tuán)隊會拼命追求更短的提示詞、更多的緩存命中,因為這樣能降低成本;但當(dāng)價格掛在結(jié)果上,團(tuán)隊自然會去追更高的通過率、更高的轉(zhuǎn)化率,因為只有結(jié)果好了才能收到錢。

      一個是向內(nèi)控成本,一個是向外創(chuàng)價值,兩條路,走著走著就分叉了。

      這么做哪些場景先跑通了?

      先說電商直播。這塊走得最快。中科深智做的AI直播全托管,從投流素材生成到AI直播轉(zhuǎn)化全包了,企業(yè)可以零成本開播,最后按GMV分成。

      什么叫GMV分成?賣出去的東西里抽個點。賣不出去,不收錢。

      他們透露了一個有意思的數(shù)據(jù):AI直播跟頭部IP主播比確實還有差距,但在素人直播這個層級,已經(jīng)比真人強(qiáng)了。有個客戶,某電商公司,跟大MCN機(jī)構(gòu)合作的時候日均GMV大概15萬左右。

      同等投流ROI的情況下,AI直播能做到這個數(shù)的40%到50%,同時人力成本省了70%以上;同樣的投放預(yù)算,產(chǎn)出打?qū)φ郏杀臼∑叱桑@賬怎么算都劃算。

      再說金融營銷。這個試得也挺激進(jìn)。

      我看到一個案例,螞蟻數(shù)科推了個智能托管模式,銀行只管給業(yè)務(wù)目標(biāo)、預(yù)算和客群,剩下的全交給智能體自己玩;投什么渠道、出什么素材、怎么平衡ROI,全是AI自己調(diào)。最后按交易規(guī)模增長的千分之二到千分之四收費。

      有意思的是,現(xiàn)在合作金融機(jī)構(gòu)里,區(qū)域性銀行占了三分之二。為什么?

      因為大行有自己的技術(shù)團(tuán)隊,什么都想自己干;區(qū)域性銀行沒這條件,反而更愿意接受交鑰匙工程,你給我結(jié)果就行,過程我不關(guān)心。

      工業(yè)領(lǐng)域也有嘗試,但更謹(jǐn)慎一些。設(shè)備預(yù)測性檢修、節(jié)能優(yōu)化這些場景,有人開始按實際節(jié)能效果收費。

      中工互娛的智振說得挺實在:小單點項目幾萬到幾十萬,可以按效果收費;但大額復(fù)雜項目,幾百萬上千萬那種,因為效果太難衡量了,暫時還是傳統(tǒng)模式。這也合理,客戶不敢賭,廠商也不敢賭。

      說到這兒你可能想問,那為什么是現(xiàn)在才火起來?

      我琢磨著有兩個原因。一個技術(shù)真的能打了,另一個是采購主體變了。

      以前賣軟件,通常科技部門負(fù)責(zé)買,科技部門的人不背業(yè)務(wù)結(jié)果的KPI,現(xiàn)在業(yè)務(wù)部門開始直接參與采購,營銷部買AI是為了多獲客,財務(wù)部買AI是為了降成本,他們天然就愿意為可量化的增長付費。

      現(xiàn)在到了一定的臨界點。但你可能會說:按效果付費這么美好,那趕緊全換啊。

      最大的問題是效果歸因。

      企業(yè)業(yè)務(wù)增長是市場、運(yùn)營、產(chǎn)品一堆因素共同作用的結(jié)果,目前用一套工作流、一個Agent還沒辦法拆分到各部門。

      也就說,運(yùn)營說是因為我搞了波活動,市場說因為我投了廣告,AI說是因為我的智能體優(yōu)化了轉(zhuǎn)化率,到底誰的功勞?怎么精確算出AI貢獻(xiàn)了多少?

      目前行業(yè)沒有統(tǒng)一標(biāo)準(zhǔn),基本只能一事一議。

      前幾天,銷售易徐曦舉了個例子:CRM全鏈條上,按結(jié)果付費的點其實很多;線索轉(zhuǎn)化了可以付費,商機(jī)成交了可以付費。

      以前產(chǎn)品設(shè)計把功能全打包在一起,沒法拆開算;現(xiàn)在想改成按結(jié)果付費,得重新包裝SKU,重新設(shè)計定價模型,甚至重新簽合同。這是整個商業(yè)邏輯的重構(gòu)。

      還有責(zé)任劃分、效果量化,全是坑。更要命的是,按效果付費,廠商得先墊錢。AI跑起來要燒算力,Agent干活要時間,最后效果沒出來,一分錢收不到。這對現(xiàn)金流是巨大的考驗。

      一邊是客戶愿不愿意為《可能有效果》買單,一邊是廠商扛不扛得住《先干活后收錢》的賬期。兩邊都在賭。

      按效果付費這條路,確實有人在走了;電商直播、金融營銷、招采審查,都跑出了一些樣板間。對于新玩家來說,這條路必須走,因為賣Token的賬,不太行。

      03

      那這筆賬到底能不能算平?什么時候算平?規(guī)模經(jīng)濟(jì)拐點在哪?

      興業(yè)證券的研報提到一個概念叫「杰文斯悖論」。啥意思?當(dāng)一項資源的價格下降時,它的使用量反而會增加,最終總消耗不降反升。

      過去三年,主流模型的單位Token推理成本降了99%以上。聽著是好事吧?成本低了,利潤空間大了。但結(jié)果呢?

      調(diào)用量暴漲,算力總賬單越滾越大。這就像超市搞促銷,打折了,買的人多了,最后花的總錢反而比不打折的時候還多。

      海豚投研算過一筆更宏觀的賬:

      2026年主流芯片設(shè)計商的收入預(yù)期是3700億美元,對應(yīng)的云計算中心資本開支是6400億。這6400億要在5年內(nèi)攤銷完,云廠商得靠這些算力創(chuàng)造出1.2萬億美元的收入才能回本。

      再往下游推,最終用戶得靠AI創(chuàng)造出2.4萬億美元的經(jīng)濟(jì)價值,相當(dāng)于美國GDP的7.5%。這個賬,能算平嗎?

      黃仁勛倒是特樂觀。

      他說「算力即收入」,認(rèn)為AI已經(jīng)到拐點了,企業(yè)對智能體的采用率正在激增。英偉達(dá)最新的財報也確實亮眼,Q4營收681億美元,同比增長73%,數(shù)據(jù)中心貢獻(xiàn)了90%以上。

      但市場反應(yīng)很有意思:財報發(fā)布后,英偉達(dá)股價先漲4%,然后轉(zhuǎn)跌。這猶豫是對「下一步往哪走」的重新定價。

      為什么猶豫?

      因為算力需求的邏輯正在變。以前大家搶訓(xùn)練芯片,訓(xùn)練是一錘子買賣,看誰的算力堆得高。現(xiàn)在風(fēng)向轉(zhuǎn)到推理了,推理是持續(xù)性消耗,看的是單位Token的成本、能效、場景適配度。

      這個轉(zhuǎn)變意味著什么?門檻降低了,競爭格局可能要變了。

      英偉達(dá)最核心的幾個云巨頭客戶,現(xiàn)在都在兩條腿走路:一邊繼續(xù)買英偉達(dá)的標(biāo)準(zhǔn)GPU,另一邊瘋狂搞自研,或者扶持第三方做專用推理芯片。

      微軟、亞馬遜、谷歌、Meta四家云廠商2026年的資本支出加起來接近7000億美元,這么大個蛋糕,沒人愿意讓一家全吃了。

      那再回到咱們關(guān)注的中國新玩家。他們算力賬長什么樣?

      首都在線是智譜的核心算力供應(yīng)商,慶陽、宿遷、天津的GPU集群一直在擴(kuò);弘信電子在打通東數(shù)西算的通道,綠色算力直供智譜、百川智能。

      潤澤科技搞的大規(guī)模智算中心,支撐字節(jié)跳動的萬億級Token吞吐,這些都在卡位低成本算力樞紐。

      但問題沒變:算力成本占研發(fā)開支的70%到80%,這是實打?qū)嵉摹?strong>每賺1塊錢,要付出5塊多的算力成本。什么時候,這個比例能降到50%以下?什么時候算力成本能被收入追上?

      這才是規(guī)模經(jīng)濟(jì)的拐點。

      有人可能會說,成本不是一直在降嗎?對,單位成本在降,但調(diào)用量漲得更快。前面那個「杰文斯悖論」說的就是,便宜了,用的人多了,最后花的總錢反而更多。

      對AI公司來說,這是「越賣越虧」的數(shù)學(xué)本質(zhì)。

      黃仁勛說「計算需求呈指數(shù)級增長」,這話沒錯。但指數(shù)增長的是收入還是成本,決定了誰能活下來。

      所以,算力成本的吞噬效應(yīng),是這幫新玩家最大的財務(wù)風(fēng)險;按效果付費跑通了客戶愿買單的邏輯,但沒解決廠商「先干活后收錢」的現(xiàn)金流壓力。

      換句話說,規(guī)模經(jīng)濟(jì)的拐點取決于另一個指標(biāo):每花1塊錢算力,能收回多少錢。這個比例什么時候能超過1,什么時候規(guī)模經(jīng)濟(jì)才真正兌現(xiàn)。

      誰能先從泥潭里爬出來?

      就看接下來一兩年,誰能在更多場景里跑通效果付費,誰的單位Token創(chuàng)造的價值最高。這才是那筆「生死賬」的最終答案。



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      消息人士稱哈梅內(nèi)伊正掌控戰(zhàn)局

      消息人士稱哈梅內(nèi)伊正掌控戰(zhàn)局

      國際在線
      2026-03-01 06:45:50
      金銀直線反彈,白銀漲近2%

      金銀直線反彈,白銀漲近2%

      21世紀(jì)經(jīng)濟(jì)報道
      2026-03-03 09:48:03
      《大西洋月刊》丨所有人的目光都投向了古巴

      《大西洋月刊》丨所有人的目光都投向了古巴

      邸報
      2026-03-02 10:33:45
      尤文圖斯挖角28歲英超天才中衛(wèi),阿根廷國腳,3大豪門也來爭搶

      尤文圖斯挖角28歲英超天才中衛(wèi),阿根廷國腳,3大豪門也來爭搶

      零度眼看球
      2026-03-03 13:38:44
      美國華人直言:中國手機(jī)掃碼支付是最不智能的發(fā)明!

      美國華人直言:中國手機(jī)掃碼支付是最不智能的發(fā)明!

      阿傖說事
      2026-01-20 12:53:01
      伊朗越打越猛!多名美國高官被斬首,特朗普大怒;沙特堅決否認(rèn)

      伊朗越打越猛!多名美國高官被斬首,特朗普大怒;沙特堅決否認(rèn)

      小丸說故事
      2026-03-03 02:22:06
      上海著名主持人直播中淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

      上海著名主持人直播中淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

      新民晚報
      2026-03-02 14:52:26
      來搞笑的?超級杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

      來搞笑的?超級杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

      懂球帝
      2026-03-02 22:29:12
      美經(jīng)濟(jì)學(xué)家:美國出現(xiàn)了嚴(yán)重戰(zhàn)略誤判,壓根沒料到中國會這么強(qiáng)大

      美經(jīng)濟(jì)學(xué)家:美國出現(xiàn)了嚴(yán)重戰(zhàn)略誤判,壓根沒料到中國會這么強(qiáng)大

      樂天閑聊
      2025-12-01 10:29:34
      活了30多年:才知道滾筒洗衣機(jī)的6個正確用法,難怪衣服洗不干凈

      活了30多年:才知道滾筒洗衣機(jī)的6個正確用法,難怪衣服洗不干凈

      裝修秀
      2026-02-17 10:45:03
      鴻蒙智行處罰違規(guī)營銷門店

      鴻蒙智行處罰違規(guī)營銷門店

      每日經(jīng)濟(jì)新聞
      2026-03-02 17:08:50
      一位腫瘤醫(yī)生的忠告:這世上除了生死,都是小事

      一位腫瘤醫(yī)生的忠告:這世上除了生死,都是小事

      洞見
      2026-02-28 21:27:24
      謝文能改穿7號,泰山隊35人名單確定 平均年齡25.8歲 兩連主搶6分

      謝文能改穿7號,泰山隊35人名單確定 平均年齡25.8歲 兩連主搶6分

      替補(bǔ)席看球
      2026-03-03 12:22:54
      蕭子升與毛主席吵架決裂,晚年流亡烏拉圭,愿望是遺骨回歸故鄉(xiāng)

      蕭子升與毛主席吵架決裂,晚年流亡烏拉圭,愿望是遺骨回歸故鄉(xiāng)

      古書記史
      2025-12-22 19:47:27
      特斯拉車主:Model Y L 中控臺充電口“燒壞”,自費更換要 2700 元

      特斯拉車主:Model Y L 中控臺充電口“燒壞”,自費更換要 2700 元

      新浪財經(jīng)
      2026-03-02 23:51:33
      河南小伙在非洲16年,當(dāng)?shù)匾环蚨嗥拗疲腥酥挥猛妫藪赍X養(yǎng)家

      河南小伙在非洲16年,當(dāng)?shù)匾环蚨嗥拗疲腥酥挥猛妫藪赍X養(yǎng)家

      網(wǎng)絡(luò)易不易
      2026-02-08 11:32:05
      山東男籃拒絕爆冷!全力擊敗廣州,新外援CBA首秀,央視直播

      山東男籃拒絕爆冷!全力擊敗廣州,新外援CBA首秀,央視直播

      體壇瞎白話
      2026-03-03 09:08:07
      彭加木神秘失蹤是場國際“大騙局”?749局高人揭秘事件后的真相

      彭加木神秘失蹤是場國際“大騙局”?749局高人揭秘事件后的真相

      真實異聞
      2024-03-05 21:34:40
      即將閉店!曾是無錫市中心“排隊王”

      即將閉店!曾是無錫市中心“排隊王”

      江南晚報
      2026-03-01 19:38:05
      美伊開出停戰(zhàn)條件,伊朗內(nèi)部形成共識,讓強(qiáng)硬派放開手腳打一場

      美伊開出停戰(zhàn)條件,伊朗內(nèi)部形成共識,讓強(qiáng)硬派放開手腳打一場

      眾生的世界觀
      2026-03-03 12:33:24
      2026-03-03 14:16:49
      智遠(yuǎn)同學(xué) incentive-icons
      智遠(yuǎn)同學(xué)
      暢銷書《復(fù)利思維》作者;精神生活與商業(yè)探索,關(guān)注科技人文、消費電商、品牌營銷、商業(yè)認(rèn)知思維等方面。
      636文章數(shù) 134關(guān)注度
      往期回顧 全部

      科技要聞

      手機(jī)AI在MWC上卷出了新高度

      頭條要聞

      伊朗稱摧毀美空軍基地大樓:20架無人機(jī)和3枚導(dǎo)彈命中

      頭條要聞

      伊朗稱摧毀美空軍基地大樓:20架無人機(jī)和3枚導(dǎo)彈命中

      體育要聞

      35輪后積分-7,他們遭遇史上最早的降級

      娛樂要聞

      謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

      財經(jīng)要聞

      霍爾木茲海峽近乎停擺 布油直逼80美元

      汽車要聞

      長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

      態(tài)度原創(chuàng)

      時尚
      教育
      游戲
      旅游
      房產(chǎn)

      普通人穿衣真的很簡單!單品選對、搭配合理,大方舒適又得體

      教育要聞

      直播預(yù)約|新學(xué)期加油站,火力攻破閱讀寫作難關(guān)!

      卡普空現(xiàn)已移除《生化危機(jī)4:重制版》新加密保護(hù)

      旅游要聞

      從“觀燈”到“玩燈” 達(dá)州“燈會+”激活夜經(jīng)濟(jì)新動能

      房產(chǎn)要聞

      方案突然曝光!海口北師大附校,又有書包大盤殺出!

      無障礙瀏覽 進(jìn)入關(guān)懷版