![]()
文:王智遠 | ID:Z201440
到了2025 年中時,大家開始聊MaaS了。
MaaS是什么?
Model-as-a-Service(模型即服務(wù))。以前,企業(yè)想用 AI,得像蓋房子一樣,自己買地(顯卡)、買圖紙(算法)、組施工隊(開發(fā)),成本極高。
現(xiàn)在,云廠商把這些都打包好了,企業(yè)只要像住酒店一樣,按天、按量付費;模型部署在云端,通過 API 接口,隨取隨用。
MaaS 把 AI 從一種「高精尖的技術(shù)」,變成了一種「即插即用的水電」;但奇怪的是,既然這么方便,為什么現(xiàn)在市面上聽不到太多動靜了?
01
因為大家都在悶聲干活,在思考怎么把「水電」接進業(yè)務(wù)里。
來看一個嚇人的數(shù)據(jù):
前幾天,字節(jié)跳動旗下火山引擎,悄悄交出了一份嚇人的成績單:日均 Token 調(diào)用量突破 50 萬億;而且,在中國大模型公有云市場的蛋糕里,火山引擎一家就切走了49.2%的份額。
咱們得對數(shù)字有點敬畏心;這 50 萬億 Token,是企業(yè)真金白銀跑出來的。這說明什么?說明企業(yè)真正在「用」。
那么,既然大家都在用,這錢到底被誰賺走了?智遠分析認為,整個市場分化成了「兩大門派」。
第一派,是云大廠做的水電站,代表選手有火山引擎、阿里云、百度智能云;他們的邏輯很簡單,我賣水和電(算力+模型),不管你家里用什么電器,插頭得插我這。
但這三家又完全不同。
尤其火山引擎,它是今年最大的變量。很多人看不懂,為什么火山入局最晚,卻能切走近一半的市場份額? 難道僅僅是因為便宜嗎?
不,便宜是結(jié)果。火山能把價格打穿,背后的核心邏輯是 「C 端練兵,B 端賺錢」。
你看它手里有誰?豆包。 作為一個日活過億的超級 App,豆包每天海量的交互請求,就是最好的「磨刀石」
大家可以想象一下這個畫面: 每天有幾億人拿著豆包在聊、在搜、在畫圖;這對服務(wù)器來說,是一場全天候、高強度的極限壓力測試
它把「并發(fā)」測透了, 什么樣的流量洪峰沒見過?豆包扛得住,企業(yè)那點業(yè)務(wù)流量才能輕輕松松;它把「成本」榨干了,這是最關(guān)鍵的。
你想想,C 端的流量是有波峰波谷的(白天忙、半夜閑),而字節(jié)內(nèi)部有龐大的推薦算法、搜索業(yè)務(wù),剛好可以和 AI 任務(wù)做「混排」
這像開餐館,如果不接待散客(C 端),只接企業(yè)包場(B 端),那你的廚房閑置率會很高,菜價一定貴;但火山是廚房 24 小時連軸轉(zhuǎn),顯卡利用率拉滿了,平攤到每一次調(diào)用的成本,自然就是白菜價。
所以,譚待才敢說,MaaS 是賺錢的。 因為對于火山來說,給 B 端提供服務(wù),本質(zhì)上是豆包用剩的「能力溢出」。
說白了,B 端企業(yè)哪怕只「蹭」到了這點溢出的紅利,拿到的也是屠殺級的價格。
另外兩家走的路線也不一樣:阿里云像百貨超市,它的邏輯是生態(tài)。魔搭社區(qū)拉攏各路模型,它只求你用它的服務(wù)器跑模型。
百度像操作系統(tǒng),它的邏輯是入口。李彥宏喊“應(yīng)用為王”,百度強推千帆平臺,更想做 AI 時代的 Windows,讓你在上面長出應(yīng)用來。
第二派是什么呢?是AI原生的廠家。
比如:智譜 AI、MiniMax、硅基流動等;他們沒有云廠商的「基礎(chǔ)設(shè)施包袱」,所以必須夠?qū)!蚱啤保瑢iT解決那些云廠商搞不定的“疑難雜癥”。
你看智譜AI,今年它做了大量私有化部署
很多國企、銀行,數(shù)據(jù)死都不能出機房。這時云廠商就尷尬了,但智譜擅長;它能把模型做輕,直接部署到本地服務(wù)器上。
那MiniMax呢?智遠認為,是偏科天才,如果你做游戲、做情感陪伴,首選 MiniMax;它的模型有“人味兒”,它的模型語音合成極其逼真,以后,在這塊細分市場說不定,能切走了不少 B 端客戶。
至于DeepSeek不用說了,它是典型的理工直男。
大家對它的印象可能還停留在“通用對話”上,但它在 B 端的殺手锏其實是代碼和推理。 如果你是搞量化交易、做數(shù)據(jù)分析的,DeepSeek 簡直是「降本增效」的神器。
所以,智遠認為,現(xiàn)在的 MaaS 市場分三類玩家:
第一類偏「基礎(chǔ)設(shè)施」,講究大而廣。他們鋪路,不論你是誰、你用什么模型,只要你用我的云、耗我的電就行,他們拼生態(tài)的厚度和算力的成本。
第二類偏垂直細分,講究「銳度」;像 MiniMax、智譜、硅基流動這種 AI 原生廠商;用一把尖刀撕開 B 端的口子,做深度的場景適配。
第三類是單純的「賣模型 KPI」; 像 DeepSeek、Kimi;講究「純粹」。你需要腦子,我就賣腦子,拼推理最強、價格最低。
02
說了這么多廠商,其實解決的都只是“有模型用”的問題。但對企業(yè)來說,真正的痛點在于:模型我買了,怎么把它變成能干活的員工呢?
在我看來,要想讓 MaaS 真正落地,得在業(yè)務(wù)流里砍下“三把刀”。
第一刀,Chat to Data(讓數(shù)據(jù)上馬)。
這塊很多人容易想岔,以為把模型買回來,直接跟它聊業(yè)務(wù)就行了。 錯。Chat to Data 的前提是,你的數(shù)據(jù)得先“上桌”。
你想想,你的數(shù)據(jù)現(xiàn)在都在哪?散落在員工電腦桌面的 Excel 里,或者躺在業(yè)務(wù)系統(tǒng)深處的 CSV、CRM 里。對模型來說,這些離線文件是“隱形”的,它根本看不見。
所以,第一步動作叫「結(jié)構(gòu)化上云」。
你得先把死數(shù)據(jù),上傳到 MaaS 平臺的數(shù)據(jù)容器里。現(xiàn)在像飛書多維表格、釘釘這些工具,干的就是這個活,把死文件變成“在線表格”。
只有數(shù)據(jù)上桌了,模型才能去讀表頭,理解這一列叫「銷售額」,那一列叫「回款率」;鋪墊好這一步,才是聊。
這時,部門伙伴問它:把上個月回款低于 50% 的客戶挑出來,它才能立馬給你跑出一個結(jié)果;說白了,這一刀本質(zhì)給模型配一個“數(shù)據(jù)插座”,有了庫,才有得聊。
數(shù)據(jù)解決了,第二刀:Chat to Knowledge(讓知識進腦)。
這塊跟數(shù)據(jù)一樣。 絕大多數(shù)企業(yè)知識,現(xiàn)在都鎖在老舊的 OA 系統(tǒng)里;PDF、Word、掃描件,模型也是看不見的。 所以,不管你用什么平臺,得先把操作手冊、法律法規(guī)、歷史合同統(tǒng)統(tǒng)上傳到云端建庫。
舉個中石化的例子:
他們面臨大量的工程標(biāo)準(zhǔn)和設(shè)計規(guī)范,查起來非常費勁。于是,他們利用百度千帆平臺,把文檔全部搬了上去,構(gòu)建了一個“標(biāo)準(zhǔn)規(guī)范智能問答助手”。
這里最關(guān)鍵是平臺的「解析」能力。
它把文檔里的表格、公式拆解成模型能讀懂的碎片。只有經(jīng)歷了“上傳-解析-入庫”這三步,知識才算真的進了企業(yè)的 AI 腦子。
這時,你再問它技術(shù)規(guī)范,它才能秒級給你答案,并且告訴你出自哪一頁。
第三刀:Chat to Action(讓流程上手);這是 2025 年的決勝局,這一刀解決“辦事”的問題。 它的本質(zhì)是API 的原子化。
以前,你得把請假、報銷、訂機票這些業(yè)務(wù)動作,拆解成一個個標(biāo)準(zhǔn)的小積木。但光有積木不夠,誰來搭呢?這時,MaaS 平臺它得變成一個「數(shù)字化施工隊」的總指揮部
我舉個最新的例子:
前幾天火山引擎發(fā)了一個叫AgentKit的開發(fā)框架,它直接把這個施工隊的角色分好了,跟咱們真實的業(yè)務(wù)場景一模一樣。
這就好比一個工程現(xiàn)場:第一步,得有“包工頭”(Router),這是最聰明的大模型(比如 DeepSeek-R1 或豆包-Pro)。
它不干具體的活,只負責(zé)聽懂人話、分派任務(wù);你說「幫我訂一張明天去上海的機票,預(yù)算 2000 以內(nèi)」,它立刻分析出時間、地點、預(yù)算,然后轉(zhuǎn)頭喊人。
第二步,得有“特種兵”(Tool Use)。
這是被封裝好的 API。包工頭一聲令下,查票 Agent沖上去查航班,比價 Agent沖上去算報銷額度;這里面有個關(guān)鍵叫 MCP 協(xié)議,你就把它理解成特種兵的萬能工具箱,即插即用。
第三步,還得有“質(zhì)檢員”(Evaluation)。這是最容易被忽略的一點。在「點擊支付」之前,必須有一個模型或者人工節(jié)點跳出來復(fù)核:
查到了這三班,符合差旅標(biāo)準(zhǔn)嗎?您確認訂這一班嗎?”如果沒有這個質(zhì)檢員,模型很可能給你訂一張 5000 塊的頭等艙,老板非瘋了不可。
看明白了嗎?這才是 MaaS 的真相;企業(yè)買「包工頭+特種兵+質(zhì)檢員」的建制;MaaS上的AgentKit 工具,在賣這套讓聽得見炮火的人,能指揮 AI 施工隊的系統(tǒng)。
當(dāng)然,智遠判斷,未來會有諸多AI 原生的 MaaS 平臺出來,專門解決垂直細分場景的問題;比如游戲行業(yè)、3D 設(shè)計,它們的流程非常特殊,通用平臺搞不定,一定會出現(xiàn)專門的垂直 MaaS 平臺來吃掉這塊市場。
03
所以,未來做MaaS平臺的大廠,到底迷戀通用大模型,還是把精力放在「垂直」和「小」上面?
這讓我想到了人的大腦。
通用大模型像大腦的原生智力(IQ)。 它的容量很大,邏輯很強,什么都能學(xué),什么都能聊。在這個層面上,OpenAI 和 Google 還在不斷卷 Scaling Law,試圖把“大腦”的容量擴得無限大。
但「垂直小模型」是什么呢? 它更像我們在后天工作中修煉出來的「思維模型」。
這好比,一個智商 180 的天才,不懂經(jīng)濟學(xué),也未必能馬上算清楚一筆復(fù)雜的賬;但給他裝一個「機會成本思維模型」(垂直模型),專門用來計算換算關(guān)系、權(quán)衡利弊,那他在這個領(lǐng)域的判斷力是頂級的。
所以,垂直和小,代表的是「業(yè)務(wù)的深耕」。
它只需要在某一個特定的切面(比如計算機會成本、審核法律合同、篩選簡歷),擁有最專業(yè)的“解題視角”就夠了。
這也解釋了,為什么2025年最流行模型蒸餾、也就是「一個個小模型即服務(wù)」。
我舉一個智聯(lián)招聘的例子:
他們做人崗匹配,全靠“通用大腦”去硬算,成本太高且效率低。 他們的做法是典型的「名師帶高徒」。
先用「大腦」思考(Teacher,請出千億參數(shù)的 DeepSeek-R1。先把復(fù)雜的簡歷和崗位需求跑一遍,通過高智商分析出人崗匹配的深層邏輯。
再把 DeepSeek 跑出來的“邏輯精華”,喂給一個百億參數(shù)的ERNIE Speed(文心輕量版);最后,讓「模型」出來干活,就是專門懂招聘、懂匹配的“小模型”。
結(jié)果呢? 推理成本直接下降了 70%。
這說明了什么?企業(yè)真正需要,利用愛因斯坦的智力,把你們業(yè)務(wù)里的“機會成本模型”、“庫存周轉(zhuǎn)模型”、“合同風(fēng)控模型”一個個蒸餾出來,讓它越用越聰明。
所以,未來企業(yè)業(yè)務(wù)之間的競爭,不看誰接的“通用大腦”更聰明(那是大廠的事),要看誰能在大腦之上,誰能長出更多、更深、更懂業(yè)務(wù)的「垂直思維模型」。垂直模型,是公司的「行業(yè)專家」。
總結(jié)下來就八個字,在MaaS平臺,外事不決問大廠(通用模型),內(nèi)事不決靠垂類;到2026年,誰能把模型做小、做專,誰才能在投入產(chǎn)出比上算得過賬來。
除了這些主流路徑,市面上也還有很多賣「一體化解決方案」的玩家,商業(yè)世界,從來沒有標(biāo)準(zhǔn)答案。以上內(nèi)容,純屬智遠個人觀察,僅供參考。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.