撰文| 吳先之
編輯| 王 潘
站在2026年,回望剛剛過去的2025年,幾乎所有人都認(rèn)同這是AI在B端落地的大年。
“ToB的生意跟ToC完全不一樣,C端會有波動和起伏,而B端只要增長會一直增長,既不可能說用就用,也不可能用了之后立馬棄用,有很高的粘性。”阿里云一位從事B端業(yè)務(wù)多年的老兵表示。
一位飛書客戶成功經(jīng)理提到,2023年到2024年上半年,飛書跟客戶共創(chuàng)了大概1500個場景,實際有用的不超過20個。可到了2025年,光是飛書AI效率先鋒大賽,便涌現(xiàn)了230個真實業(yè)務(wù)場景案例。
AI不僅在生產(chǎn)資料上重構(gòu)著企業(yè)業(yè)務(wù),還改變著企業(yè)更深層次的組織肌理。上述阿里云人士表示,“企業(yè)上云時代,我們主要對接企業(yè)IT部門,而在AI大規(guī)模落地時,目前有約三成不再是IT部門。”
AI與IT部門的交融,大約有三種形態(tài),較為激進的企業(yè),會單獨成立一級AI部門;第二種是循序漸進,將AI團隊融入到既有的IT部門中;第三種較為特殊,成立由企業(yè)一把手直管的辦公室,扮演著中臺角色,雖然建制不大,但優(yōu)先級很高。
當(dāng)企業(yè)客戶從內(nèi)到外開始變化,云與AI大廠的策略也在逐漸發(fā)生變化。
![]()
前述阿里云人士表示,“IT和云的目標(biāo)是走進運維,現(xiàn)在AI需要走進業(yè)務(wù)。”
這一觀點與飛書不謀而合。“過去IT或是云采購大部分是自上而下的,而AI的落地則是自下而上,業(yè)務(wù)一線的工作人員在自己的工作流程中把AI工具用好,實踐做出來。”
可以看到,無論是擁有全棧AI技術(shù)體系的阿里云,還是完成了從SaaS轉(zhuǎn)型為PaaS的飛書,都意識到了AI正在改變toB生意的邏輯。
我們試圖從極兔這家物流企業(yè)的角度,窺探企業(yè)AI落地背后的選擇與考量。
AI云廠商做元器件,企業(yè)做集成
與廠商期待AI加速落地不同,企業(yè)在實際運作中,更傾向于漸進式。“我們不是一次性地全量投入,而是漸進式,在一個階段內(nèi)找最重點、最急迫的問題,然后試點、打磨、升級、推廣。”極兔AI團隊表示。
極兔同許多大公司一樣,內(nèi)部系統(tǒng)無外乎外采與自研兩種,而判斷外采與自研,主要取決于投入成本、實際場景,以及是否關(guān)系到企業(yè)核心競爭力。作為全球化企業(yè),極兔對于核心系統(tǒng)和應(yīng)用都會傾向于自主研發(fā),而在底層通用大模型服務(wù)上會更多依賴于外采。
在企業(yè)實際運作中,外采與自研的邊界并不是那么涇渭分明,更多時候是以集成的形態(tài)出現(xiàn)。例如自動化設(shè)備的集成程度便很高。“物流行業(yè)發(fā)展很多年,自動化設(shè)備比較成熟,如條碼、分揀、存取、GPS跟蹤等系統(tǒng),不同企業(yè)都會做一定程度的集成”。一位極兔人士表示。快遞企業(yè)在成熟解決方案面前,沒有必要“重復(fù)造輪子”。
而另一部分涉及到企業(yè)核心競爭力,或是市面上沒有的系統(tǒng),企業(yè)只能自研。一位極兔人士提到,“只是底層很多原子化能力會采用外部成熟方案。”這也是不少toB廠商強調(diào)“被集成”的根本動因。
例如影響快遞公司效率的異常件識別系統(tǒng),極兔通過自研或外采成熟的圖像識別、OCR(光學(xué)字符識別)、人臉識別等方案,集成到自己的物流系統(tǒng)之中。再比如,涉及到核心關(guān)鍵的物流相關(guān)模型,尤其是垂域大模型,進行場景化的微調(diào),亦是如此。
![]()
值得一提的是,企業(yè)對于一些高度集成后的PaaS產(chǎn)品,表現(xiàn)出了很高的興趣。
過去幾年,生成式AI吸引了不少企業(yè)關(guān)注,其中就包括市場營銷部門。不論廠商將故事講得多么美好,生成式AI在企業(yè)級市場中,仍然算不上盡善盡美。
一位極兔速遞中國市場營銷部編導(dǎo)表示,“在企業(yè)流程中我們要的是確定性,不管是生產(chǎn)場景,還是輸出一個企業(yè)級宣傳片,確定性對于企業(yè)來說是最重要的。”即便模型再好用,使用者Prompt能力再強,最后輸出的片子仍有很大概率不可用。
視頻生成大模型存在一個悖論,既要保持生成物料的審美一致性,同時得根據(jù)腳本節(jié)奏呈現(xiàn)出差異化特點,即便如此,到最后的商標(biāo)環(huán)節(jié),還是得靠“手搓”,或引入原片。“對于企業(yè)來說,商標(biāo)的色號、形制都不能有絲毫問題。”
團隊用拆解工作流的手段,解決了問題。他們將內(nèi)容生產(chǎn)切割為N個節(jié)點,腳本生成、分鏡生成、校驗故事等環(huán)節(jié)都有對應(yīng)的Agent,且調(diào)用的模型各不相同。在此基礎(chǔ)上,又引入了一套由自己和第三方產(chǎn)品混合的Agent,對生成的物料進行整合。
在整個流程中,團隊會根據(jù)實際生成效果,調(diào)用不同模型,通義、豆包、Deepseek、即夢等,海外市場因合規(guī)原因也會使用其他大模型。極兔方面表示,“我們會根據(jù)業(yè)務(wù)場景靈活使用自研AI平臺或飛書平臺,搭建智能體或工作流應(yīng)用,引入AI后能讓確定性更高。”
在企業(yè)上云的時代,不少廠商都使用混合云策略,存在一個體量不小的云下市場。而在AI時代,不少廠商也走向了混合模型,從而讓一部分需求可以被Token計算,另一部分則完全無法計算。
一位阿里云資深市場人士測算,占比更高的中小企業(yè)主要是在云上訓(xùn)練,這部分能夠參考Token消耗。而另一部分企業(yè)要么處于合規(guī)和安全,要么是企業(yè)IT能力強,這部分占比很高的需求情況無法計算,例如私有化部署和云下訓(xùn)練部分,“我們只知道他投入了多少在IaaS,卻不知道調(diào)用了多少Token”。
無法被預(yù)計的部分確實在極兔的案例中頻頻出現(xiàn)。一位極兔人士告訴光子星球,公司在AI應(yīng)用上采用混合技術(shù)策略。最終服務(wù)端的高頻Token消耗,主要來自行業(yè)主流的模型調(diào)用,以滿足大量通用需求。然而,在追求核心業(yè)務(wù)場景的定制化效果時,極兔的研發(fā)中心放在了基于可微調(diào)基座模型,進行自主的模型精調(diào)與后訓(xùn)練。
通過這種方式,極兔得以構(gòu)建私有化的專屬模型,而非僅僅依賴商業(yè)API調(diào)用。
AI落地的KPI:性能、效果、成本
去年年中,世界人工智能大會公布了一組數(shù)據(jù),截至去年7月,全球已發(fā)布大模型3755個,其中1509個來自國內(nèi)公司。
以生成式AI為代表的大模型,處于超供給的情況下,在需求側(cè)卻出現(xiàn)了以決策式AI為代表的中小模型短缺。根據(jù)極兔方面的實踐來看,當(dāng)前階段,企業(yè)對于中小模型的需求高于大模型。一部分原因是通用模型無法解決垂直場景中的問題,企業(yè)需要在垂直場景中能用的AI。
“一些核心場景的延遲要求很苛刻,可能要20毫秒以內(nèi),且調(diào)用非常大,現(xiàn)階段只能用小模型來解決。”極兔方面提到,在下單時生成電子面單必須依賴小模型,而使用大模型的場景主要集中在對延遲要求沒有那么高,涉及到語義理解的場景,像AI助手、智能客服、經(jīng)營分析等。
實踐不僅讓極兔很早就意識到了大模型與中小模型的差異化,甚至在不斷積累之下,已在使用AI改造自己的核心能力。
據(jù)悉,集團正在構(gòu)建物流AI決策大腦,該系統(tǒng)的目的是整合攬收、中心操作、運輸、末端、客服等原本獨立性相對較強的環(huán)節(jié),提升環(huán)節(jié)間的協(xié)作能力,從而為集團整體提效。而在這個過程中,極兔自然而然地很清楚,到底在如此多的模型中,自己應(yīng)該用什么模型。
評估模型,企業(yè)不會關(guān)注模型廠商的參數(shù),而是看業(yè)務(wù)反饋。具體流程是業(yè)務(wù)部門提出需求,然后極兔技術(shù)團隊會基于業(yè)務(wù)場景和需求做調(diào)研與測算,評估ROI。評估通過之后,需求部門和產(chǎn)研部門會對齊。
整個過程中,有三個核心評估指標(biāo),分別是效果(準(zhǔn)確性)、性能(響應(yīng)時間)、成本(價格)。
以知識問答為例。極兔會首先測試不同模型的性能,關(guān)鍵信息抽取準(zhǔn)確性,例如全球各地的地理實體、人名、郵編。這是一個剛性指標(biāo),通常要求高于95%以上才能入候選池。
由于調(diào)用量往往會非常大,因而還會增加響應(yīng)時間。極兔AI團隊表示,“DeepSeek的準(zhǔn)確性非常好,但因為太慢了,所以在這個環(huán)節(jié)上可用性較低。”
![]()
效果與性能在整個評估環(huán)節(jié)中起決定作用,能覆蓋兩個核心需求,且領(lǐng)先其他模型,便會最終應(yīng)用。照理來說,微利的快遞物流行業(yè)會非常關(guān)注成本,但因為2024年以來,Token價格持續(xù)下跌,成本在決策天平上的權(quán)重已讓位于性能與效果,企業(yè)對于成本的首要顧慮得以緩解,從而更傾向于應(yīng)用領(lǐng)先的技術(shù)模型。
從該案例可以看到,企業(yè)對于模型的選用帶有典型的“可插拔”特點,隨著業(yè)務(wù)變化而隨時更換。
盡管極兔對于AI落地持漸進式思維,但集團對于AI的投入力度很大,面對業(yè)務(wù)與技術(shù)同時處于頻繁迭代的現(xiàn)狀,企業(yè)預(yù)算隨之變得較為彈性。
以2025年預(yù)算為例,集團按照物流AI決策大腦的藍(lán)圖,為十余個業(yè)務(wù)制定了對應(yīng)的預(yù)算規(guī)劃。與此同時,還設(shè)置了一個或季度,或半年度的滾動機制。當(dāng)突然發(fā)現(xiàn)新需求,或是新技術(shù)后,集團內(nèi)便會立即調(diào)研、測試,將前述流程跑一遍,只要符合流程便會立即上報。
廠商包不圓的異構(gòu)
去年年底,海外谷歌Gemini 3、GPT 5.2陸續(xù)發(fā)布,國內(nèi)如火山引擎發(fā)布了豆包大模型1.8,阿里通義大模型體系持續(xù)迭代,企業(yè)在實際應(yīng)用中其實比模型廠商有更多有效反饋。
“年底這一輪迭代后,模型的數(shù)學(xué)推理能力急劇增強,但是存在過擬合的問題。”極兔AI團隊表示,過分追求測試集的評測,導(dǎo)致企業(yè)在落地過程中發(fā)現(xiàn)了比較嚴(yán)重的幻覺和不準(zhǔn)確的問題。因此,企業(yè)不得不將更多精力放在基于文檔的知識問答、通過工程化手段提升準(zhǔn)確性,以及基于上下文的任務(wù)規(guī)劃能力上。
某云廠商人士承認(rèn),雖然模型廠商都號稱百萬級,但各種原因使得實際上給企業(yè)的文本上限不過3萬,限制了AI在廠商業(yè)務(wù)中的落地情況。
![]()
Manus在2025年嶄露頭角,只因做了任務(wù)規(guī)劃這一件核心事情,借助大模型的任務(wù)規(guī)劃能力去精準(zhǔn)調(diào)用各個工具。但是再好的解決方案,在3萬的Token上限面前,仍是“巧婦難為無米之炊”。
上下文的限制,不僅是企業(yè)當(dāng)下最頭疼的問題,也是導(dǎo)致以決策式AI為代表的小模型盛行,而以生成式AI為代表的大模型產(chǎn)品在B端遇冷的一個重要原因。從這個角度來講,飛書這類協(xié)同工具在去年吃到的紅利,或多或少便是給了企業(yè)一個大模型難以垂直應(yīng)用的解決方案。
技術(shù)路線再是美好,真正落到現(xiàn)實情況中總會走樣。
“我們用的云服務(wù)和模型比較多,各個廠商都會有銷售代表或解決方案代表常駐企業(yè),而且不光是大模型,還有云基礎(chǔ)設(shè)施的存儲計算廠商。”一位極兔人士在閑聊中透露出的信息,揭示了混合云與混合模型業(yè)態(tài)下的眾生相。
從極兔這個案例可以肯定的是,單一的云服務(wù)和AI廠商不可能將一家企業(yè)包圓。這既有技術(shù)、服務(wù)能力的考量,也有安全與合規(guī)的因素,現(xiàn)實之所以與理想有差異,原因便在于理想的動因只有技術(shù),而現(xiàn)實的動因千萬個。
大廠們真正需要思考的問題是,企業(yè)級應(yīng)用的混合模型趨勢,導(dǎo)致IaaS、PaaS、MaaS層將長期處于異構(gòu)情況下,如何為企業(yè)創(chuàng)造真實價值。
異構(gòu)的不止是技術(shù),商業(yè)世界中從來如此。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關(guān)注我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.