![]()
2024年第一季度到2025年第二季度,企業(yè)咨詢多智能體系統(tǒng)的次數(shù)漲了1445%。
這個數(shù)字來自Gartner,不是創(chuàng)業(yè)公司PR稿。當一家以保守著稱的分析機構用四位數(shù)百分比描述趨勢時,通常意味著某件事已經(jīng)從實驗室噪音變成了地板震動。
震動源頭是Agentic系統(tǒng)——不是聊天框里那個等你敲字的助手,而是拿到目標后自己拆步驟、調(diào)API、查結果、失敗重試的自主體。人類只管定方向和驗收,中間過程模型自己跑。
過去兩年"AI助手"的默認形態(tài)是Copilot模式:你prompt,它回答,你決定下一步。寫郵件、解釋代碼夠用,但一碰到復雜流程就露餡。讓它幫你上線一個功能——不是寫個函數(shù),而是規(guī)劃工作、編碼、測試、抓邊界情況、標記處理不了的部分——你會發(fā)現(xiàn) babysit 模型比自己做還累。
Agent要解決的正是這個斷點。
從"副駕駛"到"同事":架構層面的代際切換
單Agent有天花板。一個模型、一個上下文窗口、一個循環(huán), bounded task 能搞定,工作本身太大太雜就崩。企業(yè)AI的架構演進不是拼模型參數(shù),而是拼Agent數(shù)量。
福特工作室(Fordel Studios)的描述很直白:專業(yè)化Agent的編排網(wǎng)絡,每個Agent鎖定一個領域,由編排器(orchestrator)協(xié)調(diào),共享記憶打底,能完成單模型上下文窗口撐不住、可靠性閾值夠不著的流程。
微服務架構的類比被反復引用。單體應用讓位給分布式服務,全能型單Agent正在被"提線木偶"式編排器協(xié)調(diào)的專業(yè)Agent團隊取代。SS&C Blue Prism的觀察是,Agent increasingly managing complex workflows without needing constant human oversight——"越來越不需要人類持續(xù)盯著的復雜工作流管理"。
保險行業(yè)成了最干凈的演示場。
一個典型項目部署了7個專業(yè)化Agent處理單一理賠:Planner Agent啟動流程,Coverage Agent核對保單,F(xiàn)raud Agent掃描異常,Payout Agent計算金額,Audit Agent匯總供人工復核。結果是處理時間砍掉80%,從行業(yè)平均的數(shù)天壓縮到16分鐘。
16分鐘不是理論值,是生產(chǎn)環(huán)境跑出來的數(shù)字。
理賠是高度結構化的流程,規(guī)則明確、數(shù)據(jù)完整、容錯空間小,恰好卡在Agent的甜點區(qū)。但即便如此,80%的降幅還是超出了多數(shù)保險公司的內(nèi)部預期——他們原本期待的是"顯著優(yōu)化",不是"數(shù)量級重構"。
為什么是現(xiàn)在:三個被低估的基建成熟
Agent概念不新,2025-26年的結構性切換有具體支撐。
首先是工具調(diào)用能力的質(zhì)變。早期模型生成"假裝調(diào)用API"的幻覺文本,現(xiàn)在主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro)的函數(shù)調(diào)用準確率已經(jīng)能進生產(chǎn)環(huán)境。這不是能力飛躍,是可靠性閾值跨過了"人類愿意放手"的心理線。
其次是評估體系的建立。Agent要自主運行,必須有自我檢查機制。當前主流方案是"驗證Agent"——一個獨立模型專門審查主Agent的輸出,形成內(nèi)部制衡。這種架構增加了延遲和成本,但換來了人類從"每一步監(jiān)督"降級為"結果驗收"的可能。
第三是記憶層的工程化。單會話的上下文窗口不夠支撐長流程,需要外部記憶系統(tǒng)(vector store、graph database、結構化日志)讓Agent在跨會話、跨工具調(diào)用時保持狀態(tài)一致性。2024年下半年開始,這類基礎設施從Demo級進入企業(yè)級,有SLA保障、有審計日志、有合規(guī)認證。
三個條件疊加,Agent從"能跑通演示"變成"敢放進生產(chǎn)"。
組織沖擊:誰在被替代,誰在升級
保險理賠的80%時間削減,對應的是崗位結構的重新測繪。
不是"理賠員消失"的簡單敘事。觀察實際部署案例,人類角色分化為三層:最底層是純粹的數(shù)據(jù)錄入和格式檢查,這部分確實在收縮;中間層是例外處理——Fraud Agent標記的疑似案件、Payout Agent無法自動裁決的邊界金額,需要人類判斷;最上層是流程設計和Agent訓練,這是新增的頭寸。
一位參與前述保險項目的工程師描述變化:「以前一個理賠專員一天處理20件,現(xiàn)在同一個人監(jiān)督Agent處理200件,同時負責那20件Agent搞不定的例外。」
工作量重構比崗位消失更真實,也更難被統(tǒng)計捕捉。
另一個被低估的變量是"信任建立"的隱性成本。Agent的決策鏈條比傳統(tǒng)軟件更長、更不透明,金融、醫(yī)療等強監(jiān)管行業(yè)的合規(guī)部門需要重新設計審計流程。某大型保險公司的CTO提到,他們花了比技術部署多40%的時間在"可解釋性包裝"上——讓每個Agent的關鍵決策都能生成人類可讀的理由摘要,以備監(jiān)管檢查。
技術ready不等于組織ready,這個時差正在制造第一批踩坑案例。
下一步:從理賠到研發(fā),邊界在哪里
保險理賠的成功正在向外擴散。客服、財務對賬、IT運維工單處理——這些高結構、規(guī)則明確、數(shù)據(jù)豐富的流程是Agent的舒適區(qū)。
更具野心的嘗試在軟件開發(fā)領域。GitHub Copilot的演進路線很說明問題:從代碼補全(line completion)到函數(shù)生成(function generation),再到2024年底公開的"Agent模式"——給定一個Issue描述,模型自主規(guī)劃、編碼、測試、提交PR。內(nèi)部測試數(shù)據(jù)顯示,約30%的Issue可以被Agent端到端關閉,無需人類介入。
這個數(shù)字的解讀需要謹慎。30%是"能被關閉"的比例,不是"質(zhì)量達標被合并"的比例。工程師反饋顯示,Agent生成的PR在代碼風格、邊緣測試覆蓋、文檔同步方面仍有明顯 gap,需要人類復核或返工。
但方向是清晰的:Agent的覆蓋半徑在擴大,人類介入點在向上游移動——從"寫每一行代碼"到"定義Issue的驗收標準",再到"設計Agent的決策邊界"。
一個未被充分討論的限制是"目標模糊性"。理賠有明確的"處理完畢"狀態(tài),軟件開發(fā)沒有。一個功能"完成"的定義隨團隊、隨項目、隨技術債狀況而變,這種模糊性對需要明確目標才能啟動的Agent是結構性障礙。
這也是為什么當前Agent在運維(incident response)、數(shù)據(jù)分析(固定報表生成)等目標可量化場景表現(xiàn)更好,而在產(chǎn)品定義、架構設計等需要持續(xù)協(xié)商的領域進展緩慢。
1445%之后:泡沫與實物的分界線
Gartner的1445%咨詢增長背后,有相當比例是FOMO驅(qū)動的詢價。企業(yè)IT部門需要向董事會證明"我們在關注Agent",于是產(chǎn)生大量早期對話。這些對話中,相當比例會在技術評估階段發(fā)現(xiàn)自身數(shù)據(jù)基礎設施、流程標準化程度、組織變革準備度不足,項目擱置。
但這不否定趨勢本身。保險理賠的80%削減、GitHub的30%端到端關閉率,是已經(jīng)發(fā)生的實物進展。區(qū)分泡沫與實物的一個粗糙標準:能否說出具體數(shù)字,以及數(shù)字來自生產(chǎn)環(huán)境還是實驗室。
另一個觀察角度是供應商格局的演變。2024年,Agent框架(LangChain、LlamaIndex、AutoGen)是討論中心;2025年,企業(yè)采購決策更多指向垂直解決方案——不是買工具自己搭,而是買"理賠Agent""客服Agent"等端到端產(chǎn)品。這意味著技術棧正在下沉為基礎設施,價值捕獲向上遷移到行業(yè)know-how層。
對科技從業(yè)者而言,這個遷移有直接的技能含義。純工程能力(調(diào)模型、寫Agent框架)的溢價在下降,行業(yè)流程理解(理賠規(guī)則、客服SOP、財務合規(guī))的溢價在上升。Agent時代的核心競爭力,可能是"能用Agent語言描述清楚一個業(yè)務問題"——這比"能寫Agent代碼"更稀缺。
一位在保險Agent項目中負責Planner Agent設計的工程師說,他花了兩周時間才把資深理賠經(jīng)理的口頭決策邏輯轉(zhuǎn)化為Agent可執(zhí)行的步驟圖。「最難的不是技術,是讓業(yè)務方意識到自己平時'憑經(jīng)驗'做的事,其實可以被拆解成if-then規(guī)則。」
這種拆解能力,正在成為技術團隊與業(yè)務團隊之間的新接口。
Agent從Copilot進化到Colleague,2025-26年的結構性切換已經(jīng)啟動。問題是:你的流程里,有多少部分已經(jīng)被拆解到可以交給Agent?還有多少部分,你其實說不清楚自己是怎么做的?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.