![]()

作者 | 華衛
編輯 | 蔡芳芳
本文為《2025 年度盤點與趨勢洞察》系列內容之一,由 InfoQ 技術編輯組策劃。本系列覆蓋大模型、Agent、具身智能、AI Native 開發范式、AI 工具鏈與開發、AI+ 傳統行業等方向,通過長期跟蹤、與業內專家深度訪談等方式,對重點領域進行關鍵技術進展、核心事件和產業趨勢的洞察盤點。
本系列力求以體系化視角幫助讀者理解年度技術演化的底層邏輯、創新方向與落地價值,并為新一年決策提供參考。內容將在 InfoQ 媒體矩陣陸續放出,歡迎大家持續關注。
“打開方式不對,還是功能被夸大了?”從 3 月份“現象級”Agent 產品 Manus 刷屏,到如今各類 AI Agent 產品扎堆涌現,Agent 在過去這半年多一直頭頂“光環”。如今熱潮尚未退去,但 Agent 開始頻頻被吐槽。
在各大論壇,關于 Agent 實際應用能力的討論越來越多。不少長期關注該賽道的從業者及嘗鮮用戶反饋,廠商們和評測方把功能描述得非常強大,并放出了各種效果驚艷的演示案例。但普通用戶上手時卻如同“開盲盒”,嘗試多次都很難成功且很多效果無法復現,能實現的多為基礎操作,邏輯稍復雜就會跑崩。
一種聲音是:“太簡單了就失去使用 Agent 的價值了,還不如用工具實現。”
與此同時,Agent 類產品企業的市場表現似乎正在印證這些爭議。曾引爆行業的 Manus 不僅國內業務大規模裁員,用戶訪問量也呈逐月回落態勢,同類產品 Genspark 的用戶市場亦面臨相似處境。有行業觀察者甚至直言,通用 Agent 能完成的場景,價值都很低,沒人愿意付費。
11 月 5 日,麥肯錫旗下的 QuantumBlack 團隊發布了《2025 年 AI 應用現狀》報告,基于對 來自 105 個國家的 1993 名企業從業者的調查,揭開了 Agent 在全球范圍內的微妙現狀。報告指出,62% 的公司至少在嘗試使用 Agent。然而,在任何一個特定業務職能中,聲稱其組織在規模化應用 Agent 的受訪者比例都不超過 10%。有 23% 的受訪者表示其公司在某些場景部署了 Agent,但這種應用通常僅限于一兩個職能部門。
問題到底出在哪里?
“核心在于場景選擇與 Agent 能力的錯配,而非技術本身的性能瓶頸。”北京楓清科技有限公司技術合伙人王傳陽向我們表示,Agent 在標準化通用場景中具備較強的復雜邏輯處理能力,如跨平臺會議統籌、多維度信息整合等場景,其自主規劃與工具調用能力可充分發揮,效率優于傳統工具,但多數產品陷入場景選擇誤區。
一是強行讓通用 Agent 承接垂域簡單場景,這類場景雖步驟簡潔卻隱含專業壁壘,例如化工原料配比涉及行業專屬安全規范,Agent 易因知識缺失導致邏輯斷裂;二是聚焦通用低價值場景,如單純信息檢索、日程提醒等,此類場景傳統工具即可滿足,Agent 的核心價值無從體現,自然無法形成付費閉環。
還存在一類情況是,部分用戶本就是來嘗鮮、看熱鬧的,并沒有實際需求。在實在智能董事長、創始人、CEO 孫林君看來,“哪怕是之前 GPT 發展時,也經歷過‘用戶量先暴漲、再逐步回落’的過程。真正的用戶需求和有價值的場景,會在這個過程中沉淀下來。”
作為今年 AI 行業內最受關注似乎也是落地最多的一個應用領域,“場景錯配,還是能力不實?”的相關疑問持續發酵。而通用與垂直的路線抉擇,更是貫穿整個 AI Agent 賽道迭代、繞不開的核心命題。
為此,我們邀請了多家熱門 Agent 產品企業的創始人以及技術負責人,探討了通用與垂直兩個賽道的生存現狀、發展瓶頸,以及國內外 Agent 行業亂象背后的技術短板與市場邏輯。
通用 VS 垂直,誰更“難”?
在多重困境中,通用 Agent 似乎遭受到更多質疑。更值得注意的是,近期業內還普遍反映其存在成本高、落地難等現實痛點。
對此,王傳陽的看法仍是,根本原因在于行業對通用 Agent 的能力認知錯位與場景定位偏差,導致投入與產出嚴重失衡。
他舉例稱,部分企業盲目信奉 “通用 Agent 萬能論”,將其直接應用于垂域核心業務。例如,讓通用 Agent 主導信貸審批,但這需投入巨額算力進行模型微調,同時安排人工實時修正誤判,成本遠超預期。并且,通用 Agent 為覆蓋多場景采用的冗余架構,又推高了單用戶服務成本。
孫林君也觀察到一種現象是,有些人會用開源框架或某類工具,去嘗試完成一些極其復雜、大幅超越現有基模能力的任務,導致效果不佳。在他看來,“這要么是高估了自身能力,要么是高估了 AI 的潛力。”
“價值定位模糊進一步加劇了落地困境。”王傳陽指出,當前多數通用 Agent 聚焦低價值通用場景,此類場景要么存在成熟替代工具,要么用戶不愿為輕微效率提升付費;而高價值通用場景的挖掘與適配不足,導致產品陷入 “能落地的不盈利,盈利的難落地” 的僵局。
孫林君則站在企業側的角度提出,Agent 必須滿足三個關鍵特點才能真正落地使用。首先是可控性,企業內部工作流程嚴謹,Agent 需要遵循既定工作流,多次運行仍能輸出一致結果,不僅成功率要高,在不同電腦環境下也得保持穩定運行;其次是高效性,它應盡量減少對接口的依賴,可以借助 RPA 能力便捷地搭建出來;再加上穩定性,這三點是企業選擇 Agent 的核心考量。
另外,他表示,整個行業需要時間來達到高成熟度,這是現實情況。任何工具都有利有弊,對于 Agent,更應多關注積極的一面,充分發揮它在現實場景中的實用價值,而不是一味盯著當前的不足。如今 Agent 已經在很多實際場景中落地,并且在不少崗位創造了價值。比如,在不熟悉的領域,不少人會選擇付費開通會員,借助 Agent 完成自己想做的事,這也構成了它的一種商業模式。
“不管是通用 Agent 還是垂直 Agent,受限于基礎大模型的發展水平、技術成熟度,以及解決方案與實際需求的匹配度等因素,現階段確實存在一些明顯缺點,也很容易被大家感知到,但這并不會成為阻礙行業發展的根本原因。”
王傳陽進一步指出,事實上,當前 Agent 的核心挑戰在于對垂直領域深層業務邏輯的精準把控能力不足。垂直領域普遍存在知識壁壘高、業務邏輯動態閉環且容錯成本極低的特性,如工業設備運維需精準匹配設備參數與運行場景、金融風控需聯動多維度動態數據,這些隱性規則與復雜關聯難以通過通用語料覆蓋。
“從技術迭代規律來看,該挑戰今年內無望解決。”一方面,垂域高質量數據多呈現孤島化與隱私化特征,難以形成規模化訓練數據集;另一方面,通用模型與垂域知識的適配需技術團隊與行業專家長期協同調優,僅知識圖譜構建與規則映射就需數月至數年周期,短期無法實現突破。
孫林君同樣提及了數據層面,稱“往未來看,數據將逐漸成為新的行業瓶頸”。原因在于,現有公開數據大概率已被各類大模型獲取并用于訓練了,而完全由人類原創的新數據會越來越少。在眾多垂直領域中那些行業外無法獲取的專屬數據,會變得愈發稀缺。也正因此,垂直大模型相較于通用基模在針對性微調方面能取得更優的效果。
“現階段,無論是企業還是具備專業職能的個人,應用這類基于垂直大模型的 Agent,往往能看到更理想的使用效果。接下來,基于通用基模開發垂直大模型的應用也會逐步凸顯出來。”
同時,孫林君指出,Agent 的成本會逐步降低。“芯片性能在持續升級,模型優化技術也在不斷進步。現在部分 7B 級別的模型,已經能實現原來 ChatGPT 那樣的效果。按照這個發展規律,未來隨著算力的升級和模型訓練方法的革新,我們完全可以用更小體量的模型,打造出效果更優的 Agent 或大模型產品。甚至這些小模型在終端設備上的表現已經非常出色,達到了實用化水平,這都是可預見的趨勢。”
對此,王傳陽則持不同觀點,他認為,短期內(3-5 年)通用 Agent 的成本與性能難以實現突發性突破。性能方面,LLM 受限于高質量數據稀缺與算力投入性價比下降,OpenAI、Anthropic 等企業的新一代模型改進幅度已趨于平緩。成本方面,通用 Agent 的全場景適配架構存在天然冗余,即便優化算力分配,單用戶服務成本也難以低于聚焦單一領域的垂直 Agent。
角逐大半年,誰更“強大”?
在近期的一場 AI 創造者嘉年華上,RockFlow 創始人賴蘊琦給出了不一樣的視角:“通用 Agent 和垂直 Agent 不太有真正的區別。核心是‘為用戶解決什么問題’,只要能解決問題,就是很有價值的產品。”
那么,這兩類產品誰更強呢?當前有一個現象是:在跨行業場景中,通用 Agent 的任務完成度和完成深度面臨越來越多的實踐爭議與拷問。
孫林君認為,現階段通用 Agent 能完成的場景,在任務深度上其實取決于基模能力。就像之前基礎大模型做高考數學題的表現并不理想,但僅僅過了半年,現在的基礎大模型做高考數學題達到 140 分以上的成績已沒什么問題,能秒殺 99% 的考生。從這一點足以看出,只要有可迭代的框架,通用 Agent 每隔幾個月就會快速升級,而它所需要的足量數據與行業經驗,本質上都源于人的實踐積累,不是解決不了的問題。“在可見的短時間內,我們必然會看到更多有深度、能力超過普通人水平的 Agent 出現,事實上現在已經有不少了。”
“而且,垂直 Agent 就一定比通用 Agent 的能力更強大嗎?這倒也不一定。”
他舉例道,不是說把某一件事干好,公司就會變好。實際上,只有多個崗位之間實現無縫協同、高效配合,才能讓整個公司運轉得更好。從屬性上來說,Agent 平臺的核心是為用戶提供搭建 Agent 的能力。只要這個平臺的搭建能力足夠強大、足夠靈活,再加上沉淀了豐富的行業模板或現成的 Agent 資源,就能形成一個完整的生態,而這個生態必然不會局限于某個垂直行業。
另外,孫林君指出,如果將解決某個特定領域問題的 Agent 定義為垂直 Agent,比如專注于營銷、客服、運營或數據處理的 Agent,通用 Agent 對企業來說其實更具價值。他以一個現實問題舉例解釋道,“一家企業想要搭建各類 Agent 且希望這些 Agent 能夠協同工作,有必要去購買十套不同的垂直 Agent 平臺嗎?從這個角度來看,對任何企業而言,都沒必要耗費成本去搭建十套各自獨立的垂直 Agent 平臺。”
因此,他認為,面向企業或個人的通用 Agent,會是未來的核心發展趨勢。至于垂直 Agent,它確實有其階段性的優勢,目前能看到的表層情況是,它在特定領域可能顯得更深入一些。但隨著每一輪技術迭代,Agent 的底層能力會持續增強,通用 Agent 的通用性也會不斷提升,屆時垂直 Agent 的發展空間將會被一步步壓縮。
王傳陽則從技術層面談到,通用 Agent 并非必然犧牲深度,通過模塊化架構設計可實現跨行業適配與領域深度的平衡。核心思路是構建 “通用基礎層 + 領域知識層 + 場景適配層” 的三級架構:通用基礎層基于大參數模型保障跨行業的自然語言理解、工具調用等基礎能力;領域知識層通過檢索增強生成(RAG)技術嵌入垂域知識插件,如金融領域加載風控規則圖譜,能源領域接入設備運維知識庫。場景適配層則通過強化學習對具體行業場景的反饋數據進行微調,優化決策精度。
例如,企業跨行業合同生成場景,通用基礎層保障合同框架的規范性,接入不同行業插件后可匹配金融、制造等領域的專屬條款,再通過場景微調適配企業個性化需求,無需重構模型即可實現 “廣度覆蓋 + 深度適配”。
“博弈”在升級,
終局不會是二選一
自兩條路線分化以來,關于賽道終局的選擇爭議便從未停歇。這幾個月,行業內流傳著這樣一種觀點:“通用 Agent 是未來,垂直 Agent 只是過渡產品”。
而在孫林君看來,最終行業不會走向非此即彼的極端,反而會形成一種動態平衡。具體來說,如果需要深度解決某個特定領域的問題,垂直 Agent 無疑更具優勢;但如果是應對 80% 的常規通用需求,通用 Agent 就完全足夠覆蓋。其實兩者存在一定程度的互補性,想讓其中一方完全取代另一方,并不是一件容易的事。
王傳陽的觀點也類似。他認為,未來行業演進的主流邏輯是 “協同發展”:通用 Agent 承擔跨場景協同、通用任務處理等基礎工作,垂直 Agent 深耕領域深度決策,兩者形成互補而非替代關系。
大模型發展增速放緩,通用 Agent 短期內無法突破垂域知識壁壘,而垂直 Agent 的場景適配性具備長期不可替代性。當前 LLM 的性能提升已顯現邊際效益遞減,數據稀缺與算力成本飆升成為主要瓶頸,Epoch AI 預測 2028 年前可用文本數據將耗盡,未來 5 年內通用模型難以覆蓋垂域的隱性知識與剛性規則。從場景需求來看,垂直領域對 “高精度、高合規性” 的要求決定了垂直 Agent 的長期價值。例如,醫療診斷 Agent 需匹配臨床指南與患者病史,工業控制 Agent 需嚴格遵循工藝參數,這些需求無法通過通用 Agent 的 “概率性輸出” 滿足。
“即便未來實現技術突破,通用 Agent 也無法顛覆垂直 Agent 市場。”王傳陽表示,垂直 Agent 的核心競爭力不僅在于技術能力,更在于深度綁定的行業資源與場景壁壘。
然而,孫林君也直言稱,“從領域來看,我們更看好那些垂直屬性強、發展空間廣闊且行業縱深深的賽道。那些領域覆蓋較淺、沒有自身獨特行業數據支撐的 Agent,會慢慢被通用 Agent 蠶食掉。”
關于數據對 Agent 能力的重要性,知名市場研究機構 CB Insights 在最新發布的報告中亦重點提到,Agent 只有數據好,它才能真正發揮作用。在報告前言里,CB Insights 首席執行官 Manlio Carrelli 還反復強調,真正的競爭優勢不在 AI 本身,而在于能不能把準確、全面的數據用起來,以及搭建讓 Agent 真正有用的編排層。
值得關注的是,另一場 Agent 領域的關鍵爭奪戰也開始燃起:科技巨頭們正在搶 Agent 通信標準的主導權。
Anthropic 的模型上下文協議(MCP)、谷歌的 A2A 協議、IBM 的 Agent 通信協議,都在一年內推出。今年 9 月,Stripe 發布用于智能體支付的 API,并與 OpenAI 共同推出了智能體商務協議(Agentic Commerce Protocol),將通過提供 Agent 與買家、企業之間的標準化通信框架,使其能夠完成自主購買任務。
基模崛起,
淘汰賽悄然打響
Agent 賽道的“內爭”還在繼續,日漸強大的基礎模型所帶來的沖擊卻又似“外患”般接踵而至。
去年,“模型即應用”的口號就喊了出來。前幾天,月之暗面推出并開源旗艦級開源思維模型 Kimi K2 Thinking,以思維 Agent 為核心架構,主打“模型即 Agent”的理念。
模型越來越強,Agent 會不會被吃掉?這一擔憂,與 Macaron 創始人陳鍇杰在 AI 創造者嘉年華上提出的觀點不謀而合。
“大家在討論通用與垂直時,都在逃避競爭。”陳鍇杰談到,講垂直是為了表明各自領域不“打架”,都能實現融資和發展。他進一步指出,在海外做通用 Agent,是明牌正剛 ChatGPT。在他看來,假設很多場景里面要解決的問題跟 ChatGPT 差不多,不同的解決方案或者更好的解決方法可能才是問題的本質。
孫林君則向我們舉出了 AIGC 生成領域的現實案例:之前很多專注于某一細分領域像圖片處理的小型創業公司,現在不少已經不復存在了。他表示,核心原因就是通用大模型的能力每迭代. 一次,都會讓這些公司掌握的技術被沖擊掉。
但如果某個垂直領域的能力是建立在通用大模型缺乏足夠數據深度的基礎上,通用大模型想替代它就比較難。比如,醫療領域對技術精度和數據專業性的要求極高,且很多醫療相關的行業數據具有獨特性,外部無法獲取。在這類領域中,垂直應用或垂直 Agent 的使用效果要優于基于通用基模開發的 Agent,自然能擁有穩定的生存空間。反過來,若某個垂直 Agent 只是單純依托通用基模的原生能力,那它的未來就不好說了。
再比如,實在智能團隊做面向企業的通用 Agent 時,接觸過很多客戶內部獨有的軟件,不管是 GPT-4、GPT-4.5 還是 GPT-5 都沒有接觸過這類專屬系統。這些通用大模型在對這類軟件進行操作、識別和控制時,往往會出現“幻覺”,進而導致操作的不確定性和高失敗率。“而像 TARS 大模型是基于特定行業的專屬數據訓練出垂直大模型,再面向企業級 Agent 時就能對企業內部信息化系統實現更完備、精準的操作,相較于通用基模就能體現出差異化能力。”
“不過,哪怕是通用 Agent,如果完全依靠基模能力,即便結合工具把產品設計得還不錯,但底層能力要是沒法超過基礎大模型本身,那它的發展其實是高風險的,很難保持穩定。”
對此,Flowith 聯合創始人拐子結合 Flowith 的新 Agent 產品分享了另一種看法。他認為,未來模型有可能變成用戶眼中的 Agent。但對用戶而言,這并不重要。用戶真正關心的,只是能否幫自己解決問題。現在大家之所以關注 Agent,核心是它比傳統大語言模型更進了一步,不再只提供單純的輸出,而是能交付到手即可用的結果。
從市場端角度考慮,Agent 的市場規模非常龐大。全世界范圍內,無論是知識工作者、媒體從業者,還是日常使用手機、電腦的普通用戶,都是 Agent 的潛在用戶,他們需要通過這類工具變現、創造價值。因此,在模型面前,通用 Agent 有可能受到威脅,但絕非偽命題。即便模型未來去做類似事情,大概率也會采用類似 Agent 的運作方式。
“Agent 所需的調用能力、記憶功能,在當前的模型訓練架構下是做不到的。”
泡沫之下,
能賺錢的真不少
正如麥肯錫高級合伙人 Michael Chui 所言,“Agent 確實很火,但真正做好很難。”
CB Insights 在最近發布的《AI Agent Bible》中,梳理了當前 AI Agent 生態的增長脈絡。2024 年,Agent 初創公司一共拿到了 38 億美元融資,幾乎是 2023 年的三倍。2025 年,在 CB Insights 追蹤的 1500 多個科技細分市場里,交易最活躍的前十個市場中有五個直接和 Agent 相關。
在 2025 年收入最高的 20 家 Agent 初創公司里,有一半 3 年前都不存在,幾乎“從零起步”卻迅速闖進營收榜前列,包括 2022 年成立、年經常性收入 5 億美元的 Cursor,以及 2023 年成立、收入均達 1 億美元的 Lovable 和 Mercor 等。收入排名前 10 的企業中,有 6 家專注編程類 Agent,且員工人均收入達 140 萬美元。
但與此同時,倒下的 Agent 項目也不少,其中還不乏明星企業。前不久,做法律 AI Agent 產品的英國 AI 初創公司 Robin AI 因新一輪融資失敗,被掛上了破產網站。就在一月份,Robin AI 還入選了《星期日泰晤士報》推出的英國科技公司 Top 10 榜單。今年上半年,國內企業級 AI Agent 公司瀾碼科技被證實陷入經營危機,員工大規模離職,僅剩 20 余人維持客戶支持。
Chui 一針見血地指出,“很多人看到的是炒作,我們看到的是大量還在探索階段的公司。”
根據麥肯錫發布的《2025 年 AI 應用現狀》報告,目前,Agent 最常出現的領域是 IT(如自動服務臺)、知識管理(如深度研究、資料匯總)、軟件工程、服務運營等。而發展較為前沿的行業是科技、媒體電信、醫療保健,這些行業 Agent 落地的比例明顯更高。
把視線拉長到未來 3 年,王傳陽給出這樣的預測:“金融、電信、能源三大領域的 Agent 有望實現爆發式增長,核心源于這些領域具備數據基礎扎實、場景需求明確、商業價值顯性的獨特優勢。”
短短兩年間,Agent 已從前沿技術概念躍升為企業 AI 布局中的優先事項。甚至去年,業內人人都在說,2025 年是 Agent 的落地元年。現在年關將近,Agent 看似無處不在。但從落地實況來看,還遠遠不足以支持千行百業的需求。
在 10 月的一檔播客中,OpenAI 創始成員之一、前特斯拉 AI 主管 Andrej Karpath 就此給出了更為審慎的視角。他直言不諱地指出,行業內存在一些過于樂觀的預測。在他看來,更準確的描述應當是:我們正處于“Agent 的十年”。十年內,它們將能夠真正完成“工作”。
“有點泡沫并不是壞事”,有人這樣說道。
無可否認的是,這一年,Agent 成功從技術概念走上了產業應用的舞臺,并且賺到錢了。而接下來,還有眾多有增長潛力的領域產品正蓄勢待發。
加入InfoQ年度盤點讀者群,第一時間獲取盤點文章更新
AI 重塑組織的浪潮已至,Agentic 企業時代正式開啟!當 AI 不再是單純的輔助工具,而是深度融入業務核心、驅動組織形態與運作邏輯全面革新的核心力量。
把握行業變革關鍵節點,12 月 19 日 - 20 日,AICon 全球人工智能開發與應用大會(北京站) 即將重磅啟幕!本屆大會精準錨定行業前沿,聚焦大模型訓練與推理、AI Agent、研發新范式與組織革新,邀您共同深入探討:如何構建起可信賴、可規模化、可商業化的 Agentic 操作系統,讓 AI 真正成為企業降本增效、突破增長天花板的核心引擎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.