![]()
![]()
2025年作為Agent發(fā)展元年,Manus敲響了AI 應(yīng)用大發(fā)展的號(hào)角,各種Agent應(yīng)用層出不窮。這些智能體基本框架是怎樣的,哪些更有前景?
最近在海外看到一張「2025 年 AI Agent 技術(shù)趨勢(shì)全景圖」,覺(jué)得非常精彩,分享出來(lái)和大家交流。
這張圖是 《Agentic AI:利用 AI 代理重塑商業(yè)與工作》作者拉凱什·戈赫爾所做,看趨勢(shì)圖之前,可以先看這張涵蓋LLM Workflow、RAG、AI Agent、Agentic AI等常見(jiàn)概念名詞的解讀。
![]()
![]()
再來(lái)重點(diǎn)看這張趨勢(shì)圖,把未來(lái)一年最有可能落地的 Agent 形態(tài)、核心協(xié)議棧、工程框架與典型場(chǎng)景全部壓縮在一張圖里,非常清晰明了幫助大家完整理解Agent。
![]()
1
中心主題
中間的圓環(huán)標(biāo)明了 2025 AI Agent Trends 的六大類趨勢(shì):
Agentic RAG(推理型檢索增強(qiáng)生成)
Voice Agents(語(yǔ)音智能體)
CUA(Computer Using Agents,能像人類一樣操作電腦的智能體)
Coding Agents(代碼智能體)
Deep Research Agents(深度研究型智能體)
Agent Protocols(智能體協(xié)議)
六大Agent趨勢(shì)的外圈是代表產(chǎn)品,圓圈四周是每個(gè)Agent的流程圖。我們來(lái)具體解讀下,這里在每個(gè)Agent領(lǐng)域,鯨哥增加了國(guó)內(nèi)這個(gè)類型的代表產(chǎn)品。
6大 Agent 模式
1
Agentic RAG
定義:一種結(jié)合檢索與推理的 AI 智能體工作流,用于實(shí)時(shí)數(shù)據(jù)檢索和生成。
流程:
Memory(記憶):保存上下文信息
Planning(規(guī)劃):確定任務(wù)步驟
System Prompt(系統(tǒng)提示):定義任務(wù)邏輯
Agent(智能體):執(zhí)行任務(wù)
Tools(工具) + Vector Search(向量搜索) + Knowledge DB(知識(shí)庫(kù)):從外部數(shù)據(jù)庫(kù)檢索信息
Generate(生成):輸出結(jié)果
國(guó)外代表:
PerplexityAI:主打即時(shí)信息檢索+引用來(lái)源,類似搜索引擎+AI顧問(wèn)
Harvey:面向法律行業(yè)的專業(yè)推理與檢索
Glean:企業(yè)內(nèi)部知識(shí)檢索與智能問(wèn)答
國(guó)內(nèi)代表:
秘塔AI搜索:聚焦本地化搜索+實(shí)時(shí)問(wèn)答
百度文心一言 + 搜索增強(qiáng):結(jié)合百度搜索做事實(shí)檢索
360納米搜索:整合360搜索的即時(shí)信息流
2
Voice Agents
定義:通過(guò)自然語(yǔ)言與用戶交互的智能體,支持語(yǔ)音輸入與輸出。
STT(Speech-to-Text) 將語(yǔ)音轉(zhuǎn)文字
Embedding Model + Retrieval API + Vector DB 處理信息
Agent 進(jìn)行任務(wù)執(zhí)行
TTS(Text-to-Speech) 將結(jié)果轉(zhuǎn)為語(yǔ)音
可接入 Gmail、Telephony 等渠道
場(chǎng)景:智能客服、語(yǔ)音助理、電話機(jī)器人
國(guó)外代表:
OpenAI GPT-4o Voice:多模態(tài)對(duì)話,低延遲語(yǔ)音交互
Alexa LLM(亞馬遜):智能家居+語(yǔ)音助手
Apple Siri(升級(jí)版):與Apple Intelligence結(jié)合的智能助手
Meta’s Voicebox(研發(fā)中):多語(yǔ)言語(yǔ)音生成
國(guó)內(nèi)代表:
豆包:強(qiáng)實(shí)時(shí)語(yǔ)音識(shí)別與合成
小愛(ài)同學(xué)(小米):深度嵌入IoT生態(tài)
天貓精靈(阿里):智能家居+購(gòu)物語(yǔ)音控制
華為小藝:跨設(shè)備語(yǔ)音助手
3
CUA(Computer Using Agents)
定義:能夠像人類一樣操作電腦的軟件和界面。
使用 語(yǔ)言模型 解析用戶指令
獲取 桌面環(huán)境數(shù)據(jù)(Desktop Sandbox)
結(jié)合 Vector DB、Memory、第三方工具(如 Stripe、DoorDash) 執(zhí)行任務(wù)
場(chǎng)景:自動(dòng)化辦公、桌面軟件操作、RPA(機(jī)器人流程自動(dòng)化)
國(guó)外代表:
Devin(Cognition AI):能直接在電腦環(huán)境中開(kāi)發(fā)、調(diào)試、部署代碼
MultiOn:能代替用戶操作網(wǎng)頁(yè)、表格、日歷等
Adept ACT-1(研發(fā)暫停):早期探索自動(dòng)化辦公
國(guó)內(nèi)代表:
扣子空間(字節(jié)跳動(dòng)):低代碼構(gòu)建多場(chǎng)景桌面操作
MuleRUN:具備系統(tǒng)級(jí)操作的能力
Fellou:網(wǎng)頁(yè)與桌面操作的自動(dòng)化執(zhí)行
4
Coding Agents
定義:能 10 倍速構(gòu)建和調(diào)試應(yīng)用的 AI 智能體。
用戶提出 Query
Agent 選擇合適工具執(zhí)行(代碼生成、調(diào)試、測(cè)試)
輸出成品代碼或測(cè)試結(jié)果
工具鏈:
Code Generator:生成代碼
Code Debugger:調(diào)試代碼
Test Runner:自動(dòng)化測(cè)試
場(chǎng)景:軟件開(kāi)發(fā)、自動(dòng)化調(diào)試、代碼審查
國(guó)外代表:
GitHub Copilot Workspace:支持從需求到部署的全鏈路編碼
Cursor:IDE級(jí)AI編程助手
Replit Agents:可多步生成、運(yùn)行、調(diào)試代碼
國(guó)內(nèi)代表:
通義靈碼(阿里):嵌入IDE的代碼生成與調(diào)試
百度Comate:結(jié)合文心大模型的智能編程工具
字節(jié)Trae:全流程的AI IDE產(chǎn)品
5
Deep Research Agents
定義:多智能體協(xié)作,構(gòu)建深度研究型報(bào)告。
用戶需求 → Aggregator(聚合器)
分發(fā)給多個(gè) Sub-Agent(子智能體)
各自檢索、引用(Citation Agent)、分析
聚合輸出報(bào)告
場(chǎng)景:市場(chǎng)調(diào)研、學(xué)術(shù)研究、情報(bào)分析
國(guó)外代表:
OpenAI Deep Research(2025新功能):多Agent長(zhǎng)期調(diào)研
Perplexity Pro Search:支持多步調(diào)研與引用
LangChain + Agents:自定義研究工作流
Vulcan Research AI:行業(yè)情報(bào)自動(dòng)生成
國(guó)內(nèi)代表:
夸克深度搜索:支持多輪長(zhǎng)程研究
阿里通義助理 Deep Search:針對(duì)行業(yè)報(bào)告和市場(chǎng)分析
百度文心智研:自動(dòng)生成調(diào)研大綱與全文
6
AI Agent Protocols
定義:統(tǒng)一的多智能體通信協(xié)議,簡(jiǎn)化跨平臺(tái)協(xié)作。
關(guān)鍵技術(shù):
MCP、ACP、A2A(Agent-to-Agent) 協(xié)議
Google ADK、LangGraph、Cisco SLIM
Agent 發(fā)現(xiàn)與連接
任務(wù)流轉(zhuǎn)與結(jié)果回傳
支持流式與非流式數(shù)據(jù)處理
意義:打通不同智能體和工具間的交互,形成互通生態(tài)
國(guó)外代表:
Google AI Device Kit(ADK):多Agent跨設(shè)備調(diào)用
LangGraph:可視化多智能體協(xié)作編排
Cisco SLIM:企業(yè)級(jí)Agent通信標(biāo)準(zhǔn)
OpenAI MCP(Model Context Protocol):跨模型的上下文共享
國(guó)內(nèi)代表:
字節(jié)跳動(dòng)Coze協(xié)議層:支持不同Bot的消息與任務(wù)協(xié)作
阿里云AgentFlow:跨Agent編排與協(xié)議轉(zhuǎn)換
騰訊云智鏈協(xié)議:支持企業(yè)多Agent互通
華為MetaAgent標(biāo)準(zhǔn):IoT與大模型互通協(xié)議
戈赫爾還制作了Agent L1-L5的發(fā)展標(biāo)準(zhǔn):
![]()
Level 5 – 完全自治智能體
具備自我改進(jìn)能力,完全自主
持續(xù)學(xué)習(xí)與推理
無(wú)需人工干預(yù)
以目標(biāo)為驅(qū)動(dòng),具備多模態(tài)感知
能感知復(fù)雜環(huán)境
能基于過(guò)往經(jīng)驗(yàn)進(jìn)行規(guī)劃
能基于反饋進(jìn)行推理和學(xué)習(xí)
具備自然語(yǔ)言理解
工具編排
基礎(chǔ)AI系統(tǒng),自治性有限
簡(jiǎn)單機(jī)器學(xué)習(xí)用于模式識(shí)別
提供部分決策支持
剛性、基于規(guī)則的系統(tǒng),無(wú)學(xué)習(xí)能力
簡(jiǎn)單的 if-then 邏輯
手動(dòng)使用工具完成操作
無(wú)適應(yīng)性和智能
并認(rèn)為得益于 GPT-5、Claude 4.1、Grok 4 和其他內(nèi)置Agent的基礎(chǔ)模型突破,當(dāng)下Agent正朝著以下模式發(fā)展:
多智能體協(xié)作化:從單一 AI 升級(jí)到多智能體分工協(xié)作。
多模態(tài)輸入輸出:語(yǔ)音、文本、代碼、桌面操作都可以接入。
工具鏈深度集成:每類智能體都配合檢索、數(shù)據(jù)庫(kù)、測(cè)試和第三方 API。
跨協(xié)議互通:通過(guò)標(biāo)準(zhǔn)化協(xié)議讓不同廠商、不同類型智能體無(wú)縫交流。
高自動(dòng)化程度:很多智能體可直接替代人工執(zhí)行復(fù)雜任務(wù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.