AI Agent(人工智能代理)是一種能夠自主感知環(huán)境、分析信息、制定決策并執(zhí)行動(dòng)作的智能系統(tǒng)。它通過結(jié)合感知、推理、學(xué)習(xí)和行動(dòng)能力,模擬人類或生物的智能行為,完成特定任務(wù)或持續(xù)目標(biāo)。
![]()
AI Agent 和大模型的區(qū)別在于,大模型與人類之間的交互是基于prompt 實(shí)現(xiàn)的,用戶prompt 是否清晰明確會(huì)影響大模型回答的效果。而AI Agent的工作僅需給定一個(gè)目標(biāo),它就能夠針對目標(biāo)獨(dú)立思考并做出行動(dòng)。
來自加拿大的AI領(lǐng)域?qū)<襌akesh Gohel給出了2025 AI Agents 幾個(gè)可能的發(fā)展方向:
![]()
- 自主檢索增強(qiáng)生成 (Agentic RAG)
基于推理的,用于實(shí)時(shí)數(shù)據(jù)檢索和生成的AI智能體工作流。
Agentic RAG的應(yīng)用不局限于單一場景,同樣也被應(yīng)用于醫(yī)療保健領(lǐng)域。
舉例:Perplexity, Harvey AI 和 Glean AI
- 語音智能體 (Voice Agents)
能夠通過自然口語與用戶互動(dòng)的智能代理,利用廣泛的文本轉(zhuǎn)語音(TTS)和語音轉(zhuǎn)文本(STTS)的嵌入和檢索技術(shù)。
舉例:ElevenLabs, Cognigy, Vapi 和 Deepgram
- AI智能體協(xié)議 (AI Agent Protocols)
簡化多智能體之間的通信,支持不同框架下構(gòu)建的智能體之間的交流。
舉例:Accenture,A2A, ACP, SLIM等
- 計(jì)算機(jī)使用智能體 (CUA - Computer Using Agents)
能像人類一樣與計(jì)算機(jī)交互的AI智能體,可利用瀏覽器、命令行界面(CLI)甚至鼠標(biāo)光標(biāo)等工具。
舉例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
- 編程智能體 (Coding Agents)
借助巧妙的工具使用和基于大語言模型(LLM)的代碼生成,使構(gòu)建和調(diào)試應(yīng)用程序的速度提高10倍的多智能體。
舉例:Windsurf, Cursor 和 GitHub Copilot
- 深度研究智能體 (DeepResearch Agents)
協(xié)作式多智能體系統(tǒng),可從大量來源構(gòu)建內(nèi)容詳盡的研究報(bào)告。
舉例: Gemini DeepResearch, OpenAI DeepResearch 和 You(.)com DeepResearch
![]()
圖片來自:Rakesh Gohel
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.