![]()
凌晨,Anthropic 發(fā)布了Claude Managed Agents,一套用于構(gòu)建和部署云端智能體的托管工具。
![]()
用最簡單的話來介紹,開發(fā)者不需要再處理安全、狀態(tài)管理和權(quán)限等基礎(chǔ)設(shè)施,能直接讓Agent運行在生產(chǎn)環(huán)境。
官方稱,一個原本需要數(shù)月才能上線的Agent,現(xiàn)在可以在幾天內(nèi)投入生產(chǎn)。
01
以10倍速度進(jìn)入生產(chǎn)
在此之前,Agent開發(fā)真正的難點從來不在模型本身,而在工程。
我們可以很快用Claude或其他大模型做出一個看起來不錯的demo:能寫代碼、能分析文檔、甚至能自動調(diào)用工具。但一旦想把它變成一個能穩(wěn)定運行的產(chǎn)品,問題就出現(xiàn)了。
明明它看起來什么都能做,可就是很難真正用在生產(chǎn)環(huán)境里。
demo做出來以后,開發(fā)者還需要自己搭一整套基礎(chǔ)設(shè)施:安全的代碼執(zhí)行環(huán)境、長時間運行的狀態(tài)管理、不同工具之間的權(quán)限控制,以及在出錯時能夠恢復(fù)的機制。這些能力每一個都不算復(fù)雜,但組合在一起,就是一件非常耗時的大工程了。
更麻煩的是,這些工作幾乎無法復(fù)用。
模型一旦升級,harness里原本寫死的那些假設(shè)往往不再那么適配,不同Agent之間也很難共享一套穩(wěn)定的運行框架。
Agent開發(fā)翻來覆去:每個團(tuán)隊都在解決同一類問題,但很少有人真正把它做到穩(wěn)定。
因此我們經(jīng)常看到,Agent可以輕松做出demo,卻遲遲才能上線。
Claude Managed Agents試圖解決的正是這一問題:安全執(zhí)行、狀態(tài)管理、權(quán)限控制、錯誤恢復(fù)……它把這些原本要自己搭的一整套東西全部打包,統(tǒng)一由Anthropic提供。
開發(fā)者不需要再關(guān)心Agent是怎么跑起來的,只要告訴它做什么、能用什么工具、有哪些限制,剩下的執(zhí)行過程都由系統(tǒng)自動完成。
帶來的變化也很直接:原本要花幾個月搭出來的一整套系統(tǒng),現(xiàn)在變成了一個可以快速嘗試、反復(fù)調(diào)用的接口。
它沒有讓Agent變得更聰明,但它狠狠縮短了demo和生產(chǎn)之間的距離。
除了加速上線的“工具包”,它還做了以下幾件事:
首先是對長時間運行任務(wù)的支持。Agent可以在后臺自主運行數(shù)小時,進(jìn)度和輸出會被持續(xù)保存,即使發(fā)生中斷也不會丟失。
其次是多Agent之間的協(xié)作能力。Agent可以創(chuàng)建并調(diào)度其他Agent,以并行方式處理復(fù)雜工作。該能力目前以research preview形式提供,需要單獨申請訪問。
然后是對真實系統(tǒng)的訪問與治理機制。AgentAgent能夠訪問帶有范圍權(quán)限、身份管理和執(zhí)行追蹤的真實系統(tǒng),但能調(diào)用哪些工具、拿到哪些權(quán)限、使用哪些憑證,模型自己說了不算。
除此之外,系統(tǒng)還內(nèi)置了一個用于任務(wù)執(zhí)行的編排機制(a built-in orchestration harness),用于決定何時調(diào)用工具、如何管理上下文以及在出現(xiàn)錯誤時如何恢復(fù)。這意味著開發(fā)者無需手動編排Agent的執(zhí)行流程,系統(tǒng)會在運行過程中自動進(jìn)行調(diào)度。
![]()
這些能力本身并不新,但被放進(jìn)同一個系統(tǒng)里之后,就省下了很多事情。
02
不只是能用,而是已經(jīng)在用
在發(fā)布中,Anthropic 也給出了一批已經(jīng)落地的案例,基本覆蓋了協(xié)作工具、企業(yè)系統(tǒng)和開發(fā)工具這幾個典型場景。
例如Notion(一款將文檔、知識庫和項目管理整合在一起的協(xié)作工具)直接把Claude塞進(jìn)了工作區(qū)里:工程師讓它寫代碼,內(nèi)容團(tuán)隊讓它做網(wǎng)站、做PPT,多個任務(wù)還能并行。
在企業(yè)側(cè),Rakuten(日本大型互聯(lián)網(wǎng)與電商集團(tuán),業(yè)務(wù)涵蓋電商、金融和通信)已經(jīng)在多個部門部署Agent,包括產(chǎn)品、銷售、市場、財務(wù)和人力資源。他們的做法很直接:把Agent接進(jìn)Slack和Teams,讓員工像派活一樣分配任務(wù),然后拿回表格、幻燈片甚至應(yīng)用。官方說,一個Agent一周就能部署完成。
Asana(一家提供團(tuán)隊任務(wù)管理和項目協(xié)作工具的軟件公司)的思路更激進(jìn)一點。這家公司本來就是做項目管理的,現(xiàn)在干脆把Agent變成項目成員,直接參與任務(wù)推進(jìn)和內(nèi)容產(chǎn)出,起的名字也很直白:AI Teammates。
開發(fā)者這邊的代表是Sentry(提供錯誤監(jiān)控和性能分析的開發(fā)者工具),它原本就是用來監(jiān)控bug的,現(xiàn)在Agent可以自動生成修復(fù)代碼并創(chuàng)建Pull Request,把發(fā)現(xiàn)問題到提交修復(fù)的流程串起來。
還有Vibecode(一個通過自然語言生成并部署應(yīng)用的AI開發(fā)工具平臺),這類AI原生工具走得更遠(yuǎn)一點:用戶只需要寫一句需求,就可以從提示直接生成并部署一個應(yīng)用,而Managed Agents成了它背后的默認(rèn)基礎(chǔ)設(shè)施。
如此種種可以看出,不管是寫代碼、做內(nèi)容還是處理企業(yè)流程,Agent已經(jīng)開始直接接手任務(wù)了
某種意義上,當(dāng)安全、狀態(tài)、權(quán)限和調(diào)度都變成默認(rèn)能力之后,Agent不再需要被“包裝”成系統(tǒng),它本身就可以作為系統(tǒng)運行。
Agent缺的從來不是能力,只是難以落地而已。
過去開發(fā)者需要先搭好一整套框架,才能讓Agent開始落地干活;現(xiàn)在這套框架已經(jīng)提前存在,Agent可以直接被部署進(jìn)去。
這就是Claude Managed Agents的意義所在。
03
工具很好,但問題才剛開始
Claude Managed Agents一推出就引發(fā)了大量討論。
很多人對Anthropic的推進(jìn)速度感到驚訝,心情就如同下面的meme:每天一起床就又看到一個Claude更新。
![]()
這不,泄露事件之后立馬更新了Claude Code 2.1.90,Claude Mythos Preview的熱度還沒過,Claude Managed Agents又馬上出來了。
Anthropic你盡管推出,我們一點也不苦一點也不累。
![]()
開個玩笑。在感嘆發(fā)布速度的同時,對新工具的質(zhì)疑也幾乎同時出現(xiàn)。
最直接的問題,是它到底能不能真正跑好“長期任務(wù)”。
有開發(fā)者指出,Agent最大的挑戰(zhàn)從來不在短任務(wù),而是那些需要持續(xù)運行、反復(fù)決策的場景。一旦時間拉長,錯誤會不斷累積,系統(tǒng)穩(wěn)定性也會迅速下降。
能跑起來,不等于能跑得久。
更進(jìn)一步,是“可靠性”的問題。
在小規(guī)模測試中,Agent往往表現(xiàn)不錯,但一旦進(jìn)入真實生產(chǎn)環(huán)境,任務(wù)復(fù)雜度上升、調(diào)用鏈變長,各種邊界情況就會不斷出現(xiàn)。
這恰恰是大多數(shù)Agent平臺最容易失效的地方。
![]()
還有人把問題問得更實際一些:既然現(xiàn)在已經(jīng)有多Agent能力,那它到底能不能直接替代現(xiàn)有的工作流工具?
還是說,像n8n這樣的系統(tǒng),依然是必需的?
![]()
本質(zhì)上關(guān)心的還是同一件事:n8n就是為了保證流程穩(wěn)定、可控、可復(fù)現(xiàn),要想替代它,這套多Agent協(xié)調(diào)的系統(tǒng)必須足夠穩(wěn)定,足夠“可靠”。
值得注意的是,Anthropic在工程設(shè)計上也在嘗試解決這個問題。
在最新的技術(shù)文章中,他們將Agent系統(tǒng)拆成三個獨立的部分:模型與調(diào)度邏輯(“大腦”)、執(zhí)行環(huán)境與工具(“手”),以及記錄全部過程的會話日志(session)。
三者通過接口連接,任何一層失敗都可以單獨恢復(fù),而不會影響整體運行。
這套設(shè)計,把Agent從一次性執(zhí)行的流程,變成了一個可以中斷、恢復(fù)甚至重啟的系統(tǒng)。
![]()
另外,對于那些需要長時間運行的任務(wù),Anthropic沒有把所有信息都塞進(jìn)模型的上下文里,而是記錄在外部日志中,需要時再取回來用,這樣就不會占滿上下文窗口。
同樣地,權(quán)限也不再交給模型保管,而是單獨隔離出去,這樣即使出錯,也不會直接暴露敏感信息。
不過工程設(shè)計只能解決結(jié)構(gòu)問題,沒辦法保證結(jié)果。
可以說,大家并不懷疑Claude Managed Agents能做什么,懷疑的是它能不能穩(wěn)定、可控地一直做下去。
這一點,就需要時間來驗證了。
Claude Managed Agents介紹:
https://claude.com/blog/claude-managed-agents
工程博客:
https://www.anthropic.com/engineering/managed-agents
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.