![]()
4月8日,Anthropic 上線 Claude Managed Agents 公測。兩天前,公司剛宣布年化經(jīng)常性收入突破 300 億美元。兩件事放在一起看,比任何一件單獨看都更說明問題。
![]()
這次發(fā)布的表面動作是:幫企業(yè)省去搭 Agent 基礎(chǔ)設施的麻煩——沙箱環(huán)境、session 管理、錯誤恢復、權(quán)限控制,全部托管在 Anthropic 平臺上,開發(fā)者只要定義 Agent 要干什么,剩下的交給 Anthropic。
真正的動作是:Anthropic 把原本屬于第三方的那層自己接管了。
原文鏈接:https://www.anthropic.com/engineering/managed-agents
一、harness 是誰的生意
過去兩年,圍繞 Claude 長出來一批工具,專門做"harness"這層。
harness 的工作是讓模型能干活:調(diào)用工具、管理上下文、處理報錯、在任務跑了幾十分鐘之后還能接著跑。模型是大腦,harness 是手腳加神經(jīng)系統(tǒng)。LangChain 做這個,OpenClaw 做這個,大量創(chuàng)業(yè)公司做這個。這是一門生意,因為 Anthropic 過去只賣模型,不提供跑模型的基礎(chǔ)設施。
現(xiàn)在 Anthropic 把這層接管了。
Claude Managed Agents 提供的正是這套:安全沙箱代碼執(zhí)行、session 持久化、工具調(diào)用編排、錯誤恢復、權(quán)限管理,全部打包成 API,按模型用量加每小時 8 美分的運行費計費。
早期用戶里有 Notion、Rakuten、Asana。Notion 把 Agent 接進工作區(qū),支持幾十個任務并行;Rakuten 在一周內(nèi)給產(chǎn)品、銷售、財務、HR 各部署了一個 Agent,接入 Slack 和 Teams;Sentry 讓 Agent 自動寫 bug 修復補丁并開 PR,原本預估幾個月的集成,幾周就上線了。
二、所有 harness 都在編碼一件正在消失的事
Anthropic 工程博客的標題是《將大腦與雙手解耦》,核心論點藏在第一段:
harness 編碼的是模型當前做不到的事,但這些假設會隨著模型變強而過時。
他們給了一個例子。Claude Sonnet 4.5 會在感知到上下文窗口快到頭時提前收工,工程師管這個叫"context anxiety"。解法是在 harness 里加上 context reset。但同一套 harness 跑在 Opus 4.5 上,這個行為消失了,那段 context reset 的代碼變成了死重。
模型每進化一代,就有一批 harness 代碼變成負擔。寫 harness 的人越勤快,欠下的技術(shù)債越多。
這不是某家公司的問題,是整個 harness 賽道的結(jié)構(gòu)性困境:你賣的是對模型缺陷的補丁,而你的客戶正在全力消除那些缺陷。
三、Anthropic 的解法是操作系統(tǒng)思路
工程博客的核心設計決策是把三個組件徹底分開:session(發(fā)生了什么的日志)、harness(調(diào)用 Claude 并路由工具調(diào)用的循環(huán))、sandbox(Claude 跑代碼的執(zhí)行環(huán)境)。
![]()
原先這三個東西全塞在一個容器里。容器一旦崩潰,session 丟失,工程師要進去手動排障。Anthropic 把這種狀態(tài)叫做"寵物"——需要人照顧、不能丟、一旦出問題就得蹲在旁邊守著。
拆開之后,容器變成了"牲口":掛了就重啟一個,session 存在外面,harness 通過 wake(sessionId) 讀回事件日志繼續(xù)跑。任何一個組件可以單獨崩潰、單獨替換,不影響其他兩個。
這個改動帶來的性能收益是:p50 首 token 延遲下降 60%,p95 下降超過 90%。
工程博客用操作系統(tǒng)做類比:OS 把硬件虛擬化成"進程"和"文件"這類抽象,抽象的壽命比任何一代硬件都長——read() 命令對 1970 年代的磁盤和今天的 SSD 都能跑。Managed Agents 在做同樣的事:把 Agent 的核心組件虛擬化成穩(wěn)定接口,讓上層邏輯不隨模型和架構(gòu)的升級而失效。
安全邊界也在這次重設。舊設計里,Claude 生成的代碼和系統(tǒng)憑證跑在同一個容器,prompt injection 只需要說服模型讀一下自己的環(huán)境變量就能拿到 token。新設計里,沙箱永遠觸碰不到憑證,認證走 vault 加代理,harness 對所有憑證無感知。
四、OpenClaw 被踢之后,Anthropic 給了自己的答案
4月4日,Anthropic 宣布 Claude Pro 和 Max 訂閱用戶不能再用訂閱額度跑 OpenClaw 這類第三方 Agent 框架——繼續(xù)用要切換成按量付費。
原因很簡單:一個 $200/月的 Claude Max 訂閱,可以跑價值 $1000 到 $5000 的 Agent 計算任務。人類用戶一天睡覺,Agent 不睡。訂閱定價是為人類行為建模的,不適配 Agent 的使用模式。
先把第三方 harness 的廉價用量斷掉,再推出自己的托管方案,兩步之間相差四天。
路徑很清晰:Anthropic 在把 Agent 的運行層從第三方工具里拉回自己的平臺。企業(yè)客戶一旦把 Agent 跑在 Anthropic 托管的基礎(chǔ)設施上,數(shù)據(jù)管道、監(jiān)控配置、操作流程都嵌進日常工作,遷移成本會持續(xù)上升。這是企業(yè)軟件里最經(jīng)典的鎖定邏輯。
五、誰該認真看這件事
對現(xiàn)在在做 Agent 基礎(chǔ)設施的團隊,這次發(fā)布是一個信號:平臺層在向上擴張。不是第一次,也不會是最后一次。LangChain 當年的處境,值得重新想一遍。
對在用第三方 harness 工具的企業(yè),變化可能暫時感受不到,但比較基準已經(jīng)變了——Managed Agents 提供的是 Anthropic 調(diào)優(yōu)過的基礎(chǔ)設施,性能數(shù)據(jù)擺在那里。
對 Anthropic 的競爭對手,更值得關(guān)注的問題是:這套基礎(chǔ)設施是否綁定了 Claude 模型本身?如果是,那它對客戶的吸引力,部分來自模型質(zhì)量,部分來自遷移成本。兩者疊加,護城河會比看上去更厚。
Anthropic 工程博客的最后一句話是:"我們對接口的形態(tài)有主見,但對 Claude 將來需要什么具體的 harness 沒有主見。"
讀起來是技術(shù)上的謙遜,但做到這一點的前提,是他們已經(jīng)控制了接口本身。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.