Anthropic 造出了殺死 harness 的產(chǎn)品

2026-04-09 15:53:11　來源: 硅星GenAI

上海舉報

分享至

4月8日，Anthropic 上線 Claude Managed Agents 公測。兩天前，公司剛宣布年化經(jīng)常性收入突破 300 億美元。兩件事放在一起看，比任何一件單獨看都更說明問題。

這次發(fā)布的表面動作是：幫企業(yè)省去搭 Agent 基礎(chǔ)設施的麻煩——沙箱環(huán)境、session 管理、錯誤恢復、權(quán)限控制，全部托管在 Anthropic 平臺上，開發(fā)者只要定義 Agent 要干什么，剩下的交給 Anthropic。

真正的動作是：Anthropic 把原本屬于第三方的那層自己接管了。

原文鏈接：https://www.anthropic.com/engineering/managed-agents

一、harness 是誰的生意

過去兩年，圍繞 Claude 長出來一批工具，專門做"harness"這層。

harness 的工作是讓模型能干活：調(diào)用工具、管理上下文、處理報錯、在任務跑了幾十分鐘之后還能接著跑。模型是大腦，harness 是手腳加神經(jīng)系統(tǒng)。LangChain 做這個，OpenClaw 做這個，大量創(chuàng)業(yè)公司做這個。這是一門生意，因為 Anthropic 過去只賣模型，不提供跑模型的基礎(chǔ)設施。

現(xiàn)在 Anthropic 把這層接管了。

Claude Managed Agents 提供的正是這套：安全沙箱代碼執(zhí)行、session 持久化、工具調(diào)用編排、錯誤恢復、權(quán)限管理，全部打包成 API，按模型用量加每小時 8 美分的運行費計費。

早期用戶里有 Notion、Rakuten、Asana。Notion 把 Agent 接進工作區(qū)，支持幾十個任務并行；Rakuten 在一周內(nèi)給產(chǎn)品、銷售、財務、HR 各部署了一個 Agent，接入 Slack 和 Teams；Sentry 讓 Agent 自動寫 bug 修復補丁并開 PR，原本預估幾個月的集成，幾周就上線了。

二、所有 harness 都在編碼一件正在消失的事

Anthropic 工程博客的標題是《將大腦與雙手解耦》，核心論點藏在第一段：

harness 編碼的是模型當前做不到的事，但這些假設會隨著模型變強而過時。

他們給了一個例子。Claude Sonnet 4.5 會在感知到上下文窗口快到頭時提前收工，工程師管這個叫"context anxiety"。解法是在 harness 里加上 context reset。但同一套 harness 跑在 Opus 4.5 上，這個行為消失了，那段 context reset 的代碼變成了死重。

模型每進化一代，就有一批 harness 代碼變成負擔。寫 harness 的人越勤快，欠下的技術(shù)債越多。

這不是某家公司的問題，是整個 harness 賽道的結(jié)構(gòu)性困境：你賣的是對模型缺陷的補丁，而你的客戶正在全力消除那些缺陷。

三、Anthropic 的解法是操作系統(tǒng)思路

工程博客的核心設計決策是把三個組件徹底分開：session（發(fā)生了什么的日志）、harness（調(diào)用 Claude 并路由工具調(diào)用的循環(huán)）、sandbox（Claude 跑代碼的執(zhí)行環(huán)境）。

原先這三個東西全塞在一個容器里。容器一旦崩潰，session 丟失，工程師要進去手動排障。Anthropic 把這種狀態(tài)叫做"寵物"——需要人照顧、不能丟、一旦出問題就得蹲在旁邊守著。

拆開之后，容器變成了"牲口"：掛了就重啟一個，session 存在外面，harness 通過 wake(sessionId) 讀回事件日志繼續(xù)跑。任何一個組件可以單獨崩潰、單獨替換，不影響其他兩個。

這個改動帶來的性能收益是：p50 首 token 延遲下降 60%，p95 下降超過 90%。

工程博客用操作系統(tǒng)做類比：OS 把硬件虛擬化成"進程"和"文件"這類抽象，抽象的壽命比任何一代硬件都長——read() 命令對 1970 年代的磁盤和今天的 SSD 都能跑。Managed Agents 在做同樣的事：把 Agent 的核心組件虛擬化成穩(wěn)定接口，讓上層邏輯不隨模型和架構(gòu)的升級而失效。

安全邊界也在這次重設。舊設計里，Claude 生成的代碼和系統(tǒng)憑證跑在同一個容器，prompt injection 只需要說服模型讀一下自己的環(huán)境變量就能拿到 token。新設計里，沙箱永遠觸碰不到憑證，認證走 vault 加代理，harness 對所有憑證無感知。

四、OpenClaw 被踢之后，Anthropic 給了自己的答案

4月4日，Anthropic 宣布 Claude Pro 和 Max 訂閱用戶不能再用訂閱額度跑 OpenClaw 這類第三方 Agent 框架——繼續(xù)用要切換成按量付費。

原因很簡單：一個 $200/月的 Claude Max 訂閱，可以跑價值 $1000 到 $5000 的 Agent 計算任務。人類用戶一天睡覺，Agent 不睡。訂閱定價是為人類行為建模的，不適配 Agent 的使用模式。

先把第三方 harness 的廉價用量斷掉，再推出自己的托管方案，兩步之間相差四天。

路徑很清晰：Anthropic 在把 Agent 的運行層從第三方工具里拉回自己的平臺。企業(yè)客戶一旦把 Agent 跑在 Anthropic 托管的基礎(chǔ)設施上，數(shù)據(jù)管道、監(jiān)控配置、操作流程都嵌進日常工作，遷移成本會持續(xù)上升。這是企業(yè)軟件里最經(jīng)典的鎖定邏輯。

五、誰該認真看這件事

對現(xiàn)在在做 Agent 基礎(chǔ)設施的團隊，這次發(fā)布是一個信號：平臺層在向上擴張。不是第一次，也不會是最后一次。LangChain 當年的處境，值得重新想一遍。

對在用第三方 harness 工具的企業(yè)，變化可能暫時感受不到，但比較基準已經(jīng)變了——Managed Agents 提供的是 Anthropic 調(diào)優(yōu)過的基礎(chǔ)設施，性能數(shù)據(jù)擺在那里。

對 Anthropic 的競爭對手，更值得關(guān)注的問題是：這套基礎(chǔ)設施是否綁定了 Claude 模型本身？如果是，那它對客戶的吸引力，部分來自模型質(zhì)量，部分來自遷移成本。兩者疊加，護城河會比看上去更厚。

Anthropic 工程博客的最后一句話是："我們對接口的形態(tài)有主見，但對 Claude 將來需要什么具體的 harness 沒有主見。"

讀起來是技術(shù)上的謙遜，但做到這一點的前提，是他們已經(jīng)控制了接口本身。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.