<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic再發Agent神文:像人類工程師一樣思考,解決「長程任務」難題

      0
      分享至


      ↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新

      Anthropic再發Agent工程實踐神文:Effective harnesses for long-running agents(適用于長期運行Agents的有效工具),強烈建議大家圍觀閱讀

      之前我介紹過Anthropic Agent文章合集這里:

      隨著AI Agent能力的提升,開發者開始要求它們承擔跨越數小時甚至數天的復雜任務。然而,如何讓Agent在多個上下文窗口之間保持一致的進度,仍然是一個未解難題

      長程Agent面臨的核心挑戰在于,它們必須分“會話”(Session)工作,而每個新會話開始時都像是一個沒有過往記憶的新工程師接班。由于上下文窗口有限,且復雜項目無法在單一窗口內完成,Agent需要一種機制來彌合編碼會話之間的鴻溝

      Anthropic工程團隊通過觀察人類工程師的工作方式,為Claude Agent SDK開發了一套包含兩個部分的解決方案:初始化Agent(Initializer Agent)和編碼Agent(Coding Agent)

      核心挑戰:上下文壓縮還不夠

      Claude Agent SDK是一個通用的Agent框架,具備上下文管理功能(如壓縮),理論上應能讓Agent無限期工作

      但在實際測試中(例如要求最新的Opus 4.5構建一個claude.ai的克隆版),僅靠上下文壓縮是不夠的。Claude主要表現出兩種失敗模式:

      1.試圖一次性完成所有工作:Agent傾向于在一次會話中做太多事,導致中途耗盡上下文,留下的功能只完成了一半且缺乏文檔。下一個會話的Agent必須猜測之前發生了什么,浪費大量時間修復基礎應用

      2.過早宣布完工: 在項目后期,新的Agent實例看到已經有一些功能,就誤以為整個工作已完成

      解決方案:雙Agent架構

      Anthropic將問題分解,提出了雙重解決方案:

      初始化Agent:第一個會話使用專用提示詞,負責搭建環境。包括生成init.sh腳本、記錄進度的claude-progress.txt文件,以及展示文件添加情況的初始Git提交

      編碼Agent:后續的每一個會話都致力于取得增量進展,并留下結構化的更新

      這一方案的關鍵在于讓Agent在開啟新窗口時能迅速理解工作狀態——這主要通過claude-progress.txt文件和Git歷史記錄來實現

      環境管理的三大支柱

      為了支持這種工作流,環境設置包含以下關鍵組件:

      1. 功能列表(Feature List)

      為了防止Agent一次性蠻干或過早結束,初始化Agent被要求編寫一個包含所有功能需求的詳細文件。在claude.ai克隆案例中,這包含超過200個功能點。

      這些功能最初都被標記為“failing”(未通過),為后續Agent提供了清晰的工作全景圖

      JSON文件示例:

      {
      "category": "functional",
      "description": "New chat button creates a fresh conversation",
      "steps": [
      "Navigate to main interface",
      "Click the 'New Chat' button",
      "Verify a new conversation is created",
      "Check that chat area shows welcome state",
      "Verify conversation appears in sidebar"
      ],
      "passes": false
      }

      實驗發現,使用JSON格式優于Markdown,因為模型不太容易錯誤地更改或覆蓋JSON文件。同時,提示詞需包含強硬指令,禁止刪除或編輯測試,只允許更改passes字段的狀態

      2. 增量進展(Incremental Progress)

      有了初始腳手架后,編碼Agent被要求一次只做一個功能

      為了保持環境整潔,Agent需要在每次代碼變更后:

      通過Git提交代碼,并附帶描述性信息;

      在進度文件中撰寫摘要

      這使得模型可以利用Git回滾錯誤代碼,恢復到工作狀態,避免了后續Agent需要猜測前任做了什么的情況。

      3. 端到端測試

      Claude的另一個主要失敗模式是:在沒有適當測試的情況下標記功能為完成。它往往只做單元測試或簡單的curl命令,卻忽略了端到端的驗證。

      解決方案是明確提示Claude使用瀏覽器自動化工具(如Puppeteer MCP server),像人類用戶一樣進行測試。通過讓Claude看到屏幕截圖,它能識別并修復代碼中不明顯的Bug

      快速上手流程(Getting up to speed)

      基于上述架構,每個編碼Agent在會話開始時都會被提示執行一系列標準步驟:

      1. 1. 運行pwd查看當前工作目錄。

      2. 2. 閱讀Git日志和進度文件,了解最近完成了什么。

      3. 3. 閱讀功能列表文件,選擇一個未完成的最高優先級功能。

      4. 4. 運行init.sh啟動開發服務器。

      5. 5. 在實現新功能前,先運行基本的端到端測試,確保應用未處于損壞狀態。

      典型會話流程示例:

      [Assistant] 我先了解一下項目當前狀態。 [Tool Use] [Tool Use] [Tool Use] [Assistant] 檢查Git日志... [Tool Use] [Assistant] 檢查是否有啟動腳本并重啟服務器... [Assistant] 現在驗證基本功能是否正常... [Assistant] 驗證通過。現在我查看 tests.json 決定下一步做什么。
      常見故障模式與修復方案總結

      問題

      初始化Agent行為

      編碼Agent行為

      Claude過早宣布項目全部完成

      根據輸入規格,建立包含詳細功能描述的結構化JSON文件。

      會話開始時讀取功能列表,只選擇一個功能開始工作。

      環境遺留Bug或無文檔記錄

      建立初始Git倉庫和進度筆記文件。

      開始時讀取進度文件和Git日志;運行基礎測試發現潛在Bug;結束時提交Git和進度更新。

      過早標記功能為“完成”

      建立功能列表文件。

      自我驗證所有功能。僅在仔細測試后標記功能為“通過”。

      浪費時間研究如何運行App

      編寫能運行開發服務器的init.sh腳本。

      會話開始時直接讀取并運行init.sh

      這項研究展示了長程Agent框架的一種可行方案,但仍有未解決的問題:

      單Agent vs 多Agent:目前尚不清楚是通用的編碼Agent表現最好,還是采用多Agent架構(如專門的測試Agent、QA Agent、代碼清理Agent)更優

      領域泛化:本演示針對全棧Web開發。未來方向是將這些經驗推廣到科學研究或金融建模等其他長程任務領域

      參考:

      https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

      --end--

      最后記得??我,這對我非常重要,每天都在更新:

      歡迎點贊轉發推薦評論,別忘了關注我

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一夜虧光1800萬,白銀波動率飆至90%,不是交易,是屠殺!....

      一夜虧光1800萬,白銀波動率飆至90%,不是交易,是屠殺!....

      思哲與創富
      2025-12-29 18:57:19
      貝克漢姆一家出席婚禮!14歲的小七皮草配緊身裙變小貴婦,很驚艷

      貝克漢姆一家出席婚禮!14歲的小七皮草配緊身裙變小貴婦,很驚艷

      曹幺妹的小廚房
      2025-12-29 18:08:54
      飯后黃金半小時:做這件事,血糖、血管、體重都感謝你

      飯后黃金半小時:做這件事,血糖、血管、體重都感謝你

      貓大夫醫學科普
      2025-10-12 06:47:41
      美國又要完蛋了嗎?談談斬殺線

      美國又要完蛋了嗎?談談斬殺線

      十柱
      2025-12-27 16:41:22
      事業單位最閑的崗位是啥?網友:氣象局的人看到這個真是笑了

      事業單位最閑的崗位是啥?網友:氣象局的人看到這個真是笑了

      解讀熱點事件
      2025-10-08 00:20:03
      尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

      尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

      扶蘇聊歷史
      2025-12-25 16:18:51
      廣東各地市黨委、人大、政府、政協領導班子名單

      廣東各地市黨委、人大、政府、政協領導班子名單

      中國能源網
      2025-12-29 16:51:10
      章子怡為女兒慶生,10歲醒醒越長越漂亮,模樣隨爸氣質像媽超級美

      章子怡為女兒慶生,10歲醒醒越長越漂亮,模樣隨爸氣質像媽超級美

      張發林
      2025-12-30 10:36:25
      劉芳菲:拜訪龐萊臣曾孫女龐叔令女士之后,去蘇州菜市場品嘗湯圓

      劉芳菲:拜訪龐萊臣曾孫女龐叔令女士之后,去蘇州菜市場品嘗湯圓

      曉今娛
      2025-12-29 08:44:01
      央企“最牛女副處長”落馬:兩年與上司開房410次,細節曝光

      央企“最牛女副處長”落馬:兩年與上司開房410次,細節曝光

      西門老爹
      2025-12-16 15:35:31
      快船消息:小卡實至名歸,全明星首輪投票公布,戰國王出場更新

      快船消息:小卡實至名歸,全明星首輪投票公布,戰國王出場更新

      冷月小風風
      2025-12-30 10:31:52
      很多東西正著不好用,一旦你將它反過來,就會打開新世界大門

      很多東西正著不好用,一旦你將它反過來,就會打開新世界大門

      新住家居
      2025-12-21 18:09:16
      月薪五千住2880萬豪宅?徐湖平別墅調查組進駐引爆輿論

      月薪五千住2880萬豪宅?徐湖平別墅調查組進駐引爆輿論

      林子說事
      2025-12-29 11:09:31
      克林頓慨嘆 “我是烏克蘭的歷史罪人”!當年中國的決定,何其正確偉大!

      克林頓慨嘆 “我是烏克蘭的歷史罪人”!當年中國的決定,何其正確偉大!

      文史明鑒
      2025-12-29 20:27:14
      西班牙媒體評新世紀最佳運動員:梅西僅第二!C羅無緣前三!

      西班牙媒體評新世紀最佳運動員:梅西僅第二!C羅無緣前三!

      氧氣是個地鐵
      2025-12-29 18:48:57
      別端著了!上海灘兩場同演,一爆火一冷清!撕開了誰的遮羞布?

      別端著了!上海灘兩場同演,一爆火一冷清!撕開了誰的遮羞布?

      觀察鑒娛
      2025-12-29 09:27:23
      天津一人干這事被查辦!

      天津一人干這事被查辦!

      天津族
      2025-12-30 08:35:43
      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注8點

      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注8點

      全球軍事記
      2025-12-27 17:24:58
      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      妍妍教育日記
      2025-12-18 20:23:32
      知青往事:回城后他娶了高干家的閨女,整整十八年岳母不讓進家門

      知青往事:回城后他娶了高干家的閨女,整整十八年岳母不讓進家門

      草根情感故事茶社
      2025-12-24 10:21:40
      2025-12-30 11:27:00
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1024文章數 393關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      教育
      數碼
      本地
      旅游
      軍事航空

      教育要聞

      湖南中醫大學湖北分數線揭秘!別慌!

      數碼要聞

      LG將在CES 2026推出畫框式藝術電視Gallery TV

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      旅游要聞

      中國游客不重要?日本京都酒店價格已跳水

      軍事要聞

      福建海警艦艇與臺海巡船對峙航行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲原创无码| 国产无遮挡吃胸膜奶免费看| 日韩老无码| 久久综合干| 欧美性色黄大片| 亚洲精品Aa| 久久精品国产av一区二区三区| 久操不卡| 国产精品A片| 女人喷水高潮时的视频网站| 乌克兰美女浓毛bbw| 亚洲综合色中文网| 熟妇自搞| 女人喷水高潮时的视频网站 | 国产精品久久久国产盗摄| 中文字幕久久熟女蜜桃| 精品成人A片久久久久久船舶| 中文字幕av久久爽Av| 亚洲男人天堂2021| 国产精品一区二区 尿失禁| AV资源吧| 91亚色| 国产女人18毛片水真多18精品| 337人体做爰大胆视频| 色五月丁香六月欧美综合| 新沂市| 国产va影院| 亚洲欧美另类久久久精品播放的| 国产av国片精品| 国产午夜精品久久久久免费视| 自拍偷拍国产| 欧美老妇熟妇???亚洲日韩| 精品一区二区三区四区| 无码国产精品一区二区免费虚拟vr | 蜜臂av| 一 级做人爱全视频在线看| 亚洲成av人片在www鸭子| 国产精品无码dvd在线观看| 人妻无码网站| 国产女人18毛片精品18水| 国产亚洲欧美精品久久久|