3 個(gè)工程師、5 個(gè)月、100 萬(wàn)行代碼、零手寫(xiě)代碼。
可能你會(huì)覺(jué)得很離譜
但是后來(lái)和幾個(gè)朋友聊,有個(gè)朋友在公司就他 1 個(gè)人,2 周,3 萬(wàn)塊錢(qián),用 Claude Code 做了一個(gè)產(chǎn)品上線到了 App Store。
他怎么做到的?,他只是學(xué)會(huì)了 Harness Engineering。
先說(shuō)一個(gè)真實(shí)的對(duì)話(huà)。
我跟朋友解釋 Harness Engineering,說(shuō)這是”人給 AI 搭建好運(yùn)行環(huán)境,來(lái)駕馭 AI 更高效地工作”。
她聽(tīng)完點(diǎn)點(diǎn)頭,問(wèn)我:那我給電腦插電源、按開(kāi)機(jī)鍵,也算給 AI 搭環(huán)境了?
我愣了一秒。
字面上講,插電源確實(shí)是”讓 AI 能運(yùn)行”的前提。但如果插電源也算,那”做任何準(zhǔn)備工作”都叫 Harness Engineering,這個(gè)詞就沒(méi)有意義了。
這個(gè)對(duì)話(huà)幫我把概念的邊界逼清楚了:
Harness Engineering 不是給人用電腦的基礎(chǔ)設(shè)施,而是專(zhuān)門(mén)為 AI Agent 自主工作而設(shè)計(jì)的運(yùn)行環(huán)境。
區(qū)別在”自主”兩個(gè)字。
你開(kāi)機(jī),是為了讓自己能干活。Harness Engineering 要解決的問(wèn)題是:當(dāng)你不在旁邊的時(shí)候,AI Agent 也能把任務(wù)干好,干對(duì),干完。
這需要三件事到位。
![]()
說(shuō)白了,Harness Engineering 就是給 AI Agent 造一個(gè)”能干活的工作間”。工具備齊、信息有序、標(biāo)準(zhǔn)明確,它才能自主工作。
這跟之前流行的 Prompt Engineering 和 Context Engineering 不是同一層次的事。Prompt Engineering 解決的是怎么跟 AI 說(shuō)話(huà),Context Engineering 解決的是喂給 AI 什么信息,而 Harness Engineering 解決的是給 AI 造一個(gè)什么樣的工作環(huán)境。
前兩個(gè)是對(duì)話(huà)層,后一個(gè)是系統(tǒng)層。
有個(gè)類(lèi)比我覺(jué)得挺貼切的。一個(gè)新員工入職,你可以教他怎么跟你匯報(bào)(Prompt Engineering),你可以把相關(guān)背景材料發(fā)給他看(Context Engineering),但這兩件事加起來(lái),并不等于他能獨(dú)立工作。他還需要一個(gè)東西:一個(gè)配好了工具、定好了流程、說(shuō)清楚了評(píng)判標(biāo)準(zhǔn)的工作環(huán)境。他知道該去哪里找資料,知道手邊有什么工具可以用,知道做完一件事對(duì)不對(duì)的判斷標(biāo)準(zhǔn)是什么。
這個(gè)”工作環(huán)境”,才是 Harness Engineering 做的事。
地圖告訴它方向在哪、路徑怎么走。說(shuō)明書(shū)把每一步都寫(xiě)死,Agent 讀完要么照本宣科,要么被信息量壓垮。一個(gè)真正能自主工作的 Agent,需要的是地圖。
我看完這句話(huà)的時(shí)候,想到了自己之前在項(xiàng)目里踩的坑。
我們當(dāng)時(shí)也做了一份”說(shuō)明書(shū)”,一份超長(zhǎng)的 System Prompt,把所有情況都試圖覆蓋,結(jié)果 Agent 一方面會(huì)漏看重要約束,另一方面又會(huì)在不重要的細(xì)節(jié)上糾結(jié)太久。
后來(lái)才明白,信息不是越多越好,關(guān)鍵是在對(duì)的時(shí)候給到對(duì)的信息。
![]()
我在真正把 Harness 搭好之前,也經(jīng)歷過(guò)那個(gè)階段。
用 AI Agent 做項(xiàng)目,到處是坑。跑一半突然偏,輸出時(shí)好時(shí)壞,人根本離不開(kāi)。我當(dāng)時(shí)以為是模型不夠好,換了幾個(gè)底模,發(fā)現(xiàn)換完還是一樣的問(wèn)題。后來(lái)才意識(shí)到,真正的問(wèn)題不是模型,是環(huán)境。
模型就像一個(gè)能力很強(qiáng)的人。但能力強(qiáng),不等于給他一個(gè)亂成一團(tuán)的工作環(huán)境,他也能干好活。
沒(méi)做好 Harness 的時(shí)候,AI Agent 會(huì)卡在三個(gè)地方。
我遇到過(guò)一個(gè)很典型的情況。一個(gè) Agent 跑到中途,把最開(kāi)始給它的格式要求”忘了”,開(kāi)始按自己的理解輸出,輸出的結(jié)果結(jié)構(gòu)完全不對(duì),但它自己不知道,還以為任務(wù)完成了。你如果不在旁邊盯著,等它最終輸出以后,你會(huì)發(fā)現(xiàn),根本不能用。
很多任務(wù),Agent 光靠想做不到。要查系統(tǒng)日志,得有查詢(xún)接口;要驗(yàn)證頁(yè)面效果,得能打開(kāi)瀏覽器;要跑自動(dòng)化測(cè)試,得有測(cè)試框架。工具沒(méi)有提前備好,Agent 就會(huì)陷入一種尷尬的狀態(tài):知道下一步要做什么,但沒(méi)有手段執(zhí)行,只調(diào)用llm直接回復(fù)應(yīng)付或者干脆跳過(guò)。
這是最隱蔽的問(wèn)題,也是我覺(jué)得最值得認(rèn)真對(duì)待的一個(gè)。
Agent 完成一個(gè)子任務(wù),它自己判斷”好了”,但這個(gè)判斷依據(jù)是什么?沒(méi)有明確定義的話(huà),它可能把一個(gè)有明顯 bug 的輸出交給你,因?yàn)樗J(rèn)為”能跑起來(lái)就算完成”。或者反過(guò)來(lái),它會(huì)因?yàn)槟硞€(gè)無(wú)關(guān)緊要的細(xì)節(jié)沒(méi)處理好,一直在那里反復(fù)跑,浪費(fèi)了大量時(shí)間。
![]()
搭好 Harness 之后,這三個(gè)困境都有了對(duì)應(yīng)的解法。
Ryan 團(tuán)隊(duì)的 Codex,單次運(yùn)行可以在一個(gè)任務(wù)上持續(xù)工作超過(guò)六個(gè)小時(shí),通常是在人類(lèi)睡覺(jué)的時(shí)候。它自己打開(kāi)瀏覽器驗(yàn)證 UI,自己查日志找 bug,自己跑測(cè)試,自己修了再驗(yàn)證,最后打開(kāi)一個(gè) Pull Request,附上執(zhí)行記錄。整個(gè)過(guò)程,人類(lèi)不在場(chǎng)。
這不是因?yàn)樗玫哪P陀卸嗵貏e。是因?yàn)樗幸粋€(gè)搭得足夠好的 Harness。
對(duì)比一下就很清楚了。同樣是 AI Agent,同樣是復(fù)雜任務(wù),有 Harness 的跑六個(gè)小時(shí)自主完成,沒(méi)有 Harness 的跑半小時(shí)就得人來(lái)救火。差距不在模型,在環(huán)境。
說(shuō)完理論,講點(diǎn)實(shí)際的。
去年我在公司做過(guò)一個(gè) Multi-Agent 項(xiàng)目,叫 product_demo_video_agent。目標(biāo)是讓用戶(hù)上傳一張商品圖,AI 自動(dòng)生成一條產(chǎn)品展示視頻。聽(tīng)起來(lái)很直接,但實(shí)現(xiàn)起來(lái)是一個(gè)完整的多 Agent 協(xié)作系統(tǒng)。
![]()
整個(gè)系統(tǒng)的設(shè)計(jì)是這樣的。
用戶(hù)輸入進(jìn)來(lái)之后,先經(jīng)過(guò)一個(gè)主 Agent(product_demo_video_agent)做路由規(guī)劃,子Agent_1(pdv_proposal_agent)這個(gè) Agent 負(fù)責(zé)理解用戶(hù)的商品,分析適合的視頻風(fēng)格和鏡頭語(yǔ)言,輸出一個(gè)完整的視頻制作方案。然后把這個(gè)方案交給子 Agent_2(pdv_generate_agent)生成產(chǎn)品分鏡圖,子 Agent_3(pdv_generate_video_agent) 根據(jù)分鏡圖產(chǎn)出分鏡片段視頻,并調(diào)用合并工具、音頻生成工具合成最終大約20s的視頻。
四個(gè) Agent 各司其職,理論上跑得很順。但只是理論上。
實(shí)際跑起來(lái),卡了很久,踩了兩個(gè)很典型的坑。
比如兩個(gè) Agent 之間需要傳數(shù)據(jù)。主 Agent 把分析好的方案?jìng)鹘o子 Agent,子 Agent 再根據(jù)用戶(hù)需求生成方案。聽(tīng)起來(lái)很自然,但主 Agent 輸出的”方案”是什么格式?是自然語(yǔ)言描述?還是結(jié)構(gòu)化的 JSON?字段名是什么?必填項(xiàng)是哪些?視頻時(shí)長(zhǎng)、鏡頭數(shù)量、風(fēng)格關(guān)鍵詞,這些子 Agent 需要的信息,主 Agent 有沒(méi)有都輸出?
這些問(wèn)題如果沒(méi)有提前定義,就會(huì)出問(wèn)題。
我們遇到的情況是,主 Agent 有時(shí)候輸出一整段自然語(yǔ)言描述,有時(shí)候是半結(jié)構(gòu)化的數(shù)據(jù),字段名也不固定,有時(shí)候叫style,有時(shí)候叫video_style,有時(shí)候這個(gè)字段直接不出現(xiàn)。子 Agent 拿到這個(gè)”方案”,不知道該讀哪里,只能自己猜。猜對(duì)了還好,猜錯(cuò)了就生成出偏差的結(jié)果,甚至直接報(bào)錯(cuò)停掉。
排查起來(lái)特別痛苦。因?yàn)槟悴恢朗侵?Agent 的問(wèn)題、子 Agent 的問(wèn)題,還是中間傳遞的問(wèn)題,全鏈路都得看一遍,找那個(gè)到底是哪里斷了。
做完之后,兩個(gè) Agent 之間的傳遞幾乎不再出錯(cuò)了。更重要的是,一旦出錯(cuò),我們能很快定位是哪個(gè)字段的問(wèn)題,排查時(shí)間從幾小時(shí)縮短到幾分鐘。
![]()
這其實(shí)就是一種 Harness Engineering 的實(shí)踐。把 Agent 之間的接口定義清楚,讓每個(gè) Agent 只需要關(guān)注自己負(fù)責(zé)的那一段,輸入是什么、輸出是什么,不需要猜,不需要兼容各種可能的格式變體。
字段問(wèn)題解決之后,下一個(gè)問(wèn)題來(lái)了:輸出質(zhì)量忽高忽低。
同樣的輸入,有時(shí)候主 Agent 給出的視頻方案很精準(zhǔn),描述清晰,鏡頭邏輯合理,子 Agent 照著做出來(lái)的效果很好。有時(shí)候同樣的輸入,主 Agent 給出的方案很模糊,關(guān)鍵信息缺失,子 Agent 只能靠猜,最終生成的視頻就差很多。
這種不穩(wěn)定在 Multi-Agent 項(xiàng)目里最讓人頭疼,因?yàn)楹茈y復(fù)現(xiàn),你很難找到一個(gè)確定的原因說(shuō)”因?yàn)?XX 所以這次質(zhì)量差”。
我們?cè)嚵藘蓚€(gè)方向。
一個(gè)是模型選型調(diào)整。換了更強(qiáng)的底模跑主 Agent,穩(wěn)定性確實(shí)提升了不少,輸出質(zhì)量的方差明顯縮小了。但成本也跟著上去了,而且強(qiáng)模型也不是萬(wàn)能的,在某些特定場(chǎng)景下還是會(huì)飄。
另一個(gè)是 System Prompt 微調(diào)。這是更精細(xì)的調(diào)法,也是我覺(jué)得更治本的方向。我們把主 Agent 的 Prompt 拆開(kāi)來(lái)分析,哪些指令它容易理解、哪些容易誤解、哪些場(chǎng)景下容易生成質(zhì)量差的方案。然后針對(duì)性地改,把模糊的指令寫(xiě)具體,把容易出錯(cuò)的邊界情況加進(jìn)去,把期望的輸出格式用示例說(shuō)明,用幾個(gè)好的樣本告訴它”這種質(zhì)量才算及格”。
有時(shí)候基本上是按照日期來(lái)定義版本名,System Prompt需要不斷微調(diào)。
![]()
兩個(gè)方向結(jié)合起來(lái)用,效果明顯好了很多。
這個(gè)過(guò)程讓我意識(shí)到一件事:輸出質(zhì)量不穩(wěn)定,本質(zhì)是因?yàn)?Agent 對(duì)”什么是好輸出”沒(méi)有明確認(rèn)知。它不知道什么叫合格,只能靠自己的理解猜測(cè),而不同的請(qǐng)求里這個(gè)猜測(cè)的結(jié)果就會(huì)波動(dòng)。
Prompt 優(yōu)化,其實(shí)就是在做 Harness,把驗(yàn)收標(biāo)準(zhǔn)提前編碼進(jìn) Agent 的工作指令里,給它一個(gè)更清晰的參照系。讓它在生成內(nèi)容的時(shí)候,有一個(gè)具體的”對(duì)”的標(biāo)準(zhǔn)可以對(duì)照,而不是憑感覺(jué)。
字段定義是在規(guī)范接口,Prompt 微調(diào)是在規(guī)范品質(zhì)。前者解決數(shù)據(jù)怎么傳,后者解決內(nèi)容怎么對(duì),合在一起,整個(gè) Multi-Agent 系統(tǒng)才跑得穩(wěn),才能真正減少人工介入的頻率。
講完坑,講方法。
但實(shí)際結(jié)果是,Agent 一打開(kāi)就被淹沒(méi),重要信息找不到,過(guò)時(shí)信息刪不完,維護(hù)成本高得離譜。而且更關(guān)鍵的是,當(dāng)你什么都告訴它,它反而不知道什么重要。模型在處理超長(zhǎng) Prompt 時(shí)會(huì)出現(xiàn)注意力分散的問(wèn)題,早期的信息容易被后面的覆蓋,重要的約束可能就這樣被漏掉了。
他們后來(lái)的做法是把AGENTS.md瘦身到大約 100 行,只做一件事:告訴 Agent”你需要的信息在哪里”
AGENTS.md 是一張地圖,不是一本書(shū)。Agent 需要什么,自己去對(duì)應(yīng)位置讀取,不是一次性消化所有內(nèi)容。
他們團(tuán)隊(duì)意識(shí)到,當(dāng) Agent 的吞吐量增加之后,人工 QA 成了瓶頸。人的時(shí)間和注意力有限,每次 Agent 跑完都要人來(lái)驗(yàn)證,這件事本身就不可擴(kuò)展。規(guī)模上不去,不是因?yàn)?Agent 能力不夠,是因?yàn)槿祟?lèi)的驗(yàn)證能力跟不上。
解決方案是把驗(yàn)證能力也交給 Agent。
這意味著什么?
像”確保服務(wù)啟動(dòng)在 800ms 內(nèi)完成”、”這四個(gè)核心用戶(hù)旅程的請(qǐng)求耗時(shí)不得超過(guò) 2 秒”這樣的指令,Agent 自己就能跑完驗(yàn)證,不需要人來(lái)盯著看。
對(duì)我們做產(chǎn)品的人來(lái)說(shuō),遷移過(guò)來(lái)的邏輯是:你給 Agent 的任務(wù),要讓它有能力自己檢驗(yàn)結(jié)果。
如果 Agent 只能生成內(nèi)容,卻無(wú)法驗(yàn)證內(nèi)容是否符合要求,那驗(yàn)收這一環(huán)就永遠(yuǎn)壓在人身上。你的 Agent 系統(tǒng)的吞吐量天花板,就是你能做 QA 的速度上限。
想突破這個(gè)天花板,就要把驗(yàn)證能力也設(shè)計(jì)進(jìn)去,把”對(duì)不對(duì)”的判斷權(quán)交給 Agent 自己。
這一點(diǎn)聽(tīng)起來(lái)最反直覺(jué),但我覺(jué)得也是最值得細(xì)說(shuō)的一條。
Ryan 團(tuán)隊(duì)給代碼庫(kù)設(shè)計(jì)了一套嚴(yán)格的分層架構(gòu)。每個(gè)業(yè)務(wù)域有固定的層級(jí)結(jié)構(gòu),依賴(lài)方向經(jīng)過(guò)驗(yàn)證,什么模塊可以調(diào)用什么、什么不行,都有明確規(guī)定,并且用自定義 linter 強(qiáng)制執(zhí)行。違反了規(guī)則的代碼,直接報(bào)錯(cuò),不讓合并。
為什么要早做?因?yàn)?Agent 在有嚴(yán)格邊界和可預(yù)測(cè)結(jié)構(gòu)的環(huán)境里,才能跑得最快、跑得最穩(wěn)。約束越清晰,它越不會(huì)往錯(cuò)誤方向試探,越不會(huì)引入不一致的寫(xiě)法,整個(gè)代碼庫(kù)也越不會(huì)隨著吞吐量增加而悄悄腐爛。
而且有一個(gè)細(xì)節(jié)特別聰明:他們?cè)谧远x linter 的錯(cuò)誤信息里,直接寫(xiě)上修復(fù)指令。Agent 觸發(fā)了一條規(guī)則,錯(cuò)誤信息不只告訴它”這里違規(guī)了”,還告訴它”你應(yīng)該這樣改”。
這樣的約束對(duì) Agent 來(lái)說(shuō)不是束縛,是引導(dǎo)。它不需要猜測(cè)”這里怎么做才對(duì)”,規(guī)則本身就包含了答案。一旦規(guī)則到位,Agent 的速度和質(zhì)量都會(huì)提升,而不是因?yàn)楸患s束變慢。
這和我做 Multi-Agent 時(shí)候的邏輯是一樣的,給字段下定義、給 Prompt 寫(xiě)清楚期望格式和示例,都是在做規(guī)則化,把本來(lái)需要 Agent 自己猜測(cè)的東西,變成清晰可執(zhí)行的約束。
規(guī)則越清晰,Agent 越自由。這句話(huà)聽(tīng)起來(lái)矛盾,但確實(shí)是真的。
對(duì)了,還有一件容易被忽略的事:垃圾要定期回收。
Ryan 提到一個(gè)有趣的現(xiàn)象,Agent 會(huì)復(fù)現(xiàn)代碼庫(kù)里已有的模式,包括那些不夠好的模式。因?yàn)?Agent 在生成新代碼時(shí),會(huì)參考已有的代碼風(fēng)格和寫(xiě)法,如果里面有壞的寫(xiě)法,它就會(huì)把壞的寫(xiě)法繼續(xù)用下去,甚至傳播開(kāi)來(lái)。隨著時(shí)間積累,不好的寫(xiě)法越來(lái)越多,代碼庫(kù)會(huì)慢慢腐爛。
他們一開(kāi)始靠人工清理,每周五花 20% 的時(shí)間專(zhuān)門(mén)處理”AI 殘?jiān)薄o@然不可擴(kuò)展,而且這本身就是一種諷刺,用人力去清理 AI 制造的垃圾。
后來(lái)的做法是,定期跑一組后臺(tái) Agent 任務(wù),專(zhuān)門(mén)掃描偏差、更新質(zhì)量評(píng)分、發(fā)起針對(duì)性的重構(gòu) PR。大多數(shù) PR 可以在一分鐘內(nèi)審?fù)曜詣?dòng)合并,人工幾乎不需要參與。
技術(shù)債像利息,每天還一點(diǎn),好過(guò)攢著等崩。這個(gè)道理大家都懂,但真正做到的很少。有了 Agent 做垃圾回收,這件事終于變得可執(zhí)行了。
說(shuō)到這里,想聊一個(gè)更大的問(wèn)題:這一切最終走向哪里?
人類(lèi)的角色,已經(jīng)從”寫(xiě)代碼的人”變成了”設(shè)計(jì)系統(tǒng)的人”。
他用一句話(huà)總結(jié):人類(lèi)掌舵,智能體執(zhí)行。
我覺(jué)得這不是遙遠(yuǎn)的未來(lái),是正在發(fā)生的現(xiàn)在。而且不只是在軟件工程領(lǐng)域,任何依賴(lài) AI Agent 協(xié)作的工作,都在經(jīng)歷這個(gè)轉(zhuǎn)變。
我自己在做 Multi-Agent 項(xiàng)目的過(guò)程中,也明顯感受到了這個(gè)變化。我花在”寫(xiě) Prompt、定規(guī)范、搭結(jié)構(gòu)”上的時(shí)間,比寫(xiě)任何具體內(nèi)容都多。有時(shí)候一天都在改 System Prompt,在想怎么讓 Agent 更穩(wěn)定,在設(shè)計(jì)字段定義,在寫(xiě) Benchmark 用例。工作重心已經(jīng)從”產(chǎn)出”移到了”搭環(huán)境”。
一開(kāi)始我有點(diǎn)不適應(yīng),覺(jué)得自己好像沒(méi)在”干活”。后來(lái)才想明白,這本來(lái)就是更重要的工作。環(huán)境搭好了,Agent 跑起來(lái),產(chǎn)出是指數(shù)級(jí)的。環(huán)境搭不好,Agent 再?gòu)?qiáng),也是一個(gè)需要人工輔導(dǎo)的實(shí)習(xí)生。
所以我對(duì)人和 AI 協(xié)同的最終狀態(tài),有三個(gè)判斷。
這是最直接的分工變化。寫(xiě)代碼、生成內(nèi)容、跑流程、處理數(shù)據(jù),這些執(zhí)行層面的事 Agent 會(huì)越來(lái)越擅長(zhǎng),越來(lái)越快,越來(lái)越準(zhǔn)。而人的工作,是把環(huán)境準(zhǔn)備好:信息結(jié)構(gòu)、工具集合、驗(yàn)收規(guī)則,這些是 Agent 能不能干好活的地基。
地基搭得越好,Agent 干得越穩(wěn),你能解放的時(shí)間就越多。
這個(gè)分工不是”人監(jiān)督 AI”,那樣依然很累。而是”人設(shè)計(jì)系統(tǒng),AI 運(yùn)行系統(tǒng)”,設(shè)計(jì)是一次性的工作,運(yùn)行是持續(xù)自動(dòng)的。
給定一個(gè)模糊的目標(biāo),Agent 可以比任何人更快地探索可能性,發(fā)散方案,生成選項(xiàng)。它不會(huì)累,不會(huì)說(shuō)”這個(gè)方向我沒(méi)試過(guò),不確定”,它可以同時(shí)跑十個(gè)方向,把每個(gè)方向的結(jié)果都擺在你面前。
但方向?qū)Σ粚?duì),目前還是人來(lái)判斷。
人提方向,AI 鋪開(kāi)所有可能性,然后人從里面挑。這個(gè)節(jié)奏,已經(jīng)是很多團(tuán)隊(duì)現(xiàn)在的工作模式了。產(chǎn)品經(jīng)理給一個(gè)方向,Agent 生成十個(gè)方案,PM 挑選并調(diào)整,Agent 繼續(xù)細(xì)化。這個(gè)循環(huán)跑起來(lái),效率比任何傳統(tǒng)方式都高。
這條說(shuō)的是更深層的東西,也是我認(rèn)為最核心的一條。
Agent 在執(zhí)行任務(wù)時(shí),本質(zhì)上是在一套規(guī)則和約束下運(yùn)作的。這套規(guī)則,要人來(lái)定。什么能做,什么不能做,什么算好,什么算壞,什么情況下輸出達(dá)標(biāo),什么情況下要人介入,這些判斷目前都是人的責(zé)任。
AI 能非常嚴(yán)格地執(zhí)行規(guī)則,但它不能自己判斷這套規(guī)則是否合理,是否適合當(dāng)前的場(chǎng)景,是否需要在某個(gè)特殊情況下靈活處理。這個(gè)判斷力,是人類(lèi)目前仍然不可替代的核心能力。
所以未來(lái)的工程師,或者更廣義地說(shuō),未來(lái)依靠 AI 協(xié)作工作的人,核心能力會(huì)變成:搭好環(huán)境的能力、定義清晰規(guī)則的能力、在關(guān)鍵節(jié)點(diǎn)做方向判斷的能力。
寫(xiě)代碼、寫(xiě)內(nèi)容、做執(zhí)行,這些會(huì)越來(lái)越不稀缺。稀缺的是能把 Harness 搭好的人,是能清楚地知道”什么是好結(jié)果”并把這個(gè)標(biāo)準(zhǔn)表達(dá)清楚的人。
能力的重心在向上移,從執(zhí)行層移到系統(tǒng)設(shè)計(jì)層。
他在結(jié)尾寫(xiě),他們還在學(xué)習(xí)。還不知道一個(gè)完全由 Agent 生成的系統(tǒng)在架構(gòu)連貫性上會(huì)如何隨時(shí)間演變,還不知道人類(lèi)的判斷力在哪些地方能發(fā)揮最大作用,還不知道這一切隨著模型能力增長(zhǎng)會(huì)怎么變化。
我覺(jué)得這個(gè)坦誠(chéng)很有價(jià)值。Harness Engineering 不是一個(gè)有標(biāo)準(zhǔn)答案的領(lǐng)域,它太新了,所有人都在邊做邊摸索。Ryan 他們?cè)?OpenAI 內(nèi)部的探索,是目前最前沿的實(shí)踐之一,但也只是一種可能性,不是唯一答案。
但有一件事是確定的:AI 的能力在增長(zhǎng),但 Agent 能發(fā)揮多少,取決于它工作的環(huán)境有多好。
你搭的環(huán)境有多好,它就能干多好。
這不是一個(gè)技術(shù)問(wèn)題,是一個(gè)工作方式的問(wèn)題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.