<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      告別熬夜救火:學(xué)會(huì)這招,讓AI在你睡覺(jué)時(shí)也能把活干完!

      0
      分享至

      3 個(gè)工程師、5 個(gè)月、100 萬(wàn)行代碼、零手寫(xiě)代碼。

      可能你會(huì)覺(jué)得很離譜

      但是后來(lái)和幾個(gè)朋友聊,有個(gè)朋友在公司就他 1 個(gè)人,2 周,3 萬(wàn)塊錢(qián),用 Claude Code 做了一個(gè)產(chǎn)品上線到了 App Store。

      他怎么做到的?,他只是學(xué)會(huì)了 Harness Engineering。

      先說(shuō)一個(gè)真實(shí)的對(duì)話(huà)。

      我跟朋友解釋 Harness Engineering,說(shuō)這是”人給 AI 搭建好運(yùn)行環(huán)境,來(lái)駕馭 AI 更高效地工作”。

      她聽(tīng)完點(diǎn)點(diǎn)頭,問(wèn)我:那我給電腦插電源、按開(kāi)機(jī)鍵,也算給 AI 搭環(huán)境了?

      我愣了一秒。

      字面上講,插電源確實(shí)是”讓 AI 能運(yùn)行”的前提。但如果插電源也算,那”做任何準(zhǔn)備工作”都叫 Harness Engineering,這個(gè)詞就沒(méi)有意義了。

      這個(gè)對(duì)話(huà)幫我把概念的邊界逼清楚了:

      Harness Engineering 不是給人用電腦的基礎(chǔ)設(shè)施,而是專(zhuān)門(mén)為 AI Agent 自主工作而設(shè)計(jì)的運(yùn)行環(huán)境。

      區(qū)別在”自主”兩個(gè)字。

      你開(kāi)機(jī),是為了讓自己能干活。Harness Engineering 要解決的問(wèn)題是:當(dāng)你不在旁邊的時(shí)候,AI Agent 也能把任務(wù)干好,干對(duì),干完。

      這需要三件事到位。



      說(shuō)白了,Harness Engineering 就是給 AI Agent 造一個(gè)”能干活的工作間”。工具備齊、信息有序、標(biāo)準(zhǔn)明確,它才能自主工作。

      這跟之前流行的 Prompt Engineering 和 Context Engineering 不是同一層次的事。Prompt Engineering 解決的是怎么跟 AI 說(shuō)話(huà),Context Engineering 解決的是喂給 AI 什么信息,而 Harness Engineering 解決的是給 AI 造一個(gè)什么樣的工作環(huán)境。

      前兩個(gè)是對(duì)話(huà)層,后一個(gè)是系統(tǒng)層。

      有個(gè)類(lèi)比我覺(jué)得挺貼切的。一個(gè)新員工入職,你可以教他怎么跟你匯報(bào)(Prompt Engineering),你可以把相關(guān)背景材料發(fā)給他看(Context Engineering),但這兩件事加起來(lái),并不等于他能獨(dú)立工作。他還需要一個(gè)東西:一個(gè)配好了工具、定好了流程、說(shuō)清楚了評(píng)判標(biāo)準(zhǔn)的工作環(huán)境。他知道該去哪里找資料,知道手邊有什么工具可以用,知道做完一件事對(duì)不對(duì)的判斷標(biāo)準(zhǔn)是什么。

      這個(gè)”工作環(huán)境”,才是 Harness Engineering 做的事。

      地圖告訴它方向在哪、路徑怎么走。說(shuō)明書(shū)把每一步都寫(xiě)死,Agent 讀完要么照本宣科,要么被信息量壓垮。一個(gè)真正能自主工作的 Agent,需要的是地圖。

      我看完這句話(huà)的時(shí)候,想到了自己之前在項(xiàng)目里踩的坑。

      我們當(dāng)時(shí)也做了一份”說(shuō)明書(shū)”,一份超長(zhǎng)的 System Prompt,把所有情況都試圖覆蓋,結(jié)果 Agent 一方面會(huì)漏看重要約束,另一方面又會(huì)在不重要的細(xì)節(jié)上糾結(jié)太久。

      后來(lái)才明白,信息不是越多越好,關(guān)鍵是在對(duì)的時(shí)候給到對(duì)的信息。



      我在真正把 Harness 搭好之前,也經(jīng)歷過(guò)那個(gè)階段。

      用 AI Agent 做項(xiàng)目,到處是坑。跑一半突然偏,輸出時(shí)好時(shí)壞,人根本離不開(kāi)。我當(dāng)時(shí)以為是模型不夠好,換了幾個(gè)底模,發(fā)現(xiàn)換完還是一樣的問(wèn)題。后來(lái)才意識(shí)到,真正的問(wèn)題不是模型,是環(huán)境。

      模型就像一個(gè)能力很強(qiáng)的人。但能力強(qiáng),不等于給他一個(gè)亂成一團(tuán)的工作環(huán)境,他也能干好活。

      沒(méi)做好 Harness 的時(shí)候,AI Agent 會(huì)卡在三個(gè)地方。

      我遇到過(guò)一個(gè)很典型的情況。一個(gè) Agent 跑到中途,把最開(kāi)始給它的格式要求”忘了”,開(kāi)始按自己的理解輸出,輸出的結(jié)果結(jié)構(gòu)完全不對(duì),但它自己不知道,還以為任務(wù)完成了。你如果不在旁邊盯著,等它最終輸出以后,你會(huì)發(fā)現(xiàn),根本不能用。

      很多任務(wù),Agent 光靠想做不到。要查系統(tǒng)日志,得有查詢(xún)接口;要驗(yàn)證頁(yè)面效果,得能打開(kāi)瀏覽器;要跑自動(dòng)化測(cè)試,得有測(cè)試框架。工具沒(méi)有提前備好,Agent 就會(huì)陷入一種尷尬的狀態(tài):知道下一步要做什么,但沒(méi)有手段執(zhí)行,只調(diào)用llm直接回復(fù)應(yīng)付或者干脆跳過(guò)。

      這是最隱蔽的問(wèn)題,也是我覺(jué)得最值得認(rèn)真對(duì)待的一個(gè)。

      Agent 完成一個(gè)子任務(wù),它自己判斷”好了”,但這個(gè)判斷依據(jù)是什么?沒(méi)有明確定義的話(huà),它可能把一個(gè)有明顯 bug 的輸出交給你,因?yàn)樗J(rèn)為”能跑起來(lái)就算完成”。或者反過(guò)來(lái),它會(huì)因?yàn)槟硞€(gè)無(wú)關(guān)緊要的細(xì)節(jié)沒(méi)處理好,一直在那里反復(fù)跑,浪費(fèi)了大量時(shí)間。



      搭好 Harness 之后,這三個(gè)困境都有了對(duì)應(yīng)的解法。

      Ryan 團(tuán)隊(duì)的 Codex,單次運(yùn)行可以在一個(gè)任務(wù)上持續(xù)工作超過(guò)六個(gè)小時(shí),通常是在人類(lèi)睡覺(jué)的時(shí)候。它自己打開(kāi)瀏覽器驗(yàn)證 UI,自己查日志找 bug,自己跑測(cè)試,自己修了再驗(yàn)證,最后打開(kāi)一個(gè) Pull Request,附上執(zhí)行記錄。整個(gè)過(guò)程,人類(lèi)不在場(chǎng)。

      這不是因?yàn)樗玫哪P陀卸嗵貏e。是因?yàn)樗幸粋€(gè)搭得足夠好的 Harness。

      對(duì)比一下就很清楚了。同樣是 AI Agent,同樣是復(fù)雜任務(wù),有 Harness 的跑六個(gè)小時(shí)自主完成,沒(méi)有 Harness 的跑半小時(shí)就得人來(lái)救火。差距不在模型,在環(huán)境。

      說(shuō)完理論,講點(diǎn)實(shí)際的。

      去年我在公司做過(guò)一個(gè) Multi-Agent 項(xiàng)目,叫 product_demo_video_agent。目標(biāo)是讓用戶(hù)上傳一張商品圖,AI 自動(dòng)生成一條產(chǎn)品展示視頻。聽(tīng)起來(lái)很直接,但實(shí)現(xiàn)起來(lái)是一個(gè)完整的多 Agent 協(xié)作系統(tǒng)。



      整個(gè)系統(tǒng)的設(shè)計(jì)是這樣的。

      用戶(hù)輸入進(jìn)來(lái)之后,先經(jīng)過(guò)一個(gè)主 Agent(product_demo_video_agent)做路由規(guī)劃,子Agent_1(pdv_proposal_agent)這個(gè) Agent 負(fù)責(zé)理解用戶(hù)的商品,分析適合的視頻風(fēng)格和鏡頭語(yǔ)言,輸出一個(gè)完整的視頻制作方案。然后把這個(gè)方案交給子 Agent_2(pdv_generate_agent)生成產(chǎn)品分鏡圖,子 Agent_3(pdv_generate_video_agent) 根據(jù)分鏡圖產(chǎn)出分鏡片段視頻,并調(diào)用合并工具、音頻生成工具合成最終大約20s的視頻。

      四個(gè) Agent 各司其職,理論上跑得很順。但只是理論上。

      實(shí)際跑起來(lái),卡了很久,踩了兩個(gè)很典型的坑。

      比如兩個(gè) Agent 之間需要傳數(shù)據(jù)。主 Agent 把分析好的方案?jìng)鹘o子 Agent,子 Agent 再根據(jù)用戶(hù)需求生成方案。聽(tīng)起來(lái)很自然,但主 Agent 輸出的”方案”是什么格式?是自然語(yǔ)言描述?還是結(jié)構(gòu)化的 JSON?字段名是什么?必填項(xiàng)是哪些?視頻時(shí)長(zhǎng)、鏡頭數(shù)量、風(fēng)格關(guān)鍵詞,這些子 Agent 需要的信息,主 Agent 有沒(méi)有都輸出?

      這些問(wèn)題如果沒(méi)有提前定義,就會(huì)出問(wèn)題。

      我們遇到的情況是,主 Agent 有時(shí)候輸出一整段自然語(yǔ)言描述,有時(shí)候是半結(jié)構(gòu)化的數(shù)據(jù),字段名也不固定,有時(shí)候叫style,有時(shí)候叫video_style,有時(shí)候這個(gè)字段直接不出現(xiàn)。子 Agent 拿到這個(gè)”方案”,不知道該讀哪里,只能自己猜。猜對(duì)了還好,猜錯(cuò)了就生成出偏差的結(jié)果,甚至直接報(bào)錯(cuò)停掉。

      排查起來(lái)特別痛苦。因?yàn)槟悴恢朗侵?Agent 的問(wèn)題、子 Agent 的問(wèn)題,還是中間傳遞的問(wèn)題,全鏈路都得看一遍,找那個(gè)到底是哪里斷了。

      做完之后,兩個(gè) Agent 之間的傳遞幾乎不再出錯(cuò)了。更重要的是,一旦出錯(cuò),我們能很快定位是哪個(gè)字段的問(wèn)題,排查時(shí)間從幾小時(shí)縮短到幾分鐘。



      這其實(shí)就是一種 Harness Engineering 的實(shí)踐。把 Agent 之間的接口定義清楚,讓每個(gè) Agent 只需要關(guān)注自己負(fù)責(zé)的那一段,輸入是什么、輸出是什么,不需要猜,不需要兼容各種可能的格式變體。

      字段問(wèn)題解決之后,下一個(gè)問(wèn)題來(lái)了:輸出質(zhì)量忽高忽低。

      同樣的輸入,有時(shí)候主 Agent 給出的視頻方案很精準(zhǔn),描述清晰,鏡頭邏輯合理,子 Agent 照著做出來(lái)的效果很好。有時(shí)候同樣的輸入,主 Agent 給出的方案很模糊,關(guān)鍵信息缺失,子 Agent 只能靠猜,最終生成的視頻就差很多。

      這種不穩(wěn)定在 Multi-Agent 項(xiàng)目里最讓人頭疼,因?yàn)楹茈y復(fù)現(xiàn),你很難找到一個(gè)確定的原因說(shuō)”因?yàn)?XX 所以這次質(zhì)量差”。

      我們?cè)嚵藘蓚€(gè)方向。

      一個(gè)是模型選型調(diào)整。換了更強(qiáng)的底模跑主 Agent,穩(wěn)定性確實(shí)提升了不少,輸出質(zhì)量的方差明顯縮小了。但成本也跟著上去了,而且強(qiáng)模型也不是萬(wàn)能的,在某些特定場(chǎng)景下還是會(huì)飄。

      另一個(gè)是 System Prompt 微調(diào)。這是更精細(xì)的調(diào)法,也是我覺(jué)得更治本的方向。我們把主 Agent 的 Prompt 拆開(kāi)來(lái)分析,哪些指令它容易理解、哪些容易誤解、哪些場(chǎng)景下容易生成質(zhì)量差的方案。然后針對(duì)性地改,把模糊的指令寫(xiě)具體,把容易出錯(cuò)的邊界情況加進(jìn)去,把期望的輸出格式用示例說(shuō)明,用幾個(gè)好的樣本告訴它”這種質(zhì)量才算及格”。

      有時(shí)候基本上是按照日期來(lái)定義版本名,System Prompt需要不斷微調(diào)。



      兩個(gè)方向結(jié)合起來(lái)用,效果明顯好了很多。

      這個(gè)過(guò)程讓我意識(shí)到一件事:輸出質(zhì)量不穩(wěn)定,本質(zhì)是因?yàn)?Agent 對(duì)”什么是好輸出”沒(méi)有明確認(rèn)知。它不知道什么叫合格,只能靠自己的理解猜測(cè),而不同的請(qǐng)求里這個(gè)猜測(cè)的結(jié)果就會(huì)波動(dòng)。

      Prompt 優(yōu)化,其實(shí)就是在做 Harness,把驗(yàn)收標(biāo)準(zhǔn)提前編碼進(jìn) Agent 的工作指令里,給它一個(gè)更清晰的參照系。讓它在生成內(nèi)容的時(shí)候,有一個(gè)具體的”對(duì)”的標(biāo)準(zhǔn)可以對(duì)照,而不是憑感覺(jué)。

      字段定義是在規(guī)范接口,Prompt 微調(diào)是在規(guī)范品質(zhì)。前者解決數(shù)據(jù)怎么傳,后者解決內(nèi)容怎么對(duì),合在一起,整個(gè) Multi-Agent 系統(tǒng)才跑得穩(wěn),才能真正減少人工介入的頻率。

      講完坑,講方法。

      但實(shí)際結(jié)果是,Agent 一打開(kāi)就被淹沒(méi),重要信息找不到,過(guò)時(shí)信息刪不完,維護(hù)成本高得離譜。而且更關(guān)鍵的是,當(dāng)你什么都告訴它,它反而不知道什么重要。模型在處理超長(zhǎng) Prompt 時(shí)會(huì)出現(xiàn)注意力分散的問(wèn)題,早期的信息容易被后面的覆蓋,重要的約束可能就這樣被漏掉了。

      他們后來(lái)的做法是把AGENTS.md瘦身到大約 100 行,只做一件事:告訴 Agent”你需要的信息在哪里”

      AGENTS.md 是一張地圖,不是一本書(shū)。Agent 需要什么,自己去對(duì)應(yīng)位置讀取,不是一次性消化所有內(nèi)容。

      他們團(tuán)隊(duì)意識(shí)到,當(dāng) Agent 的吞吐量增加之后,人工 QA 成了瓶頸。人的時(shí)間和注意力有限,每次 Agent 跑完都要人來(lái)驗(yàn)證,這件事本身就不可擴(kuò)展。規(guī)模上不去,不是因?yàn)?Agent 能力不夠,是因?yàn)槿祟?lèi)的驗(yàn)證能力跟不上。

      解決方案是把驗(yàn)證能力也交給 Agent。

      這意味著什么?

      像”確保服務(wù)啟動(dòng)在 800ms 內(nèi)完成”、”這四個(gè)核心用戶(hù)旅程的請(qǐng)求耗時(shí)不得超過(guò) 2 秒”這樣的指令,Agent 自己就能跑完驗(yàn)證,不需要人來(lái)盯著看。

      對(duì)我們做產(chǎn)品的人來(lái)說(shuō),遷移過(guò)來(lái)的邏輯是:你給 Agent 的任務(wù),要讓它有能力自己檢驗(yàn)結(jié)果。

      如果 Agent 只能生成內(nèi)容,卻無(wú)法驗(yàn)證內(nèi)容是否符合要求,那驗(yàn)收這一環(huán)就永遠(yuǎn)壓在人身上。你的 Agent 系統(tǒng)的吞吐量天花板,就是你能做 QA 的速度上限。

      想突破這個(gè)天花板,就要把驗(yàn)證能力也設(shè)計(jì)進(jìn)去,把”對(duì)不對(duì)”的判斷權(quán)交給 Agent 自己。

      這一點(diǎn)聽(tīng)起來(lái)最反直覺(jué),但我覺(jué)得也是最值得細(xì)說(shuō)的一條。

      Ryan 團(tuán)隊(duì)給代碼庫(kù)設(shè)計(jì)了一套嚴(yán)格的分層架構(gòu)。每個(gè)業(yè)務(wù)域有固定的層級(jí)結(jié)構(gòu),依賴(lài)方向經(jīng)過(guò)驗(yàn)證,什么模塊可以調(diào)用什么、什么不行,都有明確規(guī)定,并且用自定義 linter 強(qiáng)制執(zhí)行。違反了規(guī)則的代碼,直接報(bào)錯(cuò),不讓合并。

      為什么要早做?因?yàn)?Agent 在有嚴(yán)格邊界和可預(yù)測(cè)結(jié)構(gòu)的環(huán)境里,才能跑得最快、跑得最穩(wěn)。約束越清晰,它越不會(huì)往錯(cuò)誤方向試探,越不會(huì)引入不一致的寫(xiě)法,整個(gè)代碼庫(kù)也越不會(huì)隨著吞吐量增加而悄悄腐爛。

      而且有一個(gè)細(xì)節(jié)特別聰明:他們?cè)谧远x linter 的錯(cuò)誤信息里,直接寫(xiě)上修復(fù)指令。Agent 觸發(fā)了一條規(guī)則,錯(cuò)誤信息不只告訴它”這里違規(guī)了”,還告訴它”你應(yīng)該這樣改”。

      這樣的約束對(duì) Agent 來(lái)說(shuō)不是束縛,是引導(dǎo)。它不需要猜測(cè)”這里怎么做才對(duì)”,規(guī)則本身就包含了答案。一旦規(guī)則到位,Agent 的速度和質(zhì)量都會(huì)提升,而不是因?yàn)楸患s束變慢。

      這和我做 Multi-Agent 時(shí)候的邏輯是一樣的,給字段下定義、給 Prompt 寫(xiě)清楚期望格式和示例,都是在做規(guī)則化,把本來(lái)需要 Agent 自己猜測(cè)的東西,變成清晰可執(zhí)行的約束。

      規(guī)則越清晰,Agent 越自由。這句話(huà)聽(tīng)起來(lái)矛盾,但確實(shí)是真的。

      對(duì)了,還有一件容易被忽略的事:垃圾要定期回收。

      Ryan 提到一個(gè)有趣的現(xiàn)象,Agent 會(huì)復(fù)現(xiàn)代碼庫(kù)里已有的模式,包括那些不夠好的模式。因?yàn)?Agent 在生成新代碼時(shí),會(huì)參考已有的代碼風(fēng)格和寫(xiě)法,如果里面有壞的寫(xiě)法,它就會(huì)把壞的寫(xiě)法繼續(xù)用下去,甚至傳播開(kāi)來(lái)。隨著時(shí)間積累,不好的寫(xiě)法越來(lái)越多,代碼庫(kù)會(huì)慢慢腐爛。

      他們一開(kāi)始靠人工清理,每周五花 20% 的時(shí)間專(zhuān)門(mén)處理”AI 殘?jiān)薄o@然不可擴(kuò)展,而且這本身就是一種諷刺,用人力去清理 AI 制造的垃圾。

      后來(lái)的做法是,定期跑一組后臺(tái) Agent 任務(wù),專(zhuān)門(mén)掃描偏差、更新質(zhì)量評(píng)分、發(fā)起針對(duì)性的重構(gòu) PR。大多數(shù) PR 可以在一分鐘內(nèi)審?fù)曜詣?dòng)合并,人工幾乎不需要參與。

      技術(shù)債像利息,每天還一點(diǎn),好過(guò)攢著等崩。這個(gè)道理大家都懂,但真正做到的很少。有了 Agent 做垃圾回收,這件事終于變得可執(zhí)行了。

      說(shuō)到這里,想聊一個(gè)更大的問(wèn)題:這一切最終走向哪里?

      人類(lèi)的角色,已經(jīng)從”寫(xiě)代碼的人”變成了”設(shè)計(jì)系統(tǒng)的人”。

      他用一句話(huà)總結(jié):人類(lèi)掌舵,智能體執(zhí)行。

      我覺(jué)得這不是遙遠(yuǎn)的未來(lái),是正在發(fā)生的現(xiàn)在。而且不只是在軟件工程領(lǐng)域,任何依賴(lài) AI Agent 協(xié)作的工作,都在經(jīng)歷這個(gè)轉(zhuǎn)變。

      我自己在做 Multi-Agent 項(xiàng)目的過(guò)程中,也明顯感受到了這個(gè)變化。我花在”寫(xiě) Prompt、定規(guī)范、搭結(jié)構(gòu)”上的時(shí)間,比寫(xiě)任何具體內(nèi)容都多。有時(shí)候一天都在改 System Prompt,在想怎么讓 Agent 更穩(wěn)定,在設(shè)計(jì)字段定義,在寫(xiě) Benchmark 用例。工作重心已經(jīng)從”產(chǎn)出”移到了”搭環(huán)境”。

      一開(kāi)始我有點(diǎn)不適應(yīng),覺(jué)得自己好像沒(méi)在”干活”。后來(lái)才想明白,這本來(lái)就是更重要的工作。環(huán)境搭好了,Agent 跑起來(lái),產(chǎn)出是指數(shù)級(jí)的。環(huán)境搭不好,Agent 再?gòu)?qiáng),也是一個(gè)需要人工輔導(dǎo)的實(shí)習(xí)生。

      所以我對(duì)人和 AI 協(xié)同的最終狀態(tài),有三個(gè)判斷。

      這是最直接的分工變化。寫(xiě)代碼、生成內(nèi)容、跑流程、處理數(shù)據(jù),這些執(zhí)行層面的事 Agent 會(huì)越來(lái)越擅長(zhǎng),越來(lái)越快,越來(lái)越準(zhǔn)。而人的工作,是把環(huán)境準(zhǔn)備好:信息結(jié)構(gòu)、工具集合、驗(yàn)收規(guī)則,這些是 Agent 能不能干好活的地基。

      地基搭得越好,Agent 干得越穩(wěn),你能解放的時(shí)間就越多。

      這個(gè)分工不是”人監(jiān)督 AI”,那樣依然很累。而是”人設(shè)計(jì)系統(tǒng),AI 運(yùn)行系統(tǒng)”,設(shè)計(jì)是一次性的工作,運(yùn)行是持續(xù)自動(dòng)的。

      給定一個(gè)模糊的目標(biāo),Agent 可以比任何人更快地探索可能性,發(fā)散方案,生成選項(xiàng)。它不會(huì)累,不會(huì)說(shuō)”這個(gè)方向我沒(méi)試過(guò),不確定”,它可以同時(shí)跑十個(gè)方向,把每個(gè)方向的結(jié)果都擺在你面前。

      但方向?qū)Σ粚?duì),目前還是人來(lái)判斷。

      人提方向,AI 鋪開(kāi)所有可能性,然后人從里面挑。這個(gè)節(jié)奏,已經(jīng)是很多團(tuán)隊(duì)現(xiàn)在的工作模式了。產(chǎn)品經(jīng)理給一個(gè)方向,Agent 生成十個(gè)方案,PM 挑選并調(diào)整,Agent 繼續(xù)細(xì)化。這個(gè)循環(huán)跑起來(lái),效率比任何傳統(tǒng)方式都高。

      這條說(shuō)的是更深層的東西,也是我認(rèn)為最核心的一條。

      Agent 在執(zhí)行任務(wù)時(shí),本質(zhì)上是在一套規(guī)則和約束下運(yùn)作的。這套規(guī)則,要人來(lái)定。什么能做,什么不能做,什么算好,什么算壞,什么情況下輸出達(dá)標(biāo),什么情況下要人介入,這些判斷目前都是人的責(zé)任。

      AI 能非常嚴(yán)格地執(zhí)行規(guī)則,但它不能自己判斷這套規(guī)則是否合理,是否適合當(dāng)前的場(chǎng)景,是否需要在某個(gè)特殊情況下靈活處理。這個(gè)判斷力,是人類(lèi)目前仍然不可替代的核心能力。

      所以未來(lái)的工程師,或者更廣義地說(shuō),未來(lái)依靠 AI 協(xié)作工作的人,核心能力會(huì)變成:搭好環(huán)境的能力、定義清晰規(guī)則的能力、在關(guān)鍵節(jié)點(diǎn)做方向判斷的能力。

      寫(xiě)代碼、寫(xiě)內(nèi)容、做執(zhí)行,這些會(huì)越來(lái)越不稀缺。稀缺的是能把 Harness 搭好的人,是能清楚地知道”什么是好結(jié)果”并把這個(gè)標(biāo)準(zhǔn)表達(dá)清楚的人。

      能力的重心在向上移,從執(zhí)行層移到系統(tǒng)設(shè)計(jì)層。

      他在結(jié)尾寫(xiě),他們還在學(xué)習(xí)。還不知道一個(gè)完全由 Agent 生成的系統(tǒng)在架構(gòu)連貫性上會(huì)如何隨時(shí)間演變,還不知道人類(lèi)的判斷力在哪些地方能發(fā)揮最大作用,還不知道這一切隨著模型能力增長(zhǎng)會(huì)怎么變化。

      我覺(jué)得這個(gè)坦誠(chéng)很有價(jià)值。Harness Engineering 不是一個(gè)有標(biāo)準(zhǔn)答案的領(lǐng)域,它太新了,所有人都在邊做邊摸索。Ryan 他們?cè)?OpenAI 內(nèi)部的探索,是目前最前沿的實(shí)踐之一,但也只是一種可能性,不是唯一答案。

      但有一件事是確定的:AI 的能力在增長(zhǎng),但 Agent 能發(fā)揮多少,取決于它工作的環(huán)境有多好。

      你搭的環(huán)境有多好,它就能干多好。

      這不是一個(gè)技術(shù)問(wèn)題,是一個(gè)工作方式的問(wèn)題。

      聲明:個(gè)人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍(lán)營(yíng)一姐發(fā)話(huà)了

      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍(lán)營(yíng)一姐發(fā)話(huà)了

      近史博覽
      2026-04-10 09:58:26
      為什么沒(méi)人聯(lián)合打以色列,答案很簡(jiǎn)單:不是沒(méi)人想打,是沒(méi)人敢打

      為什么沒(méi)人聯(lián)合打以色列,答案很簡(jiǎn)單:不是沒(méi)人想打,是沒(méi)人敢打

      混沌錄
      2026-04-07 17:48:09
      簽了停火也沒(méi)用!美國(guó)85名議員聯(lián)手逼宮,堅(jiān)持罷免特朗普

      簽了停火也沒(méi)用!美國(guó)85名議員聯(lián)手逼宮,堅(jiān)持罷免特朗普

      混沌錄
      2026-04-10 17:17:16
      Netflix用6集短劇掀桌,流媒體集體慌了

      Netflix用6集短劇掀桌,流媒體集體慌了

      熱搜摘要官
      2026-04-09 15:26:31
      安徽女童遇害,兇手娘家村民再曝猛料!從小被父母嬌慣,爭(zhēng)強(qiáng)好勝

      安徽女童遇害,兇手娘家村民再曝猛料!從小被父母嬌慣,爭(zhēng)強(qiáng)好勝

      青橘罐頭
      2026-04-09 07:50:17
      “聒噪”不讀guā zào,正確讀音是什么?“聒”是什么意思?

      “聒噪”不讀guā zào,正確讀音是什么?“聒”是什么意思?

      未央看點(diǎn)
      2026-04-05 15:22:13
      日本電動(dòng)汽車(chē)銷(xiāo)量大漲80%,比亞迪卻賣(mài)不動(dòng)了?

      日本電動(dòng)汽車(chē)銷(xiāo)量大漲80%,比亞迪卻賣(mài)不動(dòng)了?

      熱點(diǎn)科技
      2026-04-08 13:06:00
      莫言:告訴你一個(gè)基本不會(huì)得罪人的方法,那就是當(dāng)別人找你幫忙時(shí),你一定要痛痛快快地拒絕,猶猶豫豫地同意

      莫言:告訴你一個(gè)基本不會(huì)得罪人的方法,那就是當(dāng)別人找你幫忙時(shí),你一定要痛痛快快地拒絕,猶猶豫豫地同意

      每日一首古詩(shī)詞
      2026-04-09 06:06:47
      劉強(qiáng)東、章澤天成立新公司,名叫“天強(qiáng)”

      劉強(qiáng)東、章澤天成立新公司,名叫“天強(qiáng)”

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-04-09 19:18:32
      餐飲巨頭創(chuàng)始人突發(fā)心梗去世!廣州有多家門(mén)店

      餐飲巨頭創(chuàng)始人突發(fā)心梗去世!廣州有多家門(mén)店

      番禺臺(tái)
      2026-04-10 08:06:41
      大陸高規(guī)格接待鄭麗文,讓?shí)u內(nèi)見(jiàn)識(shí)到了大陸的智慧,鄭麗文的強(qiáng)硬

      大陸高規(guī)格接待鄭麗文,讓?shí)u內(nèi)見(jiàn)識(shí)到了大陸的智慧,鄭麗文的強(qiáng)硬

      袁周院長(zhǎng)
      2026-04-09 17:25:58
      剛剛臺(tái)風(fēng)生成!暴雨大暴雨!要來(lái)了

      剛剛臺(tái)風(fēng)生成!暴雨大暴雨!要來(lái)了

      深圳晚報(bào)
      2026-04-10 10:39:59
      從年賺358億到巨虧234億:王興的好日子,被京東終結(jié)

      從年賺358億到巨虧234億:王興的好日子,被京東終結(jié)

      民間胡扯老哥
      2026-04-10 01:17:07
      北京衛(wèi)視上星,30集諜戰(zhàn)劇來(lái)襲,國(guó)家一級(jí)演員坐鎮(zhèn),全員實(shí)力派

      北京衛(wèi)視上星,30集諜戰(zhàn)劇來(lái)襲,國(guó)家一級(jí)演員坐鎮(zhèn),全員實(shí)力派

      樂(lè)楓電影
      2026-04-10 14:36:39
      《歌手2026》首發(fā):6位歌手曝光,2位國(guó)際大咖,陣容遠(yuǎn)超前兩季

      《歌手2026》首發(fā):6位歌手曝光,2位國(guó)際大咖,陣容遠(yuǎn)超前兩季

      音樂(lè)鋼琴娛樂(lè)咖
      2026-04-10 12:20:52
      美防長(zhǎng):特朗普將在對(duì)伊軍事行動(dòng)結(jié)束后就北約的未來(lái)作出決定

      美防長(zhǎng):特朗普將在對(duì)伊軍事行動(dòng)結(jié)束后就北約的未來(lái)作出決定

      澎湃新聞
      2026-03-31 21:48:05
      伊朗這一仗,把美軍打回原形?2300枚“反華導(dǎo)彈”只剩425枚了

      伊朗這一仗,把美軍打回原形?2300枚“反華導(dǎo)彈”只剩425枚了

      Ck的蜜糖
      2026-04-10 17:48:07
      暴增2285%!商業(yè)航天+衛(wèi)星通信+火箭回收,鎖定下一個(gè)航發(fā)神話(huà)?

      暴增2285%!商業(yè)航天+衛(wèi)星通信+火箭回收,鎖定下一個(gè)航發(fā)神話(huà)?

      Thurman在昆明
      2026-04-10 03:51:13
      央視直播英超有變,利物浦可能放棄歐冠,阿森納上賽季兩負(fù)對(duì)手

      央視直播英超有變,利物浦可能放棄歐冠,阿森納上賽季兩負(fù)對(duì)手

      嗨皮看球
      2026-04-10 17:46:22
      砸6700億建雄安,面積抵3個(gè)紐約,如今究竟咋樣了?

      砸6700億建雄安,面積抵3個(gè)紐約,如今究竟咋樣了?

      娛樂(lè)圈的筆娛君
      2026-03-26 12:15:32
      2026-04-10 18:20:49
      時(shí)光漫游志
      時(shí)光漫游志
      鑒往而知未來(lái)
      336文章數(shù) 185關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

      頭條要聞

      73歲騎友"抄近路"摔倒身亡 事發(fā)路段系村民自發(fā)修建

      頭條要聞

      73歲騎友"抄近路"摔倒身亡 事發(fā)路段系村民自發(fā)修建

      體育要聞

      17歲賺了一百萬(wàn)美元,25歲被CBA裁員

      娛樂(lè)要聞

      黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

      財(cái)經(jīng)要聞

      創(chuàng)業(yè)板改革制度落地 增設(shè)第4套上市標(biāo)準(zhǔn)

      汽車(chē)要聞

      搭載第二代刀片電池及閃充技術(shù) 騰勢(shì)N8L閃充版預(yù)售35萬(wàn)起

      態(tài)度原創(chuàng)

      數(shù)碼
      本地
      健康
      公開(kāi)課
      軍事航空

      數(shù)碼要聞

      哈趣Ace1:職場(chǎng)人的AI效率外腦,百元耳夾竟能重構(gòu)辦公體驗(yàn)

      本地新聞

      12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:對(duì)美國(guó)與伊朗達(dá)成和平協(xié)議“非常樂(lè)觀”

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版