<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Token 剛定了中文名,AI 圈又多了個翻譯不了的詞

      0
      分享至

        馬上又來了一個亟需被認(rèn)證的新詞 Harness。

        這年頭想要在 AI 圈子里當(dāng)個「全面發(fā)展的專業(yè)人士」,每天要學(xué)習(xí)的概念是真的多。從最早一個 ChatGPT 能指代一切 AI,我能知道 ChatGPT 就已經(jīng)領(lǐng)先身邊大多數(shù)人。

        到后面慢慢發(fā)展到,我要去學(xué)習(xí)什么是 Prompt,是提示詞還是文令、「已死的」MCP,是被 CLI 替代的模型上下文協(xié)議、RAG 是風(fēng)靡一時(shí)的檢索增強(qiáng)生成、Agent 不是代理,是智能體、Skills 是技能,也是專家、Claude Code 是代碼助手。

        還有因?yàn)樽ψ?Claw 得名龍蝦的 OpenClaw、以及龍蝦太火需要大量消耗的 Token = xxx……

        這些堪比「顆粒度」、「對齊」的職場黑話,如果你都聽過,大概率還是能在一些聊 AI 的飯局上稍微顯露一波的。

        

        之前 MiniMax M2.7 模型介紹博客里提到的 Agent Harness 能力

        但現(xiàn)在,新的詞又來了,什么是 Harness。有網(wǎng)友在社交媒體上用一張?zhí)詫毸阉鞯慕貓D回應(yīng),表示「很好理解」。

        

        很離譜,但是我們把 AI 當(dāng)牛馬去指揮它干活,Harness 翻譯成套在 AI 身上的馬具/束縛,也并不是全無道理。

        其實(shí) Harness 最早被真正放進(jìn) Agent 領(lǐng)域,還是在 Anthropic 去年十一月的一篇博客,文章里他們探討了現(xiàn)在的 Agent 要執(zhí)行的任務(wù)越來越長,需要一個有效的 Harness 來確保 Agent 的運(yùn)作正常。

        

        博客鏈接:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

        到了今年本地運(yùn)行的 Agent 重新搬上臺面,一眾 AI 開發(fā)者和研究員在自己的技術(shù)博客里,也頻繁提到 Harness 這個詞。知名博主 Mitchell 提到 Harness Engineering 的理念是,「每當(dāng)發(fā)現(xiàn)某個智能體犯錯時(shí),就花時(shí)間設(shè)計(jì)一個解決方案,確保它以后不再犯同樣的錯誤。」

        緊接著 OpenAI 在今年二月也發(fā)了幾篇博客,講的也是 Harness engineering,在他們看來,未來工程師的工作,不是寫代碼,而是設(shè)計(jì)智能體的「工作環(huán)境」,Harness 就是這個工作環(huán)境。

        

        在 OpenAI 官網(wǎng)選擇中文后,直接翻譯成了「工程技術(shù)」,博客鏈接:https://openai.com/zh-Hans-CN/index/harness-engineering/

        為什么 Harness 開始被重視

        無論是 Anthropic 最早的博客,還是后面 OpenAI 的 Harness 工程,它們在文章里面描述的故事都是一樣的。

        Harness 是一種包含環(huán)境配置、多 Agents 協(xié)作機(jī)制、嚴(yán)格架構(gòu)約束和上下文管理的系統(tǒng),它彌補(bǔ)了 AI 的「上下文焦慮」和易錯性。

        兩家頂級 AI 實(shí)驗(yàn)室都用大量的內(nèi)部工程實(shí)踐證明了,讓大模型自主寫出百萬行代碼的關(guān)鍵,并非模型本身有多聰明,而在于構(gòu)建了一個強(qiáng)大的 Harness(工作流框架 / 護(hù)欄系統(tǒng))。

        

        我們讓 Claude 畫了一張圖,來完整介紹一下 Agent Harness,Harness = Agent 的運(yùn)行容器 + 安全邊界 + 調(diào)度控制器

        在 Anthropic 的內(nèi)部實(shí)驗(yàn)中,研究員們發(fā)現(xiàn) AI 竟然也會有「心理問題」。

        當(dāng) Claude 執(zhí)行長周期的代碼任務(wù)時(shí),一旦它感覺到自己的上下文窗口快要填滿了,它就會產(chǎn)生「上下文焦慮」。就像快要下班的打工人,開始瘋狂敷衍,試圖趕緊結(jié)束任務(wù)。

        要命的是,Claude 并不覺得自己在敷衍,當(dāng)研究員要求 AI 評估這些「為了下班趕緊結(jié)束任務(wù)」所編寫的代碼時(shí),它發(fā)現(xiàn)不了其中的問題。

        面對這種毛病,傳統(tǒng)的提示詞設(shè)計(jì)毫無用處。Anthropic 的研究員給出的 Harness 解法是:改變組織架構(gòu)。

        他設(shè)計(jì)了一個包含三個角色的 Harness 閉環(huán):

        規(guī)劃師(Planner):負(fù)責(zé)把一句話需求擴(kuò)寫成詳細(xì)的產(chǎn)品文檔。

        生成器(Generator):純粹的牛馬,只負(fù)責(zé)按文檔寫代碼。

        評估器(Evaluator):極其冷酷的 QA 兼產(chǎn)品經(jīng)理,手握自動化測試工具。

        

        Anthropic 的報(bào)告中提到,應(yīng)用了 Harness 框架的 Agent 在生成網(wǎng)頁質(zhì)量上要好很多,但是成本和時(shí)間更長。

        要求是開發(fā)一個游戲制作器,沒有 Harness 的那組,AI 跑了 20 分鐘,花了 9 美元。結(jié)果是界面能看,但核心功能是壞的——游戲里的角色出現(xiàn)在屏幕上,但對任何鍵盤操作都沒有反應(yīng),游戲沒法玩。

        有 Harness 的那組,跑了 6 小時(shí),花了 200 美元。結(jié)果是游戲不只是能玩,還有動畫系統(tǒng)、音效、AI 輔助的關(guān)卡設(shè)計(jì)。

        在這套 Harness 里,生成器寫完一段代碼,評估器就會像真實(shí)用戶一樣去點(diǎn)擊、測試,一旦發(fā)現(xiàn) Bug 或是那種充滿「AI 塑料味」的平庸設(shè)計(jì),直接打回重做。

        包括我們經(jīng)常用來測試 AI Coding 能力的網(wǎng)頁生成,Anthropic 也發(fā)現(xiàn),Harness 的潛力相當(dāng)大。在一個設(shè)計(jì)荷蘭藝術(shù)博物館網(wǎng)頁的任務(wù)中,前 9 次迭代,AI 都在老老實(shí)實(shí)地畫平庸的網(wǎng)頁。

        但在評估器不斷施壓下,第 10 次迭代,AI 突然拋棄了所有常規(guī)模板。它交出了一個特立獨(dú)行的 3D 空間:畫作懸掛在透視棋盤格的房間里,用戶需要像走迷宮一樣穿梭。

        

        如果說 Anthropic 的 Harness 側(cè)重于組織架構(gòu),去探索 Harness 的設(shè)計(jì)原理,OpenAI 的 Codex 團(tuán)隊(duì)則是把這件事做成了一種工程文化,更多地把 Harness 當(dāng)作一種工作流框架。

        他們的核心約束只有一條,那就是沒有人工手寫的代碼。所有代碼——業(yè)務(wù)邏輯、測試、CI 配置、文檔、內(nèi)部工具、生產(chǎn)監(jiān)控儀表盤——都由 Codex 寫。工程師的工作不是寫代碼,而是設(shè)計(jì)讓 AI 能可靠工作的環(huán)境。

        一開始他們用一個超長的 AGENTS.md 文件告訴 AI 所有的規(guī)則。但很快就因?yàn)樯舷挛南拗?,?dǎo)致 AI 只會進(jìn)行本地模式匹配,沒有真正理解。而且文件很快過時(shí),沒有人維護(hù),AI 開始被一堆可能不再成立的規(guī)則誤導(dǎo)。

        

        一套完整的工作流程

        后來的做法是:AGENTS.md 只有 100 行,只充當(dāng)一個「目錄」,把 AI 指向結(jié)構(gòu)化的 docs/ 文件夾。架構(gòu)文檔、產(chǎn)品規(guī)格、設(shè)計(jì)決策、技術(shù)債務(wù)追蹤,全部是可以被 AI 直接讀取的版本化文件。每個 doc 由 AI 寫,由 AI 維護(hù),定期有「文檔園丁」Agent 掃描過時(shí)的文檔來自動更新。

        他們不在乎 AI 怎么寫具體的邏輯,但在 Harness 中設(shè)置了極其嚴(yán)格的 Linter(代碼檢查工具)和物理依賴邊界。業(yè)務(wù)代碼只能單向調(diào)用,越界就會被系統(tǒng)無情切斷,根本合并不進(jìn)項(xiàng)目主分支。

        在這個 Harness 中,我們所設(shè)置的規(guī)則,變成了 AI 不可違背的意志。AI 就像生活在「楚門的世界」里,它擁有寫代碼的絕對自由,但這種自由,永遠(yuǎn)在人類設(shè)定的結(jié)界,即 Harness 之內(nèi)。

        把這些研究放在一起,其實(shí) harness 的本質(zhì)就是一套系統(tǒng),用來補(bǔ)償當(dāng)前 AI 不擅長的事。

        AI 不擅長長期記憶,Harness 就用進(jìn)度文件、git 歷史、結(jié)構(gòu)化來補(bǔ)。

        AI 評價(jià)自己太寬松,用獨(dú)立的評估 Agent,帶著具體標(biāo)準(zhǔn)和真實(shí)環(huán)境測試。

        AI 在復(fù)雜任務(wù)里容易偏航,用任務(wù)分解、結(jié)構(gòu)化、合約約定來約束范圍。

        AI 不具備對代碼庫架構(gòu)品味的直覺,因此需要用文檔和自動化規(guī)范檢查,將人類的判斷轉(zhuǎn)化為系統(tǒng)規(guī)則。

        

        Claude 生成的 Harness 在 AI 領(lǐng)域的位置信息圖

        有意思的是,隨著模型能力增強(qiáng),harness 的有些部分會變得不再必要,但新的部分又會出現(xiàn)。

        Anthropic 在升級到 Opus 4.6 之后,發(fā)現(xiàn)之前為了對抗「上下文焦慮」設(shè)計(jì)的「上下文重置」機(jī)制可以直接去掉了,因?yàn)樾履P鸵呀?jīng)能自己處理了。

        但同時(shí),他們發(fā)現(xiàn)了新的方向,用 harness 來讓 AI 在應(yīng)用里自動集成 AI 功能,這是之前模型做不到的事。

        對 Harness 來說,模型越強(qiáng),Harness 不是變得更簡單,而是要去做更難的事

        怎么翻譯 Harness

        在那篇詢問「繼 token、Agent 之后,又來了一個難以翻譯的詞:Harness」推文下,除了給出那張炸裂的「戰(zhàn)術(shù)胸帶 Harness」截圖外,還有很多網(wǎng)友給出了自己的翻譯。

        有人說應(yīng)該叫「線束」,因?yàn)檫@個詞在汽車行業(yè)已經(jīng)很多年了。還有「駕馭層」、「駕馭系統(tǒng)」、「Agent 框架」、「控制框架」、「管控層」、「錨定層」、「= Scaffold 腳手架」……

        更有意思的回復(fù)是「安全套」、「套馬桿」、以及約束牛馬該做什么不該做什么的「槽具」。

        

        微博上關(guān)于 Harness 怎么翻譯的討論也很多,Token 可以翻譯成智元的話,那 Harness 就叫智馭吧……也有人覺得和 MCP 現(xiàn)在無人問津的狀態(tài)一樣,Harness 這個概念只是現(xiàn)在熱,過一段時(shí)間又會有新的詞被造出來、被流行。

        我們問了問 Claude,它給了好幾個答案。

        「框架」,它認(rèn)為很多東西都叫框架,framework 可以,architecture 也可以;「執(zhí)行框架」,強(qiáng)調(diào)了運(yùn)行層面,但中性,沒有「約束」的感覺。

        「駕馭層」中文語境下不太用這種說法;「管控層」強(qiáng)調(diào)了「約束」,但是沒有「執(zhí)行」;「套具」在 AI 領(lǐng)域完全是陌生的概念。

        

        所以最后它說比較實(shí)用的方案是,不翻譯,就用 Harness。

        一個概念如果能被一個詞完整概括,翻譯本來順理成章的事。Harness 之所以又是一個不容易確定的詞,是因?yàn)樗?LLM 這套流程里,同時(shí)包含了「約束」、「執(zhí)行」、「環(huán)境」、「系統(tǒng)」等幾層意思,拆開來哪個都只說對了一半。

        和 Token 最終被認(rèn)證為「詞元」,Harness 大概率也會有自己的官方中文。在那天之前,你在技術(shù)文章里看到這個詞,知道它在說什么就夠了。

        然后在某個聊到 AI 的飯局上,記得說一句,「在未來,會寫提示詞和 Skills 都不是核心競爭力。真正的頂級人才,是那些懂得如何設(shè)計(jì) Harness 的人?!?/p>

        關(guān)于 Harness 的詳細(xì)內(nèi)容,還可以閱讀下面這些文章:

        1、Anthropic, Harness design for long-running application development, 適用于長時(shí)間運(yùn)行應(yīng)用程序開發(fā)的 Harness 設(shè)計(jì), 2026-03-24, https://www.anthropic.com/engineering/harness-design-long-running-apps

        2、OpenAI, Harness engineering: leveraging Codex in an agent-first world, Harness 工程:在智能體優(yōu)先的世界中利用 Codex, 2026-02-11, https://openai.com/index/harness-engineering/

        3、Mitchell Hashimoto, My AI Adoption Journey, 我的 AI 應(yīng)用之旅, 2026-02-05, https://mitchellh.com/writing/my-ai-adoption-journey

        4、OpenAI, Unlocking the Codex harness: how we built the App Server, 解鎖 Codex 的 Harness:我們?nèi)绾螛?gòu)建 App Server, 2026-02-04, https://openai.com/index/unlocking-the-codex-harness/

        5、Anthropic, Effective harnesses for long-running agents, 適用于長期運(yùn)行 Agents 的有效 Harness, 2025-11-26, https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

      聲明:包含AI生成內(nèi)容

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      沒軍人氣質(zhì)別演旅長,看了觀眾對王陽的評價(jià),陳道明的話有人信了

      沒軍人氣質(zhì)別演旅長,看了觀眾對王陽的評價(jià),陳道明的話有人信了

      陳述影視
      2026-04-11 00:09:56
      暴跌95%!一代神車退場了,比燃油車賣不掉更可怕的事正在發(fā)生

      暴跌95%!一代神車退場了,比燃油車賣不掉更可怕的事正在發(fā)生

      毒sir財(cái)經(jīng)
      2026-04-10 16:25:00
      特朗普家族11億美元戰(zhàn)爭合同曝光!停戰(zhàn)時(shí)間竟與兒子公司上市同步

      特朗普家族11億美元戰(zhàn)爭合同曝光!停戰(zhàn)時(shí)間竟與兒子公司上市同步

      興史興談
      2026-04-11 02:06:31
      匈牙利總理歐爾班競選被喊“俄羅斯人回家”!只剩2成勝率

      匈牙利總理歐爾班競選被喊“俄羅斯人回家”!只剩2成勝率

      項(xiàng)鵬飛
      2026-04-11 22:08:11
      李想在朋友圈飆臟話!疑似炮轟東風(fēng)日產(chǎn)

      李想在朋友圈飆臟話!疑似炮轟東風(fēng)日產(chǎn)

      鞭牛士
      2026-04-11 16:34:04
      理想汽車CEO李想朋友圈飆臟話后二次發(fā)聲:怒斥某日系品牌持續(xù)拉踩

      理想汽車CEO李想朋友圈飆臟話后二次發(fā)聲:怒斥某日系品牌持續(xù)拉踩

      快科技
      2026-04-11 18:08:11
      李想朋友圈炮轟:遭遇“最惡劣內(nèi)卷”,東風(fēng)日產(chǎn)高管回應(yīng):尊重每一家同行,包括理想汽車

      李想朋友圈炮轟:遭遇“最惡劣內(nèi)卷”,東風(fēng)日產(chǎn)高管回應(yīng):尊重每一家同行,包括理想汽車

      魯中晨報(bào)
      2026-04-11 19:48:04
      趙子琪直播怒懟浪姐:淘汰遭侮辱,直言咖位不夠,上不了花少

      趙子琪直播怒懟浪姐:淘汰遭侮辱,直言咖位不夠,上不了花少

      離離言幾許
      2026-04-11 09:44:35
      新華社快訊:美媒稱數(shù)艘美國海軍艦船通過霍爾木茲海峽

      新華社快訊:美媒稱數(shù)艘美國海軍艦船通過霍爾木茲海峽

      新華社
      2026-04-11 20:50:05
      柬埔寨的洪瑪奈出面,德崇扶南運(yùn)河二期開工,以后不用經(jīng)過越南

      柬埔寨的洪瑪奈出面,德崇扶南運(yùn)河二期開工,以后不用經(jīng)過越南

      阿纂看事
      2026-04-11 22:14:42
      以色列襲擊黎巴嫩被譴責(zé),內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊(duì)”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

      以色列襲擊黎巴嫩被譴責(zé),內(nèi)塔尼亞胡:“以軍是世界上最有道德的軍隊(duì)”;此前以色列對黎巴嫩發(fā)動襲擊,造成包括兒童在內(nèi)數(shù)百名平民死傷

      揚(yáng)子晚報(bào)
      2026-04-11 11:33:21
      美國前情報(bào)局長爆出俄烏戰(zhàn)場驚人內(nèi)幕,烏軍重新殺回紅軍城

      美國前情報(bào)局長爆出俄烏戰(zhàn)場驚人內(nèi)幕,烏軍重新殺回紅軍城

      史政先鋒
      2026-04-11 20:44:50
      3-0,“吊州”變“棍州” 蘇超揭幕戰(zhàn)常州爆冷擊敗南通!

      3-0,“吊州”變“棍州” 蘇超揭幕戰(zhàn)常州爆冷擊敗南通!

      揚(yáng)子晚報(bào)
      2026-04-11 21:59:05
      又發(fā)錢了!日本東京將向14歲以下居民每人發(fā)放11000

      又發(fā)錢了!日本東京將向14歲以下居民每人發(fā)放11000

      隨波蕩漾的漂流瓶
      2026-04-11 17:02:49
      美國繞月飛船成功降落!宇航員能自己走路,隔熱罩扛住2700℃灼燒

      美國繞月飛船成功降落!宇航員能自己走路,隔熱罩扛住2700℃灼燒

      火星一號
      2026-04-11 13:42:49
      過午不食?55歲男子堅(jiān)持2年不吃晚飯,去體檢后,他的胃怎樣了?

      過午不食?55歲男子堅(jiān)持2年不吃晚飯,去體檢后,他的胃怎樣了?

      白話電影院
      2026-04-09 14:36:58
      女大學(xué)生吐槽“普信男”視頻火了,卻因長相被嘲:你也照照鏡子吧

      女大學(xué)生吐槽“普信男”視頻火了,卻因長相被嘲:你也照照鏡子吧

      妍妍教育日記
      2026-04-11 07:35:08
      以軍突然發(fā)動襲擊!美軍“王牌”空降師、布什號航母等將抵達(dá)中東,特朗普強(qiáng)硬發(fā)聲!伊朗:若美方“以色列優(yōu)先”,談判將無果而終

      以軍突然發(fā)動襲擊!美軍“王牌”空降師、布什號航母等將抵達(dá)中東,特朗普強(qiáng)硬發(fā)聲!伊朗:若美方“以色列優(yōu)先”,談判將無果而終

      每日經(jīng)濟(jì)新聞
      2026-04-11 19:55:10
      鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

      鄭麗文一聲“毛主席”,打破了國民黨一個禁忌

      月明風(fēng)清1029
      2026-04-11 17:27:07
      新型賣淫方式五花八門,讓人大開眼界。

      新型賣淫方式五花八門,讓人大開眼界。

      蔚藍(lán)的珊瑚海
      2026-04-10 17:02:21
      2026-04-12 03:15:00
      AppSo incentive-icons
      AppSo
      讓智能手機(jī)更好用的秘密
      6292文章數(shù) 26819關(guān)注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

      頭條要聞

      事關(guān)霍爾木茲海峽通行安排 伊美各執(zhí)一詞

      頭條要聞

      事關(guān)霍爾木茲海峽通行安排 伊美各執(zhí)一詞

      體育要聞

      換帥之后,他們從降級區(qū)沖到升級區(qū)

      娛樂要聞

      鄭鈞回應(yīng)兒子走路:會監(jiān)督他挺直腰板

      財(cái)經(jīng)要聞

      從日本翻身看:這次誰能扛住高油價(jià)?

      汽車要聞

      煥新極氪007/007GT上市 限時(shí)19.39萬起

      態(tài)度原創(chuàng)

      藝術(shù)
      時(shí)尚
      游戲
      本地
      軍事航空

      藝術(shù)要聞

      你絕對想不到,這個國家美女竟如此多!

      普通人穿衣其實(shí)很簡單!構(gòu)造腰線、一衣多穿,大方舒適又自然

      排面拉滿!《影之刃零》入選國家級藝術(shù)雜志

      本地新聞

      12噸巧克力有難,全網(wǎng)化身超級偵探添亂

      軍事要聞

      伊朗議長帶四名遇難兒童照片赴美伊談判

      無障礙瀏覽 進(jìn)入關(guān)懷版