<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      26年AI產品經理為什么必須掌握Harness Engineering?

      0
      分享至

      Vibe Coding被熱捧為AI PM的未來技能,但其本質仍是依賴冗長Prompt的脆弱模式,難以應對工業級挑戰。OpenAI的Harness Engineering系統揭示了關鍵突破:通過約束環境、自動化驗證和反饋閉環,將AI從'玩具'升級為可靠工具。本文深度解析這一工程思維如何重構人機協作范式,以及產品經理如何從質檢員轉型為系統架構師。

      ———— / BEGIN / ————

      整個行業都在鼓吹“Vibe Coding”是2026年AI PM的必備技能。但我發現,這種模式本質上和用AI寫文章毫無二致——只不過產出物從“文字”變成了“代碼”,模型依然無法精準理解背后的真實意圖。

      在這種直覺驅動下,依靠堆砌巨長的Prompt并不斷對話,確實能迅速“聊”出一個驚艷的Demo。然而,Vibe Coding扛不住真實的工業級環境。

      在隨后的迭代中,缺乏硬約束的系統必然崩塌:每次疊加新功能,Agent就會破壞舊邏輯;執行長線任務時,極易陷入失憶與死循環。最終,過度迷信Vibe Coding的項目,無一例外變成了一座無法維護的屎山。

      問題出在哪里?

      OpenAI的Codex團隊在2026年用一組數據給出了答案:3名工程師,耗時5個月,交付了一個擁有100萬行代碼的完整軟件產品,整個過程0行人工手寫代碼。

      他們復盤這個極端實驗時指出,實現這一跨越的核心不在于使用了多強大的底座模型,而在于他們構建了一套被稱為Harness Engineering(駕馭工程)的系統。

      對于AI產品經理而言,理解并掌握Harness Engineering,是將AI應用從“玩具”推向“工業級產品”的必經之路。

      什么是Harness Engineering?

      Harness原意是馬具(韁繩、馬鞍等)。在工程領域,它指代一套控制與測試環境。

      如果把大模型比作引擎,Harness就是方向盤和剎車。引擎的馬力越大,對方向盤和剎車的要求就越高。一臺沒有剎車的跑車,馬力越強,車毀人亡的速度就越快。

      在Agent開發中,Harness Engineering指的是為AI Agent搭建一個包含明確約束、可用工具鏈、自動驗證標準和反饋閉環的獨立運行環境。 它的核心目的是讓Agent在你不在場的情況下,依然能自主、可靠地把任務做對。

      這聽起來像是在“給AI配置一臺電腦”,但更準確的比喻是“為AI搭建一條帶有自動化質檢探頭的流水線”。

      協作范式的演進:Prompt vs Context vs Harness

      理解 Harness Engineering 的前提,是看清人機協作范式如何從“語言交互”轉向“系統工程”。

      Prompt Engineering(提示詞工程):單向的指令下達


      • 模式: “你是資深行業分析師,請幫我寫一份競品分析,要求分三點……”

      • 本質: 一次性的條件概率生成。AI是一個沒有記憶、沒有手腳的被動執行者。你每次都需要重新交代背景,輸出結果完全依賴指令的精細度。

      • 局限: 任務鏈一長,AI必然失憶。人需要全程守著,不斷下發新指令。


      Context Engineering(上下文工程):靜態的信息供給


      • 模式: 接入RAG庫、定義系統級文檔(Skill手冊)。“基于這份100頁的內部數據表和行業報告,分析競品。”

      • 本質: 為AI構建信息環境。AI有了背景知識,產出質量和穩定性大幅提升。

      • 局限: 知識庫解決的是“AI怎么寫”的問題,但解決不了“AI怎么知道自己寫對了”的問題。你給了它操作手冊,但它遵不遵守全靠自覺。產出物依然需要人類逐行Review。


      Harness Engineering(駕馭工程):動態的系統閉環


      • 模式: 為Agent設定運行沙箱、配置調用接口,并植入校驗腳本。Agent提交結果后,系統自動運行驗證規則,失敗則直接把報錯信息(包含修改建議)退回給Agent重做,直到通過才提交給人類。

      • 本質: 從“優化輸入”轉向“約束邊界與自動化驗收”。

      • 核心區別: Context Engineering決定了Agent能看到什么,而Harness Engineering決定了系統能預防什么、測量什么、修復什么。


      核心機制:面向 ROI 的“推理三明治”

      Harness 在工程實操中通過“推理三明治”結構對沖質量波動。但在 2026 年的工業環境下,這套結構不再是盲目的全量堆疊,而是基于 TokenROI(推理投資回報率) 的精準博弈:

      頂層:高推理規劃(The Top Bun) 調用高推理模型(如 DeepSeek-R1 或 o1)負責將模糊需求拆解為帶有硬性約束的執行藍圖。這一層產出的不是代碼或文字,而是 “確定性驗收矩陣(Acceptance Matrix)”,明確定義了下一步執行必須觸發的工具鏈和邏輯斷點。

      中層:低推理執行(The Meat) 由低推理模型(如 GPT-4o-mini 或 8B 級端側模型)承接原子任務。在 Harness 預設的 Lint 工具、結構化測試腳本約束下,利用其低延遲和低成本優勢,進行大規模的內容填充或代碼構建。

      底層:選擇性高推理質檢(The Bottom Bun) 這是實現工業級交付的關鍵。

      為了平衡成本與延遲,系統并非對所有產出進行高推理 Review,而是通過 Harness 中的 “邏輯探針” 識別高風險變更(如涉及權限控制、金融計算或核心接口調用)。

      • L1/L2 腳本校驗: 80% 的格式與語法錯誤由確定性代碼直接攔截。

      • L3 高推理質檢: 僅當腳本校驗發現邏輯矛盾,或命中高風險斷點時,才喚醒高推理模型作為“質檢員”進行語義對撞。


      通過這種“按需喚醒”的夾心結構,Harness 系統利用高推理模型的邏輯冗余,去填補低推理模型在長線任務中的幻覺黑洞。這意味著:即使執行層偶爾“掉鏈子”,自動化反饋閉環也會將其在系統內修正,確保最終交付給人類的是具備“確定性”的成品。

      Harness 系統的五大核心模塊

      一個完整的Harness系統包含哪些部分?結合行業前沿實踐,以下是構建Harness環境必須具備的核心模塊:

      1. 按需索引

      大模型的上下文窗口雖然越來越大,但塞入的信息越多,關鍵約束被稀釋的概率就越高(即“注意力丟失”)。 Harness系統通過提供“目錄地圖”解決這個問題。

      在根目錄放置一個簡短的索引文件(如AGENTS.md),僅列出“架構說明在A”、“設計規范在B”、“API接口在C”。Agent根據當前任務,按需調取對應的子文檔。

      這種漸進式披露機制,保證了Agent工作臺的清爽和信息的高信噪比。

      2. 代碼攔截

      過去我們習慣在Prompt里寫“請務必遵守XX規范”。

      但在Harness中,凡是能用代碼寫死的規則,絕對不用Prompt去建議。 通過引入Lint工具、結構化測試腳本等確定性工具來限制Agent的行為。

      例如,設定“A模塊不能跨層級調用C模塊”,一旦Agent生成的邏輯違規,腳本直接攔截并報錯。這種機械化的硬約束,極大地壓縮了Agent自由發揮導致的犯錯空間。

      3. 三層自動質檢

      這是Harness引擎的心臟。Agent寫完方案或代碼,系統自動觸發三層驗證:

      • L1 硬性規則: 格式對不對?字數是否超標?(腳本直接判斷)

      • L2 執行測試: 邏輯能不能跑通?耗時是否超時?(在隔離沙箱中實際運行一遍)

      • L3 軟性標準: 方案的業務推演是否合理?(調用另一個高推理強度的Agent進行同行評審) 關鍵點在于,這三層驗證產生的“報錯信息”是寫給Agent看的,并且自帶修復指令。 Agent收到報錯后自主修改、再次提交,形成循環。在這個閉環里,人類完全不需要參與。


      4. 數據探針

      不要讓Agent變成“閉門造車的盲人”。Harness系統會給Agent接上“眼睛”和“探針”。


      • 給它開放UI自動化測試工具的控制權,讓它能自己打開頁面看渲染效果;

      • 給它開放日志系統的查詢權限,讓它能自己查報錯鏈路;

      • 給它提供吞吐量、延遲等指標接口,讓它能根據客觀數據驗證自己的產出。


      感知通道越豐富,Agent的閉環能力越強。

      5. 垃圾回收

      Agent 的高效執行伴隨一個致命副作用:它會以指數級速度復制并放大系統中已有的“壞模式(Bad Patterns)”。人類原本需要數月堆積的技術債,Agent 只需數小時就能讓其蔓延至整個項目。

      Harness 系統通過部署后臺治理 Agent(類似于 Java 的 GC 機制)來對抗這種熵增,但其核心不再是盲目的自動刪改,而是閉環的“探測-驗證-提議”機制:

      • 風險探測: 后臺 Agent 定期掃描知識庫、Prompt 模板和產出邏輯。利用高推理模型識別過期文檔、違背“黃金原則”的冗余邏輯或正在蔓延的代碼異味(Code Smell)。

      • 影子系統驗證(Shadow Verification): 這是防止系統崩潰的關鍵防線。治理 Agent 在發現壞模式后,不會直接修改生產環境,而是在隔離的影子沙箱中運行清理方案,并與原版本的輸出結果進行像素級的比對測試。

      • 確定性回滾預案: 只有當清理后的邏輯在影子系統中通過了 100% 的回歸測試,且性能指標(延遲、Token 消耗)不降反升時,系統才會生成一份帶有詳細差異對比(Diff)的 Merge Request。


      通過這種“自動探測、模擬驗證、人工復核”的半自動治理模式,Harness 能夠在不引入系統性風險的前提下,持續進行微小的邏輯修復,從根源上攔截 Agent 帶來的技術債爆炸。

      對AI產品經理的終極啟示

      理解了Harness Engineering,就會明白為什么自己vibe coding的AI產品只能停留在玩具階段,而OpenAI的Codex團隊能夠用極少的人力支撐龐大的復雜系統。

      對于AI產品經理而言,這意味著徹底告別依賴模型直覺的“Vibe Coding”模式:

      從流水線上的一個質檢員、安全員,AI每做完一步都要上去核對、修改指令(in the loop)。 變成了設計這條流水線的系統架構師。

      未來,PM的核心產出將不再僅僅是一份PRD或一段精妙的System Prompt,而是這套環境的業務規則定義。你需要去定義什么是合格的輸出、用什么數據指標來驗證這個輸出、發生特定錯誤時應該觸發什么工具供Agent排查。

      你的工作越前置、你設計的Harness約束越嚴謹,Agent在后臺能連續自主工作的時間就越長,你的生產力天花板就越高。

      不要試圖用更好的Prompt去控制一匹脫韁的野馬,去給它建一個擁有清晰賽道、護欄和自動測速儀的馬場。這就是2026年,AI產品經理必須建立的系統工程思維。

      本文來自公眾號:林航旗 作者:林航旗

      想要第一時間了解行業動態、面試技巧、商業知識等等等?加入產品經理進化營,跟優秀的產品人一起交流成長!


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      布倫森30+13末節17分!尼克斯險勝老鷹 沃克本季244三分隊史第一

      布倫森30+13末節17分!尼克斯險勝老鷹 沃克本季244三分隊史第一

      醉臥浮生
      2026-04-07 09:38:34
      新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

      新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

      呼吸科大夫胡洋
      2026-02-22 11:39:12
      《生化9》格蕾絲"大奶牛"MOD:極品大雷身材太火爆

      《生化9》格蕾絲"大奶牛"MOD:極品大雷身材太火爆

      游民星空
      2026-04-05 12:06:10
      最不該倒的人倒了!歐冠前夜巴薩遭雙重暴擊,天要亡我?

      最不該倒的人倒了!歐冠前夜巴薩遭雙重暴擊,天要亡我?

      茅塞盾開本尊
      2026-04-06 21:13:20
      畢業生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

      畢業生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

      復轉這些年
      2026-04-05 18:00:42
      當年周士第是師長他是排長,28年后師長成上將,排長則成了大將

      當年周士第是師長他是排長,28年后師長成上將,排長則成了大將

      云霄紀史觀
      2026-04-07 18:17:43
      德轉列右后衛身價前10:阿什拉夫8000萬第1,廷貝爾7000萬第2

      德轉列右后衛身價前10:阿什拉夫8000萬第1,廷貝爾7000萬第2

      懂球帝
      2026-04-07 12:01:33
      比失業更可怕的是工資倒退,深圳薪資回到10年前,打工人太心酸

      比失業更可怕的是工資倒退,深圳薪資回到10年前,打工人太心酸

      復轉這些年
      2026-04-07 18:05:18
      美國徹底恐慌了?中國溫壓彈進入第三代,方圓千米寸草不生

      美國徹底恐慌了?中國溫壓彈進入第三代,方圓千米寸草不生

      原來仙女不講理
      2026-04-07 16:54:18
      美聯儲主席發表重要講話,宣告美國正式分裂,特朗普走向末路

      美聯儲主席發表重要講話,宣告美國正式分裂,特朗普走向末路

      混沌錄
      2026-04-07 17:37:05
      臺灣普通家庭到底啥水平?我去了才知道,答案很現實也讓人意外

      臺灣普通家庭到底啥水平?我去了才知道,答案很現實也讓人意外

      復轉這些年
      2026-04-06 23:34:04
      樂透抽簽資格要沒了!勇士多次“勸阻”庫里復出計劃

      樂透抽簽資格要沒了!勇士多次“勸阻”庫里復出計劃

      體壇周報
      2026-04-07 17:43:18
      火力全開!上海北部"北大門"即將全面打通

      火力全開!上海北部"北大門"即將全面打通

      新浪財經
      2026-04-07 19:27:08
      芯片巨頭財報炸裂!同比飆升755%,單季狂瀾6000億!

      芯片巨頭財報炸裂!同比飆升755%,單季狂瀾6000億!

      EETOP半導體社區
      2026-04-07 11:28:15
      這招太狠,美國撤銷伊朗高級官員親屬居留權并將其驅逐出境

      這招太狠,美國撤銷伊朗高級官員親屬居留權并將其驅逐出境

      山河路口
      2026-04-05 00:00:03
      男子騎電動車帶妻子去接孩子,途中車底鋰電池突然爆燃,火焰瞬間吞沒車身,后座的妻子淪為火人

      男子騎電動車帶妻子去接孩子,途中車底鋰電池突然爆燃,火焰瞬間吞沒車身,后座的妻子淪為火人

      觀威海
      2026-04-05 07:31:02
      數千美軍深入伊朗腹地,搶了濃縮鈾之后,光天化日修建機場運走?

      數千美軍深入伊朗腹地,搶了濃縮鈾之后,光天化日修建機場運走?

      史智文道
      2026-04-05 10:05:05
      蘇州樓市受到上海樓市的影響,蘇州玲瓏板塊房價從5.4萬降至5.3萬

      蘇州樓市受到上海樓市的影響,蘇州玲瓏板塊房價從5.4萬降至5.3萬

      有事問彭叔
      2026-04-06 11:58:29
      紅土賽季開門紅!辛納送蛋橫掃強勢過關,豪取大師賽18連勝

      紅土賽季開門紅!辛納送蛋橫掃強勢過關,豪取大師賽18連勝

      全景體育V
      2026-04-07 19:35:12
      局勢大反轉!以色列襲擊美使館?特朗普沉默,歐洲國家集體失聲

      局勢大反轉!以色列襲擊美使館?特朗普沉默,歐洲國家集體失聲

      舊窗老街
      2026-04-06 20:53:26
      2026-04-07 20:59:00
      人人都是產品經理社區 incentive-icons
      人人都是產品經理社區
      想要成為大牛先從學做產品開始
      64605文章數 311581關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      美軍拯救飛行員差一點失敗 從40英里外用攝像頭對準他

      頭條要聞

      美軍拯救飛行員差一點失敗 從40英里外用攝像頭對準他

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      教育
      房產
      手機
      公開課
      軍事航空

      教育要聞

      教育部:學位論文抽檢,改革!

      房產要聞

      重磅!三亞擬出安居房新政!

      手機要聞

      傳聞蘋果闊折疊命名iPhone Ultra,曝國內同品類新機也考慮跟進

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美軍營救飛行員出動155架飛機

      無障礙瀏覽 進入關懷版