網易首頁 > 網易號 > 正文申請入駐

提示詞卷完了，上下文也卷完了。現在卷的是"賽道"

2026-03-23 17:55:12　來源: 齊天候

北京舉報

分享至

OpenAI 剛公布了一個內部實驗：3 個工程師，5 個月，100 萬行代碼，零行手寫。

不是 Demo，不是概念驗證。是一個有真實用戶、能部署上線、會出 Bug 也能修復的生產級產品。

但讓我反復回去看了三遍的，不是這個數字。而是報告里一句不起眼的話：

"我們目前最困難的挑戰，集中在設計環境、反饋回路和控制系統上。"

不是模型不夠強，不是提示詞不夠精巧。是環境沒準備好。

這就是 2026 年最重要的工程范式轉移：Harness Engineering（線束工程）。

提示詞過時了，上下文也不夠用了

過去三年，行業對"怎么讓 AI 干好活"的理解，換了三次底層邏輯。

2023 年，所有人都在卷提示詞。 Few-shot、Chain-of-Thought、角色扮演，教程滿天飛。信念很樸素：問對問題，就能拿到好答案。

在聊天場景確實成立。但 AI 一旦從"回答問題"進化到"獨立干活"，光靠一條指令就不夠了。

2025 年中，焦點轉向上下文。 Karpathy 提了 Context Engineering，Shopify CEO 迅速認同。大家開始琢磨怎么動態組裝 RAG、對話歷史、工具輸出。

但下半年的實踐暴露了一個要命的悖論：即便模型支持 100 萬 Token，性能衰減在 25.6 萬左右就出現了。更嚇人的是，有人的 Agent 陷入無限循環，一次事故燒了 5 萬美元。

上下文可以告訴 Agent"知道什么"，但攔不住 Agent"做不該做的事"。

2026 年 2 月，Mitchell Hashimoto 給缺失的那塊拼圖命了名。

HashiCorp 聯合創始人，在博客里寫了一句話，我覺得簡潔到可以刻在墻上：

每當你發現 Agent 犯了一個錯誤，你就花時間設計一個解決方案，使 Agent 永遠不再犯同樣的錯誤。

Prompt Engineering 管的是"說什么"，Context Engineering 管的是"知道什么"，Harness Engineering 管的是"在什么環境里做事"。

說白了，人類的角色從"直接干活的"變成了"設計賽道的"。你不再親手跑每一步，而是把圍欄、彎道、剎車全部提前造好，然后讓 Agent 自己跑。

OpenAI 那個實驗，到底發現了什么？

回到開頭那個實驗。

OpenAI 自己說得很明白：設定"零手寫代碼"不是為了炫技。這個約束本身就是目的。 是為了倒逼團隊去搞清楚一件事：Agent 要在什么樣的環境里，才能大規模可靠地工作？

瓶頸不在模型，在環境

初始團隊 3 人，最終 7 人。五個月交付百萬行生產級代碼，平均每人每天合并 3.5 個 PR。

但早期進展比預期慢。不是 Codex 能力不夠。是環境規范不夠。 Agent 缺少工具、缺少抽象、缺少結構。

大多數人第一反應是"模型還不夠強"。但真相恰好反過來：模型夠強了，環境沒跟上。

這一點做后端的人應該秒懂。你給一個再強的開發者，項目沒有 CI/CD，沒有代碼規范，沒有接口文檔，他一樣寫出一堆爛代碼。Agent 更甚，因為它連"憑經驗猜"的能力都沒有。

從此工程師的工作邏輯變了。 遇到 Bug 不是"換個提示詞再試一次"，而是問自己：缺少什么能力？怎么把這個能力做成 Agent 能理解、能執行的東西？

不加人，加"眼睛"

代碼產出量上去后，人類 QA 跟不上了。

團隊的做法讓我印象很深：沒有招更多測試，而是讓 Agent 自己"看見"運行時。

他們給 Codex 接上了 Chrome DevTools Protocol，Agent 可以直接啟動應用、截屏、操作 DOM、重現 Bug。再把日志、指標、鏈路追蹤全部暴露給 Agent，它可以直接用 LogQL 和 PromQL 查詢。

于是"確保服務啟動在 800ms 內"這種以前只有人才能判斷的事，Agent 也能執行了。

團隊經常看到 Codex 跑一個任務跑六個小時。通常是在人類睡覺的時候。

給地圖，別給百科全書

上下文管理這塊我看得最仔細，因為這跟我日常寫 AGENTS.md 的經驗直接相關。

OpenAI 學到的第一課：指令文件太長，Agent 反而表現更差。 一個巨大的說明文件會擠占真正重要的信息空間。當所有內容都"重要"時，什么都不重要了。

所以他們把 AGENTS.md 從百科全書變成了目錄。大約 100 行，只告訴 Agent"接下來去哪里找信息"，具體內容全在 docs/ 目錄下。

這叫漸進式披露。 先給入口，再按需深入。

更牛的是，他們連文檔維護都交給了 Agent。一個"文檔園丁"Agent 定期掃描過時內容，自動提 PR 修復。

架構圍欄：規矩越嚴，Agent 跑得越快

這個發現我一開始不太信。

團隊給應用搭了非常嚴格的架構：每個業務領域固定分層，依賴方向嚴格校驗，跨領域只能通過統一接口進入。全部通過自定義 Linter 強制執行，違反了就報錯，報錯信息里直接寫修復建議。

這種架構約束，一般大公司到幾百人的時候才會搞。但他們在三個人的時候就上了。因為 Agent 在有明確規則的環境里，跑得比"自由發揮"快得多。 規則對 Agent 來說就是導航，不是枷鎖。

集中控制邊界，局部允許自治。 這就像管理一個工程團隊：你管架構規范，不管他用 for 循環還是 stream。只不過這次你管的"團隊成員"是 Agent。

三件值得認真想的事

如果你也是一個天天跟代碼打交道的開發者，Harness Engineering 對你到底意味著什么？

第一，核心競爭力在轉移。

從"寫代碼的速度"到"理解系統的深度"。有人描述 OpenClaw 創始人用 Agent 的方式：只聊架構和重大決策，完全不碰具體實現。他腦子里裝著項目全貌，Agent 負責把想法變成代碼。

第二，今天就可以開始建自己的 Harness。

不用等什么最佳實踐。在你的項目里建一份 AGENTS.md，從最基本的內容寫起：核心架構說明、常見 Agent 錯誤、測試命令、Agent 不能碰的東西。

每次 Agent 犯錯，回來補一條規則。日積月累，這份文件就是你的 Harness。

第三，別讓初級開發者跳過"手寫代碼"這一關。

Thoughtworks 的 B?ckeler 提了一個尖銳的問題：如果新人一上來就用 Agent 寫所有代碼，從來沒經歷過手動開發的磨練，將來誰來建 Harness？

你得先知道代碼怎么寫、系統怎么崩、Bug 怎么藏，才知道賽道的護欄應該裝在哪。

2026 年最值得關注的技術辯論之一：Big Model vs Big Harness。

短期簡單任務，模型夠強就行。但長期復雜項目，沒有 Harness，再強的模型也會漂移、失控、腐化。

Hashimoto 那句話我越想越覺得精準：每當 Agent 犯錯，就設計一個方案讓它永遠不再犯。

這不就是工程的本質嗎？把經驗編碼成系統，讓錯誤只發生一次。

只不過這一次，你編碼的對象不是業務邏輯，而是 Agent 運行的整個世界。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

外國人在中國用手勢比劃點餐，全障礙語言但無障礙溝通。網友：中文含量0%，溝通效率100%

中國日報網 2026-04-12 18:40:25
104 跟貼 104
山西聞喜一男子被狗咬傷輾轉兩接種點等待6小時才接種

封面新聞 2026-04-12 16:37:28
875 跟貼 875

驚險！男子餓暈在高空，工友死死扛住其身體等來救援

環球網資訊 2026-04-12 14:50:12
448 跟貼 448

大鯊魚是冠軍！上海男籃提前4輪奪得CBA常規賽冠軍

上觀新聞 2026-04-12 21:54:06
82 跟貼 82
匈牙利蒂薩黨在國會選舉中獲勝

環球網資訊 2026-04-13 06:59:05
0 跟貼 0

進口滴眼液，從700多元漲至3000多元？

中國新聞周刊 2026-04-12 21:11:07
282 跟貼 282

“我怕我畢業走了他會挨餓”，山東高中生連續3年給校門口智力缺陷老人送烤腸，臨近畢業拜托附近女攤主幫送，攤主：很感動，不會收他的錢

瀟湘晨報 2026-04-12 21:18:21
56 跟貼 56
上海?蘇州，僅需5分鐘！這條可步行跨省的新路即將全面完工

東方網 2026-04-13 09:52:39
8 跟貼 8

為什么不能把楊柳樹都砍了？官方回應

BRTV新聞 2026-04-12 20:37:45
191 跟貼 191
深圳理工大學將面向全國13個地區招生

中國青年報 2026-04-12 23:51:04
39 跟貼 39
以軍坦克在黎南部沖撞聯黎部隊意大利車輛

海外網 2026-04-13 07:32:01
3 跟貼 3
“阿姨，我可以摸小寶寶的臉嗎？”，一歲寶寶在圖書館排隊被摸臉，全程好奇臉，超級萌

江西晨報 2026-04-13 09:02:34
14 跟貼 14
浙江今天繼續陣雨或雷雨天氣，17日后氣溫回升逼近30℃，“初夏”體感要來了

魯中晨報 2026-04-13 07:32:15
30 跟貼 30
10米/秒！國產人形機器人奔跑峰值速度接近人類巔峰，機器人能超越博爾特嗎

環球網資訊 2026-04-13 07:11:47
106 跟貼 106
祝賀！張帥組合獲得WTA500林茨站雙打冠軍

大象新聞 2026-04-13 09:21:04
43 跟貼 43
連接蚌埠！這條鐵路年底通車

蚌埠日報 2026-04-13 09:24:17
3 跟貼 3
標120W的充電器實際功率僅22.5W，商家：120W是產品型號

極目新聞 2026-04-11 00:53:31
4 跟貼 4
傳榮耀與字節跳動接洽“豆包手機”合作

藍鯨新聞 2026-04-13 09:05:05
29 跟貼 29
兩岸一園筑夢鄉田：《南靖 · 蘭蓮花開》

農視網 2026-04-13 11:51:03
1 跟貼 1
好想來：過期不代表不能吃

公關人 2026-04-13 11:55:27
0 跟貼 0
高鐵站工作人員回應游客站臺吸煙行為：如果有權限，我一定第一個沖上去制止

大象新聞 2026-04-13 11:49:02
0 跟貼 0
廣東一網約車司機車內售賣高至29元現磨咖啡，滴滴：不建議，掙的錢還沒有扣的多

界面新聞 2026-04-13 11:52:09
0 跟貼 0

伊朗革命衛隊：霍爾木茲海峽允許非軍事船只通過

每日經濟新聞

2026-04-13 07:38:50

31歲美女張筱雨去世，剛生完孩子僅1個月，媽媽悲痛透露原因

180視角

2026-04-13 11:01:45

標120W的充電器實際功率僅22.5W，商家：120W是產品型號

極目新聞

2026-04-11 00:53:31

全民考公考編，是這個時代的悲哀。

老陸不老

2026-04-12 12:19:50

NBA首輪對陣全出爐：湖人vs火箭掘金vs森林狼東部無焦點對決

醉臥浮生

2026-04-13 11:04:31

突發！匈牙利政局劇變，反對派領袖馬甲爾贏得大選！親俄勢力大敗

新浪財經

2026-04-13 07:31:15

小米汽車市場危機，開始公開化

浙江車網

2026-04-13 09:15:19

“他摟著我腰，親我臉頰”：若我接受潛規則，他就在判決時偏向我

漢史趣聞

2026-04-12 16:39:57

王石夫婦不必如此動怒

不主流講話

2026-04-13 04:53:29

美國航天員勝利歸來，航天“磚家”蔣鵬飛被“啪啪”打臉

山間聽雨

2026-04-13 09:02:55

入門即標配，頂配即滿分別克至境 E7 誠意來襲

新出行

2026-04-11 10:28:46

說封就封！美國4月13日鎖死伊朗港口，伊朗傻眼

老馬拉車莫少裝

2026-04-13 10:02:14

5月1日起，醫療回扣入刑！

中國醫療保險雜志社

2026-04-12 15:50:06

24小時內6個國際笑話！特朗普被伊朗戲耍，美軍在波斯灣丟盡臉面

知鑒明史

2026-04-13 09:15:05

NASA把55年前登月代碼甩上GitHub，程序員看完集體沉默

野生運營

2026-04-12 08:33:50

中產徹底清醒！鋼琴銷量暴跌72%：不是不愛音樂，是時代不裝了…

火山詩話

2026-04-09 13:45:45

NBA季后賽對陣出爐：湖人vs火箭掘金vs森林狼東部不如西部激烈

醉臥浮生

2026-04-13 11:09:12

里弗斯卸任雄鹿主帥：32勝50負無緣季后賽雄鹿將3年第3次選帥

醉臥浮生

2026-04-13 08:58:25

王石被抓？回應：“造謠”“已去報案路上”

新京報

2026-04-12 19:58:08

距開賽僅60天！阿根廷5000萬鐵閘或無緣世界杯韌帶撕裂+哭著離場

我愛英超

2026-04-13 07:35:52

齊天候

酷愛學習的候先生

563文章數 162291關注度

往期回顧全部

科技要聞

傳榮耀與字節跳動接洽“豆包手機”合作

頭條要聞

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

頭條要聞

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

體育要聞

一支球隊不夠爛，也是一種悲哀

娛樂要聞

賈玲減重后現身馮鞏生日宴身材未反彈

財經要聞

封鎖，還是收費站？

汽車要聞

不止命名更純粹領克10/10+要做純電操控新王

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戲

健康

本地

公開課

教育要聞

這8件幸福的小事，父母每周做兩件，養出高能量的小孩

一切為了玩家!索尼多款PS3時代神作重印或為PS6準備

干細胞抗衰4大誤區,90%的人都中招

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

公開課

手機 / 數碼

房產 / 家居

提示詞卷完了，上下文也卷完了。現在卷的是"賽道"

傳榮耀與字節跳動接洽“豆包手機”合作

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

一支球隊不夠爛，也是一種悲哀

賈玲減重后現身馮鞏生日宴 身材未反彈

封鎖，還是收費站？

不止命名更純粹 領克10/10+要做純電操控新王

態度原創

這8件幸福的小事，父母每周做兩件，養出高能量的小孩

一切為了玩家!索尼多款PS3時代神作重印 或為PS6準備

干細胞抗衰4大誤區,90%的人都中招

12噸巧克力有難，全網化身超級偵探添亂

賈玲減重后現身馮鞏生日宴身材未反彈

不止命名更純粹領克10/10+要做純電操控新王

一切為了玩家!索尼多款PS3時代神作重印或為PS6準備