網易首頁 > 網易號 > 正文申請入駐

同一模型跑6個月，輸出結構變了：環境比提示詞更狠

2026-04-04 14:30:41　來源: 閃存獵手

北京舉報

分享至

同一套權重，同一套訓練，同一套能力。跑了6個月，輸出結構完全不同——不是隨機波動，是系統性的、可預測的、能復現的差異。

作者把同一個基礎模型（foundation model）塞進兩種環境：一個能查數據庫，一個只能翻聊天記錄。問的是同一個問題："這個組件為什么存在？"

環境A的回答像代碼審查：依賴鏈、調用關系、狀態校驗，每一步都能跟數據庫對賬。環境B的回答像考古筆記：當初誰提的需求、解決了什么痛點、迭代過幾版——也是對的，但形狀完全不同。

結構環境長出結構答案，敘事環境長出敘事答案。模型沒變，問題沒變，變的是它能摸到什么、先摸到什么。

400行協議 vs 聊天記錄：上下文即偏見

兩個環境在問題抵達前，各自往上下文窗口里塞了東西。環境A預加載約400行結構協議——工具注冊表、依賴表、狀態儀表盤、門禁定義。環境B預加載對話歷史和過往推理鏈。

模型注意力機制（attention mechanism）會優先處理已經在那里的內容。結構上下文啟動結構檢索，敘事上下文啟動敘事檢索。這在問題被解析之前就發生了。

換句話說：你還沒開口，答案的骨架已經被環境搭好了。

更隱蔽的是"響應優先級"。環境A的默認工具返回結構化數據——數據庫查詢、文件讀取、計算狀態。環境B的默認工具返回文本片段和歷史記錄。模型傾向于信任先到手的東西，這是檢索的錨定效應。

能查數據庫的那個，反而更瞎

最反直覺的發現：有數據庫權限的環境，自信度更高，但盲區更大。

作者稱之為"檢索缺口"（retrieval gap）。驗證過的關于不完整圖景的事實，摸起來是完整的。數據庫給了模型一種虛假的飽和感——我查過了，所以我知道。但它查不到的東西，它不會知道自己沒查到。

反觀那個什么都驗證不了的環境，模型更容易被 Redirect，更愿意承認"這里可能缺了點什么"。工具訪問同時制造了確定性和不完整性，這是設計提示詞時很難預料的副作用。

這不是提示詞工程（prompt engineering）能修的東西。兩個環境收到的指令 substantially similar——作者特意控制了變量。差異來自環境本身：預加載什么、工具怎么排優先級、檢索何時"感覺完成"。

環境即架構：誰在替你做選擇

這個觀察戳破了一個常見幻覺：我們把模型當成黑箱，以為提示詞是唯一的控制桿。實際上，環境是更底層的架構決策。

你選擇把什么塞進系統提示（system prompt），選擇默認激活哪些工具，選擇檢索結果的排序邏輯——這些不是在"使用"模型，是在重新設計它的認知路徑。每一次部署都是一次微調，只是沒人叫它微調。

作者跑了6個月才意識到這一點。很多團隊可能永遠不會意識到，因為他們只跑一種環境。單一環境讓偏差隱形，讓"這就是模型的風格"變成自我實現的預言。

產品層面的啟示很直接：如果你的AI應用需要多維度答案，別讓環境只有一種形狀。交替使用、A/B測試、或者至少知道你的默認配置在偏袒什么。

作者最后留了一個沒解的問題：如果環境A和環境B的輸出都是"正確"的，只是形狀不同，那么"正確"的定義權到底在誰手里？是驗證數據庫，還是敘事完整性，還是別的什么東西——模型自己不會選，但環境已經替它選了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0
Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
4 跟貼 4

Claude Code一周份額，一天燒完一半？有人逆向工程發現了7個bug

機器之心Pro 2026-04-07 17:34:08
0 跟貼 0

PMDformer：一個簡單減法實現長時序預測注意力機制糾偏

機器之心Pro 2026-04-07 13:31:21
0 跟貼 0
鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0

河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
1 跟貼 1

iPhone本地跑Gemma 4火了，0 token時代還有多遠？

機器之心Pro 2026-04-07 10:52:08
8 跟貼 8
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294

毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
3個工程師、不開會，估值3.5億美元的Obsidian真正的「小而美」

機器之心Pro 2026-04-07 10:37:47
2 跟貼 2
AI邪修時刻！Meta聯手MIT投毒，左腳踩右腳強行升天

新智元 2026-04-07 09:43:43
0 跟貼 0
讓多模態檢索超越SOTA！ReCALL框架化解生成式與判別式的范式沖突

量子位 2026-04-06 23:28:00
0 跟貼 0
廢除漢字幾十年后，韓語終于被確診“中國拼音”，韓國人又破防了

新一說史 2026-04-07 20:53:00
0 跟貼 0
模仿學習如何賦能靈巧操作？這有一份「2021-2025」全景技術圖譜

機器之心Pro 2026-04-07 13:23:01
0 跟貼 0
男子和小老外結婚三年，開始健身女友這樣理解，婆婆秒接受指令！

搞笑大蘑菇 2026-04-05 13:19:09
0 跟貼 0
風箏-鄭耀先被催婚了！一套邏輯下來，說的徐百川啞口無言

龍耀影視 2026-04-03 09:03:13
3 跟貼 3
一份18K中高級測試工程師面試題

51Testing軟件測試網 2026-04-03 17:30:09
0 跟貼 0
2026企業AI大考：別秀PPT，亮出你的「用蝦」真功夫

36氪 2026-04-07 20:54:15
0 跟貼 0
Claude爆火研究漏引華人團隊成果，已挨打立正道歉

量子位 2026-04-07 17:03:51
0 跟貼 0
內容投毒，工作埋坑，打工人開始用「魔法」對抗Skill煉化？

雷科技 2026-04-07 21:42:51
0 跟貼 0
蒸餾同事skill火了，我想蒸餾老板，可以嗎？

混沌學園官方 2026-04-07 20:18:44
0 跟貼 0
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
5 跟貼 5
美媒：“無法無天的世界代價高昂”

參考消息 2026-04-07 16:50:06
11 跟貼 11
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
37 跟貼 37
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
免費無限用！谷歌上線了一款AI語音轉寫神器

智東西 2026-04-07 19:09:17
1 跟貼 1
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
183 跟貼 183
科技巨頭集體押注自研芯，AI芯片戰場正加速向推理端遷移

華爾街見聞官方 2026-04-07 21:48:40
0 跟貼 0
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
901 跟貼 901
挪威專家：美國已贏且還會繼續贏，但只有東大駐軍，中東才會太平

阿龍聊軍事 2026-04-07 20:27:41
0 跟貼 0
夏航季東航將采用國產大飛機C919執飛上海航線

黑龍江新聞網 2026-04-06 22:32:19
929 跟貼 929
千尋智能30天融資30億元：馬云、雷軍罕見“同框”！重金押注“百萬小時”數據規模，具身智能馬太效應加劇

每日經濟新聞 2026-04-07 21:00:08
0 跟貼 0
不止055！神秘水泥模型曝光，中國2萬噸巨艦要來了？

因果 2026-04-06 20:39:40
0 跟貼 0
風箏-交通員叛變，竟帶著機密文件投誠，看鄭耀先如何應對

龍耀影視 2026-04-07 08:15:51
1 跟貼 1
上海一公園內，游客爬上櫻花樹拍照，結果整棵樹倒下！網友：不堪重婦！

上觀新聞 2026-04-07 16:33:38
35 跟貼 35
中國3月外匯儲備33421.23億美元

界面新聞 2026-04-07 16:08:50
311 跟貼 311
小米汽車：小米YU7全系車型將通過OTA推送車外語音泊出功能

魯中晨報 2026-04-07 21:29:06
0 跟貼 0
張雪公布自己設計的跨界踏板車設計圖，最新回應：正在制作踏板摩托，這款踏板偏運動越野風格，售價可能比傳統的貴一點

魯中晨報 2026-04-07 17:13:05
0 跟貼 0
羅馬諾：巴薩幾年前確實想要B席，他對去西班牙持開放態度

懂球帝 2026-04-06 22:19:19
11 跟貼 11
女孩去送文件無意間看到董事長全家福竟是失散多年的爺爺

山雞看劇 2026-04-04 17:52:07
1 跟貼 1

手機 / 數碼

房產 / 家居

同一模型跑6個月，輸出結構變了：環境比提示詞更狠

400行協議 vs 聊天記錄：上下文即偏見

能查數據庫的那個，反而更瞎

環境即架構：誰在替你做選擇

滿嘴謊言！OpenAI奧特曼黑料大起底

特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

春日限定持續上新，乘開往春天的列車賞春日勝景

科普｜科學備孕，需要做好哪些孕前檢查？

蘋果折疊iPhone遭遇工程挫折？

重磅!寶可夢系列最新作本周登陸Switch平臺 正式開玩

榮耀官宣WIN系列游戲本：4月23日發布！

特朗普恐嚇4小時摧毀伊朗伊朗稱"打穿"海法未見攔截

特朗普恐嚇4小時摧毀伊朗伊朗稱"打穿"海法未見攔截

女首富陳麗華離世被曝生前已分好遺產

不止是大極狐首款MPV問道V9靜態體驗

重磅!寶可夢系列最新作本周登陸Switch平臺正式開玩