<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GPT-4準(zhǔn)確率從95%暴跌60%:上下文工程這坑

      0
      分享至


      2025年Chroma的一項測試讓18個頂級大模型集體翻車——包括GPT-4.1、Claude、Gemini。輸入越長,表現(xiàn)越差,部分模型準(zhǔn)確率從95%斷崖跌至60%。

      這戳破了一個流傳三年的幻覺:給AI塞更多信息,它會更聰明。真相是,大模型有結(jié)構(gòu)性盲區(qū),你喂什么、怎么擺,比喂多少重要得多。這門手藝叫上下文工程(Context Engineering)。

      三個必須搞懂的概念

      聊上下文工程前,先理清三個術(shù)語。Token(詞元)是大模型的思考單元,不是完整單詞,而是約四分之三個詞的文本塊。"context"算1個token,"engineering"會被切成2個。你輸入的問題、系統(tǒng)指令、附帶的文檔,全部按token計費。

      上下文窗口(Context Window)是單次交互中模型能"看見"的token總量。系統(tǒng)人設(shè)、對話歷史、外部數(shù)據(jù)、你的問題,全部擠在這個框里。主流模型標(biāo)稱128K到200萬token不等,但數(shù)字大≠好用。

      注意力機(jī)制(Attention)決定模型如何關(guān)聯(lián)token。生成每個新token前,模型要把它和窗口內(nèi)所有token比對一遍。這讓大模型能跨長文本串聯(lián)概念,也是性能瓶頸的根源。

      大模型"閱讀"方式有多反直覺

      人類讀書從左到右,大模型完全不同。注意力機(jī)制是全局比對:每個token要和所有token算關(guān)系,計算量隨長度平方級膨脹。1000token的文本,模型要做約50萬次比對;10萬token就是50億次。

      這種設(shè)計帶來一個副作用:信息位置極度敏感。Chroma的研究發(fā)現(xiàn),關(guān)鍵信息放在上下文窗口的開頭或結(jié)尾,模型提取準(zhǔn)確率顯著高于塞在中間。中間段落像被"稀釋"了,模型注意力天然向兩端傾斜。

      更麻煩的是"迷失在中間"(Lost in the Middle)現(xiàn)象。當(dāng)文檔超過一定長度,模型對中段內(nèi)容的召回率系統(tǒng)性下降。不是偶爾忘,是結(jié)構(gòu)性遺忘。你塞進(jìn)去的PDF、代碼庫、聊天記錄,中間部分正在被模型"跳過"。

      上下文工程的四條實戰(zhàn)策略

      第一條:信息分級,不是刪減是重組。把必須保留的指令、關(guān)鍵事實、用戶問題放在窗口兩端;背景材料、參考案例、歷史對話往中間堆。讓模型"不得不看"的東西占據(jù)注意力高地。

      第二條:結(jié)構(gòu)化優(yōu)于平鋪。列表、表格、層級標(biāo)題比大段文字更易被模型解析。JSON、YAML等格式明確標(biāo)注字段關(guān)系,減少模型"猜"的負(fù)擔(dān)。代碼塊用markdown包裹,別讓模型自己找邊界。

      第三條:動態(tài)裁剪,而非靜態(tài)截斷。長對話不要全塞,摘要歷史輪次;多文檔不要全堆,按相關(guān)性排序后取Top-K。RAG(檢索增強(qiáng)生成)的本質(zhì)就是動態(tài)上下文工程——先檢索,再組裝,最后塞進(jìn)窗口。

      第四條:測試你的窗口極限。每個模型、每個任務(wù)的"甜蜜點"不同。用真實數(shù)據(jù)跑消融實驗:逐步增加上下文長度,觀察準(zhǔn)確率拐點。Chroma測試?yán)铮行┠P驮?K token就崩了,有些撐到64K才下滑。

      為什么這事現(xiàn)在才有人講清楚

      2023到2024年,行業(yè)焦點在拼參數(shù)、卷窗口。Anthropic把Claude拉到200萬token,Google Gemini跟進(jìn),OpenAI默默加碼。廠商敘事是"越大越能裝",用戶直覺是"裝得多懂得多"。

      Chroma的測試數(shù)據(jù)把敘事拽回地面:18個模型,零例外,全都在長度面前露餡。這不是某個架構(gòu)的bug,是Transformer注意力機(jī)制的固有代價。上下文工程的價值,在于用組織策略對沖硬件限制。

      一個細(xì)節(jié)值得玩味:研究發(fā)布于2025年4月,但"迷失在中間"現(xiàn)象2023年就有論文記錄。為什么兩年后才有系統(tǒng)性的工程指南?因為早期大模型窗口太短,問題被"裝不下"掩蓋了;窗口膨脹后,"裝得下但用不好"才浮出水面。

      產(chǎn)品團(tuán)隊現(xiàn)在面臨的選擇是:繼續(xù)追逐200萬token的軍備競賽,還是在8萬token里把信息密度做到極致?后者需要更多設(shè)計工作,更少API調(diào)用費,以及一套被驗證過的組裝邏輯。

      Chroma的研究團(tuán)隊在附錄里埋了一句話:測試中最穩(wěn)定的模型,不是窗口最大的那個,而是對輸入結(jié)構(gòu)最敏感的那個。這算是一種暗示嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      中山市小欖鎮(zhèn)九洲基社區(qū)黨委書記盧常秋被查

      中山市小欖鎮(zhèn)九洲基社區(qū)黨委書記盧常秋被查

      南方都市報
      2026-04-07 13:04:06
      超湖人升第3!掘金加時滅開拓者9連勝 約基奇35分三雙楊瀚森DNP

      超湖人升第3!掘金加時滅開拓者9連勝 約基奇35分三雙楊瀚森DNP

      醉臥浮生
      2026-04-07 11:51:16
      剛剛 | TVB緊急聲明!

      剛剛 | TVB緊急聲明!

      天津廣播
      2026-04-07 22:23:17
      馬卡:偷走多納魯馬小紙條的球童收到隨波黑出征世界杯的邀請

      馬卡:偷走多納魯馬小紙條的球童收到隨波黑出征世界杯的邀請

      林子說事
      2026-04-07 07:11:42
      25歲上海男子入職第二天就被外派越南,登機(jī)前40分鐘被攔下,警方提醒

      25歲上海男子入職第二天就被外派越南,登機(jī)前40分鐘被攔下,警方提醒

      環(huán)球網(wǎng)資訊
      2026-04-07 18:27:46
      涼透了的專業(yè),頂級碩士也在網(wǎng)絡(luò)哭訴:月薪4500!

      涼透了的專業(yè),頂級碩士也在網(wǎng)絡(luò)哭訴:月薪4500!

      黯泉
      2026-04-07 22:03:00
      詐尸了!哈梅內(nèi)伊死而復(fù)生?特朗普大秀軍功,伊朗做出了一個舉動

      詐尸了!哈梅內(nèi)伊死而復(fù)生?特朗普大秀軍功,伊朗做出了一個舉動

      游古史
      2026-04-07 17:52:48
      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      石江月
      2026-04-07 17:09:01
      陳麗華公司曝離世內(nèi)幕!對遲重瑞稱呼暴露真實關(guān)系,遺言看哭眾人

      陳麗華公司曝離世內(nèi)幕!對遲重瑞稱呼暴露真實關(guān)系,遺言看哭眾人

      一盅情懷
      2026-04-07 16:21:17
      郭晶晶一家廣西爬山,霍啟剛累到臉色慘白,看路人懟娃拍明顯生氣

      郭晶晶一家廣西爬山,霍啟剛累到臉色慘白,看路人懟娃拍明顯生氣

      阿傖說事
      2026-04-07 17:48:02
      章子怡:感謝這個繁花盛開的創(chuàng)作時代。角色需要的樣子,就是我的樣子。

      章子怡:感謝這個繁花盛開的創(chuàng)作時代。角色需要的樣子,就是我的樣子。

      上觀新聞
      2026-04-08 01:00:04
      美軍硝煙中暴露兩大頑疾令人咋舌

      美軍硝煙中暴露兩大頑疾令人咋舌

      烽火瞭望者
      2026-04-07 06:36:54
      王寶強(qiáng)和女友開京牌大G到青島,馮清人高馬大,襯得寶強(qiáng)像小嬌夫

      王寶強(qiáng)和女友開京牌大G到青島,馮清人高馬大,襯得寶強(qiáng)像小嬌夫

      八怪娛
      2026-04-07 15:02:12
      新華社消息|伊朗媒體:伊朗已關(guān)閉與美國的所有外交和間接溝通渠道

      新華社消息|伊朗媒體:伊朗已關(guān)閉與美國的所有外交和間接溝通渠道

      新華社
      2026-04-07 22:24:22
      賀嬌龍離世三月,央媒發(fā)聲解三大誤會,知情人談遺體狀態(tài)

      賀嬌龍離世三月,央媒發(fā)聲解三大誤會,知情人談遺體狀態(tài)

      生命之泉的奧秘
      2026-04-08 01:09:46
      遲重瑞為陳麗華光頭36年,竟是因妻子兒子一句話:您光頭特別富態(tài)

      遲重瑞為陳麗華光頭36年,竟是因妻子兒子一句話:您光頭特別富態(tài)

      觀魚聽雨
      2026-04-07 18:58:33
      清明掃墓慘案!湖南永州一家5口上山盡孝,3死2傷,原因曝光

      清明掃墓慘案!湖南永州一家5口上山盡孝,3死2傷,原因曝光

      奇思妙想草葉君
      2026-04-07 20:18:42
      記住了,家敗必定有征兆:一個家庭絕不能碰的3條大忌,占一條,福氣留不住

      記住了,家敗必定有征兆:一個家庭絕不能碰的3條大忌,占一條,福氣留不住

      阿凱銷售場
      2026-04-06 19:03:49
      心源性猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧可打打牌,建議別做這7事

      心源性猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧可打打牌,建議別做這7事

      醫(yī)學(xué)原創(chuàng)故事會
      2026-03-29 23:50:13
      空籃都上不進(jìn)!“遼籃櫻木”11分鐘0分1板,球迷:白瞎這么大個子

      空籃都上不進(jìn)!“遼籃櫻木”11分鐘0分1板,球迷:白瞎這么大個子

      弄月公子
      2026-04-07 22:42:02
      2026-04-08 01:47:00
      固件更新中
      固件更新中
      有態(tài)度網(wǎng)友ytd
      1291文章數(shù) 11關(guān)注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      白宮:美伊談判進(jìn)展“只有總統(tǒng)知道實際情況”

      頭條要聞

      白宮:美伊談判進(jìn)展“只有總統(tǒng)知道實際情況”

      體育要聞

      拉門斯:我讀過寫科比、詹姆斯&喬丹等人的書,學(xué)習(xí)他們的心態(tài)

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉(zhuǎn)移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      健康
      游戲
      家居
      數(shù)碼
      軍事航空

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      《GTA6》之后是《大表哥3》?R星更可能做中世紀(jì)!

      家居要聞

      雅致愜意 感知生活之美

      數(shù)碼要聞

      索尼新高端頭戴耳機(jī)曝光售價比蘋果還貴

      軍事要聞

      美軍營救飛行員出動155架飛機(jī)

      無障礙瀏覽 進(jìn)入關(guān)懷版