<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      百萬Token白燒?Claude官方下場:5招治好上下文腐爛

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】給了100萬token,現(xiàn)在卻手把手教你怎么刪記錄!Anthropic官方承認:塞太多東西,Claude就會變蠢。面對失控的「上下文腐爛」,Anthropic連夜甩出5招救命指南。

      Anthropic自己戳破了百萬上下文神話?


      https://claude.com/blog/using-claude-code-session-management-and-1m-context

      近日,Anthropic一篇關于「如何管理百萬上下文」的博客中再次提到了「上下文腐爛」(context rot)的問題,簡單說就是:

      上下文越長,模型越蠢。

      Anthropic解釋道,上下文窗口是指模型在生成下一條回復時能夠「看到」的全部內(nèi)容,它包括你的系統(tǒng)提示、迄今為止的對話內(nèi)容、每一次工具調(diào)用及其輸出,以及所有已讀取的文件。

      目前,Claude Code的上下文窗口為一百萬個token。


      但上下文并非越長越好。模型的注意力被分散到更多token上,更早的、已經(jīng)不相關的內(nèi)容會開始干擾當前任務,導致表現(xiàn)下降,這就是「上下文腐爛」。


      這并非社區(qū)自造的概念,而是出自Anthropic官方博客。

      早在今年2月Sonnet 4.6發(fā)布時,公告里就寫明了:Sonnet 4.6提供了測試版百萬token上下文窗口。

      但百萬Token≠百萬有效Token。

      你往對話里塞的每一條消息、每一次文件讀取、每一輪工具調(diào)用,都在稀釋模型的注意力。

      早期那些已經(jīng)不相關的內(nèi)容不會自動消失,它們會像噪音一樣持續(xù)干擾當前任務。

      提出問題后,Anthropic通過這篇博客給出了一套完整的管理方法。

      先告訴你「你的對話在腐爛」,然后再手把手教你怎么治。

      上下文越長

      AI越蠢

      先把「上下文腐爛」的機制拆開看。

      100萬Token聽起來很多。

      一個中型代碼庫,連文檔帶源碼,可能也就幾十萬Token。理論上你可以把整個項目塞進去,然后隨便問。

      但模型的注意力是有限資源。

      你兩小時前讀的那個配置文件、一小時前調(diào)試失敗的那段日志、半小時前探索的一條死胡同,全都還在窗口里,全都在搶模型的注意力。

      這就是context rot的機制:模型被迫同時「記住」太多不相關的東西,沒法集中精力處理眼前的任務。

      也許你會覺得,這不就和人類開會開久了走神是一個道理嘛。

      的確如此。

      信息過載導致注意力稀釋,這與能力無關,是帶寬問題。

      更要命的是,當上下文快要撐到100萬Token上限時,系統(tǒng)會自動觸發(fā)「壓縮」(compaction):

      即把整段對話總結(jié)成一個更短的摘要,然后在新窗口里繼續(xù)工作。

      這聽起來很智能,但自動壓縮發(fā)生的那一刻,恰恰是上下文最長、模型表現(xiàn)最差的時候。

      用最蠢的狀態(tài)去做最關鍵的總結(jié),這事兒本身就很難靠譜。

      每一輪對話都是岔路口

      Anthropic在博客里把每一次對話交互定義為一個決策節(jié)點。

      每一輪交互結(jié)束后,你其實站在一個岔路口,不是只有「繼續(xù)聊」這一條路。

      第一條:Continue。在同一會話中發(fā)送另一條消息,直接繼續(xù)聊。上下文還相關,沒必要折騰。這是最自然的選擇,大多數(shù)時候也確實夠用。

      第二條:/rewind。連按兩下Esc,跳回之前某條消息,從那里重新來。

      官方博客里有一個很精準的判斷:與其糾正,不如回退。


      回退(Rewind)通常是更佳的修正方式。

      比如Claude讀了五個文件,試了一種方法沒成功,你的本能反應是說「這個不行,換個方法」。

      但這樣做的問題是,那次失敗嘗試的全部中間過程還留在上下文里,繼續(xù)污染后續(xù)判斷。

      更聰明的做法是rewind到讀完文件那個節(jié)點,帶著新信息重新發(fā)一條更精確的指令:別用方案A,foo模塊沒暴露那個接口,直接走B。

      有用的文件讀取保留了,失敗的嘗試丟掉了。上下文干干凈凈。

      你也可以讓Claude總結(jié)它學到的內(nèi)容并創(chuàng)建一條交接信息。這有點像未來的Claude給過去的自己留了一封信:這條路我試過了,走不通。

      第三條:/clear。開啟一個新會話,附帶一段簡要說明:之前做了什么、現(xiàn)在要干什么、哪些文件相關。

      好處是零腐爛,上下文完全由你控制。壞處是費事,所有背景都得你自己寫。

      第四條:/compact。讓模型總結(jié)當前對話,用摘要替換掉原來的歷史記錄。


      省事,但有損。

      你可以附上引導指令:/compact focus on the auth refactor, drop the test debugging(聚焦認證重構,刪掉測試調(diào)試。)

      讓它知道什么該留什么該扔,而不是去猜。

      /clear和/compact看起來相似,但行為截然不同:

      /compact由模型決定什么重要,你省心但可能丟關鍵信息,而/clear由你自己寫下關鍵內(nèi)容,費事但精確。


      第五條,Subagents。

      把一塊工作交給一個擁有獨立上下文的子智能體,干完活只把結(jié)論帶回來。

      當你知道接下來的任務會產(chǎn)生大量中間輸出,但你只需要最終結(jié)論時,subagent是最干凈的方案。

      它拿到一個全新的獨立上下文窗口,在里面完成所有臟活,中間過程全部留在子窗口里,最后只有一份結(jié)論帶回主會話。

      Subagents:你的一次性調(diào)查員

      這五個動作里,最容易被誤解的就是subagents。

      很多人一聽「子智能體」就往「多智能體協(xié)作」上聯(lián)想:團隊分工、并行處理、AI員工開會討論。

      但Anthropic這篇博客里講的subagents,核心價值只有一個:上下文隔離。

      官方文檔明確寫道:每個subagent都運行在自己的上下文窗口中。

      它可以讀大量文件、做大量搜索、跑完整個調(diào)查流程。但最終,只有摘要和一小段元數(shù)據(jù)會回傳給主會話。

      那些海量的中間過程,全部留在子智能體的一次性上下文里。你的主會話不會被這些噪聲污染。


      Anthropic內(nèi)部用的判斷標準也很簡單:

      我之后還需要這些工具輸出本身嗎,還是只需要最終結(jié)論?

      如果答案是后者,就交給subagent。

      博客里給了三個典型場景:

      讓subagent基于規(guī)格文件驗證工作結(jié)果;讓subagent去讀另一個代碼庫,總結(jié)它的認證流程,然后你自己來實現(xiàn);讓subagent根據(jù)你的git改動去寫文檔。

      這三個場景有一個共同點:過程很重,結(jié)論很輕。

      所以subagent的本質(zhì)不是你的同事,和你在一塊干活,更像是你的「一次性調(diào)查員」。

      它的工作簿在任務結(jié)束后就可以扔掉,你只需要拿走最后那頁報告。

      雖然Claude Code會自動調(diào)用Subagents,但你也可以給它更明確的執(zhí)行指令,比如:

      啟動一個Subagents,根據(jù)以下規(guī)范文件驗證此項工作的結(jié)果;

      派生一個Subagents去閱讀另一個代碼庫,并總結(jié)其身份驗證流程的實現(xiàn)方式,然后你自己以相同的方式實現(xiàn)它;

      派生一個Subagents,根據(jù)我的Git變更來編寫此功能的文檔。

      警惕自動壓縮的翻車時刻

      Anthropic在博客里坦承了一個很多開發(fā)者已經(jīng)踩過的坑:自動壓縮(compaction)翻車。

      什么時候翻車?當模型無法預測你接下來要干什么的時候。

      博客舉了一個例子:

      你做了一次很長的調(diào)試會話,自動壓縮觸發(fā)了,模型把整個排查過程總結(jié)了一遍。然后你突然說:「現(xiàn)在修一下bar.ts里那個warning。」

      但因為整個會話主要圍繞調(diào)試展開,那個warning只是中途順帶看到的一眼,壓縮的時候已經(jīng)被丟掉了。

      這事棘手在哪?觸發(fā)自動壓縮的那一刻,恰恰是上下文最長、模型表現(xiàn)最打折的時候。

      你讓一個已經(jīng)「走神」的模型來決定什么信息重要、什么可以丟掉。

      好在百萬Token窗口給了一個緩沖區(qū)。

      你不用等到自動觸發(fā),可以提前主動/compact,并附上說明:接下來要做什么、哪些信息必須保留。


      用最清醒的時候做壓縮,而不是等到最糊涂的時候被動挨打。

      說到底,自動壓縮不是不能用,是不能盲信。

      五條路

      一個急救包

      雖然最自然的做法就是繼續(xù)下去,但另外四個選項可用于幫助你管理上下文。

      這五條路拼在一起,本質(zhì)上就是一套防治「上下文腐爛」的急救包。


      Anthropic官方示意圖:五種上下文管理動作,從左到右保留的舊上下文越來越多

      官方博客在文末放了一張決策表,按場景匹配工具:


      每一次回車,都是一次上下文決策。

      五種場景,五個工具,選對了上下文干凈,選錯了模型變蠢。

      因此,每一輪交互之后,都該花一秒鐘想想:我的上下文還干凈嗎?接下來該走哪條路?

      百萬上下文的另一面

      是百萬token的賬單

      除了管上下文質(zhì)量,Anthropic這次還做了另一件事:

      讓開發(fā)者看見自己的消耗。

      博客開頭就說了,/usage這個新命令的推出,「來自我們和客戶進行的多次交流」。

      /usage是干什么的?

      根據(jù)Claude Code官方命令文檔,它的作用是「顯示套餐使用上限和速率限制狀態(tài)」。

      注意,這不是一個上下文管理工具。

      它不壓縮、不回退、不清理,只做一件事:讓你看見自己用了多少,還剩多少,有沒有撞上限流。

      但這恰恰是開發(fā)者最焦慮的事。

      100萬上下文聽起來很美,但token不是免費的。

      一個長會話跑下來,你到底消耗了多少配額?自動壓縮會不會在你不知情的情況下觸發(fā),丟掉關鍵信息?你離速率限制還有多遠?

      以前這些問題沒有答案,現(xiàn)在Anthropic給了一個透明窗口。

      這個功能很小,但表明Anthropic已經(jīng)意識到,百萬上下文時代,「用得起」和「用得好」是兩個必須同時解決的問題。

      光給能力不給可見性,開發(fā)者遲早會踩坑然后流失。

      提示詞工程之后

      是上下文工程

      退一步看全局。

      今年2月,Anthropic發(fā)布Sonnet 4.6,公告里確認了100萬token上下文窗口(beta)。


      那篇公告解決的是「能不能」的問題:模型能不能撐住這么長的上下文。

      用戶反饋也很正面:它在改代碼前更能有效讀取上下文了。

      4月15日這篇博客,解決的是「怎么用」的問題。它直接承認了現(xiàn)實局限,然后給出一套系統(tǒng)化的管理方法。

      兩步合在一起,構成了一個完整的閉環(huán):先給你武器,再教你怎么用不傷到自己的錢包。

      Prompt engineering這幾年被講爛了。但真正決定AI編程天花板的,可能是下一個詞:context engineering(上下文工程)。

      怎么喂上下文、什么時候清理、哪些信息該隔離、哪些該保留,這些問題以前靠直覺,現(xiàn)在Anthropic開始給方法論了。

      上下文工程,正在成為AI編程時代的必修課。

      參考資料:

      https://claude.com/blog/using-claude-code-session-management-and-1m-context

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領獎臺

      遺憾!張雪車隊無緣3連冠:極限反超 第三被罰變第四 無緣領獎臺

      念洲
      2026-04-18 20:40:05
      騎士總比分1-0!哈登22+10輕取猛龍 米切爾32分斯特魯斯24分

      騎士總比分1-0!哈登22+10輕取猛龍 米切爾32分斯特魯斯24分

      羅說NBA
      2026-04-19 05:36:20
      與孔令輝分手12年,被黑人拖在肩上的馬蘇,終是為自己的風流買單

      與孔令輝分手12年,被黑人拖在肩上的馬蘇,終是為自己的風流買單

      小正說娛樂
      2026-04-19 12:33:53
      揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

      揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

      頭狼追球
      2026-04-18 17:53:28
      牡丹江男子拽住跳樓女友整整五分鐘,力竭松手女方墜亡,法院判了

      牡丹江男子拽住跳樓女友整整五分鐘,力竭松手女方墜亡,法院判了

      奇思妙想草葉君
      2026-04-18 12:15:59
      在美以高壓下,伊朗內(nèi)部出現(xiàn)多起極端事件

      在美以高壓下,伊朗內(nèi)部出現(xiàn)多起極端事件

      高博新視野
      2026-04-18 06:00:18
      6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

      6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

      奇思妙想草葉君
      2026-04-18 23:52:46
      許爾策勒:三笘薰的進球像范巴斯滕,所有踢球的人都知道難度

      許爾策勒:三笘薰的進球像范巴斯滕,所有踢球的人都知道難度

      懂球帝
      2026-04-19 04:48:54
      雷軍宣布:小米車主安全行駛里程達十萬公里,可獲贈實體限量徽章、精美虛擬勛章,一鍵生成專屬行車故事

      雷軍宣布:小米車主安全行駛里程達十萬公里,可獲贈實體限量徽章、精美虛擬勛章,一鍵生成專屬行車故事

      魯中晨報
      2026-04-18 16:20:17
      曼聯(lián)1-0切爾西逼近歐冠!B費助攻庫尼亞制勝,卡里克需謝另外二人

      曼聯(lián)1-0切爾西逼近歐冠!B費助攻庫尼亞制勝,卡里克需謝另外二人

      羅米的曼聯(lián)博客
      2026-04-19 08:22:46
      和黃圣依離婚后,楊子去娘家接娃,14歲安迪駝背自卑,9歲弟弟帥

      和黃圣依離婚后,楊子去娘家接娃,14歲安迪駝背自卑,9歲弟弟帥

      椰黃娛樂
      2026-04-19 12:34:43
      天啊!看到1987年春晚觀眾席的遲重瑞,才懂陳麗華為啥一見鐘情

      天啊!看到1987年春晚觀眾席的遲重瑞,才懂陳麗華為啥一見鐘情

      真的八卦小學弟
      2026-04-12 00:30:12
      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      千秋文化
      2026-04-15 20:18:32
      滴滴、高德、T3等多家平臺簽字:每單抽成不超過27%,超過部分要返還給司機

      滴滴、高德、T3等多家平臺簽字:每單抽成不超過27%,超過部分要返還給司機

      網(wǎng)約車觀察室
      2026-04-18 09:53:23
      世錦賽戰(zhàn)報:世界亞軍連輸6局2-7!趙心童10連勝,丁俊暉面臨挑戰(zhàn)

      世錦賽戰(zhàn)報:世界亞軍連輸6局2-7!趙心童10連勝,丁俊暉面臨挑戰(zhàn)

      球場沒跑道
      2026-04-19 06:28:45
      “最快女護士”張水華云南石屏馬拉松退賽,本人回應:不舒服就沒跑;其辭職后已拿下兩個冠軍,獲折現(xiàn)超20萬獎勵

      “最快女護士”張水華云南石屏馬拉松退賽,本人回應:不舒服就沒跑;其辭職后已拿下兩個冠軍,獲折現(xiàn)超20萬獎勵

      極目新聞
      2026-04-19 12:01:08
      公交一味壓縮成本,反而越省越亂?北京運營現(xiàn)狀說出實話

      公交一味壓縮成本,反而越省越亂?北京運營現(xiàn)狀說出實話

      劉哥談體育
      2026-04-19 12:19:13
      想遠離癌癥,先管住嘴!腫瘤科醫(yī)生內(nèi)部的“忌口清單”,很多人天天吃

      想遠離癌癥,先管住嘴!腫瘤科醫(yī)生內(nèi)部的“忌口清單”,很多人天天吃

      環(huán)球網(wǎng)資訊
      2026-04-18 17:59:25
      林彪得知前未婚妻賣鞋為生,托人送去3000元,汪靜宜:他還沒忘我

      林彪得知前未婚妻賣鞋為生,托人送去3000元,汪靜宜:他還沒忘我

      歷史龍元閣
      2026-04-10 13:30:19
      4月16日俄烏最新:烏克蘭終于迎來了春天

      4月16日俄烏最新:烏克蘭終于迎來了春天

      西樓飲月
      2026-04-16 19:10:03
      2026-04-19 15:47:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領航智能+時代
      15010文章數(shù) 66787關注度
      往期回顧 全部

      科技要聞

      50分26秒破人類紀錄!300臺機器人狂飆半馬

      頭條要聞

      半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

      頭條要聞

      半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

      體育要聞

      湖人1比0火箭:老詹比烏度卡像教練

      娛樂要聞

      張?zhí)鞇墼u論區(qū)淪陷!被曝卷入小三風波

      財經(jīng)要聞

      華誼兄弟,8年虧光85億

      汽車要聞

      29分鐘大定破萬 極氪8X為什么這么多人買?

      態(tài)度原創(chuàng)

      手機
      時尚
      親子
      家居
      本地

      手機要聞

      OPPO Find X9s Pro首發(fā)天馬全新天工屏:全場景1nit暗光護眼 頻閃無感

      3組出游穿搭,驚艷你的假期!

      親子要聞

      不能隱瞞爸爸媽媽的四件事兒

      家居要聞

      法式線條 時光靜淌

      本地新聞

      12噸巧克力有難,全網(wǎng)化身超級偵探添亂

      無障礙瀏覽 進入關懷版