![]()
Anthropic上個月將Claude Code提示緩存的TTL(存活時間)從一小時縮短至五分鐘,適用于大多數請求。盡管該公司表示此舉不會增加用戶成本,但仍有用戶反映配額消耗明顯加快。
用戶Sean Swanson提交了一份錯誤報告,指出Anthropic曾于2月1日前后為Claude Code上下文引入一小時緩存機制,隨后又于3月7日前后將其改回五分鐘緩存。Swanson表示:"五分鐘的TTL對以長會話、高上下文為典型使用場景的Claude Code用戶而言,懲罰力度明顯過重。"
在使用AI編程助手或智能體時,上下文是指隨用戶提示一并發送的附加數據,例如已有代碼或背景說明。上下文能夠提升AI的響應準確性,但同時也需要更多的處理資源。
Claude的提示緩存機制可避免對已處理過的提示(包括上下文和背景信息)進行重復處理。緩存TTL分為五分鐘和一小時兩種。寫入五分鐘緩存的Token消耗比基準價格高出25%,寫入一小時緩存則高出100%,但從緩存中讀取數據的成本約為基準價格的10%。
Bun JavaScript運行時的創始人、現任職于Anthropic的Jarred Sumner認可Swanson的分析是"很好的探查工作",但表示將緩存改回五分鐘實際上降低了Claude Code的使用成本,原因是"Claude Code中有相當一部分請求屬于一次性調用,緩存的上下文只被使用一次,不會再被訪問"。Sumner還表示,Claude Code客戶端會自動確定緩存TTL,目前也無計劃提供全局設置選項。
對此,Swanson修訂了自己的分析,承認使用子智能體的會話確實能從五分鐘緩存較低的寫入成本中獲益,因為這些子智能體交互頻繁,"緩存幾乎從不過期"。但他同時指出,自己已連續訂閱每月200美元的套餐超過六個月,直到3月份才首次遭遇配額限制。他表示,"額外的消耗速率"正在讓"這項曾經優秀的服務變得難以使用"。
另一個影響因素是,付費套餐中Claude Opus 4.6或Sonnet 4.6模型提供的100萬Token超長上下文窗口會顯著推高成本,尤其是在緩存未命中時。Claude Code的創始人Boris Cherny表示:"在使用100萬Token上下文窗口時,提示緩存未命中的代價非常高……如果你離開電腦超過一小時后再繼續一個已停滯的會話,往往會觸發完全的緩存未命中。"他還透露,Anthropic正在研究將默認上下文窗口調整為40萬Token,并為有需要的用戶保留100萬Token的選項。目前已有相關配置項可供使用。
Cherny指出,上下文規模擴大已成為普遍趨勢,原因在于用戶"正在引入大量技能,或同時運行多個智能體及后臺自動化任務"。
部分開發者認為,緩存重建和緩存未命中是導致Claude Code配額耗盡的主要原因。目前問題已相當嚴重,Pro用戶(每月20美元)在五小時內可能僅能發送兩條提示。此外,緩存代碼中已發現多處漏洞,有用戶直言:"在這些問題修復之前,關于五分鐘與一小時緩存的討論很可能完全沒有意義,因為相關數據本身就存在嚴重偏差。"
對緩存優化的持續關注,也可能從側面印證了一個現實:Anthropic的配額所能購買到的實際處理時長,已悄然縮水。
Swanson并非唯一反映Claude性能下降的用戶。例如,一位企業團隊套餐用戶表示:"三月份我可以整天使用Opus,效果非常好。但從三月底到四月,我遇到了不到兩小時就耗盡會話用量的情況,模型陷入反復思考的循環,多次'意識到'同樣的事情,輸出了大量'但等等,我其實需要做X'之類的段落,內容只有細微差別。"AMD的一位AI總監也表達了類似看法。
緩存優化固然值得關注,但它似乎不足以解釋用戶所反映的全部問題。
Q&A
Q1:Claude Code的提示緩存機制是如何工作的?
A:Claude的提示緩存機制可以避免對已處理過的提示(包括上下文和背景信息)進行重復處理,從而節省Token消耗。緩存TTL分為五分鐘和一小時兩種。寫入五分鐘緩存的成本比基準價格高25%,寫入一小時緩存則高100%,但從緩存中讀取的成本僅為基準價格的10%。緩存命中時成本較低,未命中時則需重新處理,成本大幅上升。
Q2:為什么用戶最近感覺Claude Code配額消耗變快了?
A:主要有幾個原因:一是Anthropic將緩存TTL從一小時改回五分鐘,導致長會話更容易出現緩存未命中;二是100萬Token超長上下文窗口在緩存未命中時成本極高;三是緩存代碼本身存在已知漏洞,可能導致數據統計不準確。此外,也有觀點認為Anthropic的配額實際上對應的處理時長本身已縮減。
Q3:Anthropic打算如何解決Claude Code上下文窗口過大導致成本過高的問題?
A:Claude Code創始人Boris Cherny透露,Anthropic正在研究將默認上下文窗口從100萬Token縮減至40萬Token,同時為有需要的用戶保留手動選擇100萬Token的選項。目前已有相關配置項可供使用,用戶可以提前調整以控制成本。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.