<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude變蠢了,新模型發布前的黑暗時刻?

      0
      分享至

      文 | 字母AI

      Claude Opus變蠢了。

      最近一段時間,越來越多用戶開始有一種很難講的感覺:雖然這個模型沒有明顯出錯,但也不再像以前那樣“聰明”。

      回答更快了,推理更短了,有時候看起來像是跳過了某些本該認真完成的步驟,變得敷衍了。

      如果這種情況只是個例,用戶可能還會懷疑是不是自己的問題,但當相似的聲音越來越多,這就不再是單純的“感覺不對”了。

      網上甚至開始出現一些視頻,調侃現在的Opus就像兇猛的獅子被摘了毛圈,發現原來只是一條狗。

      一個更直接的說法開始流傳:Opus被削了!

      這是真的嗎?如果是真的,它為什么會被削呢?


      推理深度下降67%

      一開始只是零星的用戶在吐槽,說 Claude Opus“變懶了”“沒以前聰明了”。

      可能只是偶爾犯了一些過去不會犯的低級錯誤,或者在復雜任務里少做了幾步推理。

      某種意義上,和模型的協同很像是和真人的交往,一直以來配合得很好的“同事”某天忽然變臉了,擱誰誰都得難受。

      碰到這種情況,大多數人的第一反應都是懷疑自己:是不是prompt寫得不夠好?還是任務本來就不適合?這種情況應該只是偶然事件吧?

      但很快,在Reddit的Claude社區里,類似的反饋開始密集出現,而且描述高度一致:

      有人說它不再仔細讀代碼;有人說它更快給答案,但經常漏掉關鍵步驟;也有人發現,它在長任務中更容易“提前結束”,像是默認事情已經完成。


      當不同用戶在不同場景下開始重復同一類問題時,這件事似乎不再是所謂的“感覺不對”,更像是一種行為模式的變化。

      換句話說,不是感覺錯了,是模型真的在變。

      真正讓討論升級的是這個數字:有人在Claude Code的使用過程中,對歷史交互日志進行對比,發現模型在復雜任務中的推理過程明顯縮短,自2月更新以來,推理深度下降了67%。


      (參考鏈接:https://github.com/anthropics/claude-code/issues/42796)

      作者坦率地說明,67%是基于簽名長度與思考內容長度的相關估計,而不是直接測量。還提到一月份的日志被刪除了,所以基線對比不太準確。

      相比之下,報告里更有說服力的,其實是那些行為層面的變化。比如read:edit(讀取代碼vs修改代碼)的比例,從6.6下降到了2.0;3月8日之后,被stop hook捕捉到的違規行為有173次,而之前是0。


      不過數字是否精確并沒有那么重要,重要的是它讓一件原本模糊的體感問題,第一次被量化成一個可以討論的趨勢。

      于是,一個新詞在社區里開始流行:“AI shrinkflation”(AI縮水式通脹)

      縮水式通脹是一個經濟學術語,指的是商品的大小或數量減少,而價格不變。放在這里的意思也很直接,模型實際給到用戶的能力變少了,但模型看起來還是同一個名字。

      敷衍的背后

      相比社區的激烈反應,Anthropic并沒有直接承認“模型變弱”。

      Claude Code的開發負責人Boris給出的解釋是,這些變化來自系統層的調整:包括工具調用方式、推理策略以及資源分配機制的變化,而不一定是模型本身能力的下降。

      他舉了個例子:在Claude Code中,一部分問題被認為源于工具鏈和系統prompt,而不是模型本身;與此同時,在高負載情況下,系統需要對算力、token和請求進行控制,這也會影響用戶體驗。

      在最新版本中,Anthropic引入了一種叫“自適應推理”(adaptive thinking)的機制,模型會根據任務復雜度,動態決定是否以及使用多少推理。

      也就是說,并不是模型變差了,只是模型開始“自己決定”要使用多少算力。


      (參考鏈接:https://news.ycombinator.com/item?id=47660925)

      從工程角度看,這是一種很合理的優化,簡單任務少思考,復雜任務多思考,以提升整體效率

      但問題在于,效率優化和能力削弱,在用戶體驗上并沒有區別。

      當一個模型開始更少閱讀上下文、更快給出答案、更頻繁地提前結束任務,用戶感受到的不會是優化,而是敷衍。

      而且這個自適應推理機制,從感性的角度來講,也確實會讓人不太舒服。

      還是拿人際交往的那個比喻:憑什么一開始好好的,用到后面就覺得我的事情不重要了?

      這種不適感很快被另一個變化放大了:Mythos還未發布就廣受關注,Claude Mythos Preview直接被Anthropic稱為“能力躍遷的一代”,在代碼與安全任務上表現出遠超以往的能力。因此它被限制性地提供給少數機構使用,用來加固“全球最關鍵的軟件系統”。

      當“更強的新模型”與“體感變差的舊模型”同時出現,一個在社區中不斷被提起的猜測開始成型:把舊模型削了再抬新模型,一捧一踩,就會顯得新模型有著巨大的升級。

      這個邏輯沒有直接證據,但它正在被越來越多用戶相信。


      模型不再穩定

      實際上,類似的事情對AI來說并不陌生。

      早在2023年就有研究對比了GPT-4在不同時間的表現,發現同一個模型在幾個月內,推理方式和輸出行為都發生了明顯變化。這些變化后來被解釋為多種因素疊加的結果:包括推理策略調整、安全策略收緊,以及對成本和響應速度的優化。


      把陰謀論拋在一邊,如果確實存在一定程度的資源傾斜,在AI行業其實算是常態:無論是OpenAI還是Google,幾乎所有公司都會優先優化最新一代模型,舊模型則逐漸被邊緣化。

      算力是成本,也是生產力。當新模型的能力上限更高、潛在價值更大時,把更多資源投入進去,本身是一種理性的選擇。

      在這個過程中,舊模型的狀態自然會發生變化:被“降權”、推理深度被壓縮、資源分配被重新調整……這些都可以理解為一種工程上的取舍。

      不過理解歸理解,新模型不開放給大眾使用,舊模型又在毫無征兆的情況下弄成這樣,誰能輕易接受?


      從用戶的視角來看,最讓人不滿的并不是模型的“變蠢”,而是它的“不穩定”。

      當模型本身從一個穩定的工具變成一個會不斷變化的系統,它自己做出了“更好的調整”,沒有提示,沒有版本說明,也沒有邊界。

      作為用戶,你不知道它什么時候變了,不知道它具體變了什么,更不知道這種變化會不會影響你正在做的事情。

      你只能感受到它變了,變得沒以前好用了。

      這個時候,有一個新模型放在你的面前,看起來比現在這個更穩定、更可靠,或許用起來會更順手。

      于是選擇就變得微妙起來:似乎不再是你主動選擇新模型,而是舊模型的變化把你推向更新的那一個。

      即使你知道,新模型也可能在某一天變成下一個舊模型,可能還是會猝不及防地“優化”成讓人難受的版本。

      但在那一刻,差距已經擺在眼前。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      感動 丁俊暉出局后祝福趙心童:他比誰都強 看好他世錦賽破咒衛冕

      感動 丁俊暉出局后祝福趙心童:他比誰都強 看好他世錦賽破咒衛冕

      我愛英超
      2026-04-26 22:38:31
      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      南方都市報
      2026-04-26 20:40:18
      李春平“世紀騙局”:沒有百億遺產,“承德文物盜賣案”與他有關

      李春平“世紀騙局”:沒有百億遺產,“承德文物盜賣案”與他有關

      百曉生談歷史
      2026-04-26 10:13:06
      博主發帖稱遭電詐后赴深圳追討,被帶手銬關9小時,還裸體下蹲

      博主發帖稱遭電詐后赴深圳追討,被帶手銬關9小時,還裸體下蹲

      齊天候
      2026-04-26 18:28:05
      色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

      色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

      知識圈
      2026-04-26 09:35:01
      被賣緬甸女大學生后續:園區同意放人,黑幕曝光,父親覺得不對勁

      被賣緬甸女大學生后續:園區同意放人,黑幕曝光,父親覺得不對勁

      云舟史策
      2026-04-26 17:10:28
      中超積分榜:川渝繼續領跑,申花第5,津門虎據脫離降級區4分

      中超積分榜:川渝繼續領跑,申花第5,津門虎據脫離降級區4分

      懂球帝
      2026-04-26 21:58:38
      結束了!杜蘭特退出G4!曝火箭已經內部動蕩

      結束了!杜蘭特退出G4!曝火箭已經內部動蕩

      籃球實戰寶典
      2026-04-27 05:37:34
      賺46萬獎金!趙心童13-9丁俊暉 1/4決賽對手出爐 世錦賽8強定4席

      賺46萬獎金!趙心童13-9丁俊暉 1/4決賽對手出爐 世錦賽8強定4席

      侃球熊弟
      2026-04-26 19:36:04
      中國需要這樣的老師!線性代數的神,全世界想學這一課程的人,都是他的學生

      中國需要這樣的老師!線性代數的神,全世界想學這一課程的人,都是他的學生

      爆角追蹤
      2026-04-26 11:57:53
      男子戒煙3個月省下的煙錢鋪滿一床,當事人:成就感拉滿,堅決不再抽煙,會繼續攢錢,想要去西藏旅游

      男子戒煙3個月省下的煙錢鋪滿一床,當事人:成就感拉滿,堅決不再抽煙,會繼續攢錢,想要去西藏旅游

      觀威海
      2026-04-26 19:16:12
      中國開始不理會美國

      中國開始不理會美國

      楊風
      2026-04-26 22:58:45
      “望月鱔劇毒,誤食必死”,望月鱔比毒蛇還要毒?什么是望月鱔?你們有遇到過嗎?

      “望月鱔劇毒,誤食必死”,望月鱔比毒蛇還要毒?什么是望月鱔?你們有遇到過嗎?

      農夫也瘋狂
      2026-04-26 11:01:20
      文班27分4斷7帽!19分逆轉奪賽點,克林根被打到棄用,楊瀚森上場

      文班27分4斷7帽!19分逆轉奪賽點,克林根被打到棄用,楊瀚森上場

      你的籃球頻道
      2026-04-27 06:21:13
      國內多地開啟五一超長假,中小學“春假+五一”最高可連休11天,新疆5月可休15天,最早放假的游客已在路上

      國內多地開啟五一超長假,中小學“春假+五一”最高可連休11天,新疆5月可休15天,最早放假的游客已在路上

      極目新聞
      2026-04-26 22:51:26
      天津賴老師被處理后續,更多學生爆內情,賴老師就喜歡送禮的家長

      天津賴老師被處理后續,更多學生爆內情,賴老師就喜歡送禮的家長

      漢史趣聞
      2026-04-26 17:43:17
      印尼的豪賭大潰敗,給全世界提了個醒:中國行我也行,純粹是幻覺

      印尼的豪賭大潰敗,給全世界提了個醒:中國行我也行,純粹是幻覺

      補懂事的孩紙
      2026-04-26 22:52:27
      切爾諾貝利被遺忘的60萬人:拿鏟子對抗核輻射,沒人告訴他們真相

      切爾諾貝利被遺忘的60萬人:拿鏟子對抗核輻射,沒人告訴他們真相

      網易新聞出品
      2026-04-26 08:51:02
      中國拋得太及時,8500億美債沒人接盤。

      中國拋得太及時,8500億美債沒人接盤。

      流蘇晚晴
      2026-04-26 18:32:23
      如今不少制度設計的出發點,不是“怎么讓工作做得更好”,而是“萬一出事誰背鍋”!

      如今不少制度設計的出發點,不是“怎么讓工作做得更好”,而是“萬一出事誰背鍋”!

      碧翰烽
      2026-04-26 19:31:18
      2026-04-27 08:55:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      132803文章數 862118關注度
      往期回顧 全部

      科技要聞

      打1折!DeepSeek輸入緩存降價

      頭條要聞

      被問"槍擊發生后為何萬斯先撤離" 特朗普回應了

      頭條要聞

      被問"槍擊發生后為何萬斯先撤離" 特朗普回應了

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      僅次《指環王》的美劇,有第二季

      財經要聞

      DeepSeek融資、字節加碼 AI開始真燒錢了

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      教育
      親子
      本地
      房產
      公開課

      教育要聞

      健康學校“長”什么樣?

      親子要聞

      萌娃被蚊子咬后給爸爸打電話,奶聲奶氣“投訴” #睡個好覺

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      房產要聞

      新一輪教育大爆發來了!海口,開始瘋狂建學校!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 县级市| 国产99久久久国产精品~~牛| 国产免费va| 在线观看潮喷失禁大喷水无码| 天天躁日日躁狠狠躁欧美老妇| 中文字幕精品亚洲二区| 无码熟妇αⅴ人妻又粗又大| 亚洲va国产va天堂va久久 | 精品人妻人人做人人爽| 中文字幕一区二区三区擦澡| 好吊色妇女免费视频免费| ww污污污网站在线看com| ass日本少妇高潮pics| 亚洲成av人在线观看网站| 天天碰天天狠天天透澡| 免费ā片在线观看| 第一福利在线导航| 国产在线精品一区二区三区直播| 久久久久久久久久8888| 久久精品一卡二卡| 91你懂的| 国产精品lululu在线观看| 色婷婷婷丁香亚洲综合| 国产内射一区亚洲| 国产精品亚洲一区二区三区在线| 国产精品午夜福利| 中文字幕无码av波多野吉衣| jizzjizz韩国| 亚洲一区二区人妻| 国产成人AV男人的天堂| 色九九视频| 四虎国产精品成人免费久久| 国产熟妇勾子乱视频| 国产线播放免费人成视频播放| 亚洲VA中文字幕无码久久| 人人妻人人插视频| 湄潭县| 黑人大战中国av女叫惨了| 亚洲精品自拍| 亚洲va韩国va欧美va| 亚洲天堂va|