<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Meta AI 推理新論文:模型記住套路,推理 token 砍半

      0
      分享至


      大數(shù)據(jù)文摘出品

      Meta 又一次在 AI 推理上“開了掛”。

      一份新論文顯示,Meta 的研究團隊找到一種讓大模型“用更少思維,想得更清楚”的辦法。

      這篇論文名為《Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors》,發(fā)表于2025 年 9 月 17 日,來自Meta 團隊與普林斯頓大學(xué)、蒙特利爾大學(xué)聯(lián)合研究。


      作者包括Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 與 Sanjeev Arora

      論文地址: https://arxiv.org/abs/2509.13237

      論文提出一個新機制,讓大語言模型(LLM)能在每次推理后,總結(jié)自己重復(fù)用到的步驟,并把它們存為簡短指令,稱為“行為(Behavior)”。

      下一次遇到類似問題,模型不再重復(fù)推,而是直接調(diào)用這些“行為”

      效果驚人。

      在數(shù)學(xué)推理任務(wù)上,Meta 團隊實測:模型在準(zhǔn)確率不下降的前提下,推理所需的 token 數(shù)量最多減少 46%

      也就是說,同樣一道題,模型少想一半,卻答得一樣準(zhǔn)。

      研究團隊稱,這讓模型“學(xué)會記得自己怎么思考”,相當(dāng)于給 LLM 裝上了“思維緩存”。

      思維有手冊:AI的“行為記憶術(shù)”


      “行為復(fù)用”(Metacognitive Reuse)框架

      Meta 把這個機制叫做“行為手冊(Behavior Handbook)”。

      當(dāng)模型解決問題時,它會記錄下自己的整個推理過程。

      然后再回頭反思,分析哪些步驟是常見套路,比如“容斥原理”“有理化分母”“代入后先化簡”。

      模型會為這些套路起名、寫說明,變成一條條“行為指令”。

      這些指令被收進一本不斷擴充的手冊里。

      論文把這種機制稱為“元認知路徑(Metacognitive Pathway)”,意思是模型在“思考自己的思考”。

      舉個例子:當(dāng)模型遇到一道擲骰子概率題,它可能調(diào)用behavior_total_outcomes(計算所有可能結(jié)果)和behavior_inclusion_exclusion(用容斥原理避免重復(fù)計數(shù))。

      調(diào)用完就不再多說廢話,答案照出。

      所以,每個行為是一段壓縮的思維過程。它把原本要幾十步才能重建的推導(dǎo),濃縮成一句話。

      論文展示了多個實驗結(jié)果。在MATH數(shù)據(jù)集上,行為調(diào)節(jié)推理(Behavior-conditioned Inference)讓模型的推理token平均減少近一半;在AIME–24/25高難數(shù)學(xué)題上,模型在低預(yù)算(2048–8192 tokens)下仍保持穩(wěn)定精度。

      自我復(fù)盤,像人一樣“省思考”

      長期以來,大模型被詬病“啰嗦”:每解一道題,都要展開冗長的 chain-of-thought,把所有中間步驟重新鋪一遍。

      這不僅浪費 token,也拉低了模型吞吐量。Meta 讓模型自己反思,自己提煉,自己精簡。


      行為提取提示設(shè)計

      論文設(shè)計了三種模式:

      第一種,是“行為調(diào)節(jié)推理”(Behavior-conditioned Inference)。模型從手冊里調(diào)出相關(guān)行為提示,帶著它們?nèi)ソ忸}。
      結(jié)果:少寫46%的token,準(zhǔn)確率不降反升。

      第二種,是“行為引導(dǎo)自我改進”(Behavior-guided Self-improvement)。模型用自己總結(jié)的行為來指導(dǎo)下次推理。
      結(jié)果:正確率比普通“自我批改”提升10%。

      第三種,是“行為調(diào)節(jié)監(jiān)督微調(diào)”(Behavior-conditioned SFT)。Meta 研究者用帶有行為提示的推理數(shù)據(jù)去訓(xùn)練學(xué)生模型。
      結(jié)果:學(xué)生模型學(xué)會推理,比傳統(tǒng)微調(diào)版本更聰明、更高效。

      實驗中,Meta 使用了R1-Llama-70B作為“元認知策略師”,并測試了Qwen3-32B、Llama-3.1-8B 等多個學(xué)生模型

      幾乎所有模型都出現(xiàn)了相同現(xiàn)象:推理token直線下滑,性能保持平穩(wěn)。

      研究者把這一現(xiàn)象形容為:“模型從慢推導(dǎo)變成快反應(yīng)。”它不再每次都重寫思維,而是像人一樣,學(xué)會了用經(jīng)驗來省思考。

      注:頭圖AI生成

      作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動態(tài)與技術(shù)趨勢!

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計費,平均節(jié)省開支30%以上!

      掃碼了解詳情?


      點「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      人社部部長表態(tài)!2026年養(yǎng)老金或迎“22連漲”!漲多少?怎么漲?

      人社部部長表態(tài)!2026年養(yǎng)老金或迎“22連漲”!漲多少?怎么漲?

      八斗小先生
      2025-12-27 10:26:21
      美肯塔基州貨機墜毀事故 死亡人數(shù)升至15人

      美肯塔基州貨機墜毀事故 死亡人數(shù)升至15人

      每日經(jīng)濟新聞
      2025-12-27 09:06:26
      又被打崩了!俄特種部隊拿下指揮部,烏軍精銳旅集體叛逃

      又被打崩了!俄特種部隊拿下指揮部,烏軍精銳旅集體叛逃

      奇奇圈
      2025-12-27 11:59:43
      那個男人回來了!馬丁內(nèi)斯領(lǐng)銜曼聯(lián)防守大戰(zhàn),阿莫林變陣獲奇效

      那個男人回來了!馬丁內(nèi)斯領(lǐng)銜曼聯(lián)防守大戰(zhàn),阿莫林變陣獲奇效

      夜白侃球
      2025-12-27 10:49:10
      上海發(fā)布重磅文件

      上海發(fā)布重磅文件

      第一財經(jīng)資訊
      2025-12-26 10:27:02
      但斌:茅臺的主力消費人群正在慢慢消失

      但斌:茅臺的主力消費人群正在慢慢消失

      新浪財經(jīng)
      2025-12-26 16:52:47
      美媒:短短1年不到,從存亡邊緣到超級大國,中國是怎么做到的?

      美媒:短短1年不到,從存亡邊緣到超級大國,中國是怎么做到的?

      南宮一二
      2025-12-26 13:12:25
      嚴重財務(wù)造假!300391,將啟動退市!

      嚴重財務(wù)造假!300391,將啟動退市!

      中國基金報
      2025-12-26 23:25:36
      順德魚生是淡水生魚片,不擔(dān)心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會騙人!

      順德魚生是淡水生魚片,不擔(dān)心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會騙人!

      夜深愛雜談
      2025-12-23 17:35:17
      中國決心已下,說什么也不買了,白宮后知后覺,轉(zhuǎn)頭宣布對華加稅

      中國決心已下,說什么也不買了,白宮后知后覺,轉(zhuǎn)頭宣布對華加稅

      近史博覽
      2025-12-26 18:02:58
      天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

      天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

      舍長阿爺談事
      2025-12-27 08:25:04
      戰(zhàn)友聚會AA制每人交3500元,因兒子高燒39度會沒去成,次日民警上門

      戰(zhàn)友聚會AA制每人交3500元,因兒子高燒39度會沒去成,次日民警上門

      罪案洞察者
      2025-12-16 14:42:51
      央企“最牛女副處長”落馬:兩年與上司開房410次,細節(jié)曝光

      央企“最牛女副處長”落馬:兩年與上司開房410次,細節(jié)曝光

      西門老爹
      2025-12-16 15:35:31
      中國的船和油,美國全都要!24小時內(nèi),中委兩國在安理會火力全開

      中國的船和油,美國全都要!24小時內(nèi),中委兩國在安理會火力全開

      阿七說史
      2025-12-26 10:36:56
      雷霆隕落,年終慘敗后的困境與挑戰(zhàn)

      雷霆隕落,年終慘敗后的困境與挑戰(zhàn)

      章眽八卦
      2025-12-27 12:16:14
      這可是偉人和夫人的真容,不是演員扮的!有張超罕見還珍貴的照片

      這可是偉人和夫人的真容,不是演員扮的!有張超罕見還珍貴的照片

      草莓解說體育
      2025-12-27 11:25:49
      花生再次被關(guān)注!調(diào)查發(fā)現(xiàn):糖尿病常吃花生,不過半年或有6好處

      花生再次被關(guān)注!調(diào)查發(fā)現(xiàn):糖尿病常吃花生,不過半年或有6好處

      蜉蝣說
      2025-11-20 14:40:39
      廣東3消息!徐杰破紀(jì)錄,宏遠確定回購徐昕,崔永熙更新復(fù)出時間

      廣東3消息!徐杰破紀(jì)錄,宏遠確定回購徐昕,崔永熙更新復(fù)出時間

      多特體育說
      2025-12-26 22:48:23
      敖德薩遭襲,此前澤連斯基變卦、變卦、又變卦

      敖德薩遭襲,此前澤連斯基變卦、變卦、又變卦

      新民晚報
      2025-12-26 09:03:19
      在場-33后拒絕采訪!41歲勒布朗遭批凈負分之王 美媒調(diào)侃該退役了

      在場-33后拒絕采訪!41歲勒布朗遭批凈負分之王 美媒調(diào)侃該退役了

      顏小白的籃球夢
      2025-12-27 09:08:13
      2025-12-27 13:03:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6811文章數(shù) 94522關(guān)注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業(yè)界稱終端再不漲明年必虧

      頭條要聞

      賈國龍首次回應(yīng)西貝風(fēng)波 稱自己連續(xù)40天靠安眠藥入睡

      頭條要聞

      賈國龍首次回應(yīng)西貝風(fēng)波 稱自己連續(xù)40天靠安眠藥入睡

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      劉宇寧:我的價值不需要靠番位來證明

      財經(jīng)要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態(tài)度原創(chuàng)

      教育
      親子
      房產(chǎn)
      健康
      數(shù)碼

      教育要聞

      3甲=2乙,就他們的乘積

      親子要聞

      多吃富含葉黃素的食物對保持孩子眼健康有補益

      房產(chǎn)要聞

      炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

      這些新療法,讓化療不再那么痛苦

      數(shù)碼要聞

      HKC惠科全球首創(chuàng)1080Hz HD極致高刷電競顯示器

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲乱码日产精品bd在线看| 国产xxxxxx| 日韩人妻少妇一区二区三区| 狠狠色丁香婷婷久久综合五月| 青青草99| 99人妻| 亚洲综合无码明星蕉在线视频 | 日韩成人无码| 国产午夜福利精品久久不卡| 成人区人妻精品一区二区不卡视频| 亚洲17P| 精品人妻系列无码天堂| 亚洲综合精品伊人久久| 波多野结衣av高清一区二区三区 | 亚州九九久久| 亚洲精品久久久久国产| 江阴市| 欧美午夜成人电影| 国产成人无码A区在线观| 中国china体内裑精亚洲日本 | 日韩高清在线中文字带字幕| 色色资源网| 色综合久| 黑人玩弄人妻中文在线| 免费视频爱爱太爽了激情| 18禁免费无码无遮挡不卡网站| 宝应县| 国产色AV| 精品无码久久久久国产电影| 撸撸AV| 无遮挡很爽很污很黄的网站 | 极品在线视频| 亚洲男女羞羞无遮挡久久丫| 无码h黄肉动漫在线观看网站| 一本久久伊人热热精品中文字幕 | 无码h黄肉动漫在线观看| 久久精品女人天堂av| 衡阳县| 狼友综合网| 亚洲午夜精品国产电影在线观看| 老司机精品视频一区二区|