<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      三星 TRM 論文:少即是多,用遞歸替代深度,挑戰 Transformer 范式

      0
      分享至


      大數據文摘整理

      三星SAIL蒙特利爾實驗室的研究人員近日發布論文《Less is More: Recursive Reasoning with Tiny Networks》,提出一種名為Tiny Recursive Model(TRM)的新型遞歸推理架構。


      這項研究顯示,在推理任務上,小網絡也能戰勝大型語言模型

      TRM僅使用700萬參數、兩層神經網絡,就在多項高難度任務中超過了 DeepSeek R1、Gemini 2.5 Pro、O3-mini 等模型。

      在架構上,TRM也放棄了自注意力層(僅限 TRM-MLP 變體;TRM-Att 仍含自注意力。)。論文表明,對于小規模固定輸入任務,MLP反而能減少過擬合。另外,當上下文長度較短時,注意力機制反而是一種浪費。TRM 在某些任務(例如 Sudoku、Maze-Hard 等)中, 使用純 MLP 結構優于 Transformer-based 模型。


      圖注: Tiny Recursive Model(TRM)通過不斷在“答案 y和“潛在思考變量 z 之間遞歸更新,實現小參數模型的多輪自我修正推理。

      傳統大模型依賴鏈式思維(Chain-of-Thought)生成推理步驟,但這種方法成本高、容易累積錯誤。

      TRM 則通過遞歸地更新“答案”和“潛在思考變量”,讓模型在多輪自我修正中逼近正確結果。

      論文總結:“TRM以極小的規模實現了前所未有的泛化能力。”在ARC-AGI推理基準上,TRM獲得45%(ARC-AGI-1)8%(ARC-AGI-2)的準確率,高于多數大型模型。在Sudoku-Extreme任務上,它的準確率更是達到87.4%,刷新紀錄。

      研究團隊稱,這種結構的核心邏輯是“遞歸即深度”:深度遞歸可替代增加層數,模型不需更多層數,只需反復思考。

      推理機制重構:少即是多

      TRM的設計源自對上一代Hierarchical Reasoning Model(HRM)的反思。


      HRM模型在兩種不同頻率下遞歸更新潛變量與的過程,通過先無梯度、后帶梯度的雙階段循環,實現高低頻遞歸推理的結合。

      HRM 使用兩個網絡在不同“頻率層次”上遞歸運算,模仿人腦的多層推理結構。
      然而,其訓練過程復雜,依賴固定點理論(Fixed-Point Theorem)和生物學假設。

      TRM徹底放棄這些理論假設。

      研究者發現,單一網絡加深度監督(Deep Supervision)即可實現相同甚至更好的推理效果。

      模型通過多次前向遞歸更新內部潛變量z與當前答案y,讓推理鏈條在每一步收斂得更準。

      與HRM相比,TRM的參數量減少參數縮減約74%,單步前向次數減半,同時提升準確率。

      論文數據顯示:在Maze-Hard數據集上,TRM測試準確率為85.3%,高出HRM 10個百分點。

      TRM還取消了傳統的“繼續計算”機制(Adaptive Computational Time, ACT)中第二次前向傳播。

      研究者改用一個簡單的二元判斷來決定是否停止推理。

      結果顯示,模型訓練速度顯著提升,準確率幾乎不變。

      在架構上,TRM也放棄了自注意力層。對于小規模固定輸入任務(如數獨),使用多層感知機(MLP)反而能減少過擬合。

      論文指出,“當上下文長度較短時,注意力機制反而是一種浪費。”這一發現挑戰了AI界“模型越大越強”的經驗法則。減少層數、加深遞歸,是讓模型學會‘思考’的關鍵。


      結果與啟示:推理的新尺度

      實驗結果表明,TRM不僅在性能上反超HRM,更在泛化能力與效率比上建立了新標準。


      在Sudoku-Extreme上,它以5M參數實現87.4%準確率;


      在Maze-Hard任務上,以7M參數實現85.3%;


      在ARC-AGI系列測試中,表現超過Gemini 2.5 Pro與DeepSeek R1等大模型。

      研究團隊將這一成果概括為:“以遞歸取代規模,以思考取代堆疊。

      論文分析認為,大模型在生成式推理中往往容易被一次性錯誤放大,而TRM通過循環式的自我修正,將推理劃分為多個小步,顯著降低誤差傳播。

      這種結構在小樣本條件下尤為有效。

      作者還發現,兩層網絡的泛化能力優于更深模型。當層數增加到四層或以上時,性能反而下降,原因在于過擬合。

      團隊引入指數移動平均(EMA)以穩定訓練,使模型在小數據集上保持一致收斂。

      研究指出,這種方法提供了一條新的“輕量AI推理路線”:當算力與數據受限時,小模型通過遞歸學習仍可實現復雜思維行為。

      這為未來的邊緣AI與低資源應用提供了方向。智能的深度,不一定來自規模,而可能來自重復思考。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      徐湖平跑不了!收藏家顏明:江南春剛調撥出去,隔天就被陸挺買走

      徐湖平跑不了!收藏家顏明:江南春剛調撥出去,隔天就被陸挺買走

      放開他讓wo來
      2025-12-24 10:20:32
      10中5轟13+2!放棄引進控衛,美記曝火箭新動向,烏度卡也明牌了

      10中5轟13+2!放棄引進控衛,美記曝火箭新動向,烏度卡也明牌了

      巴叔GO聊體育
      2025-12-26 16:38:14
      不準踏入中國市場一步?我國下達“逐客令”,三星絕望:放過我們

      不準踏入中國市場一步?我國下達“逐客令”,三星絕望:放過我們

      法老不說教
      2025-12-10 22:27:14
      海歸光環徹底消失?49.5萬留學生涌回國,殘酷真相:企業只認這個

      海歸光環徹底消失?49.5萬留學生涌回國,殘酷真相:企業只認這個

      夢史
      2025-12-23 10:18:20
      56歲女教授與27歲小伙結婚,洞房那天她提了個要求,小伙頓時懵了

      56歲女教授與27歲小伙結婚,洞房那天她提了個要求,小伙頓時懵了

      溫情郵局
      2025-10-20 15:43:42
      一場大裁員正在席卷中國的銀行!金飯碗,也不香了,什么原因?

      一場大裁員正在席卷中國的銀行!金飯碗,也不香了,什么原因?

      小鬼頭體育
      2025-12-26 13:05:21
      塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

      塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

      懂球帝
      2025-12-26 13:44:47
      東北那旮瘩人都太有才了!個個都有梗啊

      東北那旮瘩人都太有才了!個個都有梗啊

      夜深愛雜談
      2025-12-21 18:28:27
      俄媒:俄烏和平進程再現新轉折

      俄媒:俄烏和平進程再現新轉折

      參考消息
      2025-12-26 12:27:08
      43歲金莎的婚房火了,裝飾高級,一點俗氣都沒,一定要幸福!

      43歲金莎的婚房火了,裝飾高級,一點俗氣都沒,一定要幸福!

      娛樂領航家
      2025-12-26 23:00:03
      CBA新消息!北京欲裁掉馬帝昂,孫銘徽骨折 盧偉再次對洛夫頓不滿

      CBA新消息!北京欲裁掉馬帝昂,孫銘徽骨折 盧偉再次對洛夫頓不滿

      中國籃壇快訊
      2025-12-26 16:40:15
      東南互保之后,清廷和地方的兵權博弈

      東南互保之后,清廷和地方的兵權博弈

      老崔鏟史
      2025-12-26 21:12:37
      圣誕夜遭受近三年最大處罰,重慶農商行原副行長舒靜被終身禁業!已被查!

      圣誕夜遭受近三年最大處罰,重慶農商行原副行長舒靜被終身禁業!已被查!

      穿透公司
      2025-12-26 12:25:16
      雷霆一戰吞7恥辱紀錄 !73勝概率跌至5% 被馬刺三殺衛冕SGA最扎心

      雷霆一戰吞7恥辱紀錄 !73勝概率跌至5% 被馬刺三殺衛冕SGA最扎心

      顏小白的籃球夢
      2025-12-26 10:54:31
      約基奇56+16+15創6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      約基奇56+16+15創6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      一將籃球
      2025-12-26 17:11:11
      我國有上千萬人做頸動脈超聲!院士:做一次頸動脈超聲,或管七年

      我國有上千萬人做頸動脈超聲!院士:做一次頸動脈超聲,或管七年

      岐黃傳人孫大夫
      2025-12-19 09:16:53
      《老舅》大結局:崔國明安排身后事,“大英雄霍東風”讓二胖破防

      《老舅》大結局:崔國明安排身后事,“大英雄霍東風”讓二胖破防

      東方不敗然多多
      2025-12-27 08:24:06
      2036年奧運會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      2036年奧運會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      扶蘇聊歷史
      2025-12-26 18:01:18
      順德魚生是淡水生魚片,不擔心寄生蟲嗎?網友:大數據不會騙人!

      順德魚生是淡水生魚片,不擔心寄生蟲嗎?網友:大數據不會騙人!

      夜深愛雜談
      2025-12-23 17:35:17
      順差一萬億美元你知道是啥概念不?放200年前八國聯軍早到家門口

      順差一萬億美元你知道是啥概念不?放200年前八國聯軍早到家門口

      沈言論
      2025-12-21 11:50:03
      2025-12-27 11:19:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6811文章數 94522關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發商:已超質保期

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發商:已超質保期

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      保時捷經銷商連夜閉店,維權車主寒風中瑟瑟發抖

      態度原創

      家居
      時尚
      手機
      旅游
      軍事航空

      家居要聞

      格調時尚 智慧品質居所

      推廣中獎名單-更新至2025年12月15日推廣

      手機要聞

      小米17 Ultra今天開售!雷軍:史上最好看的小米影像旗艦

      旅游要聞

      旅日大熊貓回國后,日本動物園“神操作”:由人扮演大熊貓供游客體驗互動

      軍事要聞

      英法德三國領導人通話 重申對烏支持

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费jizz| 任我爽精品视频在线观看| 吉安市| 亚洲乱码一区av春药高潮| 人妻资源站| 99伊人| 五月婷婷激情第四季| 高青县| 国产又粗又猛又爽又黄AV| 99久热在线精品视频| 少妇粉嫩小泬白浆流出| 国产人妻精品一二区| 日本中文字幕色| 成人精品一区二区三区在线观看 | 91乱子伦国产乱子伦!| 亚洲人成网网址在线看| 久久精品囯产精品亚洲| 久久毛| 男人的天堂av一二三区| 国内精品视频一区二区三区| 日本乱人伦片中文三区| 熟女中文字幕精品| 日韩丝袜人妻中文字幕| 亚洲综合无码一区二区三区不卡| 铁牛TV尤物| 成人亚洲精品一区二区三区嫩花 | 无码AV在线播放| 国产一级r片内射免费视频 | 国产毛a片啊久久久久久保和丸| 人妻人人插| 久久亚洲视频| 人人玩人人添人人澡超碰| 香蕉人妻av久久久久天天| 天天躁日日躁狠狠躁av麻豆男男| 校园春色?武侠古典?都市亚洲| 无码天堂| 中文无码人妻少妇| 欧美色欧美亚洲高清在线视频| 国产无遮挡18禁网站免费| 国产精品亚洲а∨天堂2021 | 最新精品国偷自产在线美女足|