<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Loop-ViT:AI學(xué)會「反復(fù)思考」,3.8M參數(shù)小模型追平人類平均水平

      0
      分享至



      本工作由香港科技大學(xué)、中科院自動(dòng)化所、加州大學(xué)圣克魯斯分校的研究者們共同完成



      當(dāng)我們解一道復(fù)雜的數(shù)學(xué)題或觀察一幅抽象圖案時(shí),大腦往往需要反復(fù)思考、逐步推演。然而,當(dāng)前主流的深度學(xué)習(xí)模型卻走的是「一次通過」的路線——輸入數(shù)據(jù),經(jīng)過固定層數(shù)的網(wǎng)絡(luò),直接輸出答案。

      這種前饋式架構(gòu)在圖像分類等感知任務(wù)上表現(xiàn)出色,但面對需要多步推理的抽象問題時(shí),卻顯得力不從心。最典型的例子就是「ARC-AGI 基準(zhǔn)測試」——一個(gè)被認(rèn)為是衡量 AI 抽象推理能力的「試金石」。

      近日,來自香港科技大學(xué)、中科院自動(dòng)化所、UC Santa Cruz 的研究團(tuán)隊(duì)提出了「Loop-ViT」,首次將循環(huán) Transformer 引入視覺推理領(lǐng)域。這個(gè)僅有18M 參數(shù)的模型,在 ARC-AGI-1 基準(zhǔn)上達(dá)到了「65.8%」的準(zhǔn)確率,超越了參數(shù)量高達(dá) 73M 的 VARC 集成模型。更令人驚訝的是,其 3.8M 的小型版本也能達(dá)到 60.1% 的準(zhǔn)確率,幾乎追平人類平均水平(60.2%)。



      • 論文標(biāo)題:LoopViT: Scaling Visual ARC with Looped Transformers
      • 論文鏈接:https://arxiv.org/abs/2602.02156
      • 代碼開源:https://github.com/WenjieShu/LoopViT

      什么是 ARC-AGI?

      為什么它如此困難?

      ARC-AGI(Abstraction and Reasoning Corpus)是由 Keras 之父 Fran?ois Chollet 提出的抽象推理基準(zhǔn)。與 ImageNet 等傳統(tǒng)視覺基準(zhǔn)不同,ARC 不考察模型識別貓狗、汽車的能力,而是測試其歸納推理能力。

      每個(gè) ARC 任務(wù)僅提供 2–4 個(gè)示例對(輸入-輸出網(wǎng)格),模型需要從這些示例中歸納出潛在規(guī)則,然后將其應(yīng)用到新的測試輸入上。這些規(guī)則可能涉及:

      • 對象的平移、旋轉(zhuǎn)、鏡像
      • 圖案的重復(fù)與填充
      • 基于顏色的條件變換
      • 類似「重力」的物理模擬

      人類通常能夠通過觀察示例、提出假設(shè)、驗(yàn)證修正的迭代過程來解決這些問題。然而,傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)卻缺乏這種「反復(fù)思考」的能力——它們的計(jì)算深度被固定綁定在網(wǎng)絡(luò)層數(shù)上。

      Loop-ViT 的核心創(chuàng)新



      • 循環(huán)架構(gòu):解耦計(jì)算深度與參數(shù)量

      傳統(tǒng) Vision Transformer 的計(jì)算流程是:輸入 → 第 1 層 → 第 2 層 → …… → 第 L 層 → 輸出。每增加一層就意味著更多的參數(shù),計(jì)算深度與模型容量緊密綁定。

      Loop-ViT 的設(shè)計(jì)理念截然不同:重復(fù)執(zhí)行同一組權(quán)重。模型的核心是一個(gè)權(quán)重共享的 Transformer 塊,可以被循環(huán)執(zhí)行 T 次。這意味著:

      • 計(jì)算深度可以任意擴(kuò)展,而不增加參數(shù)
      • 模型被迫學(xué)習(xí)一個(gè)通用的「思考步驟」,而非任務(wù)特定的啟發(fā)式規(guī)則
      • 類似于人類大腦的工作記憶被反復(fù)更新



      • 混合編碼塊:全局推理 + 局部更新

      研究團(tuán)隊(duì)觀察到,ARC 任務(wù)需要兩種不同的處理模式:

      • 全局規(guī)則歸納:理解整體變換規(guī)律(如「所有藍(lán)色變紅色」)
      • 局部模式執(zhí)行:精確的像素級操作(如「填充封閉區(qū)域」)

      為此,Loop-ViT 設(shè)計(jì)了Hybrid Block,融合了:

      • 自注意力機(jī)制:捕捉全局依賴關(guān)系
      • 深度可分離卷積:處理局部空間模式
      • 動(dòng)態(tài)退出:知道何時(shí)停止思考

      并非所有問題都需要同樣長的思考時(shí)間。簡單的幾何變換可能幾步就能確定答案,而復(fù)雜的算法推理則需要更多迭代。

      Loop-ViT 引入了基于熵的動(dòng)態(tài)退出機(jī)制

      • 每次迭代后,計(jì)算預(yù)測分布的 Shannon 熵
      • 當(dāng)熵值低于閾值(模型「確信」了答案),立即停止
      • 無需任何額外參數(shù),完全基于模型的內(nèi)在不確定性

      實(shí)驗(yàn)表明,能夠「早退」的樣本準(zhǔn)確率高達(dá) 83.33%,而需要完整迭代的困難樣本準(zhǔn)確率為 45.80%。這與人類的認(rèn)知資源分配策略驚人地一致——簡單問題快速解決,復(fù)雜問題投入更多時(shí)間。

      實(shí)驗(yàn)結(jié)果:

      小參數(shù),大性能

      在 ARC-AGI-1 基準(zhǔn)上,Loop-ViT 的表現(xiàn)令人印象深刻。幾個(gè)關(guān)鍵觀察如下:



      參數(shù)效率驚人:3.8M 的 Loop-ViT-Small 超越 18M 的 VARC,僅用 1/5 參數(shù)。

      超越模型集成:18M 的 Loop-ViT 超越 73M 的 VARC 四模型集成。

      深入理解:

      模型在「思考」什么?

      研究團(tuán)隊(duì)對 Loop-ViT 的內(nèi)部機(jī)制進(jìn)行了可視化分析,揭示了有趣的「涌現(xiàn)」行為:

      預(yù)測結(jié)晶現(xiàn)象:隨著迭代進(jìn)行,模型的預(yù)測從模糊逐漸變得清晰確定。早期迭代的預(yù)測波動(dòng)較大,后期則趨于穩(wěn)定——就像溶液中的晶體逐漸析出。

      注意力模式演化

      • 早期迭代:注意力分布廣泛,模型在「掃描」整個(gè)輸入,收集信息。
      • 后期迭代:注意力變得稀疏聚焦,精確對準(zhǔn)需要操作的區(qū)域。

      這種從「全局探索」到「局部執(zhí)行」的轉(zhuǎn)變,與人類解決視覺推理問題的策略高度相似。

      結(jié)語

      Loop-ViT 的成功揭示了一個(gè)重要洞見:在視覺領(lǐng)域,對于需要推理的任務(wù),「思考時(shí)間」比「模型大小」更重要。

      這與當(dāng)前大模型領(lǐng)域一味追求參數(shù)規(guī)模的趨勢形成鮮明對比。也許,實(shí)現(xiàn)真正的人工智能不僅需要更大的網(wǎng)絡(luò),更需要讓模型學(xué)會像人一樣「反復(fù)思考」。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      拒絕AI換臉,多花1個(gè)億重拍:《鏢人》的逆襲,從換角陳麗君開始

      拒絕AI換臉,多花1個(gè)億重拍:《鏢人》的逆襲,從換角陳麗君開始

      動(dòng)物奇奇怪怪
      2026-02-22 03:41:51
      短道創(chuàng)28年最差成績!王濛怒斥戰(zhàn)術(shù)與訓(xùn)練問題,直言敢簽生死狀!

      短道創(chuàng)28年最差成績!王濛怒斥戰(zhàn)術(shù)與訓(xùn)練問題,直言敢簽生死狀!

      籃球資訊達(dá)人
      2026-02-21 17:01:43
      正式交易!1.25億先生打G聯(lián)賽,右膝撕裂+股四頭肌手術(shù),可惜了

      正式交易!1.25億先生打G聯(lián)賽,右膝撕裂+股四頭肌手術(shù),可惜了

      球童無忌
      2026-02-21 20:51:40
      你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      武漢三所大學(xué)被美國宣布制裁!

      武漢三所大學(xué)被美國宣布制裁!

      牛鍋巴小釩
      2026-02-21 14:50:45
      男子拿錯(cuò)快遞,把白糖當(dāng)?shù)咨车惯M(jìn)魚缸!網(wǎng)友:魚要崩潰了……

      男子拿錯(cuò)快遞,把白糖當(dāng)?shù)咨车惯M(jìn)魚缸!網(wǎng)友:魚要崩潰了……

      環(huán)球網(wǎng)資訊
      2026-02-21 16:00:42
      朱高熾在位不足一年 ,為何能青史留名?他解決了三個(gè)天大的難題

      朱高熾在位不足一年 ,為何能青史留名?他解決了三個(gè)天大的難題

      千秋文化
      2026-01-21 20:55:53
      撒貝寧曬全家福!龍鳳胎像復(fù)制粘貼,李白狀態(tài)引熱議

      撒貝寧曬全家福!龍鳳胎像復(fù)制粘貼,李白狀態(tài)引熱議

      情感大頭說說
      2026-02-21 19:28:07
      一票難求!到處爆滿!川A大軍、渝A大軍,大年初五依舊無處可去…

      一票難求!到處爆滿!川A大軍、渝A大軍,大年初五依舊無處可去…

      火山詩話
      2026-02-21 13:51:07
      竇唯和王菲年輕時(shí)候的照片,你們從沒見過的照片

      竇唯和王菲年輕時(shí)候的照片,你們從沒見過的照片

      草莓解說體育
      2026-02-21 22:32:06
      伊朗學(xué)生在各地發(fā)起大規(guī)模反政權(quán)抗議

      伊朗學(xué)生在各地發(fā)起大規(guī)模反政權(quán)抗議

      桂系007
      2026-02-21 23:43:38
      步步踩紅線!高市公然宣稱放寬日本防衛(wèi)裝備出口

      步步踩紅線!高市公然宣稱放寬日本防衛(wèi)裝備出口

      看看新聞Knews
      2026-02-21 18:52:03
      潘瑋柏老婆曬過年照,上海豪宅里做了24道菜,侄子長得也帥

      潘瑋柏老婆曬過年照,上海豪宅里做了24道菜,侄子長得也帥

      春之寞陌
      2026-02-20 21:19:48
      清算開始了!柯文哲向民進(jìn)黨這一跪,直接把黃國昌逼上了絕路

      清算開始了!柯文哲向民進(jìn)黨這一跪,直接把黃國昌逼上了絕路

      生活魔術(shù)專家
      2026-02-21 19:11:15
      今年的消費(fèi)真相:不是大家不花錢了,而是都換了一種活法

      今年的消費(fèi)真相:不是大家不花錢了,而是都換了一種活法

      夜深愛雜談
      2026-02-21 23:09:19
      拾石村媽祖被替后續(xù): 女孩賬號曝光,當(dāng)了八年被選定,今年滿18歲

      拾石村媽祖被替后續(xù): 女孩賬號曝光,當(dāng)了八年被選定,今年滿18歲

      離離言幾許
      2026-02-20 14:02:55
      女子麗江35萬買玉鐲,三年后帶丈夫重游,老板見鐲子癱軟在地

      女子麗江35萬買玉鐲,三年后帶丈夫重游,老板見鐲子癱軟在地

      匹夫來搞笑
      2026-02-21 16:52:33
      這次中日摩擦,為何不“抵制日貨”了?

      這次中日摩擦,為何不“抵制日貨”了?

      華山穹劍
      2026-02-20 20:35:29
      正在逆襲!《鏢人》票房連續(xù)逆跌,預(yù)測提升,吳京這一次又賭贏了

      正在逆襲!《鏢人》票房連續(xù)逆跌,預(yù)測提升,吳京這一次又賭贏了

      得得電影
      2026-02-19 19:34:29
      撐過兩次世界大戰(zhàn)的百年老店,2026年倒了——英國海外買家必看的中介避雷指南

      撐過兩次世界大戰(zhàn)的百年老店,2026年倒了——英國海外買家必看的中介避雷指南

      英國那些事兒
      2026-02-20 23:35:58
      2026-02-22 06:31:03
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12325文章數(shù) 142569關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      貝加爾湖7名遇難者身份全部確認(rèn) 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認(rèn) 1家4口僅1人生還

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個(gè)吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應(yīng)

      財(cái)經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔(dān)當(dāng)”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      旅游
      房產(chǎn)
      數(shù)碼
      手機(jī)
      公開課

      旅游要聞

      上海的氣韻 | 馬上啟程來上博,博物館里過大年

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      數(shù)碼要聞

      AMD RX 9060 XT成功超頻4.769GHz!打破世界紀(jì)錄

      手機(jī)要聞

      三星Galaxy S26系列顏色曝光:將推6種配色,兩款為線上專屬

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版