<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      源自電路理論的即插即用方法讓視覺Transformer重獲高清細(xì)節(jié)

      0
      分享至



      針對視覺 Transformer(ViT)因其固有 “低通濾波” 特性導(dǎo)致深度網(wǎng)絡(luò)中細(xì)節(jié)信息丟失的問題,我們提出了一種即插即用、受電路理論啟發(fā)的 頻率動態(tài)注意力調(diào)制(FDAM)模塊。它通過巧妙地 “反轉(zhuǎn)” 注意力以生成高頻補(bǔ)償,并對特征頻譜進(jìn)行動態(tài)縮放,最終在幾乎不增加計(jì)算成本的情況下,大幅提升了模型在分割、檢測等密集預(yù)測任務(wù)上的性能,并取得了 SOTA 效果。

      該工作來自北京理工大學(xué)、RIKEN AIP和東京大學(xué)的研究團(tuán)隊(duì)。



      • 論文全文: https://arxiv.org/abs/2507.12006
      • 作者主頁: https://linwei-chen.github.io
      • 實(shí)驗(yàn)室主頁: https://ying-fu.github.io
      • 開源代碼: https://github.com/Linwei-Chen/FDAM

      研究背景:為什么這是一個(gè)重要的問題?

      視覺 Transformer(ViT)無疑是近年來計(jì)算機(jī)視覺領(lǐng)域最耀眼的明星。它憑借強(qiáng)大的全局建模能力,在圖像分類、目標(biāo)檢測、語義分割等眾多任務(wù)上刷新了紀(jì)錄。然而,當(dāng)我們構(gòu)建更深、更強(qiáng)大的 ViT 模型時(shí),一個(gè) “隱秘的角落” 里的問題逐漸浮出水面:模型看世界,怎么越來越模糊了?

      這并非錯(cuò)覺。對于分割、檢測這類需要精確定位的 “密集預(yù)測” 任務(wù)而言,圖像的邊緣、紋理等高頻細(xì)節(jié)至關(guān)重要。但研究發(fā)現(xiàn),ViT 中的核心部件 —— 自注意力機(jī)制(Self-Attention),其本質(zhì)上像一個(gè)低通濾波器。這意味著每經(jīng)過一層注意力,圖像特征中的高頻細(xì)節(jié)就會被削弱一分,而平滑的低頻結(jié)構(gòu)則被保留和增強(qiáng)。當(dāng)我們將數(shù)十個(gè)這樣的 “濾波器” 堆疊起來,災(zāi)難性的“頻率消失”(Frequency Vanishing)現(xiàn)象便發(fā)生了:網(wǎng)絡(luò)深層的特征幾乎完全丟失了細(xì)節(jié)信息,導(dǎo)致表征坍塌(Representation Collapse),最終輸出的預(yù)測結(jié)果自然也就模糊不清、邊界不準(zhǔn)。



      正如上圖所示,在標(biāo)準(zhǔn)的 ViT 中,高頻信息隨著層數(shù)加深迅速衰減至零。解決這一根本性缺陷,釋放 ViT 在高清視覺任務(wù)上的全部潛力,是當(dāng)前領(lǐng)域亟待突破的關(guān)鍵瓶頸。

      現(xiàn)有方法的局限性


      此前,一些工作嘗試緩解 ViT 的 “過平滑” 問題,例如通過正則化或直接在頻域上對衰減的高頻信號進(jìn)行靜態(tài)補(bǔ)償(如 AttnScale, NeuTRENO 等)。這些方法起到了一定作用,但它們更像是 “亡羊補(bǔ)牢”—— 在細(xì)節(jié)丟失后進(jìn)行被動修復(fù),而未能從根本上改變注意力機(jī)制的低通天性。它們?nèi)狈σ环N動態(tài)、自適應(yīng)的能力,來根據(jù)不同圖像內(nèi)容和任務(wù)需求,靈活地處理全頻譜的視覺信息。

      FDAM 的核心思想是什么?


      既然問題出在注意力機(jī)制這個(gè) “元件” 上,我們能否重新設(shè)計(jì)這個(gè) “電路”?我們的核心思想,源于經(jīng)典的電路理論。

      想象一下音響上的均衡器。標(biāo)準(zhǔn)注意力就像一個(gè)只有 “重低音”(Low-Pass)的旋鈕,它會濾掉清亮的高音。我們?nèi)绾螒{空造出一個(gè) “高音”(High-Pass)旋鈕呢?電路理論給了我們一個(gè)絕妙的啟示:高通濾波器 = 全通濾波器 - 低通濾波器。

      這個(gè)簡單的公式正是我們方法的核心 ——注意力反轉(zhuǎn)(Attention Inversion, AttInv)。

      • “全通濾波器”是什么?就是未經(jīng)處理的原始特征,它包含了所有頻率的信息。
      • “低通濾波器”是什么?就是標(biāo)準(zhǔn)注意力模塊處理后的特征,它只保留了低頻成分。

      兩者相減,得到的 “殘差” 不就恰好是那些被濾掉的高頻細(xì)節(jié)么?



      基于此,我們的 AttInv 模塊不再是單一的低通濾波器。在每一層,它都同時(shí)擁有了原始的 “低通” 路徑和我們創(chuàng)造的 “高通” 路徑。更關(guān)鍵的是,我們引入了一個(gè)輕量級的動態(tài) “混音器”,讓模型能夠根據(jù)圖像上每個(gè)區(qū)域的特點(diǎn),自主學(xué)習(xí)是該更關(guān)注平滑的整體結(jié)構(gòu)(低頻),還是更聚焦于銳利的邊緣紋理(高頻)。當(dāng)這樣的模塊堆疊起來,模型便擁有了 2^L 種(L 為層數(shù))復(fù)雜的頻率組合能力,能夠擬合出遠(yuǎn)比之前豐富多樣的頻率響應(yīng)。



      方法的關(guān)鍵組成部分


      當(dāng)然,僅有 “低音” 和 “高音” 兩個(gè)旋鈕對于專業(yè)音響師來說還不夠。為了實(shí)現(xiàn)更精細(xì)的 “調(diào)音”,我們設(shè)計(jì)了第二個(gè)關(guān)鍵組件:頻率動態(tài)縮放(Frequency Dynamic Scaling, FreqScale)。

      FreqScale 就像一個(gè)多頻段圖形均衡器。它將特征圖轉(zhuǎn)換到頻域,將其劃分為多個(gè)頻段,并為每個(gè)頻段學(xué)習(xí)一個(gè)動態(tài)的增益權(quán)重。這樣,模型不僅能區(qū)分高低頻,還能根據(jù)需要精確地 “增強(qiáng)” 或 “抑制” 某個(gè)特定頻段的信號,例如,為分割任務(wù)特別增強(qiáng)中高頻的邊緣信號。

      FDAM = AttInv (粗調(diào)高低頻) + FreqScale (精調(diào)各頻段)。兩者結(jié)合,構(gòu)成了一套完整、高效且自適應(yīng)的全頻譜解決方案。

      實(shí)驗(yàn)效果有多驚艷?


      我們的 FDAM 模塊是 “即插即用” 的,可以輕松集成到各種主流 ViT 架構(gòu)中,且?guī)淼膮?shù)量和計(jì)算量開銷微乎其微。但效果的提升卻是實(shí)實(shí)在在的:

      定量展示:

      • 在語義分割任務(wù)中,F(xiàn)DAM 為輕量的SegFormer-B0在 ADE20K 數(shù)據(jù)集上帶來了+2.4 mIoU的巨幅提升。對于強(qiáng)大的DeiT3-Base,F(xiàn)DAM 依然能穩(wěn)定提升+0.8 mIoU,達(dá)到了52.6%的 SOTA 性能。
      • 在目標(biāo)檢測與實(shí)例分割的 “兵家必爭之地” COCO 數(shù)據(jù)集上,F(xiàn)DAM 賦能Mask DINO,將檢測 AP 提升了+1.6,分割 AP 提升了+1.4,效果顯著。
      • 在遙感圖像檢測 DOTA 數(shù)據(jù)集上,我們的方法同樣取得了當(dāng)前單尺度設(shè)定的最優(yōu)成績。







      定性展示:

      • “一圖勝千言”。從下方的特征圖對比中可以直觀地看到,標(biāo)準(zhǔn) DeiT 的特征圖(b)細(xì)節(jié)模糊,而經(jīng)過 FDAM 增強(qiáng)后的特征圖(c)輪廓清晰、紋理銳利,物體的結(jié)構(gòu)被完美地保留了下來。其對應(yīng)的頻譜圖(e)也證實(shí)了我們的方法保留了更豐富的高頻成分。



      理論支撐:

      • 我們的方法不僅效果好,理論上也站得住腳。分析表明,F(xiàn)DAM 能有效抵抗表征坍塌,其 “有效秩”(Effective Rank)在網(wǎng)絡(luò)深層遠(yuǎn)高于基線模型,證明了特征的多樣性得到了更好的維持。



      這項(xiàng)工作意味著什么?


      FDAM 的價(jià)值不僅在于刷新了幾個(gè) SOTA 點(diǎn)數(shù),更在于:

      1.提供了新視角:它成功地將經(jīng)典的電路理論思想引入到前沿的 Transformer 設(shè)計(jì)中,為解決深度學(xué)習(xí)中的基礎(chǔ)問題(如信息衰減)提供了一個(gè)全新的、符合第一性原理的思考框架。

      2.解決了真問題:它精準(zhǔn)地定位并有效解決了 ViT 在密集預(yù)測任務(wù)中的一個(gè)核心痛點(diǎn) ——“頻率消失”,將 ViT 的潛力更充分地釋放出來。

      3.兼具實(shí)用與優(yōu)雅:作為一個(gè)輕量、即插即用的模塊,F(xiàn)DAM 可以毫不費(fèi)力地為現(xiàn)有模型 “增壓”,在工業(yè)界和學(xué)術(shù)界都有著巨大的應(yīng)用潛力。

      這項(xiàng)工作可能會推動社區(qū)在需要高清細(xì)節(jié)的領(lǐng)域(如醫(yī)學(xué)影像分析、高分辨率遙感、自動駕駛感知)中更廣泛地應(yīng)用和探索更深層的 ViT 模型。

      未來可以探索的方向

      FDAM 也為未來研究打開了新的大門。例如,我們是否可以設(shè)計(jì)一個(gè)完全在頻域中進(jìn)行動態(tài)路由的全新網(wǎng)絡(luò)結(jié)構(gòu)?這種頻率調(diào)制的思想能否被拓展到視頻、三維點(diǎn)云甚至多模態(tài)數(shù)據(jù)中?這些都是激動人心的未來方向。

      歡迎在 ICCV 2025 現(xiàn)場與我們交流!

      作者介紹:



      付瑩是北京理工大學(xué)計(jì)算機(jī)學(xué)院的教授、博士生導(dǎo)師,入選國家高層次青年人才計(jì)劃。她的研究領(lǐng)域主要為人工智能、計(jì)算機(jī)視覺與計(jì)算攝像學(xué)。近五年,她在中科院一區(qū)期刊和 CCF A 類會議上發(fā)表了超過 50 篇論文。她的研究成果已應(yīng)用于 “嫦娥工程”、智慧城市建設(shè)等重要項(xiàng)目。她主編的《計(jì)算機(jī)視覺基礎(chǔ)》教材入選北京理工大學(xué) “十四五” 規(guī)劃教材。她獲得的榮譽(yù)包括 ICML 杰出論文獎、日內(nèi)瓦國際發(fā)明展金獎,并入選中國圖象圖形學(xué)學(xué)會石青云青年女科學(xué)家獎和中國電子學(xué)會青年科學(xué)家獎等。此外,付教授還擔(dān)任 TIP 等期刊的編委,并擔(dān)任 CVPR、ICCV 等頂級會議的領(lǐng)域主席。



      谷林(Lin Gu)是 RIKEN AIP(理化學(xué)研究所)的研究科學(xué)家,同時(shí)也是東京大學(xué)的特別研究員。他的研究重點(diǎn)是通過進(jìn)化方法開發(fā)新一代人工智能,旨在超越人腦的局限性。

      谷林先生的研究涵蓋了計(jì)算機(jī)視覺、醫(yī)學(xué)成像、大型語言模型(LLM)、機(jī)器人技術(shù)甚至核聚變等多個(gè)領(lǐng)域。 他在 Nature Methods、PAMI、IJCV、AAAI 等頂級期刊和會議上發(fā)表了 60 多篇論文。此外,他還是 Pattern Recognition 期刊的副主編,并擔(dān)任 ICCV、ICML、NeurIPS 和 ICLR 等多個(gè)會議的領(lǐng)域主席。

      目前,谷林先生是日本內(nèi)閣府監(jiān)督的國家級項(xiàng)目 “Moonshot Program” 的項(xiàng)目經(jīng)理,并擔(dān)任 RIKEN-MOST 項(xiàng)目的日本首席研究員(PI),該項(xiàng)目專注于通過人工智能技術(shù)對精神分裂癥進(jìn)行亞型分類和早期診斷。



      陳林蔚,北京理工大學(xué)計(jì)算機(jī)學(xué)院博士。主要研究方向?yàn)橛?jì)算機(jī)視覺,重點(diǎn)關(guān)注圖像分割、目標(biāo)檢測、低光照圖像增強(qiáng)與識別以及圖像生成等領(lǐng)域。截至目前,他已發(fā)表論文十余篇,其中多篇以第一作者身份發(fā)表在國際計(jì)算機(jī)視覺頂級期刊和會議(如 TPAMI、IJCV、CVPR、ICLR、ISPRS)上。在學(xué)術(shù)社區(qū)貢獻(xiàn)方面,他擔(dān)任 IJCV、TIP、CVPR、ICCV、NeurIPS、AAAI 等多個(gè)期刊會議的審稿人,并在國際計(jì)算機(jī)視覺會議 BMVC 中因?qū)I(yè)素養(yǎng)和貢獻(xiàn)被評為 "杰出審稿人"。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      70歲大姨回鄉(xiāng)養(yǎng)老,月工資4千指定我母親伺候,父親:我們不差錢

      70歲大姨回鄉(xiāng)養(yǎng)老,月工資4千指定我母親伺候,父親:我們不差錢

      燕無衣
      2024-10-03 08:24:15
      金正恩公開承認(rèn):朝鮮士兵在俄羅斯?fàn)奚?20天海外行動細(xì)節(jié)曝光

      金正恩公開承認(rèn):朝鮮士兵在俄羅斯?fàn)奚?20天海外行動細(xì)節(jié)曝光

      策略述
      2025-12-15 21:23:55
      2026年如果房價(jià)繼續(xù)下跌,我國有一半的家庭或?qū)⒚媾R三個(gè)現(xiàn)實(shí)壓力

      2026年如果房價(jià)繼續(xù)下跌,我國有一半的家庭或?qū)⒚媾R三個(gè)現(xiàn)實(shí)壓力

      裝修秀
      2025-12-11 11:20:03
      老公談合作給我發(fā)6萬補(bǔ)償,閨蜜請我吃飯,我發(fā)現(xiàn)老公是閨蜜置頂

      老公談合作給我發(fā)6萬補(bǔ)償,閨蜜請我吃飯,我發(fā)現(xiàn)老公是閨蜜置頂

      溫情郵局
      2025-12-17 11:03:36
      未來10年,最吃香的家庭不會再是“一兒一女”了,而是這一種!

      未來10年,最吃香的家庭不會再是“一兒一女”了,而是這一種!

      一口娛樂
      2025-12-17 00:08:30
      一位在巴西開超市十年的老鄉(xiāng)說:當(dāng)?shù)厝撕尬覀儯皇且驗(yàn)闁|西便宜

      一位在巴西開超市十年的老鄉(xiāng)說:當(dāng)?shù)厝撕尬覀儯皇且驗(yàn)闁|西便宜

      南權(quán)先生
      2025-12-13 16:51:47
      曾是守衛(wèi)陜甘寧的“御林軍”,卻因一個(gè)小失誤,最終導(dǎo)致全軍覆沒

      曾是守衛(wèi)陜甘寧的“御林軍”,卻因一個(gè)小失誤,最終導(dǎo)致全軍覆沒

      轉(zhuǎn)身微笑梅
      2024-04-23 13:52:02
      河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

      河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

      寶哥精彩賽事
      2025-12-16 08:40:55
      徐萌別高興太早:范家這筆母親遺產(chǎn),才是范仲達(dá)范一夫翻盤的底牌

      徐萌別高興太早:范家這筆母親遺產(chǎn),才是范仲達(dá)范一夫翻盤的底牌

      老籣說體育
      2025-12-13 18:08:50
      還要繼續(xù)打,泰軍警告柬方:若敢用中國戰(zhàn)略武器,將直接縱深打擊

      還要繼續(xù)打,泰軍警告柬方:若敢用中國戰(zhàn)略武器,將直接縱深打擊

      時(shí)時(shí)有聊
      2025-12-15 07:30:21
      王炸登場,電腦端最強(qiáng)輸入法來了!

      王炸登場,電腦端最強(qiáng)輸入法來了!

      黑貓科技迷
      2025-12-17 11:40:01
      跳樓新娘遺書曝光:并不想死,提了5次錢,鄰居可憐,化妝師嚇哭

      跳樓新娘遺書曝光:并不想死,提了5次錢,鄰居可憐,化妝師嚇哭

      子芫伴你成長
      2025-12-15 23:46:24
      一個(gè)軍走出三位大區(qū)司令,連警衛(wèi)員都干到正國級,老軍長見面卻只喊他小王

      一個(gè)軍走出三位大區(qū)司令,連警衛(wèi)員都干到正國級,老軍長見面卻只喊他小王

      老杉說歷史
      2025-12-11 19:56:06
      忍了38天后,中國對日本發(fā)出第一道制裁令!暗示了高市早苗結(jié)局?

      忍了38天后,中國對日本發(fā)出第一道制裁令!暗示了高市早苗結(jié)局?

      今墨緣
      2025-12-16 21:57:36
      中日安理會激烈交鋒,傅聰大使提前離席,中方兩度駁斥日本發(fā)言

      中日安理會激烈交鋒,傅聰大使提前離席,中方兩度駁斥日本發(fā)言

      尋墨閣
      2025-12-18 01:09:41
      拔火罐吸出來的瘀血,是體內(nèi)的毒素?告訴你大實(shí)話,看完漲知識

      拔火罐吸出來的瘀血,是體內(nèi)的毒素?告訴你大實(shí)話,看完漲知識

      全球軍事記
      2025-12-11 20:47:33
      越南首次派軍艦在臺灣海峽“自由航行”,稱是各國合法權(quán)利

      越南首次派軍艦在臺灣海峽“自由航行”,稱是各國合法權(quán)利

      環(huán)球熱點(diǎn)快評
      2025-12-13 20:20:03
      1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)梗£愘s:這是給鬼子修的墳!

      1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)梗£愘s:這是給鬼子修的墳!

      史海孤雁
      2025-12-17 16:50:15
      一件“不會再發(fā)生”的事,又站到了普通人的門口!

      一件“不會再發(fā)生”的事,又站到了普通人的門口!

      走讀新生
      2025-11-30 18:50:02
      韋德談保羅離隊(duì):我覺得快船內(nèi)部溝通不暢,不是所有人都贊成

      韋德談保羅離隊(duì):我覺得快船內(nèi)部溝通不暢,不是所有人都贊成

      懂球帝
      2025-12-17 01:53:06
      2025-12-18 02:48:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11943文章數(shù) 142512關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財(cái)經(jīng)要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態(tài) 長城歐拉5上市 限時(shí)9.18萬元起

      態(tài)度原創(chuàng)

      時(shí)尚
      親子
      房產(chǎn)
      家居
      公開課

      你算老幾?我算老己!

      親子要聞

      撒潑打滾的娃媽媽只有一早就制服了

      房產(chǎn)要聞

      封關(guān)前夕!豪庭銘苑超前交付,敬呈海口生活新范本

      家居要聞

      溫馨獨(dú)棟 駝色與淺色碰撞

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产浓毛大泬熟妇视频| 久久久久亚洲av成人网址| 伊人蕉影院久亚洲高清| 国产av中文字幕| 亚洲熟女VS国产对比| 亚洲日韩?国产丝袜?在线精品| 久久天天躁狠狠躁夜夜2020老熟妇| 好男人社区www在线观看| 91一区二区在线播放精品| 1024你懂的国产精品| 中文字幕av免费专区| 熟女人妻av五十路六十路| 一本加勒比hezyo无码专区| www国产无套内射com| 一本色道久久88亚州精品综合| 国产VA在线视频观看| 高级艳妇交换俱乐部小说| 91福利国产午夜亚洲精品| aⅴ精品无码无卡在线观看| 亚洲成人AV在线| 成人视频在线观看18| 亚洲国产成人精品青青草原导航| 性欧美丰满熟妇xxxx性| 免费国精产品wnw2544| 人妻人人爽| 伊人九九网香蕉精品| 五月婷婷久久中文字幕| 欧美激情综合色综合啪啪五月| 国产免费无遮挡吸奶头视频| 婷婷99狠狠躁天天躁中| 亚洲熟妇无码成人A片| 国精产品一区一区二区三区mba| 免费视频爱爱太爽了激情| 亚洲另类激情专区小说图片| 色亚洲成人| 99伊人网| 国产精品夜夜爽7777777| 亚洲最大在线| 亚洲午夜久久久影院伊人| 青青草国产精品一区二区| 伊人蕉影院久亚洲高清|