<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<cite id="nwtkj"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

ImageNet分數越高，生成反而越糊？iREPA給出解釋

2025-12-22 21:49:14　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：傾傾

【新智元導讀】學霸的謊言被揭穿！一篇來自Adobe Research的論文發現，高語義理解并不會提升生成質量，反而可能破壞空間結構。用iREPA簡單修改，削弱全局干擾，生成質量立即飆升。

我們經常會疑惑：為什么視覺模型越高級，生成效果反而越差？

最近，Adobe Research發了一篇論文，專門解釋了這個看起來有點反常、但反復出現的現象。

論文地址：https://arxiv.org/pdf/2512.10794

按直覺，模型要先知道「這是什么」，才能把它畫出來。

ImageNet上的分類準確率越高，說明模型的語義理解越強，生成的內容越穩定、越靠譜。

但這篇論文給出的結果，完全相反：

一些在識別任務中表現平平、甚至看起來「很不聰明」的視覺編碼器，反而能生成出結構更清晰、質量更高的圖像。

全局語義能力越強，生成反而越容易出問題。

很可能我們從一開始，就誤會了生成模型真正擅長的是什么。

為什么視覺模型越「聰明」，生成的反而越差？

先看一個已經被反復驗證的事實：一個模型在ImageNet上的線性探測準確率越高，并不意味著它更適合用來做生成。

最直觀的例子是SAM2。這是一個在識別任務里不出彩的模型，驗證準確率只有24.1%，遠低于主流視覺大模型。

但當這些編碼器被用于REPA時，SAM2的生成質量反而優于一批準確率高出約60%的模型。

SAM2的ImageNet驗證準確率僅為24.1%，但在REPA框架下的生成gFID明顯優于多種準確率超過70%的視覺編碼器。

這還不是某一個模型的偶然表現。

論文進一步比較了同一編碼器家族中不同規模的模型，結果發現：模型越大、分類準確率越高，生成質量反而可能相似或更差。

隨著模型規模和分類準確率提升，生成gFID反而整體變差，表明這一現象并非由個別模型導致。

顯然，「高語義能力=好生成」這條默認路徑，在大量實驗中并不成立。

更關鍵的是，這種現象并不是噪聲。

在跨模型、跨設置的系統性分析中，全局語義指標與生成質量之間的相關性始終非常弱。

分類能力與生成質量幾乎無關，空間結構卻高度相關。左：線性探測準確率與生成 gFID 的相關性極弱（Pearson r=-0.26）。中：空間結構指標（LDS）與生成質量呈現出顯著強相關（Pearson r=-0.85）。右：基于空間結構改進的iREPA，在多種編碼器上穩定優于REPA。

論文進一步對多種視覺編碼器做了相關性分析，結果非常明確：

線性探測準確率與生成質量之間幾乎不存在相關性。

相比之下，反映patch空間結構的指標，與生成質量呈現出極強的正相關關系。

如果不是「懂得多」，那生成模型到底依賴的是什么？

反復確認會壓扁空間結構

在理解了「高語義≠好生成」之后，真正的問題變成了：

為什么模型越是反復確認，生成反而越容易出問題？

關鍵就是，全局語義會在生成過程中壓扁空間結構。

在生成任務中，模型并不是一次性輸出圖像，而是在訓練和采樣過程中，不斷對局部patch之間的關系做判斷。

論文將這種能力概括為「空間結構」：即相鄰patch之間應保持更高相似性，而遠處patch不應被全局語義過早拉近。

但當模型過度追求全局語義一致性，比如通過CLS token ，或對所有patch做全局平均來強化「這是什么」，這些局部差異就會被系統性地削弱。

這種做法會導致一個直接后果：前景物體的patch，與本應無關的背景patch之間，出現異常高的相似性。

空間對比度下降，邊界變得模糊，生成結果因此糊成一片。

PE-G和WebSSL-1B在ImageNet上具有更高的分類準確率，但它們的空間自相似性顯示，前景與背景被過度拉近，邊界模糊。相比之下，空間結構更清晰的SpatialPE-B，生成質量顯著更好。

研究員向模型中逐步加入全局語義信息，觀察分類能力和生成質量的變化。

結果如下圖所示：

增強全局語義信息會損害生成質量

隨著全局信息權重α從0增加到0.5，模型的線性探測準確率持續上升。

但生成質量卻顯著下降，FID明顯惡化。

也就是說，「更懂這是什么」確實在發生；但與此同時，模型也失去生成所依賴的空間結構。

這并不是優化不充分的副作用，而是因為全局語義在生成階段扮演了一個「過強約束」的角色。

它讓模型更快達成結論，卻也更早放棄了對局部結構的精細刻畫。

既然語義會干擾生成，iREPA選擇退后一步

如果說前面的實驗回答了「問題出在哪」，那 iREPA 回答的就是另一個問題：

既然全局語義會干擾生成，那該怎么對齊表示，才不會把結構壓扁？

iREPA給出了答案。它對原本的REPA訓練流程做了兩處非常簡單的修改，總共不到四行代碼。

第一處，是投影方式的改變。

在標準REPA中，patch表征通常會經過MLP投影層進行對齊。

但論文指出，MLP在這一過程中容易混合不同位置的信息，無意中削弱了空間對比度。

因此，iREPA用一個3×3的卷積層（padding=1）替換了MLP投影。

卷積的歸納偏置能保留局部鄰域關系：相鄰patch的相互影響被保留，遠處區域則不會被過早混在一起。

第二處修改，直接針對全局語義。

iREPA在對齊過程中引入了一個空間歸一化層，移除了patch特征中的全局均值分量，讓模型專注于局部之間的差異與邊界。

iREPA如何通過兩處修改，恢復生成所需的空間結構。 (a) 使用卷積投影替代MLP，可更好地保留局部空間關系。 (b) 空間歸一化層通過移除全局分量，提高patch之間的空間對比度。 (c) 經過這兩步修改后，iREPA生成的diffusion特征呈現出更清晰的空間結構。

正是這兩點改動，讓iREPA在機制上與前一節的問題形成了嚴格對應：

全局語義太強會抹平結構，那就在對齊階段削弱全局分量、強化空間關系。

結果也在意料之中。

無論是在ImageNet規模的生成任務，還是更高分辨率的設置，亦或是文本到圖像的多模態生成任務中，iREPA都表現出更快的收斂速度和更好的最終生成質量。

更重要的是，這種提升并不依賴于某一個特定編碼器。

在不同模型規模、不同視覺骨干網絡、不同訓練設置下，iREPA都能穩定改進。

這不僅是一個技巧，而是順著生成任務本身對結構的需求，把表示對齊這件事做得更克制、更精細。

很多時候，我們討論生成模型時，會下意識沿用一個標準。

但這篇論文提醒了我們，生成并不是理解的自然下游。

對生成來說，最重要的并不是「這是什么」，而是「哪些地方該靠近，哪些地方該分開」。

當我們一味強化全局語義，反復催促模型給出答案，其實是在替它提前下結論。

iREPA并沒有試圖讓模型變得更聰明。它做的更像是退后一步，把空間還給空間，把結構還給結構。

結果不是理解能力的飛躍，而是生成質量的回歸。

參考資料：

https://x.com/1jaskiratsingh/status/2000701128431034736?s=20

https://end2end-diffusion.github.io/irepa/

秒追ASI

?點贊、轉發、在看一鍵三連?

點亮星標，鎖定新智元極速推送！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

多模態檢索新突破，用軟標簽打破傳統剛性映射約束，全面超越CLIP

量子位 2025-11-15 13:18:07
0 跟貼 0
VinciCoder：多模態統一代碼生成框架和視覺反饋強化學習

機器之心Pro 2025-11-17 14:12:38
0 跟貼 0

上市15天，摩爾線程劍指英偉達腹地

虎嗅APP 2025-12-21 06:37:08
36 跟貼 36

不愧是冠軍文本！何廣智開口就是核彈級別包袱，惹全場瘋狂爆燈！

阿笎評論哥 2025-12-21 01:20:21
1 跟貼 1
26歲鄭州小伙倫敦鬧市開店賣胡辣湯：一碗售價130元

極目新聞 2025-12-19 21:19:26
6022 跟貼 6022

16歲"烤雞少年"承認用"肉寶王" 曾因日銷百只烤雞爆紅

新京報 2025-12-22 14:40:17
6170 跟貼 6170

全島封關，去海南旅游購物有啥利好？

新華社 2025-12-18 06:33:05
5876 跟貼 5876
把討厭的同事放進游戲里，修改代碼為所欲為

柚子剪輯 2025-12-21 08:32:22
1 跟貼 1

日本H3火箭在飛行途中第二級發動機燃燒提前停止

新華社 2025-12-22 10:40:28
6089 跟貼 6089
中央安全生產考核巡查組在江蘇明查暗訪：客船未執行限航規定動火作業未按要求審批

環球網資訊 2025-12-22 12:00:15
257 跟貼 257
邪修槍法，視覺過載警告！

含亮老師 2025-12-19 03:09:38
12 跟貼 12
36年卷積猜想被解決，華人唯一作者，AI或受益

機器之心Pro 2025-11-26 14:30:39
1 跟貼 1
遙遙無期的AGI是畫大餅嗎？兩位教授「吵起來了」

機器之心Pro 2025-12-22 14:48:14
0 跟貼 0
瞭望 | 雄安方法論：讀懂未來之城

新華社 2025-12-22 16:14:08
0 跟貼 0
貴州一小區自來水變藍8個月，拆卸的管道內發現油漆狀物質，20多人檢出身體異常，官方回應

封面新聞 2025-12-22 22:57:07
1184 跟貼 1184
謝霆鋒、林志玲顏值巔峰，男帥女美的視覺盛宴，遺憾沒有在一起！

大叔侃世界 2025-12-21 10:54:48
0 跟貼 0
冬至前夜探訪成都“羊肉湯一條街”：生意不如往年火爆有商家表示“不漲價”

封面新聞 2025-12-21 10:33:14
1265 跟貼 1265
南博前副院長裝病乞憐，卻翻車了

郁郁乎文 2025-12-22 22:11:42
0 跟貼 0
上交團隊實現新一代光計算芯片突破，開辟算力芯片新路徑

DeepTech深科技 2025-12-21 22:52:26
28 跟貼 28
云南這一醫院，明起試運行！

云南網絡廣播電視臺 2025-12-22 08:09:13
330 跟貼 330
“鋼鐵戰艦”海上疾馳，052DL驅逐艦穿樓而過，視覺沖擊太震撼

羅離生活說 2025-12-18 14:20:23
0 跟貼 0
回歸母校：湖南省教育廳副廳長蘭勇任湖南農業大學黨委書記

澎湃新聞 2025-12-22 18:46:27
255 跟貼 255
7490億美元！馬斯克又把財富天花板捅破了

澎湃新聞 2025-12-22 07:54:28
1956 跟貼 1956
柬內政部稱一名中國公民在柬泰沖突中受傷

北京日報 2025-12-22 17:49:52
2934 跟貼 2934
CEO親自坐在防彈玻璃后，讓員工突突突測試，人沒事說明質量過關

奧力給趣笑堂 2025-12-22 11:31:54
1 跟貼 1
三份文本定邊界，一場慶賀藏野心

劉瑞國講歷史 2025-12-22 08:28:37
11 跟貼 11
新一股中等強度冷空氣將影響廣東！全省平均氣溫下降4-7℃

南方都市報 2025-12-22 18:08:06
108 跟貼 108
王治郅入選2026國際籃聯名人堂

央視新聞客戶端 2025-12-22 07:39:40
1811 跟貼 1811
明宣宗朱瞻基陵墓，下周一開放

上觀新聞 2025-12-20 16:31:19
1423 跟貼 1423
AI開始「內卷」？騰訊混元和上交聯合揭秘多智能體「饑餓游戲」

機器之心Pro 2025-12-22 14:31:44
0 跟貼 0
115公里時速狂飆4小時：尚無車企"認領" 車型仍不清

每日經濟新聞 2025-12-23 00:39:06
14 跟貼 14
“2025長春都市圈發展”高端論壇在長春舉辦

中國日報網 2025-12-22 11:06:14
0 跟貼 0
807道靈魂拷問后，中國模型竟在「意義測試」中奪冠！

新智元 2025-12-22 23:19:05
0 跟貼 0
走進免稅店看消費新潮流（財經眼）

人民網 2025-12-22 06:36:15
36 跟貼 36
萬斯：照顧美國老年人比援助烏克蘭重要

參考消息 2025-12-22 15:00:18
523 跟貼 523
李乃文本想跟孫紅雷對視，怎料人家看都不看他，錯付了！丨超新鮮

往事我敬你一杯酒人 2025-12-20 02:41:29
1 跟貼 1
AI寫政府報告鬧出大笑話：越南一省廳文件錯成“全網段子”，省長震怒下令整頓

緬甸中文網 2025-12-22 19:59:58
0 跟貼 0
當DEI失效后 “反AI”成為新的政治正確

3DM游戲 2025-12-22 21:50:05
1 跟貼 1
外交部：中方對日本首相官邸高官擁核言論感到震驚

財聯社 2025-12-22 15:46:26
39 跟貼 39
Nano Banana最強搭子來了！WPS一鍵轉格式，幫你輕松編輯圖中文字，辦公效率飆升

智東西 2025-12-22 21:22:22
0 跟貼 0

A股，市場傳來一個“利空信號”，明天，或將迎來大跳水！

A股，市場傳來一個“利空信號”，明天，或將迎來大跳水！

夜深愛雜談

2025-12-22 16:08:33

廚房里一個調料，導致中國人死亡率全球第一，專家：不能再這么吃

廚房里一個調料，導致中國人死亡率全球第一，專家：不能再這么吃

腫瘤的真相與誤區

2025-12-22 19:59:57

醫生提醒：肝病早期不是腹痛，而是頻繁出現這5大異常，要警惕

醫生提醒：肝病早期不是腹痛，而是頻繁出現這5大異常，要警惕

蜉蝣說

2025-12-22 21:12:52

最美港姐近日被指靚樣崩壞面型起角，低詾新相力證重回顏值巔峰

最美港姐近日被指靚樣崩壞面型起角，低詾新相力證重回顏值巔峰

粵睇先生

2025-12-23 00:57:39

經濟退潮，遍地是失聲的80后。

經濟退潮，遍地是失聲的80后。

愛吃糖的貓cat

2025-12-22 19:01:06

太突然！武漢版“帝國大廈”將被拍賣？

太突然！武漢版“帝國大廈”將被拍賣？

越喬

2025-12-22 23:00:59

許亞軍捧著，段奕宏護著，郭京飛寵著，演了55部戲，41歲終于紅了

許亞軍捧著，段奕宏護著，郭京飛寵著，演了55部戲，41歲終于紅了

韓馳

2025-12-22 17:20:44

普京剛官宣完，這次輪到樊振東了，隱婚實錘？

普京剛官宣完，這次輪到樊振東了，隱婚實錘？

阿廢冷眼觀察所

2025-12-23 01:38:44

統一刻不容緩！特朗普幫了中國大忙，中國錯失機會要再等10年

統一刻不容緩！特朗普幫了中國大忙，中國錯失機會要再等10年

潮鹿逐夢

2025-12-21 10:58:57

李凱文的抗日表演賽

非典型佛教徒

2025-12-22 00:43:01

緊急通知！中日46條航線全面停航，國際輿論風暴來襲

緊急通知！中日46條航線全面停航，國際輿論風暴來襲

古裝影視解說阿兇

2025-12-22 14:07:10

女子因桃花眼走紅，訂婚兩年熱度依舊，網友喊話：88號快回來上班

女子因桃花眼走紅，訂婚兩年熱度依舊，網友喊話：88號快回來上班

梅子的小情緒

2025-12-19 14:04:18

重磅！現金存取新規出臺，2026年1月1日執行，具體規定明確

重磅！現金存取新規出臺，2026年1月1日執行，具體規定明確

復轉這些年

2025-12-22 15:42:28

民政局回應“獨居女子離世遺產歸公爭議”：買墓地可從中支付

民政局回應“獨居女子離世遺產歸公爭議”：買墓地可從中支付

南方都市報

2025-12-22 19:38:10

美媒：中國月底迎來革命性武器大豐收，殲-36讓美軍航母無處遁形

美媒：中國月底迎來革命性武器大豐收，殲-36讓美軍航母無處遁形

面包夾知識

2025-12-22 16:10:48

官宣：海港助教出任主帥

五星體育

2025-12-22 21:41:45

泰國突擊部隊發現了，柬埔寨詐騙呼叫中心！

泰國突擊部隊發現了，柬埔寨詐騙呼叫中心！

南權先生

2025-12-22 17:18:47

臺灣的“堅冰”快被打破？北平鋒：“臺獨”的末日已近在眼前

臺灣的“堅冰”快被打破？北平鋒：“臺獨”的末日已近在眼前

海峽導報社

2025-12-21 21:40:15

特朗普急眼了！美軍公海劫中國11億原油，中國反制信號已亮

特朗普急眼了！美軍公海劫中國11億原油，中國反制信號已亮

陳博世財經

2025-12-22 10:52:10

神秘高人爆料，某島丑聞里的驚天內幕，足以震動世界。

神秘高人爆料，某島丑聞里的驚天內幕，足以震動世界。

佐與佑

2024-12-18 22:04:21

AI產業主平臺領航智能+時代

14161文章數 66395關注度

往期回顧全部

科技要聞

商湯聯創親自下場痛批主流機器人技術大錯

頭條要聞

高市早苗政府創下一項27年來最差紀錄

頭條要聞

高市早苗政府創下一項27年來最差紀錄

體育要聞

戴琳，中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞，三胎生父早有答案？

財經要聞

央行信用新政：為失信者提供"糾錯"通道

汽車要聞

可享88元抵2000元等多重權益昊鉑A800開啟盲訂

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

時尚

游戲

旅游

房產

數碼要聞

華為MatePad 11.5 2026平板搭載麒麟T82B / T82處理器

珍珠配美人，最老派也最高級的時髦

德瑪西亞杯：Viper完美首秀，BLG零封LNG

旅游要聞

一箭穿古今四川內江美食街“變身”步行街重燃市井煙火

房產要聞

重磅！海南發布島內居民免稅商品經營主體及免稅店管理辦法征求意見稿！

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：日韩人妻少妇一区二区三区| 国产日韩欧美| 91在线播| www.黄色| 全球成人中文在线| 四川丰满妇女毛片四川话| 伊人97| 婷婷丁香社区| 99久久精品国产一区二区蜜芽 | 青草99在线免费观看| 国产粉嫩高中无套进入| 人妻97资源站| 久久国产精品电影| 亚洲国产精品高清久久久| 午夜福利92国语| 奶头又大又白喷奶水av| 乡宁县| 成人网站18禁| 影音先锋女人站| 日产精品久久久久久久| 色午夜| 精品国产av| 亚洲成人av在线| 午夜人成免费视频| 免费av网站| 亚洲熟女字幕| 超碰123| 久久中文字幕无码一区二区| 99视频在线精品免费观看6| 女人裸体性做爰视频| 欧美日韩不卡合集视频| 丁香激情网| 怡红院亚洲| 成全影视大全在线观看| 国产男女猛烈无遮挡免费视频| 亚洲中文无码av在线| 撕开奶罩揉吮奶头高潮av| 国产97色在线| 国产最新网址| 日韩丨亚洲丨制服|痴汉| 国产一区二区不卡在线|

<blockquote id="fwbn8"><p id="fwbn8"></p></blockquote>

<cite id="fwbn8"></cite>

<blockquote id="fwbn8"><i id="fwbn8"><noscript id="fwbn8"></noscript></i></blockquote>