<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      讓擴散模型「可解釋」不再降質,開啟圖片編輯新思路

      0
      分享至



      過去三年,擴散模型席卷圖像生成領域。以 DiT (Diffusion Transformer) 為代表的新一代架構不斷刷新圖像質量的極限,讓模型愈發接近真實世界的視覺規律。

      然而,與 LLM 可解釋性研究的蓬勃發展相對,擴散模型內部的語義結構、時間規律以及因果路徑仍然像被深深封住的「黑箱」。研究者可以憑直覺優化架構,但外界無法真正理解擴散模型在生成過程中的「思考方式」。

      更棘手的是,已有的可解釋性嘗試往往伴隨著明顯的性能下降:特征分解、激活分析、插值擾動……無論采用哪種方法,只要試圖將擴散模型拆開來看,生成質量就會顯著劣化。這讓「可解釋擴散模型」在很長一段時間里被視為不切實際的小眾方向。

      在這樣的背景下,香港中文大學 MMLab 與上海人工智能實驗室的研究團隊提出了一個不同的觀點:擴散模型作為當今視覺世界最重要的生成器,其內部機制不應永遠處于不可見狀態;可解釋性也不應該以犧牲生成質量為代價。

      基于這一理念,他們提出了被 AAAI 2026 接收的TIDE (Temporal-Aware Sparse Autoencoders)—— 首個真正意義上面向擴散 Transformer 的時序稀疏自編碼器框架。



      • 論文標題:TIDE: Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation
      • 論文鏈接:
      • https://arxiv.org/pdf/2503.07050

      TIDE:

      讓「時序」成為擴散可解釋性的核心

      以往的可解釋方法大多忽視了擴散過程最大的特點:生成是一個隨時間展開的漸進式構造過程。早期步驟決定物體形狀和布局,中期步驟塑造語義和結構,后期步驟填充材質與細節。如果忽略這條時間線,擴散模型看起來就像一團混亂的噪聲與特征。TIDE 的突破在于,它不是「硬拆」一個靜態特征,而是讓模型自己在時間維度上對齊語義:

      同一個因子會在不同時間步中保持一致的語義軌跡,最終形成一個可讀、可控、穩固的「時間語義剖面」。

      也正是在這樣的時序框架下,擴散模型內部原本模糊的過程第一次被清晰呈現出來:粗結構從噪聲中浮現、語義逐漸成型、紋理被不斷潤色……模型的「思考流」沿著時間軸被完整雕刻出來。

      更重要的是,這一切并不會破壞原模型的生成能力。TIDE 的稀疏自編碼器在特征空間進行無損重構,擴散軌跡保持穩定,模型幾乎感受不到被「觀察」的存在。同時在 scaling latent 維度時,也優于原有 vanilla SAE 方法。



      TIDE 架構與訓練

      在 Stable Diffusion XL、PixArt-α、Flux 等主流擴散框架上,TIDE 將擴散特征分解為具有可控語義的因子:

      負責輪廓的因子、負責物體姿態的因子、負責材質紋理的因子……甚至可以捕捉到跨時間的概念演化。基于這些因子,研究團隊構建出一種全新的圖像編輯方式:編輯不再依賴繁瑣的提示語或反復調參,而是可以沿著清晰的語義方向直接操控擴散過程。例如:

      • 提升紋理細節而不改變全局結構
      • 調整物體姿態但保持背景一致
      • 加強某類語義而不干擾其它部分



      這些編輯操作完全基于 TIDE 生成的語義因子完成,意味著未來擴散模型有望出現一種全新的「因子級編輯器」,具備高度可控性與透明性。

      與此同時,TIDE 對模型生成質量的影響幾乎可以忽略不計。FID、sFID 變化小于 0.1%,噪聲預測軌跡保持穩定,實現了真正意義上的「可解釋而不降質」。

      TIDE 的效果

      TIDE 在不同設置、不同模型規模以及不同任務維度下的整體表現。無論是在超參數選擇、在 DiT 不同層級進行因子學習,還是在 SDXL、FLUX-dev 等主流擴散架構上的泛化能力,TIDE 都表現出高度穩定且持續的優勢。

      可以看到,TIDE 在幾乎不增加 FID 代價的前提下,顯著提升了 AlignScore 中的語義綁定(顏色、形狀、紋理)以及跨區域關系理解(空間與非空間關系),其中多處指標在表中以綠色標記為最優表現。

      此外,在安全性評測部分,TIDE 相比多個現有方法大幅降低了攻擊成功率,顯示出更穩健的特征理解能力。整體來看,這幅表格清楚證明:TIDE 不僅帶來了高質量、可解釋的語義因子,還在保持生成質量的同時,提升了模型的結構理解、關系推理與安全性,成為一種真正可泛化、可落地的可解釋擴散框架。



      TIDE 的意義:

      補齊擴散模型的「理解」能力

      擴散模型已經成為現代視覺生成系統的核心支柱,但它們的內部機制一直缺乏系統、透明的解釋路徑。TIDE 的出現不僅提供了首個真正實用的可解釋性方案,更重要的是,它讓研究者第一次能夠沿著「時間」這條線索觀察擴散模型內部的語義結構。



      這種理解能力將直接影響未來的多個方向:

      • 更可控、更穩健的擴散編輯系統
      • 統一理解——生成模型的因子級橋接
      • 擴散模型的因果與語義理論研究
      • 新一代透明、可信的視覺生成系統

      TIDE 不僅是一個方法,更是一種新的研究范式:擴散模型并非不可解釋,只是缺少一個合適的視角。

      未來展望

      研究團隊表示,當前 TIDE 已成功驗證了時序稀疏自編碼器框架的有效性,但可解釋擴散模型的潛力遠未被完全發掘。未來的工作將進一步:

      • 擴展更大規模、更精細的時序字典
      • 探索跨模態共享的語義因子
      • 結合 LLM-SAE 構建統一解釋空間
      • 將因子級編輯推向產品化工具

      隨著更多研究者的加入,擴散模型的「黑箱壁壘」正逐漸被揭開,而 TIDE 或許是這一轉變具有代表性的第一步。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      恩佐轉會皇馬進展:切爾西愿意放人,要價1.2億歐,皇馬只給1億!

      恩佐轉會皇馬進展:切爾西愿意放人,要價1.2億歐,皇馬只給1億!

      海浪星體育
      2026-04-10 09:00:14
      哈登20+5迎一萬罰里程碑!騎士送老鷹重返第5 丹尼爾斯三雙CJ29分

      哈登20+5迎一萬罰里程碑!騎士送老鷹重返第5 丹尼爾斯三雙CJ29分

      鍋子籃球
      2026-04-11 09:45:39
      巴基斯坦狠批以色列,并部署空軍進入伊朗

      巴基斯坦狠批以色列,并部署空軍進入伊朗

      世家寶
      2026-04-10 13:49:33
      恭喜!19歲恩德里克將與妻子迎來他們的第一個孩子

      恭喜!19歲恩德里克將與妻子迎來他們的第一個孩子

      懂球帝
      2026-04-10 22:22:06
      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍營一姐發話了

      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍營一姐發話了

      共工之錨
      2026-04-10 19:34:21
      取代龍蝦的是愛馬仕?狂攬4萬星的Hermes Agent,不只是OpenClaw平替

      取代龍蝦的是愛馬仕?狂攬4萬星的Hermes Agent,不只是OpenClaw平替

      AppSo
      2026-04-10 17:26:30
      白巖松批評全紅嬋近況曝光,下場大快人心

      白巖松批評全紅嬋近況曝光,下場大快人心

      孤芳自賞的小李
      2026-04-10 14:01:18
      趙子琪自曝《乘風2026》淘汰后,節目組不讓返回候場區取包

      趙子琪自曝《乘風2026》淘汰后,節目組不讓返回候場區取包

      韓小娛
      2026-04-11 08:43:46
      騎士兩大敗因出爐,哈登錯誤明顯!莫布里毫無借口,一人也成關鍵

      騎士兩大敗因出爐,哈登錯誤明顯!莫布里毫無借口,一人也成關鍵

      魚崖大話籃球
      2026-04-11 10:04:36
      這是文物剛出土的樣子,“新鮮”到不像真品,難怪專家會被農民騙

      這是文物剛出土的樣子,“新鮮”到不像真品,難怪專家會被農民騙

      收藏大視界
      2026-04-10 23:37:01
      剛剛,以色列再次致命絕殺,徹底葬送美國生路

      剛剛,以色列再次致命絕殺,徹底葬送美國生路

      一個壞土豆
      2026-04-10 20:20:13
      紅帽撤離中國,一個時代的落幕。

      紅帽撤離中國,一個時代的落幕。

      開源中國
      2026-04-10 15:36:24
      河南一寶媽聽信“積食要少吃”,連續一個月把奶沖稀、減量,把9斤的寶寶餓瘦到7斤,誤以為脾胃不好就醫

      河南一寶媽聽信“積食要少吃”,連續一個月把奶沖稀、減量,把9斤的寶寶餓瘦到7斤,誤以為脾胃不好就醫

      大象新聞
      2026-04-10 22:44:06
      傻眼!美國員工店內熱舞TikTok引流突破780萬,老板:全員開除,一個不留

      傻眼!美國員工店內熱舞TikTok引流突破780萬,老板:全員開除,一個不留

      北美省錢快報
      2026-04-11 06:32:55
      開路虎加油逃單鬧大了,被扒上個月也曾逃單,警方介入,逃不了了

      開路虎加油逃單鬧大了,被扒上個月也曾逃單,警方介入,逃不了了

      潮鹿逐夢
      2026-04-10 15:48:58
      一場比賽兩個贏家!哈登20分迎里程碑,騎士慘敗老鷹鎖定東部第四

      一場比賽兩個贏家!哈登20分迎里程碑,騎士慘敗老鷹鎖定東部第四

      老梁體育漫談
      2026-04-11 09:34:34
      我在朝鮮買了瓶啤酒,掏出手機那一刻,服務員看我的眼神都變了!

      我在朝鮮買了瓶啤酒,掏出手機那一刻,服務員看我的眼神都變了!

      天下霸奇
      2026-04-10 09:06:32
      全紅嬋又遭網暴!哥哥怒懟網友:我們全家都胖?吃你們家大米了?

      全紅嬋又遭網暴!哥哥怒懟網友:我們全家都胖?吃你們家大米了?

      念洲
      2026-04-10 08:40:37
      導彈生產技術轉讓給中國!只因三次雪中送炭,美俄看了也“眼紅“

      導彈生產技術轉讓給中國!只因三次雪中送炭,美俄看了也“眼紅“

      芳芳歷史燴
      2026-04-10 20:53:57
      浙江一主播直播時暈倒被當場辭退 律師:屬于違法解除勞動關系

      浙江一主播直播時暈倒被當場辭退 律師:屬于違法解除勞動關系

      封面新聞
      2026-04-10 20:56:07
      2026-04-11 10:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12729文章數 142621關注度
      往期回顧 全部

      科技要聞

      三星中國被曝大調整:黑白電、顯示器淡出市場

      頭條要聞

      牛彈琴:伊朗很悲壯 向美國提高了"要價"

      頭條要聞

      牛彈琴:伊朗很悲壯 向美國提高了"要價"

      體育要聞

      17歲賺了一百萬美元,25歲被CBA裁員

      娛樂要聞

      黃景瑜王玉雯否認戀情!聚會細節被扒

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      時尚
      教育
      藝術
      房產
      軍事航空

      推廣中獎名單-更新至2026年3月31日推廣

      教育要聞

      “窮到吃豆豉,還生呢?”農村家長曬5兒3女,大兒子眼神好可怕

      藝術要聞

      你絕對想不到,毛主席的書法珍品竟然被遺棄過!

      房產要聞

      28條新規落地!好房子,終于有了“廣州標準”!

      軍事要聞

      特朗普:對美國與伊朗達成和平協議“非常樂觀”

      無障礙瀏覽 進入關懷版