<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      架構(gòu)解耦是統(tǒng)一多模態(tài)模型所必須的嗎?全新AIA損失:No

      0
      分享至



      近一年以來(lái),統(tǒng)一理解與生成模型發(fā)展十分迅速,該任務(wù)的主要挑戰(zhàn)在于視覺(jué)理解和生成任務(wù)本身在網(wǎng)絡(luò)層間會(huì)產(chǎn)生沖突。早期的完全統(tǒng)一模型(如 Emu3)與單任務(wù)的方法差距巨大,Janus-Pro、BAGEL 通過(guò)一步一步解耦模型架構(gòu),極大地減小了與單任務(wù)模型的性能差距,后續(xù)方法甚至通過(guò)直接拼接現(xiàn)有理解和生成模型以達(dá)到極致的性能。

      香港中文大學(xué) MMLab 和美團(tuán)的研究者相信,在不久的將來(lái)統(tǒng)一模型的性能一定能夠達(dá)到單任務(wù)的水平,但同時(shí)也引起了他們的思考,目前通過(guò)拆解架構(gòu)換取性能提升的方式真的是正確的嗎,它是否背離統(tǒng)一模型的初衷,它能夠提升性能的內(nèi)在原因又是什么,這種方式真的是統(tǒng)一模型必須的嗎?

      「統(tǒng)一模型的初衷」以及「 架構(gòu)解耦的缺點(diǎn)」

      統(tǒng)一理解生成模型的初衷是為了通過(guò)透明化、合理化的圖文交錯(cuò)思考過(guò)程,提高單任務(wù)的性能,例如讓模型走迷宮時(shí)統(tǒng)一模型可以生成每一步對(duì)應(yīng)的圖像,可以在模型做數(shù)學(xué)題的時(shí)候給圖像畫(huà)上輔助線,或者是在生成一張圖像的時(shí)候邊畫(huà)邊思考有沒(méi)有生成不合理的地方并且自動(dòng)修正,這些都是 Uni-MMMU 等當(dāng)前統(tǒng)一模型基準(zhǔn)所關(guān)注,也是它本身被獨(dú)立成一個(gè)領(lǐng)域的初衷。

      再回到架構(gòu)解耦的模型,例如 BAGEL 上,它本身如果要實(shí)現(xiàn)圖文交錯(cuò)思考,需要經(jīng)歷隱空間解碼到文字或者像素空間,然后再編碼到隱空間的復(fù)雜過(guò)程,兩個(gè)任務(wù)也幾乎不在同一個(gè)模型空間中,具有計(jì)算開(kāi)銷大、信息丟失兩大問(wèn)題。雖然在當(dāng)前情況下相比于其可觀的性能,這個(gè)問(wèn)題似乎并不顯著,但是研究者認(rèn)為隨著研究的進(jìn)行,這會(huì)是一個(gè)很大的問(wèn)題。

      AIA: 模型架構(gòu)解耦不是統(tǒng)一模型必須的

      為了探究清楚「架構(gòu)解耦帶來(lái)性能提升的內(nèi)在原因」以及「探索不使用架構(gòu)解耦的前提下提升模型性能的方式」,香港中文大學(xué) MMLab 和美團(tuán)聯(lián)合推出了 AIA。



      • 論文標(biāo)題:Architecture Decoupling Is Not All You Need For Unified Multimodal Model
      • 論文鏈接:https://arxiv.org/abs/2511.22663
      • 代碼:https://github.com/zhengdian1/AIA
      • 網(wǎng)頁(yè):https://github.com/zhengdian1/AIA-project

      研究者首先通過(guò)研究不同架構(gòu)的統(tǒng)一模型在每一層網(wǎng)絡(luò)中跨模態(tài)交互的強(qiáng)度,他們驚訝地發(fā)現(xiàn)不管如何進(jìn)行模型架構(gòu)解耦,理解和生成任務(wù)在同一層網(wǎng)絡(luò)中始終呈現(xiàn)負(fù)相關(guān)的關(guān)系,同時(shí)進(jìn)一步驗(yàn)證了這個(gè)現(xiàn)象與輸入的模態(tài)、長(zhǎng)度和類別都沒(méi)有關(guān)系,這說(shuō)明是模型自發(fā)在學(xué)習(xí)如何合理地分配兩個(gè)任務(wù)在每一層中的占比,從而 「緩解沖突」,這又說(shuō)明架構(gòu)解耦本質(zhì)上并沒(méi)有解決任務(wù)之間沖突的問(wèn)題。

      研究者進(jìn)一步在最后一列可視化了現(xiàn)在單任務(wù) SOTA 的模型的多模態(tài)交互模式(HunyuanImage-3.0 雖然是統(tǒng)一模型,但更側(cè)重于生成效果),結(jié)果發(fā)現(xiàn)隨著模型解耦程度的增強(qiáng),其對(duì)應(yīng)的跨模態(tài)交互模式會(huì)趨向于單任務(wù)的表現(xiàn),這也是能夠?qū)崿F(xiàn)性能提升的主要原因



      基于這個(gè)發(fā)現(xiàn),研究者設(shè)計(jì)了Attention Interaction Alignment (AIA) 損失,通過(guò)將單任務(wù)模型的跨模態(tài)交互模式作為學(xué)習(xí)目標(biāo),在訓(xùn)練的過(guò)程中顯式地約束統(tǒng)一模型的交互模式。

      AIA 效果如何?

      研究者在 Emu3 和 Janus-Pro 這兩種完全統(tǒng)一架構(gòu)、輕微模型解耦架構(gòu)上進(jìn)行了實(shí)驗(yàn),如下表所示,結(jié)果表明本文的方法能夠在沒(méi)有任何其他 trick 的情況下提升這些模型的性能,減小了與更高解耦程度模型的差距。



      同時(shí),研究者給出了使用 AIA 損失之后 Emu3 和 Janus-Pro 跨模態(tài)交互模式曲線變化,可以發(fā)現(xiàn)加入了 AIA 損失之后,兩個(gè)模型的交互曲線都向單任務(wù)模型的表現(xiàn)靠近了,既證明了 AIA 損失的有效性,同時(shí)也說(shuō)明了模型架構(gòu)解耦不是唯一能夠提高統(tǒng)一模型性能的方式。

      當(dāng)然,研究者也承認(rèn)在目前情況下完全統(tǒng)一的方法和高解耦程度的模型之間存在很大的差距,但正如 Emu3.5 的出現(xiàn),他們認(rèn)為這個(gè)差距會(huì)越來(lái)越小。因此,研究者呼吁更多的人拋開(kāi)表層的框架和數(shù)據(jù)配比,深入研究統(tǒng)一模型的任務(wù)沖突問(wèn)題,尋找更優(yōu)的解法。

      AIA 好訓(xùn)嗎?

      由于 Emu3 只有預(yù)訓(xùn)練 (PT) 階段是統(tǒng)一訓(xùn)練的,因此研究者在其 PT 權(quán)重上進(jìn)行微調(diào),而 Janus-Pro 給的是最終 SFT 微調(diào)后的權(quán)重,研究者在此基礎(chǔ)上進(jìn)行后訓(xùn)練。

      研究者通過(guò)調(diào)整 AIA 損失與 next-token-prediction (NTP) 損失的比重來(lái)測(cè)試其微調(diào)的敏感度,結(jié)果發(fā)現(xiàn)訓(xùn)練 Emu3 的時(shí)候由于其預(yù)訓(xùn)練知識(shí)比較薄弱,AIA 損失在一個(gè)很大的范圍內(nèi)都能達(dá)到穩(wěn)定收斂的效果。而在 Janus-Pro 中,由于其本身預(yù)訓(xùn)練知識(shí)很強(qiáng),AIA 的加入非常容易影響模型訓(xùn)練,但在合適的比重情況下仍然能夠達(dá)到不錯(cuò)的效果。

      AIA 有什么優(yōu)勢(shì)?

      AIA 損失的加入可以一定程度上減少現(xiàn)在常見(jiàn)的數(shù)據(jù)配比工程問(wèn)題,本文的方法在生成與理解數(shù)據(jù)配比在 1:1 的情況下能夠達(dá)到更好的效果,這說(shuō)明在一定程度上兩個(gè)任務(wù)的訓(xùn)練不再是沖突的,產(chǎn)生了協(xié)同優(yōu)化的效果。

      統(tǒng)一模型訓(xùn)練的正確道路是什么?

      通過(guò)結(jié)合現(xiàn)在所有統(tǒng)一模型訓(xùn)練的問(wèn)題以及本文的實(shí)驗(yàn)分析,可以發(fā)現(xiàn)不管怎樣解耦模型,其始終會(huì)在統(tǒng)一訓(xùn)練的過(guò)程中動(dòng)態(tài)分配不同任務(wù)在同一層的權(quán)重來(lái)緩解沖突,那這是否實(shí)際上代表了統(tǒng)一模型的正確行為



      另一條統(tǒng)一路徑是移除所有可以用來(lái)區(qū)分任務(wù)的線索(即采用統(tǒng)一分詞器、消除任務(wù)相關(guān)特殊 token、使用交錯(cuò)數(shù)據(jù)數(shù)據(jù)輸入),迫使模型只能從輸入中學(xué)習(xí)真正的統(tǒng)一空間。雖然這種方法或許可以解決任務(wù)間的負(fù)相關(guān)問(wèn)題,但也會(huì)顯著增加訓(xùn)練難度。

      未來(lái)展望

      AIA 邁出了統(tǒng)一模型訓(xùn)練原理分析的第一步,研究者希望能夠有更多志同道合的研究者加入這個(gè)領(lǐng)域的探索。統(tǒng)一模型現(xiàn)在的理論、架構(gòu)都遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到成熟,需要大家共同進(jìn)行探索。同時(shí)研究者也希望大家能夠更加關(guān)注統(tǒng)一模型真正的意義,不要一味地關(guān)注當(dāng)前單任務(wù)基準(zhǔn)上的性能。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      遼寧男籃VS北京首鋼!楊鳴沖擊3連勝,威爾斯成關(guān)鍵,央視直播

      遼寧男籃VS北京首鋼!楊鳴沖擊3連勝,威爾斯成關(guān)鍵,央視直播

      體壇瞎白話
      2025-12-17 10:24:28
      1988年李瑞環(huán)視察大港油田,工人訴苦:我們錢不少拿,就是缺媳婦

      1988年李瑞環(huán)視察大港油田,工人訴苦:我們錢不少拿,就是缺媳婦

      帝哥說(shuō)史
      2025-12-17 07:30:59
      日媒自己都坐不住了!中國(guó)街頭,日本品牌正被“全面清場(chǎng)”?

      日媒自己都坐不住了!中國(guó)街頭,日本品牌正被“全面清場(chǎng)”?

      達(dá)文西看世界
      2025-12-16 15:55:40
      被滲透?中國(guó)航天骨干出現(xiàn)內(nèi)鬼,向境外泄密11年,作案全過(guò)程曝光

      被滲透?中國(guó)航天骨干出現(xiàn)內(nèi)鬼,向境外泄密11年,作案全過(guò)程曝光

      削桐作琴
      2025-12-16 13:09:22
      新加坡網(wǎng)友:1個(gè)發(fā)電量只有中國(guó)50%的國(guó)家,卻堅(jiān)信能永遠(yuǎn)世界第一

      新加坡網(wǎng)友:1個(gè)發(fā)電量只有中國(guó)50%的國(guó)家,卻堅(jiān)信能永遠(yuǎn)世界第一

      詩(shī)意世界
      2025-12-16 10:00:03
      震驚!FBI內(nèi)部曾強(qiáng)烈反對(duì)突襲海湖莊園,但拜登政府強(qiáng)力施壓

      震驚!FBI內(nèi)部曾強(qiáng)烈反對(duì)突襲海湖莊園,但拜登政府強(qiáng)力施壓

      大洛杉磯LA
      2025-12-17 06:47:39
      狂攬30分,李晨瑄進(jìn)攻跳發(fā)太兇猛!她一個(gè)人擊敗天津,應(yīng)去國(guó)家隊(duì)

      狂攬30分,李晨瑄進(jìn)攻跳發(fā)太兇猛!她一個(gè)人擊敗天津,應(yīng)去國(guó)家隊(duì)

      金毛愛(ài)女排
      2025-12-17 10:29:33
      歡迎!前恒大巨星接近復(fù)出,時(shí)隔5年再回中超!中國(guó)是他第二故鄉(xiāng)

      歡迎!前恒大巨星接近復(fù)出,時(shí)隔5年再回中超!中國(guó)是他第二故鄉(xiāng)

      國(guó)足風(fēng)云
      2025-12-16 16:38:12
      悉尼槍擊事件中英勇奪槍男子留遺言: 告訴我家人,我為救人而倒下,澳總理赴醫(yī)院探望奪槍英雄

      悉尼槍擊事件中英勇奪槍男子留遺言: 告訴我家人,我為救人而倒下,澳總理赴醫(yī)院探望奪槍英雄

      每日經(jīng)濟(jì)新聞
      2025-12-16 15:19:32
      空調(diào)“鋁代銅”再惹爭(zhēng)議!格力缺席行業(yè)公約,董明珠堅(jiān)持用銅

      空調(diào)“鋁代銅”再惹爭(zhēng)議!格力缺席行業(yè)公約,董明珠堅(jiān)持用銅

      時(shí)代周報(bào)
      2025-12-15 20:46:42
      高市早苗因涉臺(tái)錯(cuò)誤言論在國(guó)會(huì)成眾矢之的,小泉進(jìn)次郎企圖為其“開(kāi)脫”被駁回

      高市早苗因涉臺(tái)錯(cuò)誤言論在國(guó)會(huì)成眾矢之的,小泉進(jìn)次郎企圖為其“開(kāi)脫”被駁回

      環(huán)球網(wǎng)資訊
      2025-12-16 16:43:10
      蘇聯(lián)不要的裝備,70萬(wàn)武器被八路軍拉3天3夜,撿出“半個(gè)軍械庫(kù)”

      蘇聯(lián)不要的裝備,70萬(wàn)武器被八路軍拉3天3夜,撿出“半個(gè)軍械庫(kù)”

      古書(shū)記史
      2025-12-15 23:29:05
      網(wǎng)紅主播批量撤離杭州?省市黨媒接連發(fā)文回應(yīng)

      網(wǎng)紅主播批量撤離杭州?省市黨媒接連發(fā)文回應(yīng)

      澎湃新聞
      2025-12-16 12:54:26
      97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

      97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

      以茶帶書(shū)
      2025-12-02 18:11:43
      身價(jià)上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個(gè)醒

      身價(jià)上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個(gè)醒

      白面書(shū)誏
      2025-12-08 13:24:49
      腦梗“偏愛(ài)”中國(guó)人?80%患者都缺一種維生素!

      腦梗“偏愛(ài)”中國(guó)人?80%患者都缺一種維生素!

      孟大夫之家1
      2025-12-02 19:46:07
      最高法:法院不得參與公安機(jī)關(guān)、人民檢察院聯(lián)合辦案

      最高法:法院不得參與公安機(jī)關(guān)、人民檢察院聯(lián)合辦案

      微法官
      2025-12-17 08:05:39
      “牡丹花下死,做鬼也風(fēng)流”,這一次,74歲的張紀(jì)中徹底成了笑話

      “牡丹花下死,做鬼也風(fēng)流”,這一次,74歲的張紀(jì)中徹底成了笑話

      洲洲影視娛評(píng)
      2025-12-08 19:52:00
      余承東接任董事長(zhǎng):不是輪崗,是定調(diào),把“能打的人”推到臺(tái)前!

      余承東接任董事長(zhǎng):不是輪崗,是定調(diào),把“能打的人”推到臺(tái)前!

      除夕煙火燦爛
      2025-12-17 09:58:07
      丁偉:雖然最后階段外援戰(zhàn)術(shù)讓人迷糊,但用新人方面,還是有功的

      丁偉:雖然最后階段外援戰(zhàn)術(shù)讓人迷糊,但用新人方面,還是有功的

      小樓侃體育
      2025-12-17 10:29:36
      2025-12-17 11:12:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11935文章數(shù) 142511關(guān)注度
      往期回顧 全部

      科技要聞

      無(wú)人駕駛邁關(guān)鍵一步 特斯拉股價(jià)觸歷史新高

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國(guó)人急壞了

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國(guó)人急壞了

      體育要聞

      短短一年,從爭(zhēng)冠到0勝墊底...

      娛樂(lè)要聞

      鞠婧祎收入曝光,絲芭稱已支付1.3億

      財(cái)經(jīng)要聞

      "祥源系"爆雷 有投資者數(shù)百萬(wàn)元無(wú)法提現(xiàn)

      汽車要聞

      一車多動(dòng)力+雙姿態(tài) 長(zhǎng)城歐拉5上市 限時(shí)9.18萬(wàn)元起

      態(tài)度原創(chuàng)

      數(shù)碼
      健康
      教育
      時(shí)尚
      本地

      數(shù)碼要聞

      LG MicroRGB Evo電視將于CES 2026首發(fā) 正面迎戰(zhàn)三星

      這些新療法,讓化療不再那么痛苦

      教育要聞

      很多人瞧不上高校行政,其實(shí)它是“金餑餑” ,很多人不知道

      那些被稱贊 “老得慢” 的阿姨們,這樣穿,比同齡人顯年輕

      本地新聞

      云游安徽|踏過(guò)戰(zhàn)壕與石板,讀一部活的淮北史

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 中文字幕热久久久久久久| 极品无码国模国产在线观看 | 亚洲成av人片在线观看ww| 失禁大喷潮在线播放| 中文人妻熟妇乱又伦精品| 日韩精品亚洲人成在线观看| 欧美videosdesexo吹潮| 制服.丝袜.亚洲.中文.综合懂 | 伊人色色| 亚洲天堂伊人久久a成人| 潘金莲高清dvd碟片| 中文字幕少妇人妻| 色综合网址你懂的| 无码人妻丰满熟妇区五十路百度 | 久久精品免费一区二区| 女人腿张开让男人桶爽| AV在线影院| A成片人| 少妇一边呻吟一边说使劲视频| 中文日产乱幕九区无线码| 三男一女吃奶添下面视频| 国产欧美成人一区二区a片| 无码伊人久久大杳蕉中文无码| 日韩色色网| 国产特级毛片aaaaaa毛片| www片香蕉内射在线88av8| 最近中文国语字幕在线播放| 超碰911| 国产精品国产三级国快看| 国产男女猛烈无遮挡免费网站| 免费午夜无码视频在线观看| 国产人妖网站| 泸定县| 久久亚洲综合色| 亚洲免费观看在线视频| 国产精品无遮挡猛进猛出| 亚洲一卡二卡| 亚洲成a人片在线观看无码| 无遮挡又爽又刺激的视频| 亚洲AV日韩AV激情亚洲| 万盛区|