<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Lumina-mGPT 2.0:自回歸模型華麗復興,媲美頂尖擴散模型

      0
      分享至



      上海人工智能實驗室等團隊提出Lumina-mGPT 2.0 —— 一款獨立的、僅使用解碼器的自回歸模型,統一了包括文生圖、圖像對生成、主體驅動生成、多輪圖像編輯、可控生成和密集預測在內的廣泛任務。

      本文第一作者辛毅為南京大學 & 上海創智學院博士生,現于上海人工智能實驗室實習,研究方向為圖像 / 視頻生成、多模態生成與理解統一等。通訊作者為上海人工智能實驗室青年科學家 — 高鵬。本文其他作者來自上海人工智能實驗室、香港中文大學、上海交通大學、上海創智學院、浙江工業大學等。



      • 論文標題:Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling
      • 論文鏈接:arxiv.org/pdf/2507.17801
      • GitHub 地址:Alpha-VLLM/Lumina-mGPT-2.0
      • 關鍵詞:圖像生成、自回歸模型、基座模型。

      核心技術與突破

      完全獨立的訓練架構

      不同于依賴預訓練權重的傳統方案,Lumina-mGPT 2.0 采用純解碼器 Transformer 架構,從參數初始化開始完全獨立訓練。這帶來三大優勢:架構設計不受限制(提供了 20 億和 70 億參數兩個版本)、規避授權限制(如Chameleon的版權問題)、減少預訓練模型帶來的固有偏差。



      圖像分詞器方面,通過對比 VQGAN、ViT-VQGAN 等多種方案,最終選擇在 MS-COCO 數據集上重建質量最優的 SBER-MoVQGAN,為高質量生成奠定基礎。



      統一多任務處理框架

      創新地采用統一的圖像分詞方案,將圖生圖任務通過上下拼接視為一張圖像,并通過提示描述進行控制,實現多任務訓練與文生圖訓練的一致性。使得單一模型能夠無縫支持以下任務:

      • 文生圖
      • 主體驅動生成
      • 圖像編輯
      • 可控生成(如基于輪廓 / 深度的生成)
      • 密集預測

      這種設計避免了傳統模型需切換不同框架的繁瑣,通過系統提示詞即可靈活控制任務類型。



      高效的推理策略

      為了解決自回歸模型生成速度慢的痛點,團隊引入兩種優化:

      • 模型量化:將模型權重量化為 4 位整數,同時保持激活張量為 bfloat16,通過 PyTorch 2.0 中的原生編譯工具和 torch.compile 的 reduce-overhead 模式實現無需改變模型架構的優化。

      • 推測式 Jacobi 采樣:通過靜態 KV 緩存和靜態因果注意掩碼的方案,使 SJD 兼容于靜態編譯框架,從而實現加速采樣,同時避免動態調整緩存。結合 4 位量化技術,減少 60% GPU 顯存消耗,同時通過并行解碼加速生成。

      實驗顯示,優化后模型在保持質量的前提下,生成效率顯著提升。



      實驗結果

      文生圖實驗結果

      在文本到圖像生成領域,Lumina-mGPT 2.0 在多個基準測試中表現優異,與 SANA 和Janus Pro等擴散模型和自回歸模型相當甚至超越,特別是在 “兩個物體” 和 “顏色屬性” 測試中表現卓越,以 0.80 的GenEval 分數躋身頂級生成模型之列。



      此外,在實際生成效果上,Lumina-mGPT 2.0 在真實感、細節和連貫性方面優于前代 Lumina-mGPT 和 Janus Pro,更具視覺吸引力和自然美感。



      多任務實驗結果

      在 Graph200K 多任務基準中(可控生成、物體驅動生成),Lumina-mGPT 2.0 表現優異,證明了純自回歸模型在單一框架下完成多模態生成任務的可能性。



      此外,團隊與其他的多任務生成模型進行了實際比較,Lumina-mGPT 2.0 在可控生成和主題驅動生成任務中表現突出,與 Lumina-mGPT、OneDiffusion和 OmniGen 等模型相比,展示了卓越的生成能力和靈活性。



      未來方向

      Lumina-mGPT 2.0 在優化推理后,仍面臨采樣時間長的問題,與其他基于自回歸的生成模型相似,這影響了用戶體驗,后續將進一步優化。當前 Lumina-mGPT 2.0 的重點在多模態生成, 但計劃更新擴展至多模態理解,以提高其整體功能和性能,這將使 Lumina-mGPT 2.0 在滿足用戶需求方面更加全面。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      揪心!亞運冠軍舉報領導后舉止反常:出門2天仍未歸 2天吃一頓飯

      揪心!亞運冠軍舉報領導后舉止反常:出門2天仍未歸 2天吃一頓飯

      風過鄉
      2025-12-16 13:30:27
      天意讓你看到這篇文章:你日夜擔憂的事,會在不經意的一瞬間解決

      天意讓你看到這篇文章:你日夜擔憂的事,會在不經意的一瞬間解決

      朗威談星座
      2025-12-16 06:22:59
      楊冪大學期間在北京電影學院上形體課的照片,還真是第一次看到

      楊冪大學期間在北京電影學院上形體課的照片,還真是第一次看到

      動物奇奇怪怪
      2025-12-17 01:21:21
      王毅到訪沙特,沙特王儲當面做出兩個重磅承諾,并給日本當頭一棒

      王毅到訪沙特,沙特王儲當面做出兩個重磅承諾,并給日本當頭一棒

      南宮一二
      2025-12-16 18:41:24
      西城段全線完成!北京正打造一個“新二環”!

      西城段全線完成!北京正打造一個“新二環”!

      家住東西城
      2025-12-16 23:52:21
      活到90歲靠的從來不是基因!這“9個不”,做到一半就賺了

      活到90歲靠的從來不是基因!這“9個不”,做到一半就賺了

      貓大夫醫學科普
      2025-09-27 06:56:23
      800公里收費2.8萬元!“天價救護車”涉事醫院被罰沒8.7萬元!還存在使用過期藥,超標收費等行為

      800公里收費2.8萬元!“天價救護車”涉事醫院被罰沒8.7萬元!還存在使用過期藥,超標收費等行為

      揚子晚報
      2025-12-16 14:56:03
      一個地級市居然在建全國最大央企總部

      一個地級市居然在建全國最大央企總部

      環球通信
      2025-12-16 19:38:49
      曝戴琳向三球迷借款14萬!律師:曾找前隊友借錢,金額還會增加

      曝戴琳向三球迷借款14萬!律師:曾找前隊友借錢,金額還會增加

      奧拜爾
      2025-12-16 23:30:20
      上海滑稽演員陳國慶:跨界演藝圈,72歲仍在演戲,事業家庭都圓滿

      上海滑稽演員陳國慶:跨界演藝圈,72歲仍在演戲,事業家庭都圓滿

      洲洲影視娛評
      2025-12-16 19:45:38
      堅持喝蘋果水 1 個月,身體悄悄變舒服?煮錯等于白喝 這些坑別踩

      堅持喝蘋果水 1 個月,身體悄悄變舒服?煮錯等于白喝 這些坑別踩

      開心美食白科
      2025-12-17 04:53:04
      “姜子牙”飾演者,95歲的藍天野:白天當演員,晚上當間諜,隱姓埋名75年,他的人生,比電影還精彩

      “姜子牙”飾演者,95歲的藍天野:白天當演員,晚上當間諜,隱姓埋名75年,他的人生,比電影還精彩

      In風尚
      2025-12-10 19:24:10
      北京雪地驚現蚊子!不是變異!暖氣騙出的"抗寒老炮"刷爆全網

      北京雪地驚現蚊子!不是變異!暖氣騙出的"抗寒老炮"刷爆全網

      戧詞奪理
      2025-12-16 20:31:24
      太猖狂了!張本接受采訪,竟然引用高市早苗話,網友:找死的節奏

      太猖狂了!張本接受采訪,竟然引用高市早苗話,網友:找死的節奏

      金山話體育
      2025-12-16 16:04:32
      同仁堂與磷蝦油涉事孫公司割席,品牌授權人員:控制字號就沒事

      同仁堂與磷蝦油涉事孫公司割席,品牌授權人員:控制字號就沒事

      鳳凰網財經
      2025-12-16 18:41:56
      全新:一代日產奇駿曝光!新增混動系統,CME-CD架構打造!

      全新:一代日產奇駿曝光!新增混動系統,CME-CD架構打造!

      三農老歷
      2025-12-17 09:11:37
      凌晨三點拍桌子!林詩棟輸球后,王皓那句“懂不懂”喊疼多少人

      凌晨三點拍桌子!林詩棟輸球后,王皓那句“懂不懂”喊疼多少人

      付老師種植技術團隊
      2025-12-16 21:51:25
      荷乙20歲留洋中場王博豪身價上漲,從7.5萬歐升至17.5萬歐

      荷乙20歲留洋中場王博豪身價上漲,從7.5萬歐升至17.5萬歐

      懂球帝
      2025-12-16 20:02:10
      2026年赤馬紅羊劫,是無數人命運的拐點!

      2026年赤馬紅羊劫,是無數人命運的拐點!

      水木然
      2025-12-16 19:43:03
      太痛心!20億打造的望仙谷燒沒了半條命?3年歸零的營收誰來扛?

      太痛心!20億打造的望仙谷燒沒了半條命?3年歸零的營收誰來扛?

      老特有話說
      2025-12-15 22:27:32
      2025-12-17 10:28:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11935文章數 142511關注度
      往期回顧 全部

      科技要聞

      無人駕駛邁關鍵一步 特斯拉股價觸歷史新高

      頭條要聞

      歐盟松口氣:中國發稀土通用許可證了 有效期更長

      頭條要聞

      歐盟松口氣:中國發稀土通用許可證了 有效期更長

      體育要聞

      楊瀚森18+10首次兩雙 關鍵攻防統治G聯賽

      娛樂要聞

      《雙軌》遭網友舉報,稱劇情三觀不正

      財經要聞

      "祥源系"爆雷 有投資者數百萬元無法提現

      汽車要聞

      打造全域安全2.0,吉利的新“長征”

      態度原創

      時尚
      房產
      手機
      數碼
      旅游

      那些被稱贊 “老得慢” 的阿姨們,這樣穿,比同齡人顯年輕

      房產要聞

      6.66億摘地,海南封關大動作,千畝海澄新城震撼登場

      手機要聞

      初代銷量太差!蘋果計劃iPhone Air 2升級雙攝:增配還降價

      數碼要聞

      Ray-Ban Meta眼鏡更新:能放大對話聲,還能看圣誕樹自動放節日歌

      旅游要聞

      山西5條冬游線路邀您共赴“追光”之旅

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲 制服 丝袜 无码| 老妇肥熟凸凹丰满刺激| 国产h视频在线观看| 欧美日韩v| 69人妻人人澡人人爽人人精品| 亚洲国产精品成人综合色五月| 人人爽人人爽人人爽| 亚洲中文字幕在线第六区| 五月天丁香婷婷亚洲欧洲国产| 熟妇久久无码人妻av蜜臀www| 原平市| 国产视频一区二区| 特黄视频| 精品人妻一区二区三区在线视频不卡| 麻城市| 国产激情免费视频在线观看| 久久久久国产一区二区三区| 亚洲成人在线| 公安县| 欧美变态口味重另类在线视频| 亚洲无码成人视频| 亚洲色A| 国产白浆一区二区三区四区| 狠狠躁夜夜躁人人爽天天5| 亚洲成a人片在线观看无码| 山东省| 精品?国产区一区二| 国产精品疯狂输出jk草莓视频| 色色亚洲| 欧美18videosex性欧美tube1080| 久久凹凸视频| 亚洲欧洲无码av电影在线观看| 亚洲精品一区二区| аⅴ天堂国产最新版在线中文 | 国产xxxx| 廊坊市| 欧美亚洲人成网站在线观看| 无码内射中文字幕岛国片| 欧美A级视频| 国产成人无码专区| 国产精品无码翘臀在线看|