<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      RL加持3D生成時代!首個「R1 式」文本到3D推理大模型AR3D-R1登場

      0
      分享至



      強化學習(RL)在大語言模型和 2D 圖像生成中大獲成功后,首次被系統性拓展到文本到 3D 生成領域!面對 3D 物體更高的空間復雜性、全局幾何一致性和局部紋理精細化的雙重挑戰,研究者們首次系統研究了 RL 在 3D 自回歸生成中的應用!

      來自上海人工智能實驗室、西北工業大學、香港中文大學、北京大學、香港科技大學等機構的研究者提出了AR3D-R1,這是首個強化學習增強的文本到 3D 自回歸模型。該工作系統研究了獎勵設計、RL 算法和評估基準,并提出Hi-GRPO——一種層次化強化學習范式,通過分離全局結構推理與局部紋理精修來優化 3D 生成。同時引入全新基準MME-3DR,用于評估 3D 生成模型的隱式推理能力。

      實驗表明 AR3D-R1 在 Kernel Distance 和 CLIP Score 上均取得顯著提升,達到 0.156 和 29.3 的優異成績。



      • 論文標題:Are We Ready for RL in Text-to-3D Generation? A Progressive Investigation
      • 代碼鏈接:
      • https://github.com/Ivan-Tang-3D/3DGen-R1
      • 論文鏈接:https://arxiv.org/pdf/2512.10949



      強化學習應用于 3D 生成的挑戰



      強化學習在大語言模型(如 DeepSeek-R1)和 2D 圖像生成中已被證明能夠有效提升模型性能,但將 RL 應用于 3D 生成仍面臨獨特挑戰:

      • 空間復雜性更高:3D 物體需要同時保持全局幾何一致性和局部紋理精細度,比 2D 圖像的空間復雜性高出一個維度。
      • 獎勵設計困難:如何設計既能評估全局結構又能捕捉局部細節的獎勵函數是關鍵難題。
      • 現有基準局限:當前的文本到 3D 基準主要關注物體多樣性,無法有效評估模型的隱式推理能力。
      • 算法敏感性:3D 生成對獎勵設計和 RL 算法的選擇高度敏感,需要系統性的研究來指導實踐。

      在此前的工作中,3D 模型大多停留在「預訓練 + 微調」框架,真正將 RL 引入 3D 生成的一步,還無人系統邁出。

      從「推理」到「造物」:

      AR3D-R1 的整體框架

      AR3D-R1 構建在離散 3D 生成模型 ShapeLLM-Omni 之上,引入了一個推理驅動的 3D 生成流程:

      • 先想一想:模型會先根據文本提示生成一段高層語義推理(類似 CoT),規劃出物體的大致結構、關系與風格。

      • 再動手造:隨后,推理結果會作為「中間規劃」,直接指導離散 token 的 3D 生成過程。

      這讓 AR3D-R1 不再是「憑本能畫 3D」,而是先構思、再搭骨架、最后上細節——真正把 RL 驅動的「會想」能力,遷移到了「會造」的 3D 世界里。

      獎勵設計與 RL 算法的系統性研究


      在獎勵設計方面,研究者評估了多個獎勵維度和模型選擇,得出以下關鍵發現:



      • 人類偏好對齊至關重要:與人類審美偏好對齊的獎勵信號能夠顯著提升生成質量。

      • 通用多模態模型具有魯棒性:令人驚訝的是,通用多模態模型在評估 3D 相關屬性時表現出強大的魯棒性,有時甚至優于專門的 3D 評估模型。



      在 RL 算法研究方面,研究者深入分析了 GRPO 的多個變體,包括標準 GRPO、引入 token 級平均與動態采樣的 DAPO,和更偏序列級操作的 GSPO 等:

      • Token 級優化更有效:相比響應級優化,token 級別的損失平均能更好地捕捉生成過程中的全局結構差異。

      • 動態采樣策略足以穩定訓練:對于文本到 3D 生成任務,無需復雜的訓練穩定技術。

      • 數據規模和迭代次數的擴展均能有效提升性能:但一味堆疊 RL 迭代反而可能引入過擬合或模式崩塌,需要精細校準。

      這些發現為 3D 生成中的 RL 應用提供了系統性指導。

      Hi-GRPO:

      層次化強化學習范式





      受 3D 生成自然層次結構的啟發——模型首先構建全局幾何,然后精修局部紋理(這與人類 3D 感知過程一致),研究者提出了 Hi-GRPO(Hierarchical GRPO)層次化強化學習范式。

      Hi-GRPO 的核心思想是在單次迭代中聯合優化層次化 3D 生成:

      • 全局規劃階段:模型首先針對文本提示進行全局結構規劃,生成高層語義推理來指導粗糙形狀生成。

      • 局部精修階段:模型接收初始推理結果和原始文本提示,生成紋理精細化的 3D 物體。

      • 專用獎勵集成:為粗糙階段和精修階段分別設計專門的獎勵模型集成,計算組相對獎勵來優化兩個階段。

      通過這種層次化設計,Hi-GRPO 能夠在保證全局幾何一致性的同時,精細優化局部紋理細節,實現從粗到精的漸進式 3D 生成。

      MME-3DR:

      評估 3D 生成推理能力的新基準





      現有的文本到 3D 基準,更多考察的是物體多樣性,而不是推理能力。模型在簡單 prompt 上表現不錯,但一遇到復雜要求就頻頻「翻車」。為此,論文提出了全新的推理型 3D 基準 MME-3DR,覆蓋五大高難類別:

      • 空間與結構幾何(復雜構型、相對位置關系)
      • 機械可供性(能不能「看起來就能動起來」)
      • 生物與有機形狀
      • 依賴世界知識的罕見物體
      • 風格化表達(風格、材質、抽象度的綜合控制)

      在這一更苛刻的場景下:傳統 text-to-3D 模型普遍出現崩塌,要么結構錯亂,要么風格跑偏。而 RL 訓練之后的 AR3D-R1 在五大類別上都有明顯提升,同時在多個 benchmark 上超越 Trellis 等模型,展現出更強的隱式 3D 推理能力。

      定性定量分析







      定量實驗結果表明,AR3D-R1 在多個指標上取得了顯著提升:

      • Kernel Distance 達到 0.156,表明生成的 3D 物體分布與真實數據分布高度接近。

      • CLIP Score 達到 29.3,表明生成結果與文本提示的語義對齊質量顯著提升。

      • 在 Toys4K 等現有數據集和新引入的 MME-3DR 基準上均展現出優越性能,在幾何一致性和紋理質量方面均有明顯改進。



      定性實驗中,研究者展示了 AR3D-R1 在推理過程中清晰的從粗到精進展。模型首先構建合理的全局幾何結構,然后逐步添加細節紋理,生成高質量的 3D 物體。可視化結果驗證了 Hi-GRPO 層次化范式和專用獎勵集成策略在提升 3D 生成質量方面的有效性。

      AR3D-R1 的成功標志著強化學習在文本到 3D 生成領域的首次系統性突破,為構建更智能、更具推理能力的 3D 生成模型開辟了新方向。未來,這樣的能力可以自然延伸到:

      • 具身智能與機器人:從自然語言到 3D 場景再到交互決策。
      • 游戲與內容創作:快速生成結構合理、細節豐富的 3D 資源。
      • AR/VR 與數字孿生:在復雜約束和多模態反饋下進行 3D 推理與生成。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      阿斯:巴黎想與恩里克達成終身合作協議,成績已然說明了一切

      阿斯:巴黎想與恩里克達成終身合作協議,成績已然說明了一切

      懂球帝
      2025-12-22 16:03:15
      布倫森47+8賽季新高尼克斯險勝熱火 韋爾28+20鮑威爾單節19分

      布倫森47+8賽季新高尼克斯險勝熱火 韋爾28+20鮑威爾單節19分

      醉臥浮生
      2025-12-22 09:34:30
      他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

      他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

      健身迷
      2025-12-22 10:19:04
      來了,曼聯!1.55億“頂星”閃電空降!7000萬“廢柴”離隊獲批準

      來了,曼聯!1.55億“頂星”閃電空降!7000萬“廢柴”離隊獲批準

      頭狼追球
      2025-12-22 14:11:54
      快扔掉!戴一天,輻射量相當于拍117次胸片

      快扔掉!戴一天,輻射量相當于拍117次胸片

      FM93浙江交通之聲
      2025-10-28 00:01:43
      臺灣換防失誤使中業島被菲侵占,中國三大行動讓菲機場美夢成空

      臺灣換防失誤使中業島被菲侵占,中國三大行動讓菲機場美夢成空

      壹知眠羊
      2025-12-22 07:19:13
      媒體人:FIBA未通知中國臺北籃協,自行在官網公布了比賽地點

      媒體人:FIBA未通知中國臺北籃協,自行在官網公布了比賽地點

      懂球帝
      2025-12-22 20:40:07
      梅根要氣哭了!阿奇王子莉莉貝特出鏡圣誕合影,遺傳基因不會說謊

      梅根要氣哭了!阿奇王子莉莉貝特出鏡圣誕合影,遺傳基因不會說謊

      夜深愛雜談
      2025-12-20 17:18:28
      剛剛!中信信悅灣取證,備案均價24.44萬/㎡

      剛剛!中信信悅灣取證,備案均價24.44萬/㎡

      地產K線官方
      2025-12-22 14:13:07
      海南封關后進口車價腰斬,120多萬卡宴只要60萬?個人消費者無法購買零關稅進口車

      海南封關后進口車價腰斬,120多萬卡宴只要60萬?個人消費者無法購買零關稅進口車

      大象新聞
      2025-12-20 14:01:05
      是“原切牛排”還是“調理牛排”?知名餐飲品牌引爭議,消費者:不應該在角落用小字標注

      是“原切牛排”還是“調理牛排”?知名餐飲品牌引爭議,消費者:不應該在角落用小字標注

      每日經濟新聞
      2025-12-21 21:50:05
      起初人們以為這只是一次普通的中子星合并事件……

      起初人們以為這只是一次普通的中子星合并事件……

      星空天文
      2025-12-21 17:58:53
      國務院國資委主任:做強做優做大國有企業和國有資本

      國務院國資委主任:做強做優做大國有企業和國有資本

      澎湃新聞
      2025-12-22 10:57:06
      江暢同志突發心梗,不幸逝世

      江暢同志突發心梗,不幸逝世

      新京報政事兒
      2025-12-20 22:27:40
      明年1月1日起,向好友私發淫穢信息也違法

      明年1月1日起,向好友私發淫穢信息也違法

      鳳凰網科技
      2025-12-22 19:15:07
      中美俄戰機飛行1小時成本對比:F22要60萬,蘇27需18萬,殲20多少

      中美俄戰機飛行1小時成本對比:F22要60萬,蘇27需18萬,殲20多少

      阿器談史
      2025-12-21 23:20:57
      賴清德是歷史罪人!郭正亮:5個親綠“大法官”違規裁決逾越底線

      賴清德是歷史罪人!郭正亮:5個親綠“大法官”違規裁決逾越底線

      海峽導報社
      2025-12-22 21:48:03
      善惡終有報!52歲崩潰大哭的王小騫,給所有已婚未育的人提了個醒

      善惡終有報!52歲崩潰大哭的王小騫,給所有已婚未育的人提了個醒

      小小李娛
      2025-12-22 15:26:08
      老師生日,家長群有人提議送輛40萬的轎車,我冷笑問他出多少

      老師生日,家長群有人提議送輛40萬的轎車,我冷笑問他出多少

      船長與船1
      2025-12-22 12:52:01
      炸鍋!尹錫悅丑聞震動全國,總統府秘密通道曝光,作用驚人!

      炸鍋!尹錫悅丑聞震動全國,總統府秘密通道曝光,作用驚人!

      愛吃醋的貓咪
      2025-12-22 21:36:38
      2025-12-22 22:23:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11971文章數 142516關注度
      往期回顧 全部

      科技要聞

      商湯聯創親自下場 痛批主流機器人技術大錯

      頭條要聞

      德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

      頭條要聞

      德鐵下單200輛中國巴士 德財長:這決定讓我十分惱火

      體育要聞

      戴琳,中國足球的反向代言人

      娛樂要聞

      張柏芝不再隱瞞,三胎生父早有答案?

      財經要聞

      央行信用新政:為失信者提供"糾錯"通道

      汽車要聞

      可享88元抵2000元等多重權益 昊鉑A800開啟盲訂

      態度原創

      親子
      時尚
      本地
      藝術
      公開課

      親子要聞

      AI + 護眼!我為什么選它給娃當學習搭子~

      這才是會打扮的中年女人!穿搭不花不綠,簡單時髦,值得借鑒

      本地新聞

      云游安徽|走進銅陵,照見三千年不滅的爐火

      藝術要聞

      萬年松樹開花,震驚你的雙眼!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲欧美日韩高清一区二区三区| 熟女?国产?精品| 太原市| 女人高潮流白浆视频| 又大又硬又爽免费视频| 久久99色综合| 国产精品久久久久久久久久久久| 一本无码在线观看| 国产第一页屁屁影院| 99re66| 做受视频一区二区三区| 中文字幕人妻熟女人妻| 铁牛TV尤物| 一本色道久久综合精品婷婷| 亚洲精品之国产av| 国产亚洲天堂另类综合| 国产精品天干天干综合网| 亚洲性天堂| 久热re这里精品视频在线6 | 在线无码免费的毛片视频| 一本色道久久88亚洲精品综合| 欧美18videosex性欧美tube1080 | 91视频在线免费看| 精品国产一区二区三区麻豆| 亚洲第一成人网站| 色综合?人妻| 国产精品亚洲一区二区三区| 91视频在线观看18| 国产精品人妻精品| 久久婷婷大香萑太香蕉av人| 黑人一区| 夜夜躁天天躁很很躁| 精品人妻少妇| 免费激情网址| 国产互换人妻XXXXXX6| 亚洲中文字幕无码爆乳| 亚洲AV人人澡人人人夜| 欧美xxxx黑人又粗又大| 少妇人妻偷人精品视频| 无码中文字| 亚洲欧美成人一区二区三区|