<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      騰訊混元3D搞了個狠活:單圖生成3D,背面讓用戶說了算

      0
      分享至


      單張圖生成3D模型,AI最怕什么?

      不是分辨率不夠,也不是紋理糊了——是你永遠不知道背面長什么樣。用戶拍了一張沙發的正面照,AI生成的背面可能多出三條腿,或者干脆變成一張平板。這個問題困擾了行業多年,直到最近一組中國高校研究者給出了新解法:與其讓AI瞎猜,不如讓用戶直接告訴它背面該是什么。

      數據荒:3D生成的阿克琉斯之踵

      圖像生成模型有數十億張網圖可以學,文本模型啃下了整個互聯網的文字,但3D數據呢?稀缺得可憐。這導致一個尷尬局面:AI見過無數貓的照片,卻沒見過多少只貓的完整三維掃描。讓它從單圖重建3D,本質上是在讓它"腦補"——而腦補的結果,往往是物理上不可能存在的形狀。

      研究團隊指出,現有方法在生成物體背面時,經常出現結構斷裂、比例失調或與用戶意圖不符的問題。

      傳統思路是堆更多3D訓練數據,但這事成本極高。一套專業3D掃描設備動輒上百萬,人工建模更是慢工出細活。有沒有捷徑?研究團隊把目光投向了多模態大語言模型——這些模型雖然沒"見過"多少3D數據,但讀過的東西足夠多,知道"背包應該有肩帶""椅子四條腿才穩"這類常識。

      直接讓語言模型輸出3D?不行。語言模型的表征太抽象,缺乏空間信息,喂給3D生成器就是雞同鴨講。

      中間商賺差價:圖像生成模型當翻譯

      Know3D的解法是在語言模型和3D生成器之間塞一個圖像生成模型,當翻譯。具體配置是:Qwen2.5-VL負責理解用戶指令和輸入圖像,Qwen-Image-Edit把理解轉化為空間結構信息,最后用微軟的Trellis.2生成3D模型。

      語言模型讀完文字指令,分析完輸入圖片,把"背面應該有個口袋"這類需求轉述給圖像生成模型。圖像生成模型再輸出帶空間信息的表征,指導3D生成器干活。

      關鍵問題是:從圖像生成模型的哪個環節提取信息?

      研究團隊測試了三個選項。一是最終輸出前的內部圖像表征,二是用Meta的DINOv3從輸出圖像提取的特征,三是生成過程中的中間狀態。前兩種都依賴像素級結果,如果圖像生成模型畫錯了——比如把單肩包畫成雙肩包——錯誤會原封不動傳進3D模型。

      中間狀態贏了,而且贏得很明顯。這些狀態既包含語義信息(知道這是包),又包含空間信息(知道包的大致結構),還不用對最終圖像的像素精度負責。哪怕生成的背面視圖有瑕疵,中間狀態里的結構感足夠讓3D生成器輸出合理結果。

      四分之一處的甜蜜點

      提取中間狀態的時機很有講究。太早,信息還陷在像素細節里;太晚,噪聲開始主導。消融實驗顯示,在生成進程約25%的位置截取狀態,效果最佳。

      這個發現本身就有趣——它暗示圖像生成模型的工作流程可能是:前期搭建結構框架,后期填充紋理細節。3D生成更需要前者。

      用戶能控制到什么程度?論文展示的案例中,輸入一張椅子的正面照,用戶可以指定"背面要有橫條靠背""椅腿是彎曲的"等細節,最終3D模型會忠實反映這些要求。相比傳統方法只能被動接受AI的"腦補",Know3D把背面設計的主動權交還給了用戶。

      這對電商、游戲、建筑可視化等場景意義重大。設計師不再需要為了一張背面參考圖去翻遍圖庫,用幾句話描述就能鎖定想要的效果。

      開源與閉源的微妙博弈

      Know3D的技術棧全鏈路基于開源或開放權重模型:阿里的Qwen系列語言模型和圖像編輯模型,微軟的Trellis.2 3D生成器。這種組合降低了復現門檻,也繞開了某些閉源模型的使用限制。

      但研究團隊也坦誠,當前版本對復雜交互物體的處理仍有局限。如果用戶要求"背包背面要有一個能打開的卡扣",且這個卡扣在輸入圖像中完全不可見,模型有時會生成結構合理但功能存疑的結果——它知道卡扣長什么樣,但不一定理解"能打開"意味著什么。

      另一個待優化點是生成速度。三階段流水線(語言理解→圖像翻譯→3D生成)比端到端模型慢,如何在保持可控性的前提下壓縮延遲,是工程化的關鍵。

      論文最后提到,團隊正在探索將這一框架擴展到視頻生成和4D動態場景。如果單圖到3D的背面可控,那么視頻序列到動態3D的時序一致性,或許是下一個攻關方向。

      當AI終于愿意聽用戶描述"背面應該是什么樣",3D生成的工作流會被改寫嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      楊麗萍“專屬男舞伴”墜樓自殺,跳得果決,和楊麗萍關系非同一般

      楊麗萍“專屬男舞伴”墜樓自殺,跳得果決,和楊麗萍關系非同一般

      一盅情懷
      2026-04-03 07:49:11
      整容臉上鏡有多拉胯?看《乘風2026》的瞿穎,給內娛演員上了一課

      整容臉上鏡有多拉胯?看《乘風2026》的瞿穎,給內娛演員上了一課

      一娛三分地
      2026-04-07 18:30:20
      刺激!文壇巨匠賈平凹和女兒超美詩人賈淺淺被扒疑似大量抄襲?

      刺激!文壇巨匠賈平凹和女兒超美詩人賈淺淺被扒疑似大量抄襲?

      魔都囡
      2026-04-07 01:36:16
      中國不記隔夜仇!巴拿馬接到通知,美國終于下場,巴政府自食惡果

      中國不記隔夜仇!巴拿馬接到通知,美國終于下場,巴政府自食惡果

      書紀文譚
      2026-04-06 23:14:24
      中山市小欖鎮九洲基社區黨委書記盧常秋被查

      中山市小欖鎮九洲基社區黨委書記盧常秋被查

      南方都市報
      2026-04-07 13:04:06
      霍爾木茲海峽大消息!剛剛,直線拉升

      霍爾木茲海峽大消息!剛剛,直線拉升

      中國基金報
      2026-04-07 10:20:20
      CBA正在“殺死”中國男籃!6大亂象不除,我們過不了日韓這一關

      CBA正在“殺死”中國男籃!6大亂象不除,我們過不了日韓這一關

      蛋疼體育
      2026-04-07 17:54:23
      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      共工之錨
      2026-03-31 00:27:37
      美軍跳傘飛行員身背“小金庫”,步槍金條電臺一應俱全,非常難捉

      美軍跳傘飛行員身背“小金庫”,步槍金條電臺一應俱全,非常難捉

      利刃號
      2026-04-05 23:38:07
      “打開臺灣的眼睛”,島內期待鄭麗文訪陸

      “打開臺灣的眼睛”,島內期待鄭麗文訪陸

      環球網資訊
      2026-04-07 06:56:17
      三天內13家上市公司被查!近80萬股民踩雷

      三天內13家上市公司被查!近80萬股民踩雷

      21世紀經濟報道
      2026-04-07 15:53:58
      時隔十年國民黨主席再訪大陸 鄭麗文今赴上海

      時隔十年國民黨主席再訪大陸 鄭麗文今赴上海

      參考消息
      2026-04-07 09:56:06
      皇馬vs拜仁前瞻:庫爾圖瓦缺席 姆巴佩復出是雙刃劍 拜仁無懼皇馬

      皇馬vs拜仁前瞻:庫爾圖瓦缺席 姆巴佩復出是雙刃劍 拜仁無懼皇馬

      智道足球
      2026-04-07 12:55:55
      大批美軍或準備抗命,專家發現特朗普已失去理智,可能下令扔核彈

      大批美軍或準備抗命,專家發現特朗普已失去理智,可能下令扔核彈

      軍機Talk
      2026-04-07 18:37:19
      德國新規引發關注:17至45歲男性出境超三個月需申請軍方許可

      德國新規引發關注:17至45歲男性出境超三個月需申請軍方許可

      新歐洲
      2026-04-06 18:12:22
      王寶強和女友開京牌大G到青島,馮清人高馬大,襯得寶強像小嬌夫

      王寶強和女友開京牌大G到青島,馮清人高馬大,襯得寶強像小嬌夫

      八怪娛
      2026-04-07 15:02:12
      最新放假通知:連休5天,需調休!

      最新放假通知:連休5天,需調休!

      隨州派
      2026-04-07 17:15:30
      鄭麗文抵達上海,大陸高規格接待,國民黨大佬:兩岸絕不能動武

      鄭麗文抵達上海,大陸高規格接待,國民黨大佬:兩岸絕不能動武

      娛樂小可愛蛙
      2026-04-07 17:35:50
      全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

      全球同時收到消息,北京迎來貴賓,見面握緊中方手,美國時代結束

      小柨拍客在北漂
      2026-04-06 19:14:46
      “最美趙敏”,去世3天才被發現!

      “最美趙敏”,去世3天才被發現!

      大中國
      2026-04-07 15:10:47
      2026-04-07 19:20:49
      摸魚算法
      摸魚算法
      致力于用最前沿的AI技術,換取更多發呆時間的三十歲青年。
      851文章數 9關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      教育
      旅游
      健康
      數碼
      家居

      教育要聞

      可樂、魚腥草進教室…武漢商學院這堂“食品感官分析”課,夯爆了

      旅游要聞

      2026年清明節假期國內出游1.35億人次

      干細胞抗衰4大誤區,90%的人都中招

      數碼要聞

      MINISFORUM銘凡推出M1 Lite迷你主機:搭載酷睿Ultra 5 125U

      家居要聞

      雅致愜意 感知生活之美

      無障礙瀏覽 進入關懷版