<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DualCamCtrl:給視頻生成裝上「深度相機」,讓運鏡更「聽話」

      0
      分享至



      本研究的共同第一作者是來自于香港科技大學(廣州)EnVision Research 的張鴻飛(研究助理)和陳康豪(博士研究生),兩位研究者均師從陳穎聰教授。

      你的生成模型真的「懂幾何」嗎?還是只是在假裝對齊相機軌跡?

      當前眾多視頻生成模型雖宣稱具備「相機運動控制」能力,但其控制信號通常僅依賴于相機位姿。雖近期工作通過逐像素射線方向(Ray Condition)編碼了運動信息,但由于模型仍需隱式推斷三維結構,本質上仍缺乏對場景的顯式幾何理解。這一局限性導致了相機運動的不一致——模型受限于外觀與結構兩種表征信息的耦合,無法充分捕捉場景的底層幾何特征。

      鑒于上述挑戰,來自香港科技大學、復旦大學等機構的研究團隊提出了一種全新的端到端幾何感知擴散模型框架 DualCamCtrl。該研究針對現有方法在場景理解與幾何感知方面的不足,創新性地設計了一個「雙分支擴散架構」,能夠同步生成與鏡頭運動一致的 RGB 與深度序列。進一步地,為實現 RGB 與深度兩種模態的高效協同,DualCamCtrl 提出了語義引導互對齊機制(Semantic Guided Mutual Alignment),該機制以語義信息為指導,在雙向的交互中實現了更好的模態融合。

      這些設計使 DualCamCtrl 能夠更好地解耦外觀與幾何建模,從而生成更嚴格遵循指定相機軌跡的視頻。大量實驗表明,DualCamCtrl 在相機運動一致性方面顯著優于現有方法,相機運動誤差降低超過40%



      • 論文標題:DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video Generation
      • 項目主頁:https://soyouthinkyoucantell.github.io/dualcamctrl-page/
      • 論文鏈接:https://www.arxiv.org/abs/2511.23127
      • Github 倉庫:https://github.com/EnVision-Research/DualCamCtrl
      • Huggingface 模型:https://huggingface.co/FayeHongfeiZhang/DualCamCtrl



      雙分支幾何感知擴散模型



      總體而言,DualCamCtrl 巧妙地采用了雙分支視頻擴散框架(Dual Branch Video Diffusion Framework),其中一條分支負責生成 RGB 表示,另一條分支負責生成深度表示,兩種模態通過提出的SIGMA機制進行融合。

      該設計使得模型能夠從單張輸入圖像及其對應深度圖中,同步推斷出視頻級別的 RGB 與深度隱空間表征(Latent Representation),不僅最大限度降低了模態間的相互干擾,更使深度信息得以貫穿整個視頻生成過程,實現連貫的幾何引導。

      SIGMA 機制以及雙階段訓練

      在多模態可控視頻生成任務中,訓練與融合策略是關鍵。DualCamCtrl 的核心設計正是基于這一認識,包含兩部分:一是提出語義引導互對齊(SIGMA)融合機制,促進 RGB 與深度模態在生成過程中的有效協同;二是采用分階段訓練策略——首階段學習解耦的多模態表征,次階段專注跨模態融合建模。

      該設計使模型在復雜相機運動下,能同時保持外觀連貫與三維幾何準確,實現幾何感知的可控生成。

      語義引導互對齊機制



      圖3. SIGMA融合策略的動機與優勢對比示意圖。

      基于雙分支框架,RGB 分支與深度分支分別生成對應的視頻序列和對應深度序列。盡管兩者輸入相同,但它們獨立演化易導致輸出不一致,因此需要有效的融合與對齊策略(圖 3.a)。

      然而該團隊發現:單向對齊(One-Way Alignment)易損失語義一致性,幾何引導對齊(Geometry-Guided Alignment)則過度強調幾何表征而破壞了運動的一致性。為此,該團隊提出了語義引導互對齊機制(SIGMA)

      SIGMA 采用語義引導的雙向設計:淺層以 RGB 特征錨定語義結構,深層則引入深度反饋優化幾何表達。該方法基于兩個 key insights(圖 3.b、3.c):

      • 語義優先的重要性:外觀特征應在早期占主導地位以保持語義的穩定,而深度信號作為后期補充來優化幾何結構。
      • 雙向交互的重要性:兩分支相互反饋可避免單向對齊的失衡,實現更穩定的隱空間表征對齊。

      分階段訓練策略

      為實現 RGB 與深度模態穩健生成與有效協同的目標,DualCamCtrl 采用分階段訓練策略(Two-stage training),為每個階段的學習設置不同側重點:

      • 解耦訓練階段(Decoupled Stage):核心目標是使 RGB 與深度分支分別專注學習外觀與幾何表征。為此,模型使用共享預訓練權重初始化,并利用 state-of-the-art (SOTA) 視頻深度估計模型Video Depth Anything生成的深度特征進行監督。此階段禁止模態間交互,確保表征演化的獨立性。
      • 融合訓練階段(Fusion Stage):在兩個分支具備基礎能力后,核心目標轉向實現外觀與幾何信息的互補增強。為此,模型引入零初始化的融合模塊,逐步建立跨模態交互,并通過聯合優化 RGB 與深度目標函數,實現多模態表征的對齊與協同。



      圖2:兩階段訓練的效果:單階段模型因無法充分收斂(上圖),導致其相機軌跡對齊效果欠佳(下圖)。這凸顯了先解耦學習外觀與幾何表征的兩階段策略的有效性。

      實驗結果

      在定量和定性比較中,DualCamCtrl 在各項指標上均顯著優于當前的 SOTA 方法。

      定性分析:



      在相同輸入條件下,DualCamCtrl 在相機運動的對齊效果和視頻生成的視覺效果上均顯著優于現有先進方法。圖中“+”標記為視覺對比的定位參考點。

      定量分析:



      Image to Video 定量分析結果



      Text to Video 定量分析結果

      總結

      DualCamCtrl 提出了一種集成深度信息的雙分支視頻擴散模型,實現了更精準的相機控制視頻生成。通過引入語義引導互對齊機制(SIGMA)與兩階段訓練策略,該模型有效同步了 RGB 序列與深度序列的生成和融合,顯著增強了模型的幾何感知能力。實驗表明,該方法在相機一致性誤差上比先前方法降低超過 40%,為相機控制視頻生成提供了新的技術思路,并有望推動其他可控視頻生成任務的發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      已爆單!外媒嘆:這波中國又趕上了

      已爆單!外媒嘆:這波中國又趕上了

      觀察者網
      2025-12-22 17:57:28
      湖南7歲豆豆去世,前后僅一天,原因公開,已故外公摸頭照引爭議

      湖南7歲豆豆去世,前后僅一天,原因公開,已故外公摸頭照引爭議

      天天熱點見聞
      2025-12-21 14:13:14
      “東南亞詐騙終點站”被攻陷!園區墻上五個大字“誠信贏天下”

      “東南亞詐騙終點站”被攻陷!園區墻上五個大字“誠信贏天下”

      深度報
      2025-12-21 22:42:35
      純屬浪費天賦,老鷹把狀元練成3D,火箭提前布局或能收獲意外之喜

      純屬浪費天賦,老鷹把狀元練成3D,火箭提前布局或能收獲意外之喜

      拾叁懂球
      2025-12-23 02:15:28
      《老舅》直到崔國明想自盡,才知,小雪、二胖為何比崔夢更孝順他

      《老舅》直到崔國明想自盡,才知,小雪、二胖為何比崔夢更孝順他

      TVB的四小花
      2025-12-23 01:48:01
      悉尼槍擊案槍手或在超級監獄服刑:完全隔離,吃喝拉撒都在牢房,堪稱“混凝土墳墓”

      悉尼槍擊案槍手或在超級監獄服刑:完全隔離,吃喝拉撒都在牢房,堪稱“混凝土墳墓”

      紅星新聞
      2025-12-22 19:33:10
      聲稱拿下庫皮揚斯克的俄軍司令庫佐夫列夫被曝消失!或已身亡

      聲稱拿下庫皮揚斯克的俄軍司令庫佐夫列夫被曝消失!或已身亡

      項鵬飛
      2025-12-21 20:34:23
      硬抗42天,日本走出了危險一步,中方發出警告,條件已經成熟

      硬抗42天,日本走出了危險一步,中方發出警告,條件已經成熟

      策略述
      2025-12-22 15:09:07
      饒毅:應該給我國30到55歲的中青年科學家漲薪,砍掉幾個大項目用于中青年人才

      饒毅:應該給我國30到55歲的中青年科學家漲薪,砍掉幾個大項目用于中青年人才

      化學人生
      2025-12-22 21:14:30
      8500萬打水漂?曼聯新援2分鐘離譜2失單刀!隊友氣炸,近3個月0球

      8500萬打水漂?曼聯新援2分鐘離譜2失單刀!隊友氣炸,近3個月0球

      我愛英超
      2025-12-22 03:22:37
      方媛每日6菜1湯4肉,郭富城岳父下廚不請保姆

      方媛每日6菜1湯4肉,郭富城岳父下廚不請保姆

      張例喜歡軟軟糯糯
      2025-12-23 00:20:47
      暴跌25%!曾經一包難求的頂級“奢侈品”,如今五折甩賣都沒人要

      暴跌25%!曾經一包難求的頂級“奢侈品”,如今五折甩賣都沒人要

      夜深愛雜談
      2025-12-22 17:39:31
      中美較量開始了:世紀號油輪事件,是特朗普對中國的敲打,中國硬核回擊!

      中美較量開始了:世紀號油輪事件,是特朗普對中國的敲打,中國硬核回擊!

      V記錄號
      2025-12-21 14:58:44
      哈國兩千萬噸稀土賣美日!中國直接關上大門!哈國徹底傻眼!

      哈國兩千萬噸稀土賣美日!中國直接關上大門!哈國徹底傻眼!

      荊楚寰宇文樞
      2025-12-22 22:20:09
      賴清德彈劾案最新進展:臺立法機構將于明日排案 最快周五提案

      賴清德彈劾案最新進展:臺立法機構將于明日排案 最快周五提案

      環球網資訊
      2025-12-22 16:35:16
      2026年新規:60歲以上老人憑身份證享優待,5大福利+3個細節必看

      2026年新規:60歲以上老人憑身份證享優待,5大福利+3個細節必看

      墨蘭史書
      2025-12-22 17:20:03
      5中5轟12+5!遼籃棄用之人證明自己 莫蘭德上頭給了他機會

      5中5轟12+5!遼籃棄用之人證明自己 莫蘭德上頭給了他機會

      胖子噴球
      2025-12-22 21:24:14
      比糖和鹽還傷血管,已被世衛組織拉入“黑名單”,勸你早日忌口

      比糖和鹽還傷血管,已被世衛組織拉入“黑名單”,勸你早日忌口

      39健康網
      2025-12-20 20:16:48
      慘不忍睹,四川全場46分創CBA常規賽單場歷史最低分

      慘不忍睹,四川全場46分創CBA常規賽單場歷史最低分

      懂球帝
      2025-12-22 21:43:19
      演員朱珠疑似塌房?照片流出,驚呆網友!

      演員朱珠疑似塌房?照片流出,驚呆網友!

      大眼妹妹
      2025-12-15 10:39:19
      2025-12-23 02:35:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11971文章數 142516關注度
      往期回顧 全部

      科技要聞

      商湯聯創親自下場 痛批主流機器人技術大錯

      頭條要聞

      北約秘書長:向烏克蘭駐軍細節正在加緊制定中

      頭條要聞

      北約秘書長:向烏克蘭駐軍細節正在加緊制定中

      體育要聞

      戴琳,中國足球的反向代言人

      娛樂要聞

      張柏芝不再隱瞞,三胎生父早有答案?

      財經要聞

      央行信用新政:為失信者提供"糾錯"通道

      汽車要聞

      可享88元抵2000元等多重權益 昊鉑A800開啟盲訂

      態度原創

      本地
      數碼
      時尚
      教育
      公開課

      本地新聞

      云游安徽|走進銅陵,照見三千年不滅的爐火

      數碼要聞

      華為MatePad 11.5 2026平板搭載麒麟T82B / T82處理器

      珍珠配美人,最老派也最高級的時髦

      教育要聞

      高二英語成績120分左右,看英文原版小說是大坑,和提分南轅北轍

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲中文字幕AV在线| 亚洲熟女视频| 精品无码老熟妇magnet| 国产偷窥熟妇高潮呻吟| 少妇做爰免费视看片| 日韩一级亚洲一午夜免费观看中文版国语版| 国产盗摄xXxX视频XXXⅩ| 午夜精品久久久久久毛片| 无码熟妇人妻av在线电影| 无码少妇一区二区三区芒果| 亚洲中文字幕无码中文字| 庐江县| 色涩涩网| 国产一区二区三区黄色片| 国产亚洲制服免视频| 久久精品无码一区二区三区免费| 国产人妻人伦精品久久| 51自拍视频| 狠狠躁日日躁夜夜躁欧美老妇 | 成人国产精品免费视频| 精品国产污污免费网站| 亚洲中文字幕乱码av波多ji| 无码人妻一区二区三区四区| 家庭激情网| 色二区| 一区二区特级毛片| 狠狠色噜噜狠狠狠狠2021| 偷国产乱人伦偷精品视频| 亚洲精品一区二区三区蜜臀| 欧美日韩国产码高清| 亚洲最大成人| 欧美黑人又粗又大| 无码人妻精品区二区蜜桃91| 九九国产| 中文字幕熟妇无码专区| 无码高潮喷吹在线播放亚洲| 人人妻人人狠人人爽| 亚洲精品麻豆一二三区| 91中文字幕一区在线| 四虎永久www成人影院| 日本丰满少妇高潮呻吟|