<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      港科大廣州、快手可靈發布立體視頻轉換單步推理新方案

      0
      分享至



      近年來,隨著 VR 頭戴設備、智能眼鏡、3D 影院的發展,人們對于 3D 立體視頻內容的需求不斷增加。3D 電影帶來的沉浸式體驗著實令人著迷,但因其制作過程需要專業的相機設備、復雜耗時的專家后處理,3D 內容的制作讓普通玩家望而卻步:

      2010 年,卡梅隆導演為了實現經典著作《泰坦尼克號》的 3D 版本重制,制作團隊投入了高達 1800 萬美元,動用了 300 名專業工程師,耗時整整 60 周才完成[1]。

      如此高昂的成本和復雜的人力投入,一直是 3D 內容生產的最大阻礙。盡管近年來自動化的“單目轉雙目”(Monocular-to-Stereo)技術有所發展,但效果往往不盡如人意,轉換的結果往往要么產生錯誤的視差,要么無法處理復雜的鏡面場景,且速度極慢:現有的研究工作轉換一段 5 秒的視頻,耗時15 分鐘到 70 分鐘不等。

      針對這一難題,快手可靈團隊與香港科技大學(廣州)陳穎聰教授團隊(共同一作博士生沈貴寶、紅鳥碩士生杜壹華、博士生葛汶杭)聯合提出了一種全新的解決方案 ——StereoPilot。這是一種基于生成式先驗的統一高效立體視頻轉換模型,能夠在極短的時間內(11 秒),將一段 5 秒的普通 2D 視頻轉換為高質量的 3D 立體視頻,在所有定量指標上均超越了當前 SOTA 方法。



      • 論文鏈接:https://arxiv.org/abs/2512.16915
      • 項目主頁:https://hit-perfect.github.io/StereoPilot/
      • 代碼鏈接:https://github.com/KlingTeam/StereoPilot/

      當解鎖了 3D 視頻的制作部分,接下來,你只需要購買一副大約價格 10 元人民幣的紅藍眼鏡,即可跟隨 StereoPliot 一起,開啟沉浸式視覺體驗:

      論文的作者,對單目轉雙目視頻,從以往的研究方法到數據格式,由表及里地進行了深入分析:

      傳統困境:為何 "Depth-Warp-Inpaint" 走不通?



      在 StereoPilot 之前的研究工作中,學術界和工業界主流的 2D 轉 3D 方案通常采用“深度估計 - 重投影 - 補全”(Depth-Warp-Inpaint, DWI)的多階段流水線 :首先估計輸入視角(如 left-view)每個像素的深度,再依據深度和視差(disparity)的反比關系計算出視差進而重投影到目標視角(right-view),最后再對遮擋位置進行補全。雖然這種方法符合直覺,但在實際應用中卻存在三大致命缺陷:

      1. 誤差累積(Error Propagation)

      DWI 流程是串行的:先估計深度圖,再根據深度圖將像素 “重投影”(Warp)到另一只眼睛的視角,最后修補空洞。這導致了一個嚴重的問題:一步錯,步步錯。如果初始的深度估計不準確,后續的重投影步驟會直接放大這種錯誤,導致最終生成的畫面出現嚴重的幾何畸變和偽影 。

      2. 深度歧義(Depth Ambiguity)

      搞不定的 “鏡中花”這是 DWI 方法面臨的最棘手的物理難題。在現實世界中,鏡子或玻璃等反光表面存在一種特殊的現象:鏡子表面的物理深度與鏡子里反射物體的成像深度是不同的。 然而,傳統的深度估計算法在同一個像素點上只能預測一個深度值。這導致 DWI 方法無法正確處理反射場景 —— 它們往往會將物體反射的光學成像如同紋理一樣錯誤地 “貼” 在鏡子表面,導致 3D 觀感極度違和。







      基于以上的現象觀察和論述,我們可以得到:在鏡面反射、透明等一個位置具備多個光學深度的場景下,單目深度估計算法預測得出的單一深度值,將無法通過簡單的反比幾何關系導出視差從而進行正確的重投影(warp)操作,而作者提出的 StereoPilot 則很好處理了“鏡中花”的場景,如下圖所示:



      3. 格式不一致(Format Inconsistency)與幾何假設失效

      目前的 DWI 方法通常假設:深度(Depth)與視差(Disparity)之間存在簡單的反比關系。這種假設僅對平行攝像機(Parallel)配置有效。然而, 3D 電影影視工業中,為了獲得更好的觀影體驗,通常使用的是匯聚攝像機(Converged/Toe-in)。 在匯聚模式下,上述簡單的幾何假設不再成立,強行使用 DWI 方法會導致視差計算錯誤,和需要還原的 3D 訓練數據無法達成一致。

      撥開迷霧:Converged(匯聚式) vs. Parallel(平行式)

      為了徹底解決格式問題,我們必須先理清 3D 視頻數據的兩種主要格式,StereoPlilot 的作者用下面的圖例形象地展示了兩種數據格式的區別:



      • 平行格式(Parallel): 左右兩個相機的光軸是完全平行的。這種格式常見于計算機視覺數據集,其視差與深度成簡單的反比關系,常常被用于計算高精度的深度值。
      • 匯聚格式(Converged): 左右相機的光軸向內旋轉,匯聚于一點(匯聚點)。這會產生一個 “零視差平面”—— 在這個平面之前的物體會有出屏效果(正視差),而在其之后的物體則 “深陷” 屏幕中(負視差),而處于零視差面的主體則沒有視差,觀眾的眼睛提供了休息區。這是 3D 電影工業的標準格式。深度與視差之間不再存在簡單的反比關系。

      下面兩個例子形象展示了了兩種 3D 數據格式的區別:



      平行格式(Parallel)vs 匯聚格式(Converged)

      由于先前的研究工作往往從未對這兩種格式進行區分,或者只在單一格式上進行訓練,不可避免的帶來了一些不合理的對比,如將匯聚式 3D 電影數據集上訓練的模型在平行光軸的數據集上進行測試對比。

      StereoPilot:統一、高效的端到端解決方案

      為了攻克上述難題,快手可靈聯合港科大(廣州)團隊提出了StereoPilot。

      UniStereo:首個大規模統一 3D 立體視頻數據集

      團隊構建了UniStereo數據集,數據處理打標流程如下圖所示,這是業界首個同時包含 Parallel 和 Converged 兩種格式的大規模 3D 立體視頻數據集。UniStereo 數據集包含了兩個部分:



      • Stereo4D (Parallel): 包含了 Stereo4D 的數據中 58,000 個 5 秒的源自真實世界的平行視角視頻片段 。
      • 3DMovie (Converged): 從 142 部高質量 3D 電影中精選并處理了 48,000 個 5 秒的匯聚視角視頻片段。

      作者將會公開 Parallel 格式的所有數據和 Converged 格式數據的處理流程。

      統一高效的模型結構



      StereoPilot 的模型結構如上圖所示,主要包含下面三個核心部分:

      • Diffusion as Feed-Forward 11 秒極速轉換:不同于傳統的迭代式擴散模型(需要幾十步采樣,速度慢),StereoPilot 首次在該任務中采用了的"Diffusion as Feed-Forward"架構。作者將時間步 固定為一個極小值,利用預訓練視頻擴散模型(Video Diffusion Transformer)強大的生成先驗,直接在單次前向傳播中預測目標視圖。 這使得 StereoPilot 處理一個 5 秒(81 幀)的視頻僅需 11 秒,而同類方法(如 Mono2Stereo, SVG)往往需要十幾分鐘甚至一小時。
      • Domain Switcher 全能格式切換:為了讓一個模型同時搞定兩種 3D 格式并提高模型的泛化能力,StereoPilot 引入了一個可學習的 Domain Switcher。這就好比給模型裝了一個 “開關”,用戶可以根據需要,自由控制生成 Parallel 還是 Converged 格式的 3D 視頻,實現了真正的統一。
      • Cycle Consistency 保證幾何一致性:為了確保生成的左眼和右眼視頻在幾何上更好的對齊,團隊還設計了循環一致性損失(Cycle Consistency Loss),強制模型在從左圖生成右圖、再從右圖還原左圖的過程中保持信息不丟失,提升了目標視角與源視角的幾何一致性。

      實驗對比展示

      定量指標對比

      作者在 UniStereo 基準測試集中對近期的 SOTA 方法進行了全面的對比,如表格所示,StereoPilot 在 PSNR、SSIM、LPIPS 等所有核心指標上均顯著優于 StereoDiffusion, StereoCrafter, SVG, Mono2Stereo 等現有 SOTA 方法,在推理性能上,對比其他方法動輒十幾分鐘到一個多小時的推理時間,StereoPilot 的 11 秒的推理速度實現了壓倒性的優勢。



      可視化對比

      根據作者展示的可視化對比結果,相比其他的 SOTA 方法,StereoPilot 預測的結果具有更加準確的視差和更高的視覺質量。此外,如前文中分析,StereoPilot 可以處理復雜的鏡面場景(如下圖中的最后一列的樣本),這是其他方法從原理上無法做到的事情。



      消融分析

      為了驗證 StereoPilot 方法中的模塊的有效性,作者提供了 Domain Switcher 和 Cycle Consistency 的消融分析實驗。

      首先,如下展示的動態效果所示,StereoPilot 可以在 Domain Switcher 的加持下,實現 parallel 和 converged 的兩種 3D 格式的靈活轉換。





      除了實現靈活統一的 3D 視頻轉換外,作者進一步地進行定量和定性實驗,驗證統一地訓練方式對模型泛化性能的影響,如下圖表所示:





      從圖表展示的結果可以看出 Domain Switcher 和 Cycle Consistency 為模型在測試集上提供了更好的泛化性能與一致性。

      結語

      快手可靈團隊和港科大廣州聯合提出的 StereoPilot,實現了快速高質量的端到端 2D 視頻轉 3D 視頻,打破了 2D 轉 3D 依賴昂貴人工或低效深度重投影的桎梏,為 VR/AR 內容創作、老電影修復以及沉浸式視頻體驗提供了新的可能性。此外,團隊首次闡明 parallel 和 converged 兩種 3D 立體視頻數據的格式,并首次構建了大規模統一 3D 立體視頻數據集,澄清了該領域的訓練、測評標準。

      [1] https://zh.wikipedia.org/wiki/% E6% B3% B0% E5%9D% A6% E5% B0% BC% E5%85%8B% E5%8F% B7_(1997% E5% B9% B4% E7%94% B5% E5% BD% B1)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      小洛熙父母哭謝法醫劉良:你讓黑暗散去,我的天空星星都亮了!

      小洛熙父母哭謝法醫劉良:你讓黑暗散去,我的天空星星都亮了!

      苗苗情感說
      2025-12-22 12:28:30
      中國首例五胞胎終于長大了,父親因勞累去世,母親直言后悔生下他們

      中國首例五胞胎終于長大了,父親因勞累去世,母親直言后悔生下他們

      等風來育兒聯盟
      2025-08-01 12:21:35
      長征十二號甲首飛發射成功,回收失利!一級返回出現異常箭體墜地

      長征十二號甲首飛發射成功,回收失利!一級返回出現異常箭體墜地

      科普大世界
      2025-12-23 11:38:44
      回顧浙江護士穿情趣內衣出軌,丈夫送錦旗到醫院,法院:尋釁滋事

      回顧浙江護士穿情趣內衣出軌,丈夫送錦旗到醫院,法院:尋釁滋事

      詩意世界
      2025-12-23 14:02:24
      高層出手,大魚漸漸浮出水面!

      高層出手,大魚漸漸浮出水面!

      梳子姐
      2025-12-23 11:12:11
      中國小將入選德轉世界天才榜第21位,法甲球隊關注其未來

      中國小將入選德轉世界天才榜第21位,法甲球隊關注其未來

      阿錯田間生活
      2025-12-23 19:25:51
      泰軍端掉電詐呼叫中心,繳獲千萬現金黃金,網友沸騰

      泰軍端掉電詐呼叫中心,繳獲千萬現金黃金,網友沸騰

      胡嚴亂語
      2025-12-23 15:47:01
      善惡終有報!張本智和再傳新消息,原來張繼科早就猜中了他的結局

      善惡終有報!張本智和再傳新消息,原來張繼科早就猜中了他的結局

      料峭春寒洞
      2025-12-23 13:38:54
      菲律賓和廣東同為1億多人口,菲律賓創造3.3萬億,廣東是多少?

      菲律賓和廣東同為1億多人口,菲律賓創造3.3萬億,廣東是多少?

      傲傲講歷史
      2025-09-27 16:59:25
      2025年“演技最好”的7位男演員:于和偉第4,第1名當之無愧

      2025年“演技最好”的7位男演員:于和偉第4,第1名當之無愧

      洲洲影視娛評
      2025-12-07 14:45:43
      長達10年,女子被丈夫下藥供陌生人性侵,人數創紀錄讓女子崩潰

      長達10年,女子被丈夫下藥供陌生人性侵,人數創紀錄讓女子崩潰

      干史人
      2024-09-16 20:00:03
      誰都沒想到!中日46條航線剛取消,竟讓這些“妖魔鬼怪”現出原形

      誰都沒想到!中日46條航線剛取消,竟讓這些“妖魔鬼怪”現出原形

      介知
      2025-12-23 16:00:49
      事關黃金!上金所再發風險提示

      事關黃金!上金所再發風險提示

      大象新聞
      2025-12-23 15:41:08
      事實證明,放棄回國嫁給撒貝寧的李白,才是她人生中最正確的決定

      事實證明,放棄回國嫁給撒貝寧的李白,才是她人生中最正確的決定

      角落的隱藏美景
      2025-12-17 06:20:07
      回國后我才敢說:越南是我去過的所有國家中,最被低估的

      回國后我才敢說:越南是我去過的所有國家中,最被低估的

      李健政觀察
      2025-12-18 09:49:21
      美國公布新艦建造計劃 以推進特朗普的“黃金艦隊”目標

      美國公布新艦建造計劃 以推進特朗普的“黃金艦隊”目標

      財聯社
      2025-12-23 06:56:05
      交警提醒:紅燈右轉新規,別再憑感覺轉!看錯一個標志扣3分罰200

      交警提醒:紅燈右轉新規,別再憑感覺轉!看錯一個標志扣3分罰200

      今朝牛馬
      2025-12-22 22:10:53
      首都醫科大學附屬北京友誼醫院消化內科副主任醫師、醫學博士王俊雄到德州七院坐診手術

      首都醫科大學附屬北京友誼醫院消化內科副主任醫師、醫學博士王俊雄到德州七院坐診手術

      感知山東
      2025-12-23 09:26:39
      《奔跑吧》爭議不斷的嘉賓,脾氣臭還自以為是,范丞丞也帶不動她

      《奔跑吧》爭議不斷的嘉賓,脾氣臭還自以為是,范丞丞也帶不動她

      銀河史記
      2025-12-22 19:11:16
      湖北省委組織部發布公告

      湖北省委組織部發布公告

      隨州派
      2025-12-23 16:18:28
      2025-12-23 20:47:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11980文章數 142518關注度
      往期回顧 全部

      科技要聞

      慘烈90分鐘!快手驚魂:遭遇最強黑產攻擊

      頭條要聞

      男生被對象媽媽嫌矮做斷骨增高術 十年后下樓雙腿無力

      頭條要聞

      男生被對象媽媽嫌矮做斷骨增高術 十年后下樓雙腿無力

      體育要聞

      楊瀚森連續5場DNP!開拓者遭活塞雙殺

      娛樂要聞

      朱孝天回應阿信感謝,自曝沒再收到邀約

      財經要聞

      祥源系百億產品爆雷 浙金中心18人被拘

      汽車要聞

      四款新車集中發布 星途正式走進3.0時代

      態度原創

      游戲
      時尚
      健康
      家居
      公開課

      《影之刃零》制作人梁其偉訪談:如何還原武俠的精髓"/> 主站 商城 論壇 自運營 登錄 注冊 《影之刃零》制作人梁其偉訪談:如何還原武俠的精髓 Marv...

      推廣|| 用完立馬復購!百元get大牌膚感

      這些新療法,讓化療不再那么痛苦

      家居要聞

      通透明亮 大氣輕奢風

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: AV五十路| 国产jjizz女人多水| 色偷偷资源网| 18av千部影片| 九九伊人| 在线观看国产精品普通话对白精品| 天天澡天天狠天天天做| 南木林县| 嫩草亚洲小泬久久夂| 成在人线av无码免费高潮水老板| 久久亚洲精品成人无码网站| 少妇人妻偷人精品视蜜桃| av天堂午夜精品一区| 影音先锋女人av鲁色资源网小说| 鲁鲁av| 成人免费xxxxx在线观看| 日日夜夜精品| 欧美肥婆姓交大片| 黄瓜视频在线观看| 亚洲а∨天堂久久精品2021| 91热| 精东A片成人影视| 亚洲春色在线视频| 亚洲成人www| 亚洲欧美精品午睡沙发| 99999久久久久久亚洲| 免费观看羞羞视频网站| 乃东县| 黑人无码在线| 99热精品在线| 国产日韩久久免费影院| 亚洲精品97久久中文字幕无码| 成人免费无遮挡无码黄漫视频| 亚洲欧美v国产一区二区| 国产乱理伦片在线观看| 男人扒女人添高潮视频| 又粗又大又硬又长又爽| 亚洲人成色无码yyyy| 色欲人妻综合网站| 狠狠亚洲欧美日韩| 人妻aⅴ久久久北条麻妃|