<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      「視頻世界模型」新突破:AI連續生成5分鐘,畫面也不崩

      0
      分享至



      當 Sora 讓世界看到了 AI 生成視頻的驚艷效果,一個更深層的問題浮出水面:如何讓生成的視頻不只是「看起來像」,而是真正理解并遵循物理世界的規律?這正是「視頻世界模型」(Video World Model)要解決的核心挑戰。當生成時長從幾秒擴展到幾分鐘,模型不僅要畫面逼真,更要在長時間尺度上保持結構、行為與物理規律的一致性。然而,誤差累積與語義漂移往往導致長視頻出現畫面退化與邏輯崩壞 —— 這已成為衡量世界模型能力的關鍵瓶頸。

      圍繞這一挑戰,上海人工智能實驗室聯合復旦大學、南京大學、南洋理工大學 S-Lab 等單位提出了LongVie 2—— 一個能夠生成長達5 分鐘高保真、可控視頻的世界模型框架



      LongVie 2 可自回歸生成 3-5 分鐘的超長可控視頻

      • 論文:https://arxiv.org/pdf/2512.13604
      • 項目主頁:https://vchitect.github.io/LongVie2-project/
      • GitHub:https://github.com/Vchitect/LongVie
      • 視頻演示:https://www.youtube.com/watch?v=ln1kMNYj50Y


      https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg

      什么是理想的視頻世界模型?

      一個理想的視頻世界模型,不應只是「生成得更久」,而應同時具備以下三項核心能力:

      • 全面可控性(Comprehensive Controllability):能夠在長時間生成過程中穩定響應多種控制信號,保持場景結構與運動意圖不漂移;
      • 長期視覺保真(Long-term Fidelity):隨著時間推進,畫面質量不發生明顯退化,不出現紋理崩塌或細節丟失;
      • 長程上下文一致性(Long-context Consistency):跨片段、跨時間保持語義、身份與物理規律的一致,避免「換世界式」斷裂。

      現有世界模型的瓶頸在哪里?

      本文系統調研了當前主流的視頻世界模型,發現一個共同問題:隨著生成時長的增加,模型的可控性、視覺保真度與時間一致性會同步下降。



      現有模型在長時間生成時的退化問題

      LongVie 2:三階段遞進式訓練

      為系統性解決上述挑戰,LongVie 2 設計了一套逐層遞進的三階段訓練策略,從控制、穩定性到時間一致性層層強化:



      LongVie 2 三階段訓練流程

      階段一:Dense & Sparse 多模態控制

      通過引入稠密信號(如深度圖)與稀疏信號(如關鍵點軌跡),為模型提供穩定且可解釋的世界約束。這使生成過程不再完全依賴隱式記憶,從源頭提升長程可控性。

      階段二:退化感知訓練(Degradation-aware Training)

      長視頻生成中,質量衰減幾乎不可避免。LongVie 2 的核心創新在于:在訓練階段主動「制造困難」——



      退化感知訓練示意圖

      • 利用 VAE 的多次 encode-decode 模擬重建誤差;
      • 通過 加噪 + Diffusion 去噪 構造退化圖像。

      以此作為訓練信號,使模型學會在不完美輸入下保持穩定生成,顯著增強長期視覺保真度。

      階段三:歷史上下文建模

      在生成過程中顯式引入歷史片段信息,并通過針對性 loss 約束相鄰片段的銜接,使跨片段過渡更加自然順暢,有效緩解長視頻中的語義斷裂與邏輯跳變問題。



      三階段訓練效果對比

      一圖看懂 LongVie 2 框架

      通過多模態控制、退化感知訓練與歷史上下文建模的協同設計,LongVie 2 將長視頻生成從「片段拼接」提升為持續演化的世界建模過程:



      LongVie 2 整體框架

      從左至右,LongVie 2 首先將跨片段的稠密(深度)與稀疏(關鍵點)控制視頻做全局歸一化,并為所有片段采用統一的噪聲初始化。隨后在每一片段生成時,將全局歸一化后的控制信號、上一片段的末幀與文本提示送入模型,逐步生成完整的長視頻。

      LongVie 2 能力展示

      該研究將LongVie 2與 Go-With-The-Flow 和 Diffusion As Shader 進行了對比。結果顯示,LongVie 2 在可控性方面表現顯著優于現有方法:



      與現有方法的可控性對比


      https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg


      https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg

      消融實驗也充分驗證了三階段訓練的有效性:



      消融實驗結果

      LongVGenBench

      首個可控超長視頻評測基準

      當前缺乏面向可控長視頻生成的標準化評測。為此,本文提出LongVGenBench—— 首個專為超長視頻生成設計的基準數據集,包含100 個時長超過 1 分鐘的高分辨率視頻,覆蓋真實世界與合成環境的多樣場景,旨在推動該方向的系統研究與公平評測。

      定量評估與用戶主觀測評結果顯示,LongVie 2 在多項指標上達到SOTA 水平,并獲得最高用戶偏好度:





      定量評測結果與用戶研究

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蔡磊近照曝光:紅光滿面、妻兒和睦,48歲本命年他能跑贏死神嗎?

      蔡磊近照曝光:紅光滿面、妻兒和睦,48歲本命年他能跑贏死神嗎?

      削桐作琴
      2026-02-20 23:29:01
      江蘇男子帶著一家人去俄羅斯旅游,結果老婆孩子葬身貝加爾湖

      江蘇男子帶著一家人去俄羅斯旅游,結果老婆孩子葬身貝加爾湖

      霹靂炮
      2026-02-22 22:56:18
      《鏢人》陳麗君、李云霄火了,霄君cp再續友情,兩人都無公開戀情

      《鏢人》陳麗君、李云霄火了,霄君cp再續友情,兩人都無公開戀情

      芬霏劇時光
      2026-02-23 18:08:54
      谷愛凌奪冠后得知奶奶去世,稱昨晚還夢到了奶奶

      谷愛凌奪冠后得知奶奶去世,稱昨晚還夢到了奶奶

      懂球帝
      2026-02-22 22:05:10
      媽祖開始懲罰這位姓許的有錢人了

      媽祖開始懲罰這位姓許的有錢人了

      麥杰遜
      2026-02-21 18:12:33
      任何一艘美航母上,都要帶足大量女兵?她們在航母上有什么作用?

      任何一艘美航母上,都要帶足大量女兵?她們在航母上有什么作用?

      來科點譜
      2026-02-23 09:27:06
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報
      2025-12-14 22:36:54
      大年初六,和幾個大廠(字節、阿里)朋友聚會。突然不聊房子了

      大年初六,和幾個大廠(字節、阿里)朋友聚會。突然不聊房子了

      螞蟻大喇叭
      2026-02-23 17:08:47
      日本首相退休后,每月的養老金是多少

      日本首相退休后,每月的養老金是多少

      徐靜波靜說日本
      2025-12-06 09:15:21
      75歲老人全新養老方式:不請保姆不去養老院,成本小老人舒心

      75歲老人全新養老方式:不請保姆不去養老院,成本小老人舒心

      孢木情感
      2026-02-21 12:15:25
      21+9難救主,馬瑟林懊惱絕殺不中:倫納德的話讓我備受鼓舞

      21+9難救主,馬瑟林懊惱絕殺不中:倫納德的話讓我備受鼓舞

      大眼瞄世界
      2026-02-23 16:12:04
      一個家庭最大的災難不是貧窮,而是父母才50歲,就處于這種狀態

      一個家庭最大的災難不是貧窮,而是父母才50歲,就處于這種狀態

      真實人物采訪
      2025-12-02 17:00:03
      比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

      比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

      芳芳歷史燴
      2025-12-25 20:32:52
      閃電航打包出售ipad,全都是蘋果牌

      閃電航打包出售ipad,全都是蘋果牌

      中國民航人
      2026-02-20 19:54:05
      1957年,韓先楚拒絕當福州軍區司令員,毛主席震怒:你不去也得去

      1957年,韓先楚拒絕當福州軍區司令員,毛主席震怒:你不去也得去

      南書房
      2026-02-22 07:25:13
      中產的智能馬桶,我不敢坐

      中產的智能馬桶,我不敢坐

      有意思報告
      2026-02-23 08:42:19
      信號與噪音:俄烏戰爭爆發前夕,那些不為人知的幕后故事

      信號與噪音:俄烏戰爭爆發前夕,那些不為人知的幕后故事

      近距離
      2026-02-22 12:49:16
      孫越訪談坦白:和岳云鵬私下不怎么聯系,成就如今的“德云一哥”

      孫越訪談坦白:和岳云鵬私下不怎么聯系,成就如今的“德云一哥”

      離離言幾許
      2026-02-21 09:26:48
      寧忠巖:拿到三枚獎牌完全超出預期,賽前目標有一枚就很好了

      寧忠巖:拿到三枚獎牌完全超出預期,賽前目標有一枚就很好了

      懂球帝
      2026-02-23 14:00:06
      馬筱梅曬設計款紅包,汪小菲帶隊外出聚餐,小菻菻顯得格外親張蘭

      馬筱梅曬設計款紅包,汪小菲帶隊外出聚餐,小菻菻顯得格外親張蘭

      心靈得以滋養
      2026-02-23 14:28:05
      2026-02-23 18:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12326文章數 142569關注度
      往期回顧 全部

      科技要聞

      智譜、MiniMax合計蒸發近千億市值,為何?

      頭條要聞

      鄭麗文:一旦臺海爆發沖突 臺灣將成最大輸家

      頭條要聞

      鄭麗文:一旦臺海爆發沖突 臺灣將成最大輸家

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經要聞

      美國海關將停止征收被裁定違法的關稅

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      房產
      本地
      數碼
      公開課
      軍事航空

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      數碼要聞

      1986年的蘋果巨無霸Mac電腦亮相:女孩打字演示 這鍵盤太狂了

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美軍重兵集結蓄力作戰之際 新一輪美伊談判時間“敲定”

      無障礙瀏覽 進入關懷版