<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      生成不遺忘,「超長時序」世界模型!北大EgoLCD長短時記憶加持

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導(dǎo)讀】視頻生成模型總是「記性不好」?生成幾秒鐘后物體就變形、背景就穿幫?北大、中大等機構(gòu)聯(lián)合發(fā)布EgoLCD,借鑒人類「長短時記憶」機制,首創(chuàng)稀疏KV緩存+LoRA動態(tài)適應(yīng)架構(gòu),徹底解決長視頻「內(nèi)容漂移」難題,在EgoVid-5M基準(zhǔn)上刷新SOTA!讓AI像人一樣擁有連貫的第一人稱視角記憶。

      隨著Sora、Genie等模型的爆發(fā),視頻生成正從「圖生動」邁向「世界模擬器」的宏大目標(biāo)。

      然而,在通往「無限時長」視頻生成的路上,橫亙著一只攔路虎——「內(nèi)容漂移」(Content Drift)。

      你是否發(fā)現(xiàn),現(xiàn)有的視頻生成模型在生成長視頻時,往往也是「金魚記憶」:前一秒還是藍(lán)色瓷磚,后一秒變成了白色墻壁;原本手里的杯子,拿著拿著就變成了奇怪的形狀;

      對于第一人稱(Egocentric)視角這種晃動劇烈、交互復(fù)雜的場景,模型更是極其容易「迷失」。

      生成長視頻不難,難的是「不忘初心」。

      近日,來自北京大學(xué)、中山大學(xué)、浙江大學(xué)、中科院和清華大學(xué)的研究團(tuán)隊,提出了一種全新的長上下文擴(kuò)散模型EgoLCD,不僅引入了「類腦的長短時記憶」設(shè)計,還提出了一套全新的結(jié)構(gòu)化敘事Promp方案,成功讓AI在生成長視頻時「記住」場景布局和物體特征。


      論文地址:https://arxiv.org/abs/2512.04515

      項目主頁:https://aigeeksgroup.github.io/EgoLCD

      在EgoVid-5M基準(zhǔn)測試中,EgoLCD在時間一致性生成質(zhì)量上全面碾壓OpenSora、SVD等主流模型,向構(gòu)建具身智能世界模型邁出了關(guān)鍵一步!


      核心痛點

      AI為什么會「失憶」?

      在長視頻生成中,傳統(tǒng)的自回歸(AR)模型非常容易出現(xiàn)生成式遺忘

      這就像讓一個人蒙眼畫畫,畫著畫著就偏離了最初的構(gòu)圖。對于第一人稱視頻(如Ego4D數(shù)據(jù)集)來說,劇烈的相機抖動和復(fù)雜的手物交互,讓這種「漂移」更加致命。

      傳統(tǒng)的Transformer雖然有注意力機制,但面對長序列,計算量呈二次方爆炸根本存不下那么多歷史信息;而簡單的滑動窗口又會丟掉早期的關(guān)鍵信息。

      EgoLCD (Egocentric Video Generation with Long Context Diffusion) 將長視頻生成重新定義為一個「高效且穩(wěn)定的內(nèi)存管理問題」。


      長短時記憶系統(tǒng) (Long-Short Memory)

      EgoLCD 設(shè)計了一種類似人類大腦的雙重記憶機制:

      長期記憶(Long-Term Sparse KV Cache):不再傻傻地緩存所有Token,而是利用稀疏注意力機制,只存儲和檢索最關(guān)鍵的「語義錨點」(比如房間的布局、關(guān)鍵物體的特征)。這不僅大大降低了顯存占用,還鎖死了全局一致性。

      短期記憶(Attention+LoRA):利用LoRA作為隱式記憶單元,增強短窗口注意力的適應(yīng)性,快速捕捉當(dāng)前視角的劇烈變化(如手的快速移動)。

      一句話總結(jié):長期記憶負(fù)責(zé)「穩(wěn)」,短期記憶負(fù)責(zé)「快」。

      記憶調(diào)節(jié)損失 (Memory Regulation Loss)

      為了防止模型在訓(xùn)練時「偷懶」,團(tuán)隊設(shè)計了一種特殊的損失函數(shù)。它強制模型生成的每一幀,都要與從長期記憶庫中檢索到的「歷史片段」保持語義對齊。

      這就像給AI戴上了一個「緊箍咒」,一旦它生成的畫面開始「胡編亂造」(漂移),Loss就會懲罰它,迫使它回歸原本的設(shè)定。

      結(jié)構(gòu)化敘事提示 (Structured Narrative Prompting, SNP)

      EgoLCD拋棄了簡單的文本提示,采用了一種分段式的、包含時間邏輯的結(jié)構(gòu)化劇本。

      訓(xùn)練時:使用GPT-4o生成極其詳盡的幀級描述,訓(xùn)練模型將視覺細(xì)節(jié)與文字嚴(yán)格對應(yīng)。

      推理時:SNP充當(dāng)「外部顯性記憶」,通過檢索前序片段的Prompt,引導(dǎo)當(dāng)前片段的生成,確保故事線和視覺風(fēng)格的連貫。

      性能炸裂



      為了公正地評測「不遺忘」的能力,研究團(tuán)隊甚至專門開發(fā)了一套新指標(biāo)——NRDP (Normalized Referenced Drifting Penalty),專門用來懲罰那些「虎頭蛇尾」、越往后質(zhì)量越差的模型。

      實驗結(jié)果顯示:

      一致性碾壓:在NRDP-Subject(主體一致性)和NRDP-Background(背景一致性)上,EgoLCD取得了壓倒性優(yōu)勢,漂移率極低。

      超越基線:相比SVD、DynamiCrafter和OpenSora等頂流模型,EgoLCD在EgoVid-5M基準(zhǔn)上的CD-FVD(時序連貫性)和動作一致性指標(biāo)均為最佳。

      極長生成:展示了長達(dá)60秒的連貫視頻生成(如一名演講者從黃昏講到深夜),人物衣著、背景樓宇細(xì)節(jié)始終如一,沒有發(fā)生形變!

      通往具身智能的「黑客帝國」

      EgoLCD不僅僅是一個視頻生成模型,它更像是一個「第一人稱世界模擬器」。

      通過生成長時程、高一致性的第一人稱視頻,EgoLCD能夠為具身智能(機器人)提供海量的訓(xùn)練數(shù)據(jù),模擬復(fù)雜的物理交互和長序列任務(wù)(如做飯、修理)。

      正如Sora讓人們看到了世界模型的雛形,EgoLCD則讓「通過視頻教會機器人理解世界」的夢想,變得前所未有的清晰。

      參考資料:

      https://arxiv.org/abs/2512.04515

      秒追ASI

      ?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

      點亮星標(biāo),鎖定新智元極速推送!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      北京阿姨20年守茅臺股票:90萬本金,分紅326萬,成本歸零!

      北京阿姨20年守茅臺股票:90萬本金,分紅326萬,成本歸零!

      趣文說娛
      2025-12-20 18:29:20
      真相浮出水面?財新披露南博“五宗罪”

      真相浮出水面?財新披露南博“五宗罪”

      數(shù)字財經(jīng)智庫
      2025-12-26 16:47:16
      1976年尼克松重返北京,執(zhí)意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

      1976年尼克松重返北京,執(zhí)意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

      史海殘云
      2025-12-19 14:26:17
      一穿就出圈,復(fù)古綠才是秋冬氛圍感之王

      一穿就出圈,復(fù)古綠才是秋冬氛圍感之王

      印客美學(xué)
      2025-12-26 04:03:25
      201米!40億!騰訊西南總部,世界“第一扭”摩天樓

      201米!40億!騰訊西南總部,世界“第一扭”摩天樓

      GA環(huán)球建筑
      2025-12-25 23:00:32
      人社部部長表態(tài)!2026養(yǎng)老金到底怎么漲?40年以上工齡更吃香?

      人社部部長表態(tài)!2026養(yǎng)老金到底怎么漲?40年以上工齡更吃香?

      阿纂看事
      2025-12-26 09:21:37
      68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國外,如今過得怎樣

      68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國外,如今過得怎樣

      豐譚筆錄
      2025-12-24 00:09:46
      北京89-85新疆 球員評價:3人優(yōu)秀,3人及格,4人低迷

      北京89-85新疆 球員評價:3人優(yōu)秀,3人及格,4人低迷

      籃球資訊達(dá)人
      2025-12-27 00:30:37
      朝鮮突然公開了,震驚世界的武器,王炸級武器

      朝鮮突然公開了,震驚世界的武器,王炸級武器

      南權(quán)先生
      2025-12-26 16:58:36
      CBA奪冠熱門客場7分惜敗,遭第2敗終結(jié)4連勝,主帥很失落

      CBA奪冠熱門客場7分惜敗,遭第2敗終結(jié)4連勝,主帥很失落

      吳紒愛體育
      2025-12-26 21:35:10
      供應(yīng)鏈鎖死!皮革制品遭關(guān)稅“精準(zhǔn)阻擊” 明年美國漲價沖擊將更明顯?

      供應(yīng)鏈鎖死!皮革制品遭關(guān)稅“精準(zhǔn)阻擊” 明年美國漲價沖擊將更明顯?

      財聯(lián)社
      2025-12-26 10:53:09
      一張“皮卡丘”8000萬?美網(wǎng)紅宣布將出手!國內(nèi)2元一張轉(zhuǎn)手賣上萬元,杭州門店曾有數(shù)百人通宵排隊

      一張“皮卡丘”8000萬?美網(wǎng)紅宣布將出手!國內(nèi)2元一張轉(zhuǎn)手賣上萬元,杭州門店曾有數(shù)百人通宵排隊

      揚子晚報
      2025-12-26 18:32:21
      張韶涵的渣女站姿火了!腿縫幾乎沒有間距,看得人眼睛都直了

      張韶涵的渣女站姿火了!腿縫幾乎沒有間距,看得人眼睛都直了

      TVB的四小花
      2025-12-03 14:33:08
      一位兩袖清風(fēng)的領(lǐng)袖,是如何用二十年搞垮一個發(fā)達(dá)國家

      一位兩袖清風(fēng)的領(lǐng)袖,是如何用二十年搞垮一個發(fā)達(dá)國家

      馬探解說體育
      2025-12-25 16:23:47
      高市早苗出招:拼速度的時刻到了!日本高層赴俄,在中國背后捅刀

      高市早苗出招:拼速度的時刻到了!日本高層赴俄,在中國背后捅刀

      天氣觀察站
      2025-12-27 04:30:22
      兩個事實證明,中國實際已經(jīng)控制了面積80平方公里的南沙五方礁?

      兩個事實證明,中國實際已經(jīng)控制了面積80平方公里的南沙五方礁?

      阿器談史
      2025-12-15 15:51:21
      這個時代的GOAT是誰?名將加內(nèi)特公開自己的答案:史蒂芬·庫里

      這個時代的GOAT是誰?名將加內(nèi)特公開自己的答案:史蒂芬·庫里

      體育妞世界
      2025-12-26 07:58:25
      2026年元旦不一般,有3個特點與往年大不同,別忘:吃3樣,做2事

      2026年元旦不一般,有3個特點與往年大不同,別忘:吃3樣,做2事

      小茉莉美食記
      2025-12-27 05:10:03
      終于有年輕人肯說心里話:圣誕節(jié)越來越冷清?是因為大家都覺醒了

      終于有年輕人肯說心里話:圣誕節(jié)越來越冷清?是因為大家都覺醒了

      神牛
      2025-12-25 13:49:01
      姜昆美國過圣誕僅1天,惡心的一幕出現(xiàn),郭德綱的話含金量還在升

      姜昆美國過圣誕僅1天,惡心的一幕出現(xiàn),郭德綱的話含金量還在升

      奇思妙想草葉君
      2025-12-25 23:39:02
      2025-12-27 05:59:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      14189文章數(shù) 66399關(guān)注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經(jīng)要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態(tài)度原創(chuàng)

      旅游
      親子
      家居
      教育
      軍事航空

      旅游要聞

      百年老街變身!上海新天地東臺里開業(yè),解鎖冬日消費新范式

      親子要聞

      2025年即將過去,準(zhǔn)備好一大波溫暖瞬間來襲

      家居要聞

      格調(diào)時尚 智慧品質(zhì)居所

      教育要聞

      英語口語速成方法!

      軍事要聞

      烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产999| 伊人久久亚洲中文字幕| 性欧美视频| 美女内射毛片在线看免费人动物 | 无码欧洲| 成人网站在线进入爽爽爽| 污污内射在线观看一区二区少妇| 欧美丝袜另类| 国产亚洲精品自在久久vr| 亚洲国产区男人本色| 大地资源网第二页免费观看| 91丨九色丨拳交| 蜜芽久久人人超碰爱香蕉| 精品三级av无码一区| 无码av波多野结衣| 日韩无码第2页| 国产丝袜在线播放| 人妻有码av中文字幕久久琪| 欧美疯狂做受xxxx高潮小说| 色五月丁香六月欧美综合| 新田县| 超碰人人摸| 乱女乱妇熟女熟妇综合网| 亚洲成人影片| 久久久久高潮毛片免费全部播放| 精品人妻一区二区三区奶水| 国产伦理自拍| jizzjizz亚洲| 久久中文字幕日韩无码视频| 全部av―极品视觉盛宴| 久久久无码精品午夜| 中文字幕精品aⅴ内射夜夜夜| 久久久久久性高| 秋霞av鲁丝片一区二区| 乱码午夜-极国产极内射| 国产av中文字幕| 无码h黄动漫在线播放网站| 国产午夜视频在线观看| 亚洲在线不卡| 色欲色香天天综合网| 人妻丰满熟妇aⅴ无码|