<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      別被「更像真的視頻」騙了,AI視頻生成,還遠未真正學會物理世界

      0
      分享至



      這兩年,視頻生成模型進步很快。清晰度更高了,鏡頭更穩(wěn)了,人物和場景看上去也越來越自然。很多時候,我們判斷一個模型強不強,看的就是它 “像不像真的”。但這其實只回答了一半的問題:它看起來像真的,不代表它真的符合現(xiàn)實世界的物理規(guī)律。這件事放在短視頻生成里,也許只是 “偶爾有點怪”;但如果視頻模型真的要往 world model、仿真系統(tǒng)、具身智能這些方向走,問題就不一樣了。一個模型如果連物體怎么接觸、狀態(tài)怎么變化、事件怎么按因果順序發(fā)生都搞不清楚,那它再像,也只是像。



      現(xiàn)在的視頻評測,更像是在比 “好不好看”

      目前,視頻生成領域常見的評測方式,要么看自動指標,要么讓人直接選 “哪個視頻更好”。這種方式當然有意義,它能比較清晰度、流暢度、觀感這些東西,但它很難告訴你:視頻里到底有沒有違反基本物理常識

      比如,一個物體是不是無緣無故消失了;兩個東西是不是明明沒接觸卻發(fā)生了交互;一個動作的結果是不是和前面的過程根本對不上。這些問題,才真正關系到模型是在 “生成一個像真的畫面”,還是在 “模擬一個可信的世界”。

      Physion-Eval:從 “視覺真實” 走向 “物理真實” 的新 benchmark

      這篇工作提出了Physion-Eval。它不是再做一個 “誰的視頻更好看” 的排行榜,而是想認真回答一個更關鍵的問題:AI 生成的視頻,在物理層面到底有多真實



      • 論文標題: Physion-Eval: Evaluating Physical Realism in Generated Video via Human Reasoning
      • 作者: Qin Zhang, Peiyu Jing, Hong-Xing Yu, Fangqiang Ding, Fan Nie, Weimin Wang, Yilun Du, James Zou, Jiajun Wu, and Bing Shuai
      • 作者單位:Physion Labs,斯坦福大學,MIT,哈佛大學,Character AI
      • 論文鏈接: https://arxiv.org/abs/2603.19607
      • 數(shù)據(jù)集鏈接: https://huggingface.co/datasets/PhysionLabs/Physion-Eval
      • 視頻鏈接:https://www.youtube.com/watch?v=Vbn_W3WNUHw

      這個 benchmark 同時覆蓋第一人稱和第三人稱場景,包含10,990 條專家推理軌跡,覆蓋22 類細粒度物理現(xiàn)象。和常見評測不太一樣的地方在于,這里的每條樣本不只是簡單打個分,而是會標出錯誤發(fā)生在什么時候、屬于哪一類問題,以及為什么不對

      數(shù)據(jù)上,第三人稱部分來自WISA-80K,第一人稱部分基于EPIC-KITCHENS構建。為了保證標注質(zhì)量,論文組織了90 位具有 STEM 背景并接受過本科物理訓練的專家標注者,采用雙人標注和資深專家裁決的流程,最后得到的是帶時間戳、錯誤類別和文字解釋的高質(zhì)量標注。

      在這一過程中,人類智能所展現(xiàn)出的優(yōu)勢尤為明顯:人類不僅能夠識別視覺上的異常,更能夠基于物理直覺與因果理解,對復雜的動態(tài)過程進行推理和解釋。相比之下,即使是當前最先進的多模態(tài)模型,在時序一致性、交互合理性以及隱含物理規(guī)律的判斷上,仍存在明顯不足。





      最直接的結論:現(xiàn)在的模型,還遠談不上 “物理一致”

      這篇工作的主結論其實很簡單,也很扎眼:在物理過程敏感的場景里,83.3% 的第三人稱生成視頻和 93.5% 的第一人稱生成視頻,都至少包含一個人類可以明確識別的物理錯誤。這說明什么?說明今天的視頻模型確實越來越會制造 “真實感” 了,但離 “真正符合物理規(guī)律” 還有很遠。



      而且這些錯誤不是零零散散的小毛病,而是系統(tǒng)性的。論文里總結的典型問題包括:接觸或交互失敗、對象突然出現(xiàn)或消失、時間連貫性崩塌、因果順序錯亂、材料或狀態(tài)變化異常、幾何碰撞不合理等等。換句話說,問題不只是 “畫面有點假”,而是模型對物體、接觸、運動和結果之間最基本的關系,還經(jīng)常搞錯。



      很多錯誤不是粗糙,而是 “看著像,但其實完全不對”

      Physion-Eval 里最有意思的地方,其實是那些具體例子。它們不是那種一眼就看出來的低級 bug,而是第一眼好像還行,仔細一想?yún)s明顯不符合常識。

      比如,桌面上突然多出一把本來不存在的刀;瓶口朝下,液體卻不往下流;水直接穿過鍋底;又或者一個鍋被兩根手指以幾乎不可能的方式拎起來。它們的問題不在于 “渲染不精細”,而在于直接違背了物體守恒、重力、不可穿透性和穩(wěn)定接觸這些最基本的物理規(guī)律。

      這也是為什么我們覺得,這項工作不只是 “又多了一個 benchmark”。它更像是在提醒大家:今天很多模型也許已經(jīng)很會生成 “像真的視頻”,但還遠沒有學會 “世界為什么會這樣動”。





      更麻煩的是,連最強的多模態(tài)模型也不太會看這些錯誤

      論文還問了另一個很現(xiàn)實的問題:那能不能讓現(xiàn)在的大模型來當 “自動評委”,替人判斷一個視頻有沒有物理問題?

      答案是,暫時還不行。

      文章評估了10 個開源和閉源的 MLLM critic,結果顯示,它們和人類判斷之間還有明顯差距。以Gemini 3.0 Pro為例,它會漏掉超過74.4% 的第三人稱錯誤視頻和 90.1% 的第一人稱錯誤視頻。而且它們不只是漏檢,還會把錯誤發(fā)生的時間說錯,甚至編出根本不存在的原因。

      這點其實很關鍵。因為如果以后大家真想靠自動 critic 去評估 world model 或視頻生成系統(tǒng),那 critic 本身至少得先真的看懂視頻里的物理過程。就目前來看,人類判斷依然是最可靠的標準。









      越是高動態(tài)的物理過程,越容易暴露當前模型的短板

      論文進一步從physical intensitydynamics兩個維度分析了生成模型與市面上已有的 MLLM critic 的表現(xiàn)。結果表明,相比強度大小,過程本身的動態(tài)性和復雜性更容易暴露視頻生成模型的物理建模缺陷。對 MLLM critic 來說也是如此:只有當錯誤足夠明顯時,它們才會表現(xiàn)出有限的判斷能力,但整體仍明顯落后于人類。







      總結

      Physion-Eval 想指出的,不只是 “現(xiàn)在的視頻生成模型還不夠強”,而是一個更根本的問題:當行業(yè)越來越關注視頻 “看起來有多真” 的時候,我們可能忽略了它 “實際上對不對”

      對于真正想做 world model、機器人、具身智能和仿真的人來說,這個問題繞不過去。畫面更清晰、動作更順滑,當然重要;但如果物體會無故出現(xiàn),液體不會往下流,動作結果和前因對不上,那模型就還沒有真正學會世界的運行方式。

      視頻生成下一階段,也許不該只繼續(xù)卷觀感,而應該更認真地去解決物體持續(xù)性、接觸關系、狀態(tài)變化、時序一致性和因果結構這些更本質(zhì)的問題。“看起來對”,從來不等于 “實際上對”

      作者介紹

      本文由來自美國頂級科技公司與世界一流高校的豪華作者陣容共同完成,集結 Physion Labs、斯坦福大學、MIT、哈佛大學及 Character AI 的核心研究者。其中,Physion Labs 團隊(Qin Zhang、Peiyu Jing、Bing Shuai)長期專注于生成式視頻與世界模型中的物理一致性問題,構建了面向行業(yè)的評估基礎設施與數(shù)據(jù)閉環(huán),致力于成為下一代生成模型的 “物理可信層”。其余作者包括斯坦福大學的 Hong-Xing Yu、Fan Nie、James Zou、Jiajun Wu,麻省理工學院的 Fangqiang Ding,哈佛大學的 Yilun Du,以及 Character AI 的 Weimin Wang 等業(yè)內(nèi)頂尖學者。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      看來美帝是真的準備打地面戰(zhàn)爭了

      看來美帝是真的準備打地面戰(zhàn)爭了

      仰望星空的一粒沙子
      2026-04-04 19:18:21
      聯(lián)合國警告特朗普政府:若襲擊伊朗民用設施 或構成戰(zhàn)爭罪

      聯(lián)合國警告特朗普政府:若襲擊伊朗民用設施 或構成戰(zhàn)爭罪

      新京報
      2026-04-07 20:17:06
      張學良得知楊虎城一家被殺細節(jié),不相信是蔣所為,見楊后人極冷漠

      張學良得知楊虎城一家被殺細節(jié),不相信是蔣所為,見楊后人極冷漠

      大千世界觀
      2026-04-06 21:40:05
      發(fā)達了!廣西一男子全包家族清明拜祖費用,網(wǎng)友:這就是光宗耀祖

      發(fā)達了!廣西一男子全包家族清明拜祖費用,網(wǎng)友:這就是光宗耀祖

      火山詩話
      2026-04-07 18:41:53
      中國已通知俄羅斯,愿意將俄羅斯公民免簽政策延長一年?外交部回應

      中國已通知俄羅斯,愿意將俄羅斯公民免簽政策延長一年?外交部回應

      環(huán)球網(wǎng)資訊
      2026-04-07 15:25:14
      教育部發(fā)布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

      教育部發(fā)布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

      笑熬漿糊111
      2026-04-05 00:05:25
      浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

      浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

      阿器談史
      2026-04-02 13:31:44
      連燒30小時!百億航母變廢鐵?5700人全被扣押,福建艦成全球唯一

      連燒30小時!百億航母變廢鐵?5700人全被扣押,福建艦成全球唯一

      小熊侃史
      2026-04-07 10:29:19
      突發(fā)!北京又一大型商場即將閉店!

      突發(fā)!北京又一大型商場即將閉店!

      大北京早知道
      2026-04-07 16:14:42
      伊朗首都響起密集爆炸聲

      伊朗首都響起密集爆炸聲

      北青網(wǎng)-北京青年報
      2026-04-07 16:18:04
      4 種最佳抗衰老的運動,平均壽命延長5-10年

      4 種最佳抗衰老的運動,平均壽命延長5-10年

      增肌減脂
      2026-04-07 21:15:04
      14分鐘兩次離譜錯判!U20女足進球被吹,對手后衛(wèi)手球被無視

      14分鐘兩次離譜錯判!U20女足進球被吹,對手后衛(wèi)手球被無視

      奧拜爾
      2026-04-07 21:25:48
      清明節(jié),兒子寫燒給母親的祭文,看哭了14億中國人!

      清明節(jié),兒子寫燒給母親的祭文,看哭了14億中國人!

      每日一首古詩詞
      2026-04-05 06:07:07
      霍爾木茲海峽,大消息!特朗普發(fā)聲!伊朗回應!黃金、白銀、美股,跳水!原油飆漲

      霍爾木茲海峽,大消息!特朗普發(fā)聲!伊朗回應!黃金、白銀、美股,跳水!原油飆漲

      證券時報e公司
      2026-04-07 22:06:55
      王楚欽奪得世界杯冠軍成全了多少人?樊振東張本智和都得發(fā)來賀電

      王楚欽奪得世界杯冠軍成全了多少人?樊振東張本智和都得發(fā)來賀電

      羅納爾說個球
      2026-04-06 16:43:41
      東北3歲小網(wǎng)紅繼續(xù)做吃播,父母是真不想上班

      東北3歲小網(wǎng)紅繼續(xù)做吃播,父母是真不想上班

      九方魚論
      2026-04-07 05:02:58
      從權傾朝野到滿門抄斬,他的九十歲老母都被砍頭示眾!

      從權傾朝野到滿門抄斬,他的九十歲老母都被砍頭示眾!

      歷史按察使司
      2026-04-07 12:41:15
      海康威視辟謠“300人被帶走”,在伊朗無相關業(yè)務

      海康威視辟謠“300人被帶走”,在伊朗無相關業(yè)務

      局市
      2026-04-07 18:20:19
      董宇輝爭議言論炸上熱搜,人設大反轉!

      董宇輝爭議言論炸上熱搜,人設大反轉!

      陳意小可愛
      2026-04-07 18:09:49
      日媒:日本一老人在景點與女子發(fā)生爭執(zhí)啃咬對方手臂,被捕后短時間內(nèi)死亡,警方正調(diào)查死因

      日媒:日本一老人在景點與女子發(fā)生爭執(zhí)啃咬對方手臂,被捕后短時間內(nèi)死亡,警方正調(diào)查死因

      環(huán)球網(wǎng)資訊
      2026-04-07 11:12:37
      2026-04-07 23:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12701文章數(shù) 142616關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

      頭條要聞

      特朗普恐嚇4小時摧毀伊朗 伊朗稱"打穿"海法未見攔截

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      健康
      時尚
      數(shù)碼
      家居
      軍事航空

      干細胞抗衰4大誤區(qū),90%的人都中招

      120元和120分鐘,哪個更奢侈?

      數(shù)碼要聞

      OPPO ColorOS共創(chuàng)者星球2026年第1期高票建議采納情況公布

      家居要聞

      雅致愜意 感知生活之美

      軍事要聞

      美軍營救飛行員出動155架飛機

      無障礙瀏覽 進入關懷版