<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      徹底顛覆!谷歌4D世界模型來了,比SOTA快300倍!

      0
      分享至


      來源:新智元

      【導讀】谷歌 DeepMind 發布 D4RT,徹底顛覆了動態 4D 重建范式。它拋棄了復雜的傳統流水線,用一個統一的「時空查詢」接口,同時搞定全像素追蹤、深度估計與相機位姿。不僅精度屠榜,速度更比現有 SOTA 快出 300 倍。這是具身智能與自動駕駛以及 AR 的新基石,AI 終于能像人類一樣,實時看懂這個流動的世界。

      如果是幾年前,你問一位計算機視覺工程師:「我想把這段視頻里的所有東西——無論它是靜止的房子還是奔跑的狗——都在 3D 世界里重建出來,并且還能隨時知道它們下一秒會去哪兒,需要多久?」

      他大概會遞給你一根煙,讓你先去買幾塊頂級顯卡,然后給你畫一個由四五個不同模型拼湊起來的流程圖:先算光流,再算深度,再估相機位姿,最后還得用一晚上的時間去跑優化,祈禱結果別崩。

      但谷歌 DeepMind 剛剛發布的D4RT(Dynamic 4D Reconstruction and Tracking),試圖終結這種混亂。


      這篇論文在計算機視覺領域扔下了一枚關于「效率革命」的重磅炸彈。

      它把原本割裂的 3D 重建、相機追蹤、動態物體捕捉,統一成了一個極簡的「查詢」動作。


      更重要的是,它的速度比現有SOTA技術快了 18 到 300 倍


      如果在你的認知里,高質量的 4D 重建還是好萊塢特效工作室里那些昂貴且緩慢的渲染農場,耗費漫長的時間等待生成完畢,那么 D4RT 正在把這種能力變成一種可以塞進機器人大腦甚至 AR 眼鏡里的實時直覺。

      Demo 演示

      為了理解 D4RT 到底做到了什么,我們需要先看一眼它眼中的世界。

      在論文展示的演示中,最直觀的震撼來自于對「動態混亂」的駕馭能力。

      想象一下這個畫面:一只天鵝在水面上劃過,或者一朵花在風中快速綻放。

      傳統的 3D 重建算法(比如 MegaSaM 或 )處理這種場景通常是一場災難——因為它們假設世界是靜止的,所以它們往往會在 3D 空間里留下一串「重影」,就像老式膠片重疊曝光一樣,天鵝變成了長著幾十個脖子的怪物,或者花朵直接變成了一團無法辨認的噪點。

      但 D4RT 給出的結果極其干凈。

      它不僅可以精準還原天鵝的 3D 形態,還完美剝離了相機的運動和天鵝自身的運動。

      在它的視野里,時間變成了一個可以隨意拖動的滑塊。


      更令人印象深刻的是它的全像素追蹤能力。

      你可以點擊視頻中花瓣上的任意一個像素,D4RT 就能畫出這個點在過去和未來的完整 3D 軌跡,哪怕這個點在中間幾幀被蜜蜂遮擋了,或者跑到了畫面之外,模型依然能根據上下文「腦補」出它的去向。


      這種視覺效果給人的感覺是:AI 不再是在一幀幀地「看」視頻,而是把整段視頻吞下去,在大腦里生成了一個完整的、流動的全息全景圖,然后你可以隨意從任何角度、任何時間去檢視它。


      模型能力對比圖

      拆解「神話」

      是真的快,還是文字游戲?

      科技公司發論文,數據通常都很漂亮。

      作為觀察者,我們需要剝離 PR 濾鏡,看看數據背后的定語。

      谷歌聲稱 D4RT 比之前的 SOTA 快了300 倍,處理一分鐘的視頻只需要 5 秒鐘。

      這是真的嗎?

      答案是:在特定維度上,是真的。

      這里的「300倍」指的是吞吐量,具體來說是「在保持相同幀率(FPS)的前提下,模型能同時追蹤多少條 3D 軌跡」。

      • 數據對比:在 24 FPS 的標準電影幀率下,之前的強者 SpatialTrackerV2 只能同時追蹤84條軌跡,再多就卡了;而 D4RT 可以輕松處理1570條。如果是和 DELTA 這種更慢的模型比,那就是314 倍的差距。


      • 實際意義:這意味著之前的技術可能只能盯著畫面里的主角(比如一個人),而 D4RT 可以同時盯著背景里走動的路人、飄落的樹葉和遠處的車流——即所謂的「全像素級感知」。

      它比同類技術強在哪兒?

      目前市面上的 4D 重建技術主要分兩派:

      1. 「拼裝派」(如 MegaSaM):把深度估計、光流、分割等多個現成模型串起來。雖然效果不錯,但不僅慢,而且一旦一個環節出錯(比如光流飄了),后面全完。

      1. 「多頭派」(如 VGGT):雖然是一個大模型,但為了輸出不同的任務(深度、位姿、點云),需要掛載不同的解碼頭,結構臃腫。

      D4RT 的牛,在于它做到了架構層面的統一

      它不需要為深度單獨做一個解碼器,也不需要為位姿單獨做一個。

      它只用同一個接口解決所有問題。


      有沒有代價?當然有。

      D4RT 的「快」主要體現在推理階段。

      在訓練階段,它依然是一個龐然大物。它的編碼器使用了 ViT-g,擁有10 億參數,并且需要在 64 個 TPU 芯片上訓練兩天。

      這絕不是普通開發者在自家車庫里能復現的玩具,它是典型的「大廠重武器」。

      技術解碼

      把 4D 重建變成「搜索引擎」

      那么,D4RT 到底是怎么做到的?

      論文的核心邏輯可以用一句話概括:先全局「閱讀」視頻,再按需「搜索」答案。

      不再逐幀解碼,而是「全局記憶」

      傳統的視頻處理往往是線性的,處理第 10 幀時可能已經「忘」了第 1 幀的細節。

      D4RT 的第一步是使用一個巨大的 Transformer 編碼器(Encoder),把整段視頻壓縮成一個全局場景表征(Global Scene Representation, F)

      你可以把這個F想象成 AI 對這段視頻形成的「長期記憶」。

      一旦這個記憶生成了,原本龐大的視頻數據就被濃縮在了這里。

      「哪里不會點哪里」的查詢機制

      這是 D4RT 最天才的設計。它發明了一種通用的查詢(Query)語言。

      當 AI 想要知道某個像素的信息時,它會向解碼器(Decoder)發送一個查詢 q:

      這個公式翻譯成人話就是:

      請告訴我:在這一幀圖像上坐標為的那個點,它在這個時間時刻,如果從這個相機的視角看過去,它的 3D 坐標在哪里?」

      • 如果你想生成深度圖:就問「現在這個點在現在的相機里多遠?」(讓 )。

      • 如果你想做軌跡追蹤:就問「這個點在第 1 幀、第 2 幀……第 N 幀都在哪?」(固定 ,改變 )。


      • 如果你想重建點云:就問「視頻里所有點在同一時刻的世界坐標在哪?」(把所有點都映射到同一個 )。


      并行計算的藝術

      因為每一個查詢(Query)都是獨立的,D4RT 不需要像穿針引線一樣按順序計算。

      它可以一次性扔出幾萬個問題,利用 GPU/TPU 的并行能力同時算出答案。

      這就是為什么它能比別人快 300 倍的根本原因:它把一個復雜的串行幾何問題,變成了一個大規模并行的搜索問題。

      關鍵的「作弊」技巧:9x9 Patch

      論文作者還發現了一個有趣的細節:如果只告訴解碼器坐標點,AI 有時候會「臉盲」,分不清紋理相似的區域。

      于是,他們在查詢時順便把那個像素點周圍9x9的小方塊圖像(RGB Patch)也喂給了模型。


      這就像是你讓人在人群中找人,光給個坐標不行,還得給他一張那個人臉部的特寫照片。

      消融實驗證明,這個小小的設計極大地提升了重建的銳度和細節。


      產業影響

      谷歌的野心與具身智能的眼睛

      D4RT 的出現,對谷歌現有的業務版圖和未來的 AI 戰略有著極強的互補性。

      具身智能與自動駕駛的最后一塊拼圖

      現在的機器人之所以笨,很大程度上是因為它們「看不懂」動態環境。

      一個掃地機器人能避開沙發,但很難預判一只正在跑過來的貓。

      D4RT 提供的實時、密集、動態的 4D 感知,正是機器人急需的技能。

      它能讓機器人理解:那個東西不僅現在在那里,而且下一秒它會出現在我左邊。

      對于自動駕駛而言,這種對動態物體(如行人、車輛)的像素級軌跡預測,是提升安全性的關鍵。

      增強現實(AR)的基石

      谷歌一直在 AR 領域尋找突破口(從當年的谷歌眼鏡,到現在的 Project Astra)。

      要在眼鏡端實現逼真的 AR,必須要有極低延遲的場景理解。

      D4RT 展示的高效推理能力(尤其是在移動端芯片上的潛力),讓「實時把虛擬怪獸藏在真實沙發后面」變得在工程上可行。

      對普通人的影響

      視頻編輯的「魔法化」

      對于普通用戶,這項技術最快落地的場景可能是手機相冊和視頻編輯軟件。

      想象一下,你拍了一段孩子踢球的視頻。

      有了 D4RT,你可以像在《黑客帝國》里一樣,在視頻播放過程中隨意旋轉視角(盡管你拍攝時并沒有移動),或者輕易地把路人從復雜的背景中「扣」掉,甚至改變視頻中光源的方向。

      這是 D4RT 這種 4D 重建技術成熟后的應用之一。

      結語

      D4RT 讓我們看到了一種新的可能性:AI 對世界的理解,正在從二維的「圖像識別」跨越到四維的「時空洞察」。

      它告訴我們,要看清這個流動的世界,關鍵不在于每一幀都看得多仔細,而在于如何建立一個能夠隨時回應疑問的全局記憶。

      AI的眼中,過去并沒有消逝,未來也不再不可捉摸,它們只是同一個四維坐標系里,等待被查詢的兩個不同參數而已。

      參考資料:

      https://d4rt-paper.github.io/

      https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/

      https://storage.googleapis.com/d4rt_assets/D4RT_paper.pdf

      為偉大思想而生!

      AI+時代,互聯網思想(wanging0123),

      第一必讀自媒體

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      云南“14歲男生奸殺同班女生”被判無期,受害人家屬將申請抗訴

      云南“14歲男生奸殺同班女生”被判無期,受害人家屬將申請抗訴

      新京報
      2026-04-28 19:36:18
      穆斯卡特完成自救,海港兩人讓人感到意外,依舊是爭冠最大熱門

      穆斯卡特完成自救,海港兩人讓人感到意外,依舊是爭冠最大熱門

      體壇風之子
      2026-04-28 07:00:11
      公開曬結婚證!趙露思:我會一直一直保護你的幸福

      公開曬結婚證!趙露思:我會一直一直保護你的幸福

      黔鄉小姊妹
      2026-04-28 08:16:52
      曝南京“小潘記鴨血粉絲”老板去世,59歲年掙千萬,疑高血壓導致

      曝南京“小潘記鴨血粉絲”老板去世,59歲年掙千萬,疑高血壓導致

      裕豐娛間說
      2026-04-28 10:15:07
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      山西突發重大命案!33歲未婚男殺害離婚女后潛逃,逃跑畫面流出

      山西突發重大命案!33歲未婚男殺害離婚女后潛逃,逃跑畫面流出

      老貓觀點
      2026-04-28 07:34:27
      畸形母愛毀星二代:母乳12年同床15年荒唐事

      畸形母愛毀星二代:母乳12年同床15年荒唐事

      看盡落塵花q
      2026-04-25 14:10:18
      這都行?李瑋鋒停賽 寧波大勝!梅州洋帥被打下課,張效瑞樂開花

      這都行?李瑋鋒停賽 寧波大勝!梅州洋帥被打下課,張效瑞樂開花

      刀鋒體育
      2026-04-28 12:33:25
      醫生發現:老人若長時間不吃甜食,用不了多長時間身體有5大改善

      醫生發現:老人若長時間不吃甜食,用不了多長時間身體有5大改善

      芹姐說生活
      2026-04-23 15:04:44
      倫敦世乒賽又“作妖”!逼出國乒“最強大腦”!

      倫敦世乒賽又“作妖”!逼出國乒“最強大腦”!

      最愛乒乓球
      2026-04-29 00:07:34
      網傳五一后醫療行業被查,醫護人員人心惶惶,評論區呼聲十分強烈

      網傳五一后醫療行業被查,醫護人員人心惶惶,評論區呼聲十分強烈

      譚談社會
      2026-04-27 23:01:22
      別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

      別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

      職場資深秘書
      2026-04-28 22:32:48
      安徽省立醫院十大“王牌醫生”,江淮地區疑難重癥就醫收藏!

      安徽省立醫院十大“王牌醫生”,江淮地區疑難重癥就醫收藏!

      鬼菜生活
      2026-04-29 02:00:47
      陜西女子莫名當上成都5家公司老板,官方:組成聯合調查組開展核查

      陜西女子莫名當上成都5家公司老板,官方:組成聯合調查組開展核查

      界面新聞
      2026-04-28 21:53:37
      倫敦世乒賽住宿條件曝光,松島輝空教練崩潰吐槽!國乒自帶蘭州拉面真香!

      倫敦世乒賽住宿條件曝光,松島輝空教練崩潰吐槽!國乒自帶蘭州拉面真香!

      乒乓樂園
      2026-04-29 00:05:07
      正式官宣!26歲孫穎莎喜訊震撼公布,熱議刷屏,期待已久終到來

      正式官宣!26歲孫穎莎喜訊震撼公布,熱議刷屏,期待已久終到來

      乒乓樂園
      2026-04-29 00:03:55
      百度發全員信通知職級體系大調整

      百度發全員信通知職級體系大調整

      財聯社
      2026-04-28 10:53:07
      越南國家主席夫人:我一定會回來的

      越南國家主席夫人:我一定會回來的

      中國日報網
      2026-04-27 18:35:12
      辟謠帖:日本對公職人員巨額財產來源不明,有哪些刑事處罰?

      辟謠帖:日本對公職人員巨額財產來源不明,有哪些刑事處罰?

      生活時尚導刊
      2026-04-28 11:14:39
      伊朗被大量未售出的石油淹沒,廢棄儲油罐已重啟

      伊朗被大量未售出的石油淹沒,廢棄儲油罐已重啟

      新浪財經
      2026-04-28 15:40:36
      2026-04-29 05:19:00
      互聯網思想 incentive-icons
      互聯網思想
      AI時代,互聯網思想觀察
      2434文章數 16907關注度
      往期回顧 全部

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      體育要聞

      魔術黑八活塞,一步之遙?!

      娛樂要聞

      蔡卓妍官宣結婚,老公比她小10歲

      財經要聞

      中央政治局會議定調,八大看點速覽!

      汽車要聞

      拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

      態度原創

      本地
      親子
      數碼
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      親子要聞

      拍這期視頻時眼淚止不住地流

      數碼要聞

      機械革命蒼龍16 / 18 Pro游戲本RTX 5070 12GB款開啟預約

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      德國總理默茨:美國正遭受伊朗領導層的羞辱

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕无码家庭乱欲| 亚洲人妻无码一区| 精品国产乱码久久久久乱码| 亚洲精品一区二区三区中文字幕| 波多野结衣一区二区三区高清av| 五月综合激情婷婷六月色窝| 人人妻人人澡人人爽国产一区| 国产tsAV| 伊人色综合久久天天五月婷| 中文字幕日韩精品人妻| 欧美午夜精品| 欧美精品久久久久久久久46P| 桦甸市| 野花日本大全免费观看10电影| 亚洲一区国色天香| 亚洲 欧美 清纯 校园 另类| 精品乱码久久久久久中文字幕| 欧美人人妻人人澡人人尤物| 999无码精品亚洲精品日韩人妻无码| 吉木萨尔县| 色欲αv一区二区三区天美传媒| 欧美人精品人妻在线| 中文成人在线| 九色精品国产亚洲av麻豆一| ****亚洲成a人片第1集| 浮山县| 中文字幕一区二区三区日韩精品| 亚洲中文字幕日韩精品| 两个人日本www免费版| 国语精品国内自产视频| 久久草网站| 尤物在线观看国产精品| 天天燥日日燥| 色一情一乱一伦一区二区三欧美| 国产日韩精品欧美一区喷水| 欧美日韩在线视频一区| 日韩精品国产另类专区| 日韩肏屄| 无码国产欧美一区二区三区不卡| 东京热av无码一区二区 | 日韩大香蕉|