<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

^{<blockquote id="bw8db"><i id="bw8db"></i></blockquote>}<p id="bw8db"></p>

^{<blockquote id="bw8db"></blockquote>}

<cite id="bw8db"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

英偉達Jim Fan：「世界建模」是新一代預訓練范式

2026-02-05 23:23:52　來源: 量子位

北京舉報

0

分享至

henry 發自凹非寺
量子位 | 公眾號 QbitAI

繼“下一個詞預測”之后，世界建模將成為新的預訓練范式。

這是英偉達機器人主管Jim Fan給出的最新判斷。

他認為，2026年將成為大世界模型（Large World Models）真正為機器人領域以及更廣義的多模態AI奠定基礎的第一年。

謝賽寧隨即轉發表示贊同：“事后看來顯而易見”。

在這篇長文中，Jim Fan討論了世界模型的定義與應用，尤其聚焦于物理AI領域的發展，同時展望了新的推理形式：

世界建模（world modeling）是在給定一個動作的條件下，預測下一個合理的世界狀態（或一段更長時間范圍內的狀態）。
當前世界模型的主要炒作集中在AI視頻領域，而2026年將迎來物理AI的爆發。
世界模型需要更廣義的預訓練目標：下一個世界狀態不應只包含RGB，還必須覆蓋3D運動、本體感覺與觸覺。
將出現一種新的推理形式：在視覺空間中的思維鏈，而非語言空間中的思維鏈。

以下為分享全文：

第二個預訓練范式

下一個詞預測(Next word prediction )曾是第一個預訓練范式，而現在我們正在經歷第二次范式轉變：

世界建模（world modeling），或者說“下一個物理狀態預測”

很少有人真正理解這一轉變的深遠意義。不幸的是，目前世界模型最被炒作的應用仍然是AI視頻（接下來可能是游戲）。

我非常有信心地說：2026年將成為大世界模型（Large World Models）首次為機器人領域，以及更廣義的多模態 AI 奠定真實基礎的一年。

在這個背景下，我將世界建模定義為：在給定一個動作的條件下，預測下一個合理的世界狀態（或一段更長時間范圍內的狀態）。

視頻生成模型是其中的一種實現形式，其中“下一個狀態”是一系列RGB幀（通常為 8–10 秒，最長可達數分鐘），而“動作”是一段描述要執行什么的文本。

訓練過程就是對數十億小時視頻像素的未來變化進行建模。

本質上，視頻世界模型就是可學習的物理模擬器和渲染引擎。

它們能夠捕捉反事實情景（counterfactuals），即預測如果采取不同動作，未來可能會如何不同——這就是推理。世界模型從根本上以視覺為中心。

相比之下，VLM本質上是以語言為中心的。從最早的原型（e.g. LLaVA, Liu et al. 2023）開始，整體路徑基本一致：視覺在編碼器處進入，然后被送入語言主干網絡。

隨著時間推移，編碼器不斷改進，架構變得更簡潔，視覺試圖變得更加“原生”（如全模態模型）。

然而，視覺仍然是二等公民，無法與領域多年構建的LLM能力相比。（LLM)這條路線方便，因為我們熟LLM的擴展性，架構設計、數據配方、評測指標（如 VQA）都高度優化為語言服務。

對于物理AI來說，2025年以VLA為主：在預訓練VLM上接入機器人動作解碼器。

嚴格來說，它更像是 “LVA”：語言 > 視覺 > 動作，等級遞減。

方便是方便，但VLM中大多數參數用于知識（例如“這一團像素是可口可樂品牌”），而不是物理（“如果你傾倒可樂瓶，它會灑成棕色水洼，弄臟白色桌布，還可能損壞電機”）。

VLA的設計在知識檢索上很強，但物理能力分配不足。多階段嫁接的設計，也違背我對簡潔優雅的偏好。

從生物學角度看，視覺主導了我們的皮層計算。大約三分之一的大腦皮層用于在枕葉、顳葉和頂葉區域處理像素。

相比之下，語言依賴于一個相對緊湊的區域。視覺是連接我們大腦、運動系統和物理世界的最高帶寬通道。它閉合了“感知—運動回路（sensorimotor loop）”——這是機器人最需要解決的回路，而且在中間不需要語言。

自然界給了我們一個最具說服力的例證：高靈巧物理智能幾乎不依賴語言——猿類。

我見過猿類駕駛高爾夫球車，用螺絲刀更換剎車片，動作就像人類機械師一樣。

它們的語言理解能力不超過BERT或GPT-1，但它們的物理技能遠遠超過我們當前最先進的機器人。

猿類可能沒有優秀的語言模型，但它們顯然擁有對“如果……會怎樣”的穩健心理表征：即對物理世界如何運作、以及在其干預下會如何反應的理解。

世界建模的時代已經到來。

這是帶著苦澀教訓的時代。正如Jitendra常提醒我們這些“擴展成癮者”：

監督是AI研究者的鴉片。

YouTube的海量視頻和智能眼鏡的興起，將以遠超文本訓練規模的原始視覺流捕捉世界。

我們將看到一種新的預訓練形式：下一個世界狀態將不只包含RGB——3D空間運動、本體感覺和觸覺感知才剛剛開始。

我們將看到一種新的推理形式：在視覺空間中的思維鏈，而不是語言空間中的思維鏈。

你可以通過模擬幾何關系和接觸來解決物理謎題，想象物體如何移動和碰撞，而無需將其翻譯成字符串。語言是一種瓶頸，是一種腳手架，而不是基礎。

我們將面臨一系列新的潘多拉盒問題：即便未來模擬完美，動作該如何解碼？

像素重建真的是最優目標，還是應該進入其他潛在空間？需要多少機器人數據？遠程操作的擴展是否仍然可行？

完成這些之后，我們是否終于迎來機器人領域的GPT-3時刻？

Ilya 說得沒錯：AGI尚未收斂。我們又回到了研究時代，而沒有什么比挑戰第一性原理更讓人興奮的了。

世界模型作為新的范式

總體來看，這篇新文章可以被看作是Jim Fan在2025年機器人年終總結中第三點的延伸與展開。

當時，他提出：基于VLM的路線，本質上主要服務于語言和知識，而不是物理世界本身

那時，他已經把問題說得很直白：

VLM的參數主要面向語言和知識，而非物理世界。

視覺編碼器在訓練中會主動丟棄細節，但機器人操作恰恰依賴這些細節。

因此，VLA并不會隨著VLM的scale自然增強。

而最近這篇關于world modeling（世界建模）的長文，則可以看作是Jim Fan對這一判斷的系統性展開與進一步思考。

對于他的觀點，業內大佬和網友也紛紛表達了看法。

來自Google DeepMind的Genie 3聯合負責人、世界模型團隊負責人Jack Parker-Holder也在轉發分享了他對世界模型應用場景的理解：

世界模型本身就是一類全新的基礎模型。它們既服務于交互式媒體（視頻模型），也服務于具身AGI。世界模型是連接虛擬與物理兩個領域的橋梁，其真正價值在于跨任務、跨領域的泛化能力。

換句話說，就像LLM作為基座模型既能編程又能解數學題一樣，放到世界模型上，視頻生成與具身操控也可以兼容

而谷歌、英偉達等玩家，也都在虛擬游戲、視頻以及物理機器人領域同步布局。

不過，前英偉達機器人研究主管Arsalan Mousavian也提醒：

對于大型世界模型（LWM）來說，這是一個非常棒的愿景，但從像素到物理的躍遷仍然很陡峭。

要讓世界模型成為可靠的動作生成骨干，還必須解決以下問題：

幾何一致性：確保運動學和物體恒常性在物理上成立。
同一性保持：避免跨實體的幻覺預測，例如機器人A在預測過程中突然變成機器人B。
推理速度：降低實時循環延遲。大型世界模型計算量大、延遲高，而機器人需要高頻率響應。
動作采樣：世界模型可以預測結果，但我們仍然需要對動作進行采樣。

在數據量和計算需求上，這一目標將使當前的動作策略擴展（action-policy scaling）顯得相對溫和。

此外，jim fan提到的視覺推理也引發廣泛討論：

推理不一定非得依賴語言——視覺模擬（幾何、接觸、運動）本身就能構成推理過程。

機器人正是視覺為中心的基礎模型大顯身手的完美舞臺。2026將是多模態、多輪交互代理（機器人/CUA）之年，而這一場比賽的勝者，必然會在游戲中更加重視視覺模態。

猿猴的比喻非常貼切。我們太過癡迷語言，以至于忘記了靈巧的行動能力并不一定需要詞匯量。2026年或許是機器人技術最終停止依賴語言模型，轉而構建原生系統的一年。

而除開英偉達、谷歌等巨頭在世界模型技術路線的押注外，商業層面也在快速推進——

一周前，李飛飛創辦的World Labs正以約50億美元估值進行新一輪融資，規模最高可達5億美元。

LeCun前段時間創辦AMI Labs（Advanced Machine Intelligence，AMI）也吸引了包括Cathay Innovation在內的潛在投資者，傳聞其融資估值可能達到35億美元。

參考鏈接：https://x.com/DrJimFan/status/2018754323141054786

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

中國常駐聯合國代表傅聰重申：日本沒資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
4593 跟貼 4593
中國游客稱因道路積雪被困俄羅斯“極光村” 超40小時，俄媒：滯留游客都已離開

上游新聞 2026-02-17 20:22:05
24829 跟貼 24829

痛心！樹齡1200年古樟持續燃燒7小時，只因倆小孩隨手扔爆竹

環球網資訊 2026-02-21 10:22:16
625 跟貼 625

人氣火爆！江蘇無錫一景區發布限流公告

現代快報 2026-02-19 22:42:05
591 跟貼 591
硅谷大佬拒絕握手，印度AI峰會“槽點”不斷

第一財經資訊 2026-02-20 21:10:47
433 跟貼 433

哈爾濱冰雪大世界臨時閉園2天，網友稱有冰雕開始融化，客服稱正在修整，重新開園后門票降價100元

極目新聞 2026-02-19 23:22:54
309 跟貼 309

特斯拉新車正式下線：無方向盤、無踏板、無后視鏡；定價不高于3萬美元，“不需要人開，直接輸入目的地即可”

中國能源網 2026-02-20 19:18:19
1720 跟貼 1720
訂單排到4月！山東福安達春節不打烊全力趕生產

齊魯壹點 2026-02-20 18:07:10
239 跟貼 239

柬埔寨向26國通報

澎湃新聞 2026-02-21 02:12:47
159 跟貼 159
美國2025年國內生產總值（GDP）增長2.2%，低于2024年的2.8%

每日經濟新聞 2026-02-20 21:43:05
201 跟貼 201
大超市爆改文商旅綜合體，“金陵長樂坊”開市首日人氣爆棚

現代快報 2026-02-19 22:53:05
602 跟貼 602
一天涌入20.4萬人！無錫到處都在排隊！

江南晚報 2026-02-20 18:33:51
355 跟貼 355
大年初五迎財神，馬年理財錢投哪？

上觀新聞 2026-02-21 12:09:05
36 跟貼 36
中國短道速滑隊創28年來最差戰績，“王濛說簽生死狀復出”登上熱搜第一，不是說遺憾，是滑得太難看了！

大象新聞 2026-02-21 15:44:03
3 跟貼 3
美航天局：載人繞月任務發射將于3月6日進行

央視新聞客戶端 2026-02-21 07:43:36
681 跟貼 681
英媒：英國政府考慮立法取消安德魯王位繼承權

環球網資訊 2026-02-21 07:10:25
82 跟貼 82
韓國歷史學家：韓中兩國需共同調研抗日斗爭史

澎湃新聞 2026-02-21 11:42:58
6 跟貼 6
罄！告急！有跨省回上海返程機票高達11560元

新民晚報 2026-02-21 12:30:00
0 跟貼 0
俄戰略轟炸機在白令海完成計劃飛行有外國戰機伴飛

界面新聞 2026-02-20 20:37:08
396 跟貼 396
iPhone 18 Pro續航有望再突破：三大升級加持

環球網資訊 2026-02-21 09:39:01
85 跟貼 85
走進春天，觸摸這躍動的生命圖景

海外網 2026-02-21 15:07:09
4 跟貼 4
溫州景區一幕！寶馬車主太囂張

溫百君 2026-02-21 16:50:13
0 跟貼 0
33.9萬！火鍋店稱把春節4天盈利分給員工，老板：去年關了兩家店但春節福利要堅持

紅星新聞 2026-02-21 10:12:08
0 跟貼 0
沒想到，這事兒驚動了新華社！

鈞言堂 2026-02-21 16:45:17
0 跟貼 0

一個拉鏈，短短7秒的畫面，竟然值100萬美元？

一個拉鏈，短短7秒的畫面，竟然值100萬美元？

眼界看視野

2026-02-20 15:26:33

超越國界！蘇翊鳴激動擁抱日本女選手，感恩日本教練培養

超越國界！蘇翊鳴激動擁抱日本女選手，感恩日本教練培養

米修體育

2026-02-20 16:12:13

整容成癮、拋妻娶粉？“消失”的宋小寶，終究為曾經的荒唐買了單

整容成癮、拋妻娶粉？“消失”的宋小寶，終究為曾經的荒唐買了單

啟迪你的思維

2026-02-02 20:56:29

父親葬禮收了近4萬份子錢！山東網友哭訴，沒有一個是因自己來的

父親葬禮收了近4萬份子錢！山東網友哭訴，沒有一個是因自己來的

火山詩話

2026-02-21 11:45:52

萊奧：伊布曾因輸掉訓練賽，拒絕同隊的青年球員再次參加合練

萊奧：伊布曾因輸掉訓練賽，拒絕同隊的青年球員再次參加合練

懂球帝

2026-02-21 16:31:05

今晚吉林省有大范圍降雪！局部有大到暴雪！

今晚吉林省有大范圍降雪！局部有大到暴雪！

吉刻新聞

2026-02-21 16:09:21

五五分流為什么分不下去了？背后的真相

五五分流為什么分不下去了？背后的真相

楓冷慕詩

2026-01-24 13:09:19

“這種兒子，直接用鋼筋揍！”家長曬農村兒子現狀，網友忍無可忍

“這種兒子，直接用鋼筋揍！”家長曬農村兒子現狀，網友忍無可忍

妍妍教育日記

2026-01-08 20:37:01

金價一夜大反轉！2月20日全國金店最新價出爐，入手的最佳時機？

金價一夜大反轉！2月20日全國金店最新價出爐，入手的最佳時機？

奇思妙想生活家

2026-02-20 21:34:24

揭秘《飛馳人生3》斷層領先原因：這就是韓寒價值觀的勝利

揭秘《飛馳人生3》斷層領先原因：這就是韓寒價值觀的勝利

人格志

2026-02-18 20:52:58

煙酒不離身卻拿下59塊金牌，23歲選擇退役，今63歲仍為國家做貢獻

煙酒不離身卻拿下59塊金牌，23歲選擇退役，今63歲仍為國家做貢獻

寒士之言本尊

2025-12-24 12:26:45

很多人低估了一萬塊的威力

洞見

2026-01-12 20:34:37

TOP14位身高170以上的女神，有顏有燈有演技

TOP14位身高170以上的女神，有顏有燈有演技

素然追光

2026-01-02 02:45:02

黃曉明公開回應“在澳門輸掉十幾億”：是AI生成的虛假內容

黃曉明公開回應“在澳門輸掉十幾億”：是AI生成的虛假內容

大象新聞

2026-02-21 15:28:04

你是否也經常往馬桶里倒水？這樣做看似環保，實則危險重重

你是否也經常往馬桶里倒水？這樣做看似環保，實則危險重重

爆炸營養彭鑫蕊

2026-02-20 16:07:19

劉衛東“受賄數額特別巨大”是怎么回事？

劉衛東“受賄數額特別巨大”是怎么回事？

雪中風車

2026-02-20 22:18:22

研究顯示：“獵鷹9”火箭解體致高空大氣鋰原子濃度飆升10倍

研究顯示：“獵鷹9”火箭解體致高空大氣鋰原子濃度飆升10倍

界面新聞

2026-02-20 16:34:02

14億人“生死”交給外資？若自來水和食鹽被控制，后果有多嚴重？

14億人“生死”交給外資？若自來水和食鹽被控制，后果有多嚴重？

云景侃記

2026-02-04 22:34:38

2023年，985女碩士王懿在東京活活餓死，父母拒絕為其收尸

2023年，985女碩士王懿在東京活活餓死，父母拒絕為其收尸

談史論天地

2026-02-18 17:45:40

李亞鵬前妻帶娃回村過年，山里蓋三層小樓，院子大到能遛彎

李亞鵬前妻帶娃回村過年，山里蓋三層小樓，院子大到能遛彎

松林侃世界

2026-02-20 20:37:08

追蹤人工智能動態

12186文章數 176389關注度

往期回顧全部

科技要聞

智譜上市1月漲5倍，市值超越京東、快手

頭條要聞

在貝加爾湖遇難的3名中國游客身份已確認：系一家人

頭條要聞

在貝加爾湖遇難的3名中國游客身份已確認：系一家人

體育要聞

冬奧第一"海王"？一人和13國選手都有關系

娛樂要聞

鏢人反超驚蟄無聲拿下單日票房第二！

財經要聞

一覺醒來，世界大變，特朗普改新打法了

汽車要聞

比亞迪的“顏值擔當”來了方程豹首款轎車路跑信息曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

游戲

旅游

手機

公開課

親子要聞

放寒假別老催著孩子寫作業了，跳繩機會來了！

萬幸中的不幸！男子情人節收到游戲但沒有光盤！

旅游要聞

海鷗翩躚賀新歲來青島開啟海上歡樂新春之旅

手機要聞

vivo產品線結構分析，走量最大的是這個檔次

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="qarqa"></sub>

<sub id="qarqa"></sub>