<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      世界模型的下一個階段是什么?智源研究院給出了答案

      0
      分享至


      智東西
      作者 王涵
      編輯 漠影

      你一定在科幻電影中看到過這樣的情節:主角不小心進入了游戲世界,在3D虛擬的場景中探索、漫步。

      如今,這不再是只能幻想的場景。世界模型的出現,給這一情節帶來了更多在現實中實現的可能性。

      經過一年時間的打磨,10月底,智源研究院發布了新一代原生多模態世界模型“悟界·Emu3.5”

      性能上,相較上一版本,Emu3.5在超過13萬億token的大規模多模態數據基礎上展開訓練,其視頻數據訓練量時長從15年提升到790年,參數量從8B上升至34B

      在不犧牲性能的前提下,Emu3.5每張圖片的推理速度提升了近20倍,首次使自回歸模型的生成效率達到頂尖的閉源擴散模型的水平。

      智東西獲得了Emu3.5的內測資格,第一時間對其文生圖和圖片編輯功能進行了實測。

      首先是文生圖功能,我們輸入提示詞如下:

      在一個充滿活力的廚房場景中,大窗戶外可見郁郁蔥蔥的綠植。兩個動畫角色并排站著。左邊是一個擬人化的狐貍模樣的生物,有著橙色的皮毛、白色的腹部和一雙富有表現力的大眼睛,脖子上系著一條綠色的圍裙。右邊是一個年輕女孩,棕色的頭發扎成了辮子,穿著黃色的襯衫,外面套著一件藍綠色的圍裙。兩個角色似乎都在忙著做飯,背景中掛著各種廚房用具、鍋以及橙子、大蒜等食材。整個環境明亮又歡快,陽光透過外面的樹葉灑進來。圖像中沒有可見的文字。

      不到一分鐘,Emu3.5就生成了一副很“迪士尼風”的圖畫。畫面顏色明亮輕快,小女孩和狐貍都和提示詞形容的十分相似,畫面光影、比例和構圖都很協調。


      圖片編輯方面,我們上傳了一張小松鼠的照片,要求Emu3.5將畫面中的小松鼠提取出來,背景換成雪地場景。


      原圖片中,小松鼠和背景色調一致,肉眼都容易看不清楚,Emu3.5卻十分精準地識別出了小松鼠的形象。其生成的圖片光影、結構準確,連陽光照射在雪地上的反光都十分逼真,在畫面的前方和后方背景,還實現了相機般的虛化效果。


      此外,Emu3.5還能修改圖片視角。我們上傳了一張仰視的鼓樓夜景照片,要求Emu3.5將這張照片轉化為一只鳥的視角:


      Emu3.5不僅能精準實現視角切換,其“下一階段預測”范式更使其具備自動補全周邊環境畫面的能力,表現就像一臺置于真實場景中的相機。


      此外,Emu3.5還可以更改畫面中主體的位置關系和動作形態,比如讓小狗擁抱小貓:


      識別數字和計數一直是多模態模型的弱點,Emu3.5卻可以精準識別將圖片中的標號,將指定序號的掛畫換成另外一張海報:


      在畫面中加入一個物體也不在話下,Emu3.5可以直接將魔方放置在圖片場景中,并且會根據場景的光線和風格自動調整物體的色調,不會出現“不在一個圖層”的效果。


      再比如,Emu3.5還可以修復老照片,還原老照片本來的顏色和質感:


      當然,作為世界模型,Emu3.5也可以創造出一個“世界”。

      例如,我們讓Emu3.5生成了一個臥室照片。接著,點擊繼續探索,要求Emu3.5更走近一些。通過一步一步地變換視角,Emu3.5就可以生成一個完整的“世界”:


      除了變換視角,Emu3.5還可以“預測”圖片場景100年后的樣子:


      該模型延續了將圖像、文本和視頻等多模態數據統一建模的核心思想,并在“Next-Token Prediction”范式的基礎上,模擬人類自然學習方式,以自回歸方式實現了對多模態序列的“Next-State Prediction(NSP)”,從而獲得了可泛化的世界建模能力。

      那么,NSP是怎么實現的?Emu3.5和其他世界模型有什么不一樣的地方?除了生成圖片和“世界”Emu3.5還能用在哪里?我深扒了“悟界·Emu3.5”的技術報告,給你一一解答。

      一、直接預測下一個狀態,厲害在哪?

      李飛飛在她的自傳《我看見的世界》中寫到,5.43億年前,地球上的生物生活在原始海洋中,沒有感官和知覺,因此也沒有大腦。后來,“寒武紀生命大爆發”時期到來,生物進化歷程從此開始狂飆。

      動物學家安德魯·帕克認為,“寒武紀生命大爆發”之所以會發生,其實是因為生物開始具備“光敏感性”,這也是現代眼睛形成的基礎。

      簡單來說,生命爆發進化是從“看見”開始的。那如果將這個進化路徑放在AI上呢?

      在Emu的技術溝通會上,王仲遠博士也提出了類似的看法,他說:“人類的學習,不是從文本學習開始的。我們每一個人從出生開始,跟其他人的交流,認識物理世界的運行規律,都是從視覺開始的。”

      Emu3.5的訓練數據中包含超13萬億多模態token,其中視頻數據時長累計有790年,覆蓋教育、科技、How-to、娛樂等多領域。與傳統方法不同,Emu3.5的訓練語料庫旨在捕捉長時程、交錯的多模態語境。

      具體而言,該子集來源于大規模互聯網視頻的連續視頻幀和時間對齊的音頻轉錄文本,這些內容本身就保留了時空連續性、跨模態對齊性和語境連貫性。


      在訓練框架上,Emu3.5基于單一自回歸Transformer架構,采用端到端原生多模態建模,無需依賴擴散模型或組合式方法,就實現了圖像、文本、視頻等多模態數據的“大一統”處理。

      進而,在大規模多模態數據和Next-Token Prediction(NTP,下一個token預測)的基礎上,Emu3.5擴展出“Next-State Prediction(NSP,下一狀態預測)”即直接預測多模態序列的完整動態狀態,而非孤立token。


      NSP厲害就厲害在,它可以讓模型從多模態數據中自主學習世界的動態規律,例如物理動態、時空連續性、因果關系,進而實現“理解——預測——規劃”的完整能力。

      NSP還能將高層意圖轉化為可執行的多步行動路徑,接受指令后,Emu3.5能基于視頻中學到的 “物體移動規律”,規劃符合物理邏輯的連貫步驟,這正是AI從“感知”進化為“認知”的核心標志


      為了提高推理效率,研究團隊提出了離散擴散自適應(DiDA)方法,它將逐token解碼轉換為雙向并行預測,在不犧牲性能的情況下,將單圖像推理速度提升了約20倍。

      研究團隊還構建了多維度獎勵系統,對NSP的 “多步驟規劃準確性”“因果邏輯連貫性” 進行定向優化,提升了Emu3.5的步驟分解與物理規律匹配度。

      從性能表現來看,當前Emu3.5參數量為340億,訓練所用視頻數據累計時長達790年,僅占全互聯網公開視頻數據的1%以下,但模型性能已達到“產品級”水準。

      “自回歸架構”+“大規模強化學習訓練”+“下一狀態預測”(NSP)范式,至此,Emu3.5找到了多模態世界模型的Scaling Law方向,多模態模型性能可以像大語言模型(LLM)一樣,隨計算和參數規模的增長而可預測地提升。

      “Emu3.5很可能開啟了第三個Scaling范式。”王仲遠博士這樣形容Emu3.5,毫不夸張。

      二、教機器人抓拿握,不用再不同場景分開學了

      正是因為在“下一狀態預測”上的技術突破,EMU3.5 模型具備了學習現實世界物理動態與因果的能力,展現出對復雜動態世界進行預測和規劃的能力。這就讓EMU3.5可以在具身智能方面大展身手。

      在場景應用層面,模型可實現跨場景的具身操作,具備泛化的動作規劃與復雜交互能力,并能在世界探索中保持長距離一致性與可控交互,兼顧真實與虛擬的動態環境,實現自由探索與精準控制。


      據介紹,Emu3.5已經開始了在具身智能方面的實踐探索。

      過去,數據采集多局限于固定場景,機器人真機只能采集到具體有限的數據,通過Emu3.5它可以產生泛化的數據,使得模型產生了泛化的能力。

      而得益于Emu系列采用的自回歸架構,其可擴展性極強,并且能夠支持視覺與文字Token的輸出。這能夠極大的提高模型,包括具身機械人、機械手臂,實際場景中處理泛化性的能力,自然而然就會推動整個具身更快進入一些真實的場景中

      在真實場景測試中,應用Emu3.5后,未知場景中,機器人行動的表現成功率可直接達到70%,而其他模型的表現成功率往往接近零。

      “泛化”這一方向就是是智源研究院的重點發力的領域,目前正進一步擴大技術驗證規模,在真機上對各類場景展開嘗試。

      三、只有原生多模態大模型,才能讓AI感知世界、理解世界

      從上文中對Emu3.5的技術解讀不難發現,智源研究院一直堅持的技術路線核心就是“原生多模態”

      從Emu3到Emu3.5,模型均采用單一自回歸Transformer架構,實現圖像、文本、視頻數據的 “端到端統一處理”,無需依賴擴散模型(DiT)或混合架構,從底層解決 “多模態數據對齊” 與 “跨模態推理” 的核心痛點。


      智源研究院的研究團隊認為,世界模型不等同于視頻預測模型。真正的世界模型應該理解“杯子掉落→破碎”“點燃木頭→燃燒”等深層因果關系,并且可以“舉一反三”,將一個場景中的能力泛化到其他場景,真正做到像人一樣思考。

      原生多模態大模型的研發,能夠把多模態的理解和多模態的生成統一起來。智源研究院認為,只有這樣,才能夠真正讓AI看到、感知、理解這個世界,才能夠讓AI真正進入物理世界,真正解決現實生活中更多現實的問題。

      結語:世界模型進入“下一個狀態預測”范式

      從“下一Token預測”邁向“下一個狀態預測”,Emu3.5的發布標志著世界模型的發展進入了一個新階段。

      其意義不僅在于視頻生成功效的提升,更在于通過“原生多模態”與“下一狀態預測”的路徑,讓模型獲得了對物理世界動態與因果關系的深層理解能力。這為AI在真實場景中實現可靠的規劃與決策奠定了基礎。

      在行業落地上,這一能力更是直接瞄準了具身智能、自動駕駛和工業仿真等行業的痛點。在這些領域,AI不僅需要“看得見”,更需要“看得懂”,并能預測“接下來會發生什么”。

      隨著“狀態預測”范式的確立,世界模型的技術競爭正從“生成質量”的比拼,升級為“世界理解深度”的較量。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      太突然!溫州這16所學校關閉

      太突然!溫州這16所學校關閉

      住溫網
      2025-12-17 10:05:36
      日媒:針對山上徹也槍殺安倍晉三一案,檢方建議判處被告無期徒刑

      日媒:針對山上徹也槍殺安倍晉三一案,檢方建議判處被告無期徒刑

      環球網資訊
      2025-12-18 14:55:32
      為什么說彭德懷是中華民族的脊梁?他身上的這幾種品質太寶貴

      為什么說彭德懷是中華民族的脊梁?他身上的這幾種品質太寶貴

      健康快樂丁
      2025-12-18 09:04:29
      一個奇怪的現象:50歲以后的人,能活到90歲的,基本上50歲的時候,就戒掉了這3件蠢事,尤其是最后一件事!

      一個奇怪的現象:50歲以后的人,能活到90歲的,基本上50歲的時候,就戒掉了這3件蠢事,尤其是最后一件事!

      東林夕亭
      2025-11-19 08:41:35
      太離譜了!楊鳴被驅逐原因曝光,揮拳捶打裁判臀部,離場口吐芬芳

      太離譜了!楊鳴被驅逐原因曝光,揮拳捶打裁判臀部,離場口吐芬芳

      宗介說體育
      2025-12-18 11:30:33
      群體狂熱中那個“不敬禮”的人,到底有多了不起!

      群體狂熱中那個“不敬禮”的人,到底有多了不起!

      尚曦讀史
      2025-12-12 09:11:04
      抵制孫繼海!董路:既然他公開下場+與流量乞丐為伍 我也不拘著了

      抵制孫繼海!董路:既然他公開下場+與流量乞丐為伍 我也不拘著了

      風過鄉
      2025-12-18 08:22:31
      趙薇低調回老家探親,怕被人認出,全副武裝就連指甲油都抹去了

      趙薇低調回老家探親,怕被人認出,全副武裝就連指甲油都抹去了

      娛樂團長
      2025-12-18 11:41:49
      泰國定義柬埔寨園區為“犯罪團伙”,國人卻稱他們為“電詐人員”

      泰國定義柬埔寨園區為“犯罪團伙”,國人卻稱他們為“電詐人員”

      清書先生
      2025-12-17 17:32:36
      真實的陶淵明:晚年為生存乞討,5個兒子無一成才,63歲活活餓死

      真實的陶淵明:晚年為生存乞討,5個兒子無一成才,63歲活活餓死

      玥來玥好講故事
      2025-12-10 20:33:51
      福建板塊走強 海峽創新20cm漲停

      福建板塊走強 海峽創新20cm漲停

      每日經濟新聞
      2025-12-18 13:28:02
      跌慘了!從單價5.7萬跌至2.2萬抄底,南京某頭部板塊房價跳水…

      跌慘了!從單價5.7萬跌至2.2萬抄底,南京某頭部板塊房價跳水…

      火山詩話
      2025-12-17 18:50:24
      接連造謠,日本副外相“刪號跑路”!

      接連造謠,日本副外相“刪號跑路”!

      環球時報國際
      2025-12-18 00:04:26
      今晚,珠海全市夜查!

      今晚,珠海全市夜查!

      珠海發布
      2025-12-18 09:41:05
      安徽健美冠軍王昆去世后續:30歲疑患甲流仍堅持高強度訓練

      安徽健美冠軍王昆去世后續:30歲疑患甲流仍堅持高強度訓練

      王嚾曉
      2025-12-17 07:34:59
      中方一錘定音,在日大熊貓提前回國,中日53年熊貓外交成絕響

      中方一錘定音,在日大熊貓提前回國,中日53年熊貓外交成絕響

      樂天閑聊
      2025-12-16 11:22:49
      27歲廣東女孩“巧巧妹妹”去世,從小被媽媽拋棄,體重僅剩35斤

      27歲廣東女孩“巧巧妹妹”去世,從小被媽媽拋棄,體重僅剩35斤

      180視角
      2025-12-18 15:42:25
      被抵毀的“東南互保”:實質是不抵抗的愛國

      被抵毀的“東南互保”:實質是不抵抗的愛國

      深度報
      2025-11-17 23:00:01
      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當場愣了

      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當場愣了

      罪案洞察者
      2025-09-16 14:31:27
      陪玩陪睡只是冰山一角,認干爹,舔手指,拜高踩低,實在荒唐!

      陪玩陪睡只是冰山一角,認干爹,舔手指,拜高踩低,實在荒唐!

      探長影視解說
      2025-12-18 15:47:16
      2025-12-18 16:35:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      10927文章數 116928關注度
      往期回顧 全部

      科技要聞

      新一代AI創業大賽頒獎典禮暨AI投資論壇

      頭條要聞

      上海一高層居民樓有186個充電艙 居民稱睡"炸藥包"上

      頭條要聞

      上海一高層居民樓有186個充電艙 居民稱睡"炸藥包"上

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      內娛解約大戰:鞠婧祎和絲芭,誰是狼人

      財經要聞

      重大改革,身關14億人的政策徹底變了!

      汽車要聞

      開箱日產大沙發 精致辦公or躺平追劇 哪個更適配?

      態度原創

      健康
      教育
      旅游
      房產
      藝術

      這些新療法,讓化療不再那么痛苦

      教育要聞

      人社部舉辦2025年全國人力資源市場高校畢業生就業服務專項行動

      旅游要聞

      五知堂在練塘?它在每一個停下腳步聆聽和感知的意象中

      房產要聞

      太強了!封關時刻,兩天砸下50億!央企綠發,重倉三亞!

      藝術要聞

      卡洛斯·杜蘭:不只是薩金特的老師!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 末成年娇小性色xxxxx| 国产麻豆成人传媒免费观看| 亚欧色一区w666天堂| 痉挛高潮喷水av无码免费| 成人欧美日韩一区二区三区| av免费网站| 亚洲成人久| 亚洲中文字幕精品久久| 老鸭窝在钱视频| 欧美射图| 尹人成人| 乱人伦??国语对白| 欧美日韩国产码高清| 激情内射亚州一区二区三区爱妻| jizzjizz亚洲| 巴林左旗| 国产v亚洲v天堂无码久久久| 欧美亚洲一区二区三区| 国产精品自在自线免费观看| 一区二区三区国产| 国产色视频一区二区三区| 欧美自拍嘿咻内射在线观看| 韩国精品一区二区三区| 中文字幕国产av| 91乱子伦国产乱子伦海的味道| 97精品超碰一区二区三区| 国产精品综合色区av| 熟妇人妻系列aⅴ无码专区友真希| 精品久久久久久无码专区不卡| 亚洲精品一区中文字幕乱码| 亚洲成a人片在线观看中| 日逼| 酒店大战丝袜高跟鞋人妻| 天堂中文8资源在线8| 精品香蕉在线视频| 一本大道人妻中字幕在线视频| 欧美xxxxx高潮喷水| 久久久久人妻精品区一| 无码少妇人妻| 水蜜AⅤ视频一区二区三区| 狠狠躁夜夜躁人人爽蜜桃|