<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      智源研究院王仲遠(yuǎn):訓(xùn)練仍有巨大的Scaling空間 | MEET2026

      0
      分享至

      編輯部 整理自 MEET2026
      量子位 | 公眾號 QbitAI

      全球互聯(lián)網(wǎng)的文本數(shù)據(jù)已基本挖掘完畢,但視頻數(shù)據(jù)還未被充分利用。

      智源研究院的多模態(tài)世界模型悟界·Emu3.5,就是一個從視頻中學(xué)習(xí),而非僅依賴文本的大模型。

      在量子位MEET2026智能未來大會上,北京智源人工智能研究院院長王仲遠(yuǎn)提到:

      • 當(dāng)前人工智能正處于第三次浪潮的關(guān)鍵拐點:大模型不僅推動AI從弱智能向通用智能跨越,更有望讓機器人從1.0專用時代邁入2.0通用時代。

      為此,智源研究院發(fā)布“悟界”系列大模型,錨定AI從數(shù)字世界進入物理世界的核心方向。

      智源的Emu3.5與具身大腦全棧技術(shù)體系,就成為支撐這一技術(shù)演進趨勢的兩大基石。



      MEET2026智能未來大會上,王仲遠(yuǎn)還說,要實現(xiàn)AI與物理世界的深度交互,需突破多模態(tài)理解與具身執(zhí)行的核心技術(shù)瓶頸。

      目前,悟界系列已在多模態(tài)學(xué)習(xí)范式、跨機器人本體適配等領(lǐng)域取得關(guān)鍵進展,且多項成果已開源開放,助力產(chǎn)業(yè)協(xié)同創(chuàng)新。

      為了完整體現(xiàn)王仲遠(yuǎn)的思考,在不改變原意的基礎(chǔ)上,量子位對演講內(nèi)容進行了編輯整理,希望能給你帶來更多啟發(fā)。

      MEET2026智能未來大會是由量子位主辦的行業(yè)峰會,近30位產(chǎn)業(yè)代表與會討論。線下參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關(guān)注與報道。

      核心觀點梳理
      • 當(dāng)下人工智能處于第三次浪潮的重要拐點,大模型推動其從弱人工智能邁向通用人工智能,推動機器人從1.0專用機器人時代進入2.0通用具身智能時代。
      • 視頻是能夠大規(guī)模獲得的模擬真實世界的高效載體,同時包含時間、空間、物理、因果關(guān)系以及意圖等各種要素。
      • 2025年往后,第三代Scaling范式的關(guān)鍵在多模態(tài)。智源研究院的悟界·Emu3.5,通過統(tǒng)一的自回歸架構(gòu),將大語言模型的Next-Token Prediction升級為在多模態(tài)數(shù)據(jù)上進行Next-State Prediction,預(yù)示著AI從語言學(xué)習(xí)邁入多模態(tài)世界學(xué)習(xí)的新階段。
      • 目前的具身大模型依然是不好用、不通用、不易用。不好用,指的是具身大模型還沒有達到ChatGPT時刻;不通用,指的是很多模型只能適用一個本體或者同一個品牌的本體;不易用,指的是大腦、小腦以及本體之間的適配度還是不夠高。
      • 智源研究院從成立起堅持開源開放,過去兩年多開源200多個模型,涵蓋語言模型、多模態(tài)模型、具身模型等,全球下載量突破6.9億次;開源100多個數(shù)據(jù)集,涵蓋語言、語音、圖像、視頻和具身智能等,全球下載量超過400萬次,僅在11月底開源的一個具身數(shù)據(jù)集下載量已超百萬次。

      以下為演講全文。

      從數(shù)字世界到物理世界:AI迎來第三次浪潮關(guān)鍵拐點

      今天想和大家分享的是智源研究院在“推動人工智能從數(shù)字世界邁向物理世界”上的一些最新科研進展。

      我們知道當(dāng)下人工智能正處于第三次浪潮中的重要的拐點。

      過去幾年,大模型的爆發(fā)讓AI從原來的弱人工智能時代邁向通用人工智能時代,也有望推動機器人從1.0時代進入到2.0時代,也就是從專用的機器人到通用的具身智能。

      基于對這一趨勢的預(yù)判,在今年的智源大會上,智源研究院也發(fā)布了“悟界”系列大模型

      如果說四年前所發(fā)布的“悟道”系列大模型開啟了中國大模型時代——“悟道”的“道”代表我們對大語言模型方法和路徑的探索,那么“悟界”系列大模型代表了我們對于人工智能從數(shù)字世界進入到物理世界這一趨勢的判斷——“悟界”的“界”代表智源對于虛實世界邊界的不斷突破。

      今天我想重點跟大家分享兩方面的進展:

      一個是在我們在多模態(tài)世界模型上的突破,另外是具身大腦的全棧技術(shù)體系的成型



      Emu3.5:從長視頻中學(xué)習(xí)物理世界動態(tài)

      在今年的10月30日,智源研究院發(fā)布了悟界·Emu3.5,這是一個多模態(tài)的世界模型的基座。

      Emu3.5用一個單一的Transformer基座能完成多樣化的能力,它跟其他一些大模型最重要的區(qū)別是,它是從長視頻中進行學(xué)習(xí)

      我們知道文字和語言是人類智慧的結(jié)晶,是人類知識的總結(jié)。大語言模型的成功得益于從文字中學(xué)到了智能,學(xué)到了邏輯推理的能力,但全世界只有一個互聯(lián)網(wǎng),文本的數(shù)據(jù)已經(jīng)被基本使用殆盡,這也是為什么這一兩年可以看到像大語言模型的預(yù)訓(xùn)練已經(jīng)開始進入到比較緩慢的階段。

      另外一方面,如果人工智能要從數(shù)字世界進入到物理世界,不僅僅需要理解文字,還要理解整個世界運行的規(guī)律,需要能夠處理圖像、聲音等各種各樣模態(tài)的信息。

      視頻是目前能夠大規(guī)模獲得的,同時包含時間、空間、物理、因果關(guān)系、意圖等各種要素的、能夠高效模擬真實世界的載體。



      我們知道大語言模型最重要的能力是對下一個詞元(Next-Token)進行預(yù)測,Emu3.5一個非常重要的能力,就是從長視頻中來進行學(xué)習(xí),也正是由于這樣的訓(xùn)練范式,使得我們能夠從Next-Token Prediction升級到Next-State Prediction,能夠?qū)ο乱粋€時空狀態(tài)進行預(yù)測。

      我們相信人工智能在未來這幾年會從“語言學(xué)習(xí)”進入到“多模態(tài)世界學(xué)習(xí)”的新階段。

      為了實現(xiàn)這一目標(biāo),對比上一個版本,Emu3.5在各方面都有了大幅提升,比如訓(xùn)練數(shù)據(jù)集中視頻的總量,從原來的15年上升到了790年,參數(shù)量從原來的8B提升到了34B。

      Emu3.5所采用的是全自回歸的架構(gòu),自回歸架構(gòu)與Diffusion和Diffusion Transformer的架構(gòu)相比,其實在圖像、視頻等多模態(tài)的生成速度上,是有比較明顯劣勢的,但在Emu3.5中,通過我們自研的DiDA技術(shù),每一張圖片的生成速度能夠提升約20倍,使得自回歸模型文生圖速度與世界頂級模型模型媲美。

      基于以上突破,我們相信Emu3.5開啟了第三個的Scaling范式。

      剛才前面兩位演講嘉賓也提到,現(xiàn)在整個Scaling確實進入到緩慢的階段。前幾年是大語言模型的預(yù)訓(xùn)練的Scaling,過去這兩年是后訓(xùn)練的Scaling,在多模態(tài)這塊,由于我們知道海量的多模態(tài)數(shù)據(jù)還沒有被有效地使用,因此依然有非常大的Scaling的空間。

      更為關(guān)鍵的是,像Emu3.5采用的是自回歸的架構(gòu),因此能夠復(fù)用現(xiàn)有所有針對大語言模型的基礎(chǔ)設(shè)施,并且Emu3.5現(xiàn)在才只是34B的模型,對比大語言模型依然有千億、萬億的廣闊空間。

      目前,Emu3.5科研體驗版已經(jīng)向公眾開放,歡迎大家體驗。

      這里我也簡單介紹一下,請看大屏幕中展示的Emu3.5生成的例子。文生圖方面,模型可以生成非常精美的圖片,各種細(xì)節(jié)非常豐富。在圖像編輯任務(wù)中,Emu 3.5展現(xiàn)了非常強的多模態(tài)理解能力。



      比如說在左上角的例子,我們給了一個指令,“把問號的區(qū)域換成合適的顏色”,模型能夠通過語義推理填充符合邏輯的顏色;再比如中間的例子,指令是“將批改的卷子還原,把手寫的部分去除”,這要求模型首先要識別出哪些屬于手寫的部分。右下角的例子里,我們給了一張圖片,要求“換成一個俯瞰的視角”,模型非常好地展示出俯瞰視角的形象。可以看到,Emu3.5具備了很好的多模態(tài)推理和視覺理解能力。

      近期,像Gemini 3 pro和Nano Banana pro相繼發(fā)布,在業(yè)界引發(fā)關(guān)注,其實之前我們把Emu3.5跟Nano Banana第一代做了對比,能力旗鼓相當(dāng)。針對最新發(fā)布的Pro版本,我們正在進行各項能力的評估與測試,這邊展示其中部分結(jié)果。

      在一些虛擬轉(zhuǎn)現(xiàn)實、尤其涉及到時間空間下一個狀態(tài)預(yù)測的任務(wù)上面,Emu3.5的表現(xiàn)可圈可點。

      比如說在這個例子里,將摩托車的模型草稿圖轉(zhuǎn)成現(xiàn)實,我們可以看到Nano Banana還是做了很多偏離原圖的“自由發(fā)揮”,觀察細(xì)節(jié)可以看到與原圖的差異還是比較明顯的。Emu3.5則更好地保持了一致性。



      再比如說左右視角轉(zhuǎn)換,因為Emu3.5是從視頻中學(xué)習(xí),它對物理世界,對于時間、空間、物理的知識有了更加充分地理解,所以能夠達到更好的理解和生成的效果。對于預(yù)測下一個狀態(tài)的任務(wù),從下面這個例子可以非常明顯地看出來,Emu3.5預(yù)測狀態(tài)的正確性和邏輯性具有顯著優(yōu)勢。



      除了圖像生成和圖像編輯以外,Emu3.5還具備長時空序列的視覺故事生成,視覺指導(dǎo)(圖文說明書)生成的能力,所有這些都是“世界模型”的核心要素。大家可以通過Demo了解更多。

      更為關(guān)鍵的是,Emu3.5是全開源的模型。

      具身大腦全棧技術(shù):破解機器人“不通用、不易用”難題

      Emu3.5解決的是世界基座模型的能力,人工智能要進入到物理世界,很重要的是跟硬件結(jié)合,像具身智能。

      在具身智能上,智源研究院主要通過在數(shù)據(jù)和模型上進行破局,我們知道現(xiàn)在整個具身大模型依然不好用、不通用、不易用。

      “不好用”是指具身大模型上沒有迎來“ChatGPT的時刻”,“不通用”是指很多模型只適用于一個本體或者同一個品牌的本體,“不易用”指的是大腦、小腦以及本體之間的適配難度還是比較高的。

      今年我們智源研究院構(gòu)建了以具身大腦Robo Brain為核心,自底向上的全棧的技術(shù)體系。

      比如說,我們能夠?qū)崿F(xiàn)跨各種機器人異構(gòu)本體的數(shù)據(jù)采集以及數(shù)據(jù)標(biāo)準(zhǔn)化。在此基礎(chǔ)上,構(gòu)建了具身大腦模型、具身小腦VLA基座模型,以及具身智能評測、端云協(xié)同部署框架等,所有這一切都能夠為整個產(chǎn)業(yè)加速發(fā)展,起到實質(zhì)性的助力作用。

      在今年智源大會上,我們還發(fā)布了RoboBrain2.0的版本,展示了模型能夠?qū)⑷祟悘?fù)雜指令進行拆解,根據(jù)現(xiàn)場空間環(huán)境分解指令,并且分配給不同類型的機器人進行執(zhí)行的具身大腦的能力。

      同樣,這種交互與理解能力,其實不僅僅用在執(zhí)行上,在導(dǎo)覽導(dǎo)購一些場景也有非常多的可以落地的應(yīng)用。

      在9月份的時候,我們也發(fā)布了具身小腦的基座模型,RoboBrain-X0,這是一個能夠在零樣本泛化、少量樣本微調(diào)條件下,驅(qū)動多種不同真實機器人完成復(fù)雜任務(wù)的跨本體基座大模型。11月20日的智源具身開放日上,我們發(fā)布了升級版X0-Pro,能夠執(zhí)行更加復(fù)雜的指令。

      在人形機器人領(lǐng)域,全身控制也是非常重要的能力。前兩個月大家可能有在網(wǎng)上看到一條非常火的視頻,我們用一個35千克的G1機器人拉動1.4噸的汽車。背后驅(qū)動這臺機器人的,就是全身控制框架BAAI Thor,它也驅(qū)動機器人實現(xiàn)了連續(xù)28個空翻的高難度全身控制。



      開源開放

      在11月20日的智源具身開放日上,我們也開源了一個高質(zhì)量的雙臂操作數(shù)據(jù)集,短短20天內(nèi)全球下載量突破了130萬次,我想,這就是智源研究院對于整個行業(yè)實實在在的貢獻。

      當(dāng)然不僅僅在具身智能,實際上智源研究院從成立的第一天開始,就堅持開源開放。

      我們在過去兩年多開源了200多款模型,涵蓋大語言模型、多模態(tài)模型、具身模型等,全球下載總量已經(jīng)突破了6.9億次。數(shù)據(jù)集也開放了近百個,涵蓋語言、語音、圖像、視頻和具身智能等,全球下載量超過了400萬次。

      除了開源,我們也積極跟產(chǎn)業(yè)里的各方進行合作,比如在具身智能上,智源現(xiàn)在已經(jīng)跟國內(nèi)頭部30余家機器人企業(yè)和機構(gòu)開展合作,我們也希望能夠與更多的大公司和創(chuàng)業(yè)公司開展合作,共同推動具身智能世界模型的發(fā)展。

      以上就是我的分享,謝謝大家。


      — 完 —

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      鶴羽說個事
      2025-12-29 15:38:35
      劉邦為呂雉洗腳,發(fā)現(xiàn)足底黑痣,當(dāng)夜血洗皇后寢宮,14宮人喪命

      劉邦為呂雉洗腳,發(fā)現(xiàn)足底黑痣,當(dāng)夜血洗皇后寢宮,14宮人喪命

      星宇共鳴
      2025-12-26 10:06:16
      天大的鍋!費德勒因瑞士旅游熱潮遭祖國政府高層批評

      天大的鍋!費德勒因瑞士旅游熱潮遭祖國政府高層批評

      網(wǎng)球之家
      2025-12-29 13:19:18
      被處分僅1月,張水華官宣新賽事!時間線曝光,白巖松果然沒說錯

      被處分僅1月,張水華官宣新賽事!時間線曝光,白巖松果然沒說錯

      李健政觀察
      2025-12-29 16:32:30
      政壇頂級抽象:愛潑斯坦案機密,被網(wǎng)友一秒破解

      政壇頂級抽象:愛潑斯坦案機密,被網(wǎng)友一秒破解

      酷玩實驗室
      2025-12-29 11:28:42
      可以「追殺」徐鶯,誰敢奈何「康生」?

      可以「追殺」徐鶯,誰敢奈何「康生」?

      家傳編輯部
      2025-12-28 09:37:04
      李宗仁歸國之后,希望能出任人大副委員長一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

      李宗仁歸國之后,希望能出任人大副委員長一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

      史海孤雁
      2025-12-25 16:48:16
      五點圍島 解放軍的兩面“盾牌”有何玄機?

      五點圍島 解放軍的兩面“盾牌”有何玄機?

      看看新聞Knews
      2025-12-29 23:41:03
      《新聞聯(lián)播》放了這段畫面!無人機俯瞰臺北101

      《新聞聯(lián)播》放了這段畫面!無人機俯瞰臺北101

      看看新聞Knews
      2025-12-30 00:21:18
      美軍悍然扣押中方油輪!大陸攔截美對臺島軍售的船只,時機已到了

      美軍悍然扣押中方油輪!大陸攔截美對臺島軍售的船只,時機已到了

      趣文說娛
      2025-12-26 15:22:25
      日本天塌了?我國正式宣布這一決定!網(wǎng)友表示:早該這樣了!

      日本天塌了?我國正式宣布這一決定!網(wǎng)友表示:早該這樣了!

      愛吃醋的貓咪
      2025-12-29 19:54:22
      央視:王楚欽已和國家隊教練組充分溝通,明年1月不參加比賽

      央視:王楚欽已和國家隊教練組充分溝通,明年1月不參加比賽

      懂球帝
      2025-12-29 12:46:11
      日本擁核已進入倒計時?殘酷現(xiàn)實:我們可能真的攔不住

      日本擁核已進入倒計時?殘酷現(xiàn)實:我們可能真的攔不住

      遠(yuǎn)方風(fēng)林
      2025-12-27 19:03:37
      特朗普大膽開麥,美國已替代聯(lián)合國,中方警告:臺島或?qū)⒊苫鹚幫?>
    </a>
        <h3>
      <a href=博覽歷史
      2025-12-29 18:27:35
      43歲賈玲近況:退出春晚、淡出綜藝,解散公司,她把自己作沒了?

      43歲賈玲近況:退出春晚、淡出綜藝,解散公司,她把自己作沒了?

      夢錄的西方史話
      2025-12-22 18:47:01
      大羅:當(dāng)年我賽前豪言要戴帽,結(jié)果在場上對手差點把我牙打掉

      大羅:當(dāng)年我賽前豪言要戴帽,結(jié)果在場上對手差點把我牙打掉

      懂球帝
      2025-12-29 17:36:55
      “黃河畫家”徐惠君126平尺巨幅畫作被人無意“潑墨”,本人稱:該畫作估價380萬元,不會追查肇事者,希望網(wǎng)友提供補救建議,讓墨漬成為神來之筆

      “黃河畫家”徐惠君126平尺巨幅畫作被人無意“潑墨”,本人稱:該畫作估價380萬元,不會追查肇事者,希望網(wǎng)友提供補救建議,讓墨漬成為神來之筆

      極目新聞
      2025-12-29 20:27:57
      聯(lián)合國都未承認(rèn)的事,日本稱“毫無疑問”,中方一句話讓日媒破防

      聯(lián)合國都未承認(rèn)的事,日本稱“毫無疑問”,中方一句話讓日媒破防

      蘇浩
      2025-12-30 09:00:05
      快訊/曹西平深夜驚傳家中離世!享壽66歲 前天才發(fā)文感嘆地震

      快訊/曹西平深夜驚傳家中離世!享壽66歲 前天才發(fā)文感嘆地震

      ETtoday星光云
      2025-12-30 07:06:11
      亞洲周刊再報猛料,為成功出手龐來臣虛藏品,聯(lián)手篡改民國史。

      亞洲周刊再報猛料,為成功出手龐來臣虛藏品,聯(lián)手篡改民國史。

      百態(tài)人間
      2025-12-29 16:47:24
      2025-12-30 10:23:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      11942文章數(shù) 176346關(guān)注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數(shù)十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習(xí)

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習(xí)

      體育要聞

      “史上最貴”的世界杯,球迷成了韭菜

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經(jīng)要聞

      翁杰明:宏觀數(shù)據(jù)與居民微觀感受存在差距

      汽車要聞

      “路”要越走越深,猛士的智能越野時代來了

      態(tài)度原創(chuàng)

      家居
      健康
      教育
      本地
      公開課

      家居要聞

      東方雅韻 溫馨恬適

      這些新療法,讓化療不再那么痛苦

      教育要聞

      湖南中醫(yī)大學(xué)湖北分?jǐn)?shù)線揭秘!別慌!

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠(yuǎn)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 狠狠cao日日穞夜夜穞av| 亚洲情综合五月天| 又大又粗又爽18禁免费看| 国产成人中文字幕精品在线| jizz网站| 成人无码视频| 日韩精品极品视频在线观看免费| 亚洲欧美国产免费综合视频| 国产乱国产乱老熟300部视频| 2020久久香蕉国产线看观看| 新蔡县| 久久久久久亚洲AV无码专区| 又大又紧又粉嫩18p少妇| 丰满人妻妇伦又伦精品国产| 中文字幕精品无码一区二区三区| 四虎www永久在线精品| 色欲二区| 一本色道久久综合| 青青草99| 日韩色区| 无码人中文字幕| 东京热无码AV| 成在线人免费| 无码内射成人免费喷射| 精品99视频| 操日本屄| 911国产精品| 999白浆| 欧美成aⅴ人高清免费| 亚洲va国产va天堂va久久| 插入中文字幕在线一区二区三区| 无套进入无套内谢A片| 亚洲精品国产suv一区88| 欧美日韩在线视频一区| 蜜桃视频婷婷狼人看在线视频| 清水河县| 人妻少妇精品系列| 久久久这里只有精品10| 日本三码电影在线| 麻豆A?V视频| 国内精品久久久久影院一蜜桃|