國內(nèi)開源VLA最高star一作開講！具身VLA大模型技術(shù)研討會(huì)最終議程公布

2025-11-12 21:39:03　來源: 機(jī)器人前瞻

北京舉報(bào)

分享至

11月19日，由智一科技旗下智猩猩聯(lián)合智東西、機(jī)器人前瞻舉辦的2025中國具身智能機(jī)器人大會(huì)（EAIRCon 2025）將在深圳灣萬麗酒店舉辦。

這也是智一科技在大灣區(qū)舉辦的首屆機(jī)器人大會(huì)。今年以來，智一科技旗下智猩猩分別聯(lián)合智東西、芯東西已先后成功舉辦2025中國生成式AI大會(huì)、2025中國AI算力大會(huì)、2025全球AI芯片峰會(huì)等大型會(huì)議。

2025中國具身智能機(jī)器人大會(huì)（EAIRCon 2025）為期一天，由主論壇+專題論壇+研討會(huì)+展覽區(qū)組成，將以“具身啟智機(jī)器覺醒”為主題，邀請近40位嘉賓帶來致辭、報(bào)告、演講和對話，全方位解構(gòu)具身智能掀起的新一輪機(jī)器人革命。

主論壇將于上午在主會(huì)場+分會(huì)場一拉開帷幕，將邀請知名學(xué)者、產(chǎn)業(yè)領(lǐng)袖、創(chuàng)業(yè)者、技術(shù)大咖和頂級投資人帶來分享，并將進(jìn)行一場高端對話。

具身智能人形機(jī)器人專題論壇則將于下午在主會(huì)場進(jìn)行，將聚焦人形機(jī)器人這一具身智能最佳載體及產(chǎn)業(yè)鏈層面的技術(shù)產(chǎn)品創(chuàng)新。

機(jī)器人模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)研討會(huì)、具身世界模型技術(shù)研討會(huì)、具身VLA大模型技術(shù)研討會(huì)則會(huì)在分會(huì)場一、二進(jìn)行，將邀請來自高校、工業(yè)界的研究人員和技術(shù)專家?guī)碇黝}報(bào)告和技術(shù)分享。其中，研討會(huì)主要面向持有閉門專享票、貴賓通票的觀眾開放。

今天，將為大家公布具身VLA大模型技術(shù)研討會(huì)的完整議程。已經(jīng)迫不及待報(bào)名的朋友，可以先掃描下方二維碼添加小助手報(bào)名啦！

01.

議程發(fā)布：多維度解構(gòu)VLA

共探最熱具身大模型技術(shù)范式

短短三年，從零星探索到主流浪潮，VLA已經(jīng)成為連接大模型與具身智能的關(guān)鍵橋梁，不僅是當(dāng)下最受關(guān)注的具身大模型技術(shù)范式，更被認(rèn)為是最具潛力的機(jī)器人基礎(chǔ)大模型技術(shù)路線，有望開啟具身智能的GPT時(shí)刻。

在這一背景下，2025中國具身智能機(jī)器人大會(huì)同期的具身VLA大模型技術(shù)研討會(huì)將于下午的分會(huì)場二進(jìn)行，由主題報(bào)告和圓桌Panel兩個(gè)環(huán)節(jié)組成。

上海交通大學(xué)長聘教軌助理教授穆堯，上海人工智能實(shí)驗(yàn)室具身智能中心青年研究員曾嘉，美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人文俊杰，北京大學(xué)計(jì)算機(jī)學(xué)院副研究員兼信息技術(shù)高等研究院視覺智能實(shí)驗(yàn)室主任王釗，OpenHelix-Team負(fù)責(zé)人、VLA-Adapter一作丁鵬翔，Alluxio首席架構(gòu)師傅正佳，清華大學(xué)在讀博士、SimpleVLA-RL一作李昊展等七位知名青年學(xué)者與技術(shù)專家出席并帶來報(bào)告。曾嘉博士也將主持本次研討會(huì)以及圓桌Panel。

在人工智能邁向真實(shí)世界應(yīng)用的關(guān)鍵節(jié)點(diǎn)，具身智能領(lǐng)域正面臨數(shù)據(jù)稀缺與泛化能力不足的雙重困境。穆堯老師將以《人-數(shù)字人-機(jī)器人三元一體具身智能》為主題帶來報(bào)告，分享一項(xiàng)突破性解決方案——人-數(shù)字人-機(jī)器人三元一體具身智能架構(gòu)，通過充分挖掘互聯(lián)網(wǎng)海量人類行為數(shù)據(jù)、利用先進(jìn)仿真引擎大規(guī)模生成策略合成數(shù)據(jù)、并將虛擬學(xué)習(xí)成果遷移至物理機(jī)器人，實(shí)現(xiàn)從"專用機(jī)器人"到"通用智能體"的質(zhì)的飛躍。

曾嘉博士是上海人工智能實(shí)驗(yàn)室具身智能中心操作智能方向負(fù)責(zé)人，研究方向?yàn)闄C(jī)械臂操作、視覺-語言-動(dòng)作大模型。本次報(bào)告的題目為《理解、想象、執(zhí)行一體化的具身操作大模型》，將重點(diǎn)介紹最新推出的具身操作大模型InternVLA-A1。該模型在操作任務(wù)的成功率顯著超越π0、GR00T N1.5等模型，尤其在涉及傳送帶動(dòng)態(tài)抓取、多機(jī)協(xié)作的高動(dòng)態(tài)場景表現(xiàn)出很強(qiáng)的適應(yīng)性。

文俊杰老師現(xiàn)擔(dān)任美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人。他認(rèn)為：讓機(jī)器人具備多模態(tài)大模型通用智能的關(guān)鍵難點(diǎn)在于語言與動(dòng)作之間的“模態(tài)鴻溝”。本次研討會(huì)將重點(diǎn)探討VLA模型從“對齊”到“統(tǒng)一”的根本轉(zhuǎn)變，通過重構(gòu)模型架構(gòu)與訓(xùn)練范式，使模型在同一表示/參數(shù)空間中同時(shí)學(xué)會(huì)理解與執(zhí)行，進(jìn)而將思維鏈?zhǔn)酵评碛糜谖粗蝿?wù)求解。

具身視覺導(dǎo)航大腦讓機(jī)器人擺脫遙控器與激光雷達(dá)建圖，僅使用視覺攝像頭讓機(jī)器人擁有眼睛一般看懂眼前世界，進(jìn)行通行度理解和內(nèi)容理解從而自主決策導(dǎo)航點(diǎn)，并結(jié)合時(shí)空域感知構(gòu)建短期記憶地圖完善路徑規(guī)劃。曾任職于阿里巴巴達(dá)摩院的王釗老師將以《開放世界具身視覺導(dǎo)航大腦》為主題帶來報(bào)告。

丁鵬翔博士的研究主要專注于多構(gòu)型本體的VLA模型基座模型設(shè)計(jì)。他以一作身份發(fā)表的VLA-Adapter目前GitHub Star已經(jīng)達(dá)到1.6k，是國內(nèi)開源VLA中最高的，也是業(yè)內(nèi)第五個(gè)過千Star的工作。丁鵬翔博士致力于解決VLA模型的加速推理，數(shù)據(jù)利用效率以及推動(dòng)VLA模型真正落地應(yīng)用效果。本次報(bào)告將圍繞《多構(gòu)型VLA如何破局》展開，將探討如何針對多種機(jī)器人形態(tài)（如機(jī)械臂、四足機(jī)器人、人形機(jī)器人）結(jié)合其結(jié)構(gòu)特性，分別設(shè)計(jì)和設(shè)置不同的VLA基座模型。

Alluxio首席架構(gòu)師傅正佳博士也將在此次研討會(huì)上帶來分享，主題為《構(gòu)建面向具身智能數(shù)據(jù)閉環(huán)的高性能數(shù)據(jù)訪問平臺(tái)》。傅正佳博士加入Alluxio前，曾在新加坡科技公司Bigo Technology擔(dān)任機(jī)器學(xué)習(xí)研發(fā)總監(jiān)。

目前，VLA模型的發(fā)展仍受限于數(shù)據(jù)稀缺與泛化能力不足等問題。本次報(bào)告李昊展博士將解讀以一作身份提出的專為VLA模型設(shè)計(jì)的高效強(qiáng)化學(xué)習(xí)框架SimpleVLA-RL。該框架基于veRL構(gòu)建，引入了VLA專用軌跡采樣、可擴(kuò)展并行化、多環(huán)境渲染及優(yōu)化的損失計(jì)算方法。實(shí)驗(yàn)表明，SimpleVLA-RL能緩解數(shù)據(jù)稀缺問題并大幅增強(qiáng)VLA的泛化能力，還能使VLA自主發(fā)現(xiàn)更高效的策略。這種 “突破人類演示數(shù)據(jù)模式” 的現(xiàn)象被定義為 “Pushcut”。

02.

嘉賓陣容：上交大穆堯與SimpleVLA-RL、

VLA-Adapter一作都來了

報(bào)告嘉賓：上海交通大學(xué)長聘教軌助理教授穆堯

報(bào)告主題：人-數(shù)字人-機(jī)器人三元一體具身智能

內(nèi)容概要：在人工智能邁向真實(shí)世界應(yīng)用的關(guān)鍵節(jié)點(diǎn)，具身智能領(lǐng)域正面臨數(shù)據(jù)稀缺與泛化能力不足的雙重困境。本次演講將分享一項(xiàng)突破性解決方案——人-數(shù)字人-機(jī)器人三元一體具身智能架構(gòu)，通過充分挖掘互聯(lián)網(wǎng)海量人類行為數(shù)據(jù)、利用先進(jìn)仿真引擎大規(guī)模生成策略合成數(shù)據(jù)、并將虛擬學(xué)習(xí)成果遷移至物理機(jī)器人，實(shí)現(xiàn)從"專用機(jī)器人"到"通用智能體"的質(zhì)的飛躍。這一創(chuàng)新范式不僅將具身智能的數(shù)據(jù)獲取成本降低數(shù)個(gè)量級，更通過多源數(shù)據(jù)融合與虛實(shí)結(jié)合的遷移學(xué)習(xí)機(jī)制，讓AI真正具備跨模態(tài)、跨場景的泛化能力。演講將深入闡述三層協(xié)同架構(gòu)的技術(shù)細(xì)節(jié)、數(shù)據(jù)驅(qū)動(dòng)的泛化方法論，以及在快遞包裹處理、柔性分揀、自動(dòng)化科學(xué)實(shí)驗(yàn)等實(shí)際場景的驗(yàn)證成果，探討具身智能從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的可行路徑。

報(bào)告嘉賓：上海人工智能實(shí)驗(yàn)室具身智能中心青年研究員曾嘉

報(bào)告主題：理解、想象、執(zhí)行一體化的具身操作大模型

內(nèi)容概要：本報(bào)告將介紹上海人工智能實(shí)驗(yàn)室具身智能中心最新推出的具身操作大模型InternVLA-A1。該模型以InternVL3為基座，基于一個(gè)統(tǒng)一的Transformer架構(gòu)，集場景理解、任務(wù)想象與精準(zhǔn)執(zhí)行能力于一體。其中，場景理解模塊以圖像和文本為輸入，用于解析任務(wù)指令并理解任務(wù)場景；基于場景理解的解析結(jié)果，任務(wù)想象模塊通過預(yù)測未來圖像的形式，想象執(zhí)行任務(wù)的未來演變；最終，動(dòng)作執(zhí)行模塊在任務(wù)想象的指導(dǎo)下，通過Flow Matching過程輸出機(jī)器人控制指令。該模型融合了上海人工智能實(shí)驗(yàn)室的虛實(shí)混合操作數(shù)據(jù)集InternData-A1、上海國地中心實(shí)訓(xùn)場數(shù)據(jù)及互聯(lián)網(wǎng)多源異構(gòu)數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練，從多源異構(gòu)機(jī)器人、多場景數(shù)據(jù)中獲取了廣泛、通用的操作知識(shí)。在物流、家居、商超等多場景的真機(jī)評測基準(zhǔn)上，InternVLA-A1顯著優(yōu)于pi0及gr00t n1.5，且模型已適配方舟無限、松靈、國地青龍人形機(jī)器人、智元Genie、Franka等多款機(jī)器人本體。

報(bào)告嘉賓：美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人文俊杰

報(bào)告主題：從對齊到統(tǒng)一——VLA模型的發(fā)展與挑戰(zhàn)

內(nèi)容概要：如何讓機(jī)器人具備多模態(tài)大模型的通用智能？關(guān)鍵難點(diǎn)在于語言與動(dòng)作之間的“模態(tài)鴻溝”：傳統(tǒng)的表層對齊往往只在訓(xùn)練分布內(nèi)表現(xiàn)良好，一到開放世界便失靈。為此，我們推動(dòng)從“對齊”到“統(tǒng)一”的根本轉(zhuǎn)變，通過重構(gòu)模型架構(gòu)與訓(xùn)練范式，使模型在同一表示/參數(shù)空間中同時(shí)學(xué)會(huì)理解與執(zhí)行，進(jìn)而將思維鏈?zhǔn)酵评碛糜谖粗蝿?wù)求解。該研究為機(jī)器人走向真實(shí)應(yīng)用場景提供了堅(jiān)實(shí)技術(shù)支撐，使其在多變環(huán)境下更魯棒、更可靠。

報(bào)告嘉賓：北京大學(xué)計(jì)算機(jī)學(xué)院副研究員兼信息技術(shù)高等研究院視覺智能實(shí)驗(yàn)室主任王釗

報(bào)告主題：開放世界具身視覺導(dǎo)航大腦

內(nèi)容概要：開放世界具身視覺導(dǎo)航大腦面向人形機(jī)器人、機(jī)器狗、無人車、消費(fèi)級移動(dòng)設(shè)備等各類具身實(shí)體提供開放環(huán)境中純視覺自主導(dǎo)航方案。具身視覺導(dǎo)航大腦讓機(jī)器人擺脫遙控器與激光雷達(dá)建圖，僅使用視覺攝像頭讓機(jī)器人擁有眼睛一般看懂眼前世界，進(jìn)行通行度理解和內(nèi)容理解從而自主決策導(dǎo)航點(diǎn)，并結(jié)合時(shí)空域感知構(gòu)建短期記憶地圖完善路徑規(guī)劃。技術(shù)亮點(diǎn)：1）純視覺導(dǎo)航、無需激光雷達(dá)；2）無需建圖、隨時(shí)隨地可用；3）適應(yīng)動(dòng)態(tài)開放世界，不論室內(nèi)還是室外、小區(qū)、道路、野外等場景。技術(shù)應(yīng)用場景有面向B端大區(qū)域的電子地圖導(dǎo)航，如巡邏、物流、清掃機(jī)器人和面向C端的主動(dòng)式/跟隨式導(dǎo)航，如陪伴機(jī)器人。具身視覺導(dǎo)航大腦已應(yīng)用在江蘇某清掃無人車、深圳某人型機(jī)器人、上海某消費(fèi)級移動(dòng)機(jī)器人等客戶場景，在公安場景的數(shù)字警犬示范應(yīng)用被《人民日報(bào)》、《浙江日報(bào)》等媒體報(bào)道。

報(bào)告嘉賓：OpenHelix-Team負(fù)責(zé)人、VLA-Adapter一作丁鵬翔

報(bào)告主題：多構(gòu)型VLA如何破局

內(nèi)容概要：端到端視覺-語言-動(dòng)作模型旨在實(shí)現(xiàn)將數(shù)字世界中的通用智能遷移到物理世界，從而全面提升具身體的智能水平。本報(bào)告將從多模態(tài)大模型在空間智能方面的不足切入，結(jié)合基礎(chǔ)視覺策略網(wǎng)絡(luò)的推理速度的瓶頸，探討如何針對多種機(jī)器人形態(tài)（如機(jī)械臂、四足機(jī)器人、人形機(jī)器人）結(jié)合其結(jié)構(gòu)特性，分別設(shè)計(jì)和設(shè)置不同的VLA基座模型。該研究為實(shí)現(xiàn)新一代智能機(jī)器人、智能家居、智慧工廠等場景提供關(guān)鍵技術(shù)支撐，加速人機(jī)共融智能時(shí)代的到來，推動(dòng)具身智能技術(shù)的創(chuàng)新與應(yīng)用。

報(bào)告嘉賓：Alluxio首席架構(gòu)師傅正佳

報(bào)告主題：從重建到生成，邁向通用具身智能的閉環(huán)仿真

內(nèi)容概要：大語言模型（LLM）的飛速發(fā)展，為通用人工智能（AGI）的實(shí)現(xiàn)帶來了希望。然而，LLM 本身無法與物理世界進(jìn)行真實(shí)交互，這一局限正是具身智能（Embodied AI）致力于研究與彌合的關(guān)鍵鴻溝。在具身智能領(lǐng)域，若想重現(xiàn)LLM“大數(shù)據(jù) + 大模型”的成功路徑，一方面依賴海量交互數(shù)據(jù)作為VLA基礎(chǔ)預(yù)訓(xùn)練，另一方面，需要克服在物理世界中的交互帶來的天然局限：效率低、風(fēng)險(xiǎn)高、難以復(fù)現(xiàn)。因此，構(gòu)建一個(gè)可規(guī)模化擴(kuò)展（Scalable）的世界模型作為具身智能模型的閉環(huán)交互環(huán)境，已成為該領(lǐng)域發(fā)展的關(guān)鍵路徑。本次分享將重點(diǎn)介紹地平線在該領(lǐng)域的最新研究進(jìn)展，涵蓋以下核心模塊：可交互場景重建、前饋式3D重建、具身3D生成引擎以及具身視頻生成。

報(bào)告嘉賓：清華大學(xué)在讀博士、SimpleVLA-RL一作李昊展

報(bào)告主題：SimpleVLA-RL：簡單可拓展的VLA強(qiáng)化學(xué)習(xí)訓(xùn)練

內(nèi)容概要：VLA模型已成為使機(jī)器人在真實(shí)環(huán)境中解決各類復(fù)雜操作任務(wù)極具前景的新范式，其發(fā)展仍受限于數(shù)據(jù)稀缺與泛化能力不足等問題，而強(qiáng)化學(xué)習(xí)能緩解數(shù)據(jù)依賴并顯著提升模型性能與泛化性，正受到廣泛關(guān)注。本次報(bào)告將解讀所提出的專為VLA模型設(shè)計(jì)的高效強(qiáng)化學(xué)習(xí)框架SimpleVLA-RL，內(nèi)容主要分為三部分：首先概述VLA訓(xùn)練范式，并闡述引入強(qiáng)化學(xué)習(xí)的必要性；接著將詳解SimpleVLA-RL架構(gòu)設(shè)計(jì)；最后，展望VLA強(qiáng)化學(xué)習(xí)領(lǐng)域的未來發(fā)展趨勢。

03.

報(bào)名方式

大會(huì)設(shè)置了四類電子門票，分別是論壇觀眾票、論壇VIP票、閉門專享票和貴賓通票。會(huì)場座位分布如下。

四類電子門票中，論壇觀眾票為免費(fèi)票，申請后需經(jīng)審核通過方可參會(huì)；論壇VIP票、閉門專享票和貴賓通票均需購買。各類門票的詳細(xì)權(quán)益可通過文末左下角「閱讀原文」，直達(dá)官網(wǎng)進(jìn)行了解。

具身世界模型技術(shù)研討會(huì)將于11月19日在分會(huì)場二上午進(jìn)行，主要向持有閉門專享票、貴賓通票的觀眾開放。

希望參加研討會(huì)的朋友，可以掃描下方二維碼，添加小助手“小鷗”進(jìn)行報(bào)名，已添加過“小鷗”的老朋友，可以給“小鷗”私信，發(fā)送“EAIR 25”即可報(bào)名。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.