![]()
11月19日,由智一科技旗下智猩猩聯(lián)合智東西、機(jī)器人前瞻舉辦的2025中國具身智能機(jī)器人大會(huì)(EAIRCon 2025)將在深圳灣萬麗酒店舉辦。
這也是智一科技在大灣區(qū)舉辦的首屆機(jī)器人大會(huì)。今年以來,智一科技旗下智猩猩分別聯(lián)合智東西、芯東西已先后成功舉辦2025中國生成式AI大會(huì)、2025中國AI算力大會(huì)、2025全球AI芯片峰會(huì)等大型會(huì)議。
2025中國具身智能機(jī)器人大會(huì)(EAIRCon 2025)為期一天,由主論壇+專題論壇+研討會(huì)+展覽區(qū)組成,將以“具身啟智 機(jī)器覺醒”為主題,邀請近40位嘉賓帶來致辭、報(bào)告、演講和對話,全方位解構(gòu)具身智能掀起的新一輪機(jī)器人革命。
主論壇將于上午在主會(huì)場+分會(huì)場一拉開帷幕,將邀請知名學(xué)者、產(chǎn)業(yè)領(lǐng)袖、創(chuàng)業(yè)者、技術(shù)大咖和頂級投資人帶來分享,并將進(jìn)行一場高端對話。
具身智能人形機(jī)器人專題論壇則將于下午在主會(huì)場進(jìn)行,將聚焦人形機(jī)器人這一具身智能最佳載體及產(chǎn)業(yè)鏈層面的技術(shù)產(chǎn)品創(chuàng)新。
機(jī)器人模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)研討會(huì)、具身世界模型技術(shù)研討會(huì)、具身VLA大模型技術(shù)研討會(huì)則會(huì)在分會(huì)場一、二進(jìn)行,將邀請來自高校、工業(yè)界的研究人員和技術(shù)專家?guī)碇黝}報(bào)告和技術(shù)分享。其中,研討會(huì)主要面向持有閉門專享票、貴賓通票的觀眾開放。
今天,將為大家公布具身VLA大模型技術(shù)研討會(huì)的完整議程。已經(jīng)迫不及待報(bào)名的朋友,可以先掃描下方二維碼添加小助手報(bào)名啦!
01.
議程發(fā)布:多維度解構(gòu)VLA
共探最熱具身大模型技術(shù)范式
短短三年,從零星探索到主流浪潮,VLA已經(jīng)成為連接大模型與具身智能的關(guān)鍵橋梁,不僅是當(dāng)下最受關(guān)注的具身大模型技術(shù)范式,更被認(rèn)為是最具潛力的機(jī)器人基礎(chǔ)大模型技術(shù)路線,有望開啟具身智能的GPT時(shí)刻。
在這一背景下,2025中國具身智能機(jī)器人大會(huì)同期的具身VLA大模型技術(shù)研討會(huì)將于下午的分會(huì)場二進(jìn)行,由主題報(bào)告和圓桌Panel兩個(gè)環(huán)節(jié)組成。
上海交通大學(xué)長聘教軌助理教授穆堯,上海人工智能實(shí)驗(yàn)室具身智能中心青年研究員曾嘉,美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人文俊杰,北京大學(xué)計(jì)算機(jī)學(xué)院副研究員兼信息技術(shù)高等研究院視覺智能實(shí)驗(yàn)室主任王釗,OpenHelix-Team負(fù)責(zé)人、VLA-Adapter一作丁鵬翔,Alluxio首席架構(gòu)師傅正佳,清華大學(xué)在讀博士、SimpleVLA-RL一作李昊展等七位知名青年學(xué)者與技術(shù)專家出席并帶來報(bào)告。曾嘉博士也將主持本次研討會(huì)以及圓桌Panel。
在人工智能邁向真實(shí)世界應(yīng)用的關(guān)鍵節(jié)點(diǎn),具身智能領(lǐng)域正面臨數(shù)據(jù)稀缺與泛化能力不足的雙重困境。穆堯老師將以《人-數(shù)字人-機(jī)器人三元一體具身智能》為主題帶來報(bào)告,分享一項(xiàng)突破性解決方案——人-數(shù)字人-機(jī)器人三元一體具身智能架構(gòu),通過充分挖掘互聯(lián)網(wǎng)海量人類行為數(shù)據(jù)、利用先進(jìn)仿真引擎大規(guī)模生成策略合成數(shù)據(jù)、并將虛擬學(xué)習(xí)成果遷移至物理機(jī)器人,實(shí)現(xiàn)從"專用機(jī)器人"到"通用智能體"的質(zhì)的飛躍。
曾嘉博士是上海人工智能實(shí)驗(yàn)室具身智能中心操作智能方向負(fù)責(zé)人,研究方向?yàn)闄C(jī)械臂操作、視覺-語言-動(dòng)作大模型。本次報(bào)告的題目為《理解、想象、執(zhí)行一體化的具身操作大模型》,將重點(diǎn)介紹最新推出的具身操作大模型InternVLA-A1。該模型在操作任務(wù)的成功率顯著超越π0、GR00T N1.5等模型,尤其在涉及傳送帶動(dòng)態(tài)抓取、多機(jī)協(xié)作的高動(dòng)態(tài)場景表現(xiàn)出很強(qiáng)的適應(yīng)性。
文俊杰老師現(xiàn)擔(dān)任美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人。他認(rèn)為:讓機(jī)器人具備多模態(tài)大模型通用智能的關(guān)鍵難點(diǎn)在于語言與動(dòng)作之間的“模態(tài)鴻溝”。本次研討會(huì)將重點(diǎn)探討VLA模型從“對齊”到“統(tǒng)一”的根本轉(zhuǎn)變,通過重構(gòu)模型架構(gòu)與訓(xùn)練范式,使模型在同一表示/參數(shù)空間中同時(shí)學(xué)會(huì)理解與執(zhí)行,進(jìn)而將思維鏈?zhǔn)酵评碛糜谖粗蝿?wù)求解。
具身視覺導(dǎo)航大腦讓機(jī)器人擺脫遙控器與激光雷達(dá)建圖,僅使用視覺攝像頭讓機(jī)器人擁有眼睛一般看懂眼前世界,進(jìn)行通行度理解和內(nèi)容理解從而自主決策導(dǎo)航點(diǎn),并結(jié)合時(shí)空域感知構(gòu)建短期記憶地圖完善路徑規(guī)劃。曾任職于阿里巴巴達(dá)摩院的王釗老師將以《開放世界具身視覺導(dǎo)航大腦》為主題帶來報(bào)告。
丁鵬翔博士的研究主要專注于多構(gòu)型本體的VLA模型基座模型設(shè)計(jì)。他以一作身份發(fā)表的VLA-Adapter目前GitHub Star已經(jīng)達(dá)到1.6k,是國內(nèi)開源VLA中最高的,也是業(yè)內(nèi)第五個(gè)過千Star的工作。丁鵬翔博士致力于解決VLA模型的加速推理,數(shù)據(jù)利用效率以及推動(dòng)VLA模型真正落地應(yīng)用效果。本次報(bào)告將圍繞《多構(gòu)型VLA如何破局》展開,將探討如何針對多種機(jī)器人形態(tài)(如機(jī)械臂、四足機(jī)器人、人形機(jī)器人)結(jié)合其結(jié)構(gòu)特性,分別設(shè)計(jì)和設(shè)置不同的VLA基座模型。
Alluxio首席架構(gòu)師傅正佳博士也將在此次研討會(huì)上帶來分享,主題為《構(gòu)建面向具身智能數(shù)據(jù)閉環(huán)的高性能數(shù)據(jù)訪問平臺(tái)》。傅正佳博士加入Alluxio前,曾在新加坡科技公司Bigo Technology擔(dān)任機(jī)器學(xué)習(xí)研發(fā)總監(jiān)。
目前,VLA模型的發(fā)展仍受限于數(shù)據(jù)稀缺與泛化能力不足等問題。本次報(bào)告李昊展博士將解讀以一作身份提出的專為VLA模型設(shè)計(jì)的高效強(qiáng)化學(xué)習(xí)框架SimpleVLA-RL。該框架基于veRL構(gòu)建,引入了VLA專用軌跡采樣、可擴(kuò)展并行化、多環(huán)境渲染及優(yōu)化的損失計(jì)算方法。實(shí)驗(yàn)表明,SimpleVLA-RL能緩解數(shù)據(jù)稀缺問題并大幅增強(qiáng)VLA的泛化能力,還能使VLA自主發(fā)現(xiàn)更高效的策略。這種 “突破人類演示數(shù)據(jù)模式” 的現(xiàn)象被定義為 “Pushcut”。
![]()
02.
嘉賓陣容:上交大穆堯與SimpleVLA-RL、
VLA-Adapter一作都來了
![]()
報(bào)告嘉賓:上海交通大學(xué)長聘教軌助理教授 穆堯
報(bào)告主題:人-數(shù)字人-機(jī)器人三元一體具身智能
內(nèi)容概要:在人工智能邁向真實(shí)世界應(yīng)用的關(guān)鍵節(jié)點(diǎn),具身智能領(lǐng)域正面臨數(shù)據(jù)稀缺與泛化能力不足的雙重困境。本次演講將分享一項(xiàng)突破性解決方案——人-數(shù)字人-機(jī)器人三元一體具身智能架構(gòu),通過充分挖掘互聯(lián)網(wǎng)海量人類行為數(shù)據(jù)、利用先進(jìn)仿真引擎大規(guī)模生成策略合成數(shù)據(jù)、并將虛擬學(xué)習(xí)成果遷移至物理機(jī)器人,實(shí)現(xiàn)從"專用機(jī)器人"到"通用智能體"的質(zhì)的飛躍。這一創(chuàng)新范式不僅將具身智能的數(shù)據(jù)獲取成本降低數(shù)個(gè)量級,更通過多源數(shù)據(jù)融合與虛實(shí)結(jié)合的遷移學(xué)習(xí)機(jī)制,讓AI真正具備跨模態(tài)、跨場景的泛化能力。演講將深入闡述三層協(xié)同架構(gòu)的技術(shù)細(xì)節(jié)、數(shù)據(jù)驅(qū)動(dòng)的泛化方法論,以及在快遞包裹處理、柔性分揀、自動(dòng)化科學(xué)實(shí)驗(yàn)等實(shí)際場景的驗(yàn)證成果,探討具身智能從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的可行路徑。
![]()
報(bào)告嘉賓:上海人工智能實(shí)驗(yàn)室具身智能中心青年研究員 曾嘉
報(bào)告主題:理解、想象、執(zhí)行一體化的具身操作大模型
內(nèi)容概要:本報(bào)告將介紹上海人工智能實(shí)驗(yàn)室具身智能中心最新推出的具身操作大模型InternVLA-A1。該模型以InternVL3為基座,基于一個(gè)統(tǒng)一的Transformer架構(gòu),集場景理解、任務(wù)想象與精準(zhǔn)執(zhí)行能力于一體。其中,場景理解模塊以圖像和文本為輸入,用于解析任務(wù)指令并理解任務(wù)場景;基于場景理解的解析結(jié)果,任務(wù)想象模塊通過預(yù)測未來圖像的形式,想象執(zhí)行任務(wù)的未來演變;最終,動(dòng)作執(zhí)行模塊在任務(wù)想象的指導(dǎo)下,通過Flow Matching過程輸出機(jī)器人控制指令。該模型融合了上海人工智能實(shí)驗(yàn)室的虛實(shí)混合操作數(shù)據(jù)集InternData-A1、上海國地中心實(shí)訓(xùn)場數(shù)據(jù)及互聯(lián)網(wǎng)多源異構(gòu)數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練,從多源異構(gòu)機(jī)器人、多場景數(shù)據(jù)中獲取了廣泛、通用的操作知識(shí)。在物流、家居、商超等多場景的真機(jī)評測基準(zhǔn)上,InternVLA-A1顯著優(yōu)于pi0及gr00t n1.5,且模型已適配方舟無限、松靈、國地青龍人形機(jī)器人、智元Genie、Franka等多款機(jī)器人本體。
![]()
報(bào)告嘉賓:美的AIRC具身基礎(chǔ)模型負(fù)責(zé)人 文俊杰
報(bào)告主題:從對齊到統(tǒng)一——VLA模型的發(fā)展與挑戰(zhàn)
內(nèi)容概要:如何讓機(jī)器人具備多模態(tài)大模型的通用智能?關(guān)鍵難點(diǎn)在于語言與動(dòng)作之間的“模態(tài)鴻溝”:傳統(tǒng)的表層對齊往往只在訓(xùn)練分布內(nèi)表現(xiàn)良好,一到開放世界便失靈。為此,我們推動(dòng)從“對齊”到“統(tǒng)一”的根本轉(zhuǎn)變,通過重構(gòu)模型架構(gòu)與訓(xùn)練范式,使模型在同一表示/參數(shù)空間中同時(shí)學(xué)會(huì)理解與執(zhí)行,進(jìn)而將思維鏈?zhǔn)酵评碛糜谖粗蝿?wù)求解。該研究為機(jī)器人走向真實(shí)應(yīng)用場景提供了堅(jiān)實(shí)技術(shù)支撐,使其在多變環(huán)境下更魯棒、更可靠。
![]()
報(bào)告嘉賓:北京大學(xué)計(jì)算機(jī)學(xué)院副研究員兼信息技術(shù)高等研究院視覺智能實(shí)驗(yàn)室主任 王釗
報(bào)告主題:開放世界具身視覺導(dǎo)航大腦
內(nèi)容概要:開放世界具身視覺導(dǎo)航大腦面向人形機(jī)器人、機(jī)器狗、無人車、消費(fèi)級移動(dòng)設(shè)備等各類具身實(shí)體提供開放環(huán)境中純視覺自主導(dǎo)航方案。具身視覺導(dǎo)航大腦讓機(jī)器人擺脫遙控器與激光雷達(dá)建圖,僅使用視覺攝像頭讓機(jī)器人擁有眼睛一般看懂眼前世界,進(jìn)行通行度理解和內(nèi)容理解從而自主決策導(dǎo)航點(diǎn),并結(jié)合時(shí)空域感知構(gòu)建短期記憶地圖完善路徑規(guī)劃。技術(shù)亮點(diǎn):1)純視覺導(dǎo)航、無需激光雷達(dá);2)無需建圖、隨時(shí)隨地可用;3)適應(yīng)動(dòng)態(tài)開放世界,不論室內(nèi)還是室外、小區(qū)、道路、野外等場景。技術(shù)應(yīng)用場景有面向B端大區(qū)域的電子地圖導(dǎo)航,如巡邏、物流、清掃機(jī)器人和面向C端的主動(dòng)式/跟隨式導(dǎo)航,如陪伴機(jī)器人。具身視覺導(dǎo)航大腦已應(yīng)用在江蘇某清掃無人車、深圳某人型機(jī)器人、上海某消費(fèi)級移動(dòng)機(jī)器人等客戶場景,在公安場景的數(shù)字警犬示范應(yīng)用被《人民日報(bào)》、《浙江日報(bào)》等媒體報(bào)道。
![]()
報(bào)告嘉賓:OpenHelix-Team負(fù)責(zé)人、VLA-Adapter一作 丁鵬翔
報(bào)告主題:多構(gòu)型VLA如何破局
內(nèi)容概要:端到端視覺-語言-動(dòng)作模型旨在實(shí)現(xiàn)將數(shù)字世界中的通用智能遷移到物理世界,從而全面提升具身體的智能水平。本報(bào)告將從多模態(tài)大模型在空間智能方面的不足切入,結(jié)合基礎(chǔ)視覺策略網(wǎng)絡(luò)的推理速度的瓶頸,探討如何針對多種機(jī)器人形態(tài)(如機(jī)械臂、四足機(jī)器人、人形機(jī)器人)結(jié)合其結(jié)構(gòu)特性,分別設(shè)計(jì)和設(shè)置不同的VLA基座模型。該研究為實(shí)現(xiàn)新一代智能機(jī)器人、智能家居、智慧工廠等場景提供關(guān)鍵技術(shù)支撐,加速人機(jī)共融智能時(shí)代的到來,推動(dòng)具身智能技術(shù)的創(chuàng)新與應(yīng)用。
![]()
報(bào)告嘉賓:Alluxio首席架構(gòu)師 傅正佳
報(bào)告主題:從重建到生成,邁向通用具身智能的閉環(huán)仿真
內(nèi)容概要:大語言模型(LLM)的飛速發(fā)展,為通用人工智能(AGI)的實(shí)現(xiàn)帶來了希望。然而,LLM 本身無法與物理世界進(jìn)行真實(shí)交互,這一局限正是具身智能(Embodied AI)致力于研究與彌合的關(guān)鍵鴻溝。在具身智能領(lǐng)域,若想重現(xiàn)LLM“大數(shù)據(jù) + 大模型”的成功路徑,一方面依賴海量交互數(shù)據(jù)作為VLA基礎(chǔ)預(yù)訓(xùn)練,另一方面,需要克服在物理世界中的交互帶來的天然局限:效率低、風(fēng)險(xiǎn)高、難以復(fù)現(xiàn)。因此,構(gòu)建一個(gè)可規(guī)模化擴(kuò)展(Scalable)的世界模型作為具身智能模型的閉環(huán)交互環(huán)境,已成為該領(lǐng)域發(fā)展的關(guān)鍵路徑。本次分享將重點(diǎn)介紹地平線在該領(lǐng)域的最新研究進(jìn)展,涵蓋以下核心模塊:可交互場景重建、前饋式3D重建、具身3D生成引擎以及具身視頻生成。
![]()
報(bào)告嘉賓:清華大學(xué)在讀博士、SimpleVLA-RL一作 李昊展
報(bào)告主題:SimpleVLA-RL:簡單可拓展的VLA強(qiáng)化學(xué)習(xí)訓(xùn)練
內(nèi)容概要:VLA模型已成為使機(jī)器人在真實(shí)環(huán)境中解決各類復(fù)雜操作任務(wù)極具前景的新范式,其發(fā)展仍受限于數(shù)據(jù)稀缺與泛化能力不足等問題,而強(qiáng)化學(xué)習(xí)能緩解數(shù)據(jù)依賴并顯著提升模型性能與泛化性,正受到廣泛關(guān)注。本次報(bào)告將解讀所提出的專為VLA模型設(shè)計(jì)的高效強(qiáng)化學(xué)習(xí)框架SimpleVLA-RL,內(nèi)容主要分為三部分:首先概述VLA訓(xùn)練范式,并闡述引入強(qiáng)化學(xué)習(xí)的必要性;接著將詳解SimpleVLA-RL架構(gòu)設(shè)計(jì);最后,展望VLA強(qiáng)化學(xué)習(xí)領(lǐng)域的未來發(fā)展趨勢。
03.
報(bào)名方式
大會(huì)設(shè)置了四類電子門票,分別是論壇觀眾票、論壇VIP票、閉門專享票和貴賓通票。會(huì)場座位分布如下。
![]()
四類電子門票中,論壇觀眾票為免費(fèi)票,申請后需經(jīng)審核通過方可參會(huì);論壇VIP票、閉門專享票和貴賓通票均需購買。各類門票的詳細(xì)權(quán)益可通過文末左下角「閱讀原文」,直達(dá)官網(wǎng)進(jìn)行了解。
具身世界模型技術(shù)研討會(huì)將于11月19日在分會(huì)場二上午進(jìn)行,主要向持有閉門專享票、貴賓通票的觀眾開放。
希望參加研討會(huì)的朋友,可以掃描下方二維碼,添加小助手“小鷗”進(jìn)行報(bào)名,已添加過“小鷗”的老朋友,可以給“小鷗”私信,發(fā)送“EAIR 25”即可報(bào)名。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.