10 月 8 日,英偉達(dá) Omniverse 及物理 AI 產(chǎn)品與技術(shù)營銷負(fù)責(zé)人 Madison Huang 首次公開亮相訪談節(jié)目《英偉達(dá) OpenUSD Insider Series Podcast》,與光輪智能 CEO 謝晨博士圍繞主題《Bridging the Sim2Real Gap with SimReady and AI》展開對談,深度探討 “如何讓機(jī)器人在虛擬世界學(xué)習(xí)、在真實(shí)世界行動”。
![]()
左上:Edmar 右上:Madison Huang 左下:穆斯塔法 右下:謝晨
值得關(guān)注的是,Madison Huang 是英偉達(dá)創(chuàng)始人黃仁勛之女。主持人 Edmar 在開場時便強(qiáng)調(diào) “這是非常特別的一期”,并提及這是 Madison 的首次官方直播。不同于產(chǎn)品發(fā)布或企業(yè)宣講的宏大場景,此次她以英偉達(dá) Omniverse 及物理 AI 產(chǎn)品與技術(shù)營銷負(fù)責(zé)人的身份,聚焦機(jī)器人與仿真主題參與對談。
與 Madison 對話的,是前英偉達(dá)自動駕駛仿真負(fù)責(zé)人、現(xiàn)任光輪智能 CEO 謝晨,以及光輪智能增長負(fù)責(zé)人穆斯塔法。謝晨是 Sim2Real 領(lǐng)域的資深實(shí)踐者,并非行業(yè)新人,他曾在英偉達(dá)主導(dǎo)自動駕駛仿真工作,此前還負(fù)責(zé)過 Cruise 的仿真業(yè)務(wù),具備深厚的技術(shù)與實(shí)踐積累。
這場一個半小時的直播,在技術(shù)圈引發(fā)廣泛討論:既因 Madison 的首次公開亮相,更因?qū)φ動|及了重新定義機(jī)器人產(chǎn)業(yè)的核心命題 ——如何彌合 Sim2Real Gap(仿真與現(xiàn)實(shí)鴻溝)。而這場以技術(shù)為導(dǎo)向的直播背后,正藏著英偉達(dá)在物理智能領(lǐng)域的關(guān)鍵布局。
▍英偉達(dá)一周內(nèi)連續(xù)兩場直播!仿真才是機(jī)器人數(shù)據(jù)困境最優(yōu)解
需要關(guān)注的是,NVIDIA Omniverse 官方頻道上一期直播中,斯坦福大學(xué)教授李飛飛與英偉達(dá)首席科學(xué)家 Jim Fan,曾圍繞 BEHAVIOR 具身智能挑戰(zhàn)賽展開對話。Jim Fan 在訪談中坦言,機(jī)器人學(xué)習(xí)最大的問題就是 “仿真和真實(shí)世界存在差距”。這個問題目前集中在三個方面,一是感知差距,仿真的視覺、觸覺等信號與真實(shí)場景(如物體紋理、光照)有差異;二是物理交互差距,仿真中物體的受力反饋、形變(如布料褶皺、流體流動)與真實(shí)物理規(guī)律有偏差;三是場景復(fù)雜度差距,真實(shí)世界的動態(tài)變化(如突發(fā)障礙物、物體狀態(tài)突變)難在仿真中完全復(fù)現(xiàn),導(dǎo)致機(jī)器人仿真所學(xué)難適配真實(shí)場景。
![]()
Jim Fan 同時表示,3D 計(jì)算機(jī)視覺、視頻生成、3D 世界生成等生成式 AI 技術(shù)有望進(jìn)一步提升仿真的真實(shí)感,可通過這些工具優(yōu)化仿真環(huán)境的視覺渲染、物體細(xì)節(jié),減少感知層面的差距。目前NVIDIA 與斯坦福合作的 “OmniGibson” 仿真引擎,已能支持剛體物理、可變形物體(布料、流體)交互,以及物體的加熱、切割等復(fù)雜狀態(tài)模擬。同時,Jim Fan也進(jìn)一步強(qiáng)調(diào),機(jī)器人學(xué)習(xí)不能依賴單一數(shù)據(jù)來源,同樣需要 “仿真數(shù)據(jù)與真實(shí)數(shù)據(jù)相結(jié)合”。
![]()
而本期節(jié)目當(dāng)中,Madison也提到了與Jim Fan相同的觀點(diǎn):“機(jī)器人不能只讀取數(shù)據(jù),它們必須親身體驗(yàn)這個世界。” 她進(jìn)一步解釋,語言類程序可依托互聯(lián)網(wǎng)海量數(shù)據(jù)訓(xùn)練,但機(jī)器人研發(fā)者面臨顯著數(shù)據(jù)困境。現(xiàn)實(shí)中手動采集數(shù)據(jù)成本高、效率低且存在安全風(fēng)險,“沒人會讓機(jī)器人在現(xiàn)實(shí)里反復(fù)撞門來學(xué)習(xí)開門”,而仿真正是突破這一困境的關(guān)鍵路徑。
謝晨認(rèn)為,“ Sim2Real 就是我們在仿真中訓(xùn)練的內(nèi)容能部署到現(xiàn)實(shí)世界,這其實(shí)是件非常困難的事”。他提到,自動駕駛的仿真到現(xiàn)實(shí)問題相對容易解決,因?yàn)槠渲饕谝曈X;但機(jī)器人領(lǐng)域的情況截然不同。“一切都與物理接觸有關(guān),最重要的是操控,還需要結(jié)合靈巧手、觸覺傳感器,問題復(fù)雜得多”。同時,謝晨強(qiáng)調(diào) “現(xiàn)實(shí)世界數(shù)據(jù)無法完全解決(機(jī)器人數(shù)據(jù))壁壘”:當(dāng)前機(jī)器人數(shù)量有限,難以像自動駕駛汽車那樣大規(guī)模采集現(xiàn)實(shí)數(shù)據(jù),因此“我們必須使用合成數(shù)據(jù),并且堅(jiān)信合成數(shù)據(jù)將是解決物理 AI 數(shù)據(jù)壁壘最重要、最主要的數(shù)據(jù)來源”。
▍英偉達(dá)“三臺計(jì)算機(jī)”邏輯 Sim2Real 如何串聯(lián)機(jī)器人全鏈路?
在 Madison 與謝晨的對話中提到,過去十年,英偉達(dá)已不再是單純的顯卡企業(yè),而是致力于打造機(jī)器人可學(xué)習(xí)的 “虛擬地球”。英偉達(dá)不直接研發(fā)機(jī)器人,而是為機(jī)器人領(lǐng)域提供從技術(shù)學(xué)習(xí)到落地應(yīng)用的全鏈路體系。這套體系可通過 “三臺計(jì)算機(jī)” 的邏輯理解,而 Sim2Real(仿真到現(xiàn)實(shí))正是串聯(lián)三者的核心紐帶。
第一臺是 AI 超級計(jì)算機(jī)(AI Supercomputer),是 “讓機(jī)器學(xué)會處理信息” 的基礎(chǔ)。與語言類程序依托海量文本數(shù)據(jù)訓(xùn)練理解能力類似,機(jī)器人核心程序也需算力支撐;但區(qū)別在于,機(jī)器人程序依賴物理世界數(shù)據(jù),這就需要第二臺計(jì)算機(jī)提供支持。
第二臺是仿真計(jì)算機(jī)(Simulation Computer),以 Omniverse 和 Isaac Sim 為核心,負(fù)責(zé)讓機(jī)器在虛擬世界中掌握感知與交互能力。Madison 在直播中強(qiáng)調(diào):“自動駕駛仿真相對簡單,核心依賴視覺;但機(jī)器人需要觸摸、抓取、操作,物理交互才是關(guān)鍵難點(diǎn)。” 她還提到,外界常問英偉達(dá) “能否做電纜、電線仿真”,這對英偉達(dá)而言意義重大 —— 其 NVL 72 液冷機(jī)架級 AI 計(jì)算系統(tǒng)及 Blackwell 系列產(chǎn)品的制造流程復(fù)雜,僅一個 NVL 72 機(jī)架就需兩英里長銅纜,這類工作對人類而言枯燥且有安全風(fēng)險,亟需機(jī)器人完成,因此電纜、電線仿真正是機(jī)器人領(lǐng)域亟待突破的 “圣杯級” 難題,而光輪智能在該領(lǐng)域的成果十分突出。
第三臺是物理 AI 計(jì)算機(jī)(Physical AI Computer),由 GROOT(通用機(jī)器人基礎(chǔ)程序)、Cosmos(世界模型)和 Jetson Thor(機(jī)器人端側(cè)芯片)構(gòu)成,負(fù)責(zé)讓機(jī)器人在真實(shí)世界中執(zhí)行任務(wù),其中 Cosmos 是銜接仿真與現(xiàn)實(shí)的關(guān)鍵環(huán)節(jié)。
![]()
利用合成數(shù)據(jù)生成技術(shù)為 GROOT N 系列模型提供支持的流程
謝晨在直播中提到:“Cosmos 就像數(shù)據(jù)的放大器,我們將仿真生成的精準(zhǔn)數(shù)據(jù)、現(xiàn)實(shí)采集的少量數(shù)據(jù)輸入其中,它能生成更多樣、更貼近真實(shí)情況的數(shù)據(jù),解決機(jī)器人訓(xùn)練的數(shù)據(jù)量難題。”
為何必須在虛擬世界訓(xùn)練機(jī)器人?謝晨用實(shí)例解釋:“要讓機(jī)器人學(xué)會疊衣服,現(xiàn)實(shí)中需招募大量人員采集數(shù)據(jù),還得考慮衣服材質(zhì)、褶皺差異;但在仿真中,我們可生成上千種衣服模型、設(shè)置不同物理參數(shù),讓機(jī)器人幾天內(nèi)完成相當(dāng)于現(xiàn)實(shí)幾年的訓(xùn)練量。”
Madison 補(bǔ)充道:“Sim2Real 的關(guān)鍵不是讓虛擬復(fù)制現(xiàn)實(shí),而是讓虛擬覆蓋現(xiàn)實(shí)。通過場景隨機(jī)化、參數(shù)調(diào)整,讓機(jī)器人在虛擬中接觸足夠多的意外情況,到了現(xiàn)實(shí)中才能應(yīng)對自如。”
▍為什么是光輪智能?“從根本上來說,我們離不開光輪智能”
這場直播選擇謝晨作為對話嘉賓,不僅因他曾任職英偉達(dá)的經(jīng)歷,更核心的是其創(chuàng)立的光輪智能,與英偉達(dá) Sim2Real 技術(shù)路線高度契合。雙方已經(jīng)不局限于簡單的技術(shù)合作,而是形成了技術(shù)共生的關(guān)系。用Madison 的話說:“光輪智能是少數(shù)能在物理精度、交互邏輯、場景多樣性上,全面匹配英偉達(dá)物理智能生態(tài)需求的合作方。”
![]()
Madison 在直播中提到,當(dāng)前英偉達(dá)正重點(diǎn)推進(jìn) “物理 AI”(含機(jī)器人、自動駕駛、數(shù)字孿生)的技術(shù)落地與產(chǎn)業(yè)應(yīng)用,“核心痛點(diǎn)是缺乏海量真實(shí)、多樣化的物理交互數(shù)據(jù),我們需要的是能真正落地的解決方案,而非停留在概念層面”。她表示,英偉達(dá)的技術(shù)布局需兩大支撐:一是能穩(wěn)定輸出高質(zhì)量數(shù)據(jù)的 “合成數(shù)據(jù)工廠”,二是與 “以 OpenUSD 為 SimReady 資產(chǎn)基礎(chǔ)” 愿景一致的合作伙伴。“光輪智能成立的時機(jī),恰好是英偉達(dá)最需要這樣一支團(tuán)隊(duì)的時候,他們理解我們的技術(shù)邏輯,且能快速將其轉(zhuǎn)化為實(shí)際成果”。“從根本上來說,我們離不開光輪智能“。
事實(shí)上英偉達(dá)這個方向與光輪智能在核心目標(biāo)上不謀而合,謝晨在直播中回憶到:“2023 年我們成立光輪智能,目標(biāo)是解決機(jī)器人領(lǐng)域的數(shù)據(jù)瓶頸。當(dāng)時機(jī)器人領(lǐng)域尚處早期,我們先從自動駕駛合成數(shù)據(jù)切入,進(jìn)而與英偉達(dá)自動駕駛團(tuán)隊(duì)展開合作,后續(xù)隨著合作深入,我們陸續(xù)聯(lián)動 Gear Lab 團(tuán)隊(duì),以及 Omniverse 團(tuán)隊(duì),如今還在和 Cosmos 團(tuán)隊(duì)協(xié)作,已逐步融入英偉達(dá)的生態(tài)鏈條”。
謝晨在直播中強(qiáng)調(diào)雙方對 SimReady 資產(chǎn)的共識:“很多人誤以為 SimReady 只是數(shù)字 3D 模型,但我和英偉達(dá)的看法一致:它必須具備真實(shí)的物理屬性,比如冰箱鉸鏈的阻尼、微波爐材質(zhì)的摩擦系數(shù)”。他透露,光輪的核心工作是通過專業(yè)設(shè)備采集真實(shí)物理數(shù)據(jù),再植入 SimReady 資產(chǎn),“我們用物理設(shè)備從不同方向、位置采集力數(shù)據(jù),在仿真中搭建同類傳感器采集信息,通過對比真實(shí)與仿真的力測曲線,確保物理屬性匹配。”
▍結(jié)語與未來
外界分析認(rèn)為,此次直播是英偉達(dá)物理智能版圖的非正式亮相:從OpenUSD(3D數(shù)據(jù)標(biāo)準(zhǔn))、SimReady(仿真資產(chǎn)標(biāo)準(zhǔn)),到Newton(物理計(jì)算)、Cosmos(世界模型),英偉達(dá)正構(gòu)建物理智能全鏈路體系,而光輪智能正是該體系中的關(guān)鍵合作伙伴。隨著雙方合作的進(jìn)一步加深,未來有望改變傳統(tǒng)機(jī)器人產(chǎn)業(yè)的技術(shù)路徑。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.