黃仁勛女兒首秀直播：英偉達(dá)具身智能布局藏哪些關(guān)鍵信號？

2025-10-16 11:02:30　來源: 機(jī)器人大講堂

安徽舉報(bào)

分享至

10 月 8 日，英偉達(dá) Omniverse 及物理 AI 產(chǎn)品與技術(shù)營銷負(fù)責(zé)人 Madison Huang 首次公開亮相訪談節(jié)目《英偉達(dá) OpenUSD Insider Series Podcast》，與光輪智能 CEO 謝晨博士圍繞主題《Bridging the Sim2Real Gap with SimReady and AI》展開對談，深度探討 “如何讓機(jī)器人在虛擬世界學(xué)習(xí)、在真實(shí)世界行動”。

左上：Edmar 右上：Madison Huang 左下：穆斯塔法右下：謝晨

值得關(guān)注的是，Madison Huang 是英偉達(dá)創(chuàng)始人黃仁勛之女。主持人 Edmar 在開場時便強(qiáng)調(diào) “這是非常特別的一期”，并提及這是 Madison 的首次官方直播。不同于產(chǎn)品發(fā)布或企業(yè)宣講的宏大場景，此次她以英偉達(dá) Omniverse 及物理 AI 產(chǎn)品與技術(shù)營銷負(fù)責(zé)人的身份，聚焦機(jī)器人與仿真主題參與對談。

與 Madison 對話的，是前英偉達(dá)自動駕駛仿真負(fù)責(zé)人、現(xiàn)任光輪智能 CEO 謝晨，以及光輪智能增長負(fù)責(zé)人穆斯塔法。謝晨是 Sim2Real 領(lǐng)域的資深實(shí)踐者，并非行業(yè)新人，他曾在英偉達(dá)主導(dǎo)自動駕駛仿真工作，此前還負(fù)責(zé)過 Cruise 的仿真業(yè)務(wù)，具備深厚的技術(shù)與實(shí)踐積累。

這場一個半小時的直播，在技術(shù)圈引發(fā)廣泛討論：既因 Madison 的首次公開亮相，更因?qū)φ動|及了重新定義機(jī)器人產(chǎn)業(yè)的核心命題 ——如何彌合 Sim2Real Gap（仿真與現(xiàn)實(shí)鴻溝）。而這場以技術(shù)為導(dǎo)向的直播背后，正藏著英偉達(dá)在物理智能領(lǐng)域的關(guān)鍵布局。

▍英偉達(dá)一周內(nèi)連續(xù)兩場直播！仿真才是機(jī)器人數(shù)據(jù)困境最優(yōu)解

需要關(guān)注的是，NVIDIA Omniverse 官方頻道上一期直播中，斯坦福大學(xué)教授李飛飛與英偉達(dá)首席科學(xué)家 Jim Fan，曾圍繞 BEHAVIOR 具身智能挑戰(zhàn)賽展開對話。Jim Fan 在訪談中坦言，機(jī)器人學(xué)習(xí)最大的問題就是 “仿真和真實(shí)世界存在差距”。這個問題目前集中在三個方面，一是感知差距，仿真的視覺、觸覺等信號與真實(shí)場景（如物體紋理、光照）有差異；二是物理交互差距，仿真中物體的受力反饋、形變（如布料褶皺、流體流動）與真實(shí)物理規(guī)律有偏差；三是場景復(fù)雜度差距，真實(shí)世界的動態(tài)變化（如突發(fā)障礙物、物體狀態(tài)突變）難在仿真中完全復(fù)現(xiàn)，導(dǎo)致機(jī)器人仿真所學(xué)難適配真實(shí)場景。

Jim Fan 同時表示，3D 計(jì)算機(jī)視覺、視頻生成、3D 世界生成等生成式 AI 技術(shù)有望進(jìn)一步提升仿真的真實(shí)感，可通過這些工具優(yōu)化仿真環(huán)境的視覺渲染、物體細(xì)節(jié)，減少感知層面的差距。目前NVIDIA 與斯坦福合作的 “OmniGibson” 仿真引擎，已能支持剛體物理、可變形物體（布料、流體）交互，以及物體的加熱、切割等復(fù)雜狀態(tài)模擬。同時，Jim Fan也進(jìn)一步強(qiáng)調(diào)，機(jī)器人學(xué)習(xí)不能依賴單一數(shù)據(jù)來源，同樣需要 “仿真數(shù)據(jù)與真實(shí)數(shù)據(jù)相結(jié)合”。

而本期節(jié)目當(dāng)中，Madison也提到了與Jim Fan相同的觀點(diǎn)：“機(jī)器人不能只讀取數(shù)據(jù)，它們必須親身體驗(yàn)這個世界。” 她進(jìn)一步解釋，語言類程序可依托互聯(lián)網(wǎng)海量數(shù)據(jù)訓(xùn)練，但機(jī)器人研發(fā)者面臨顯著數(shù)據(jù)困境。現(xiàn)實(shí)中手動采集數(shù)據(jù)成本高、效率低且存在安全風(fēng)險，“沒人會讓機(jī)器人在現(xiàn)實(shí)里反復(fù)撞門來學(xué)習(xí)開門”，而仿真正是突破這一困境的關(guān)鍵路徑。

謝晨認(rèn)為，“ Sim2Real 就是我們在仿真中訓(xùn)練的內(nèi)容能部署到現(xiàn)實(shí)世界，這其實(shí)是件非常困難的事”。他提到，自動駕駛的仿真到現(xiàn)實(shí)問題相對容易解決，因?yàn)槠渲饕谝曈X；但機(jī)器人領(lǐng)域的情況截然不同。“一切都與物理接觸有關(guān)，最重要的是操控，還需要結(jié)合靈巧手、觸覺傳感器，問題復(fù)雜得多”。同時，謝晨強(qiáng)調(diào) “現(xiàn)實(shí)世界數(shù)據(jù)無法完全解決（機(jī)器人數(shù)據(jù)）壁壘”：當(dāng)前機(jī)器人數(shù)量有限，難以像自動駕駛汽車那樣大規(guī)模采集現(xiàn)實(shí)數(shù)據(jù)，因此“我們必須使用合成數(shù)據(jù)，并且堅(jiān)信合成數(shù)據(jù)將是解決物理 AI 數(shù)據(jù)壁壘最重要、最主要的數(shù)據(jù)來源”。

▍英偉達(dá)“三臺計(jì)算機(jī)”邏輯 Sim2Real 如何串聯(lián)機(jī)器人全鏈路？

在 Madison 與謝晨的對話中提到，過去十年，英偉達(dá)已不再是單純的顯卡企業(yè)，而是致力于打造機(jī)器人可學(xué)習(xí)的 “虛擬地球”。英偉達(dá)不直接研發(fā)機(jī)器人，而是為機(jī)器人領(lǐng)域提供從技術(shù)學(xué)習(xí)到落地應(yīng)用的全鏈路體系。這套體系可通過 “三臺計(jì)算機(jī)” 的邏輯理解，而 Sim2Real（仿真到現(xiàn)實(shí)）正是串聯(lián)三者的核心紐帶。

第一臺是 AI 超級計(jì)算機(jī)（AI Supercomputer），是 “讓機(jī)器學(xué)會處理信息” 的基礎(chǔ)。與語言類程序依托海量文本數(shù)據(jù)訓(xùn)練理解能力類似，機(jī)器人核心程序也需算力支撐；但區(qū)別在于，機(jī)器人程序依賴物理世界數(shù)據(jù)，這就需要第二臺計(jì)算機(jī)提供支持。

第二臺是仿真計(jì)算機(jī)（Simulation Computer），以 Omniverse 和 Isaac Sim 為核心，負(fù)責(zé)讓機(jī)器在虛擬世界中掌握感知與交互能力。Madison 在直播中強(qiáng)調(diào)：“自動駕駛仿真相對簡單，核心依賴視覺；但機(jī)器人需要觸摸、抓取、操作，物理交互才是關(guān)鍵難點(diǎn)。” 她還提到，外界常問英偉達(dá) “能否做電纜、電線仿真”，這對英偉達(dá)而言意義重大 —— 其 NVL 72 液冷機(jī)架級 AI 計(jì)算系統(tǒng)及 Blackwell 系列產(chǎn)品的制造流程復(fù)雜，僅一個 NVL 72 機(jī)架就需兩英里長銅纜，這類工作對人類而言枯燥且有安全風(fēng)險，亟需機(jī)器人完成，因此電纜、電線仿真正是機(jī)器人領(lǐng)域亟待突破的 “圣杯級” 難題，而光輪智能在該領(lǐng)域的成果十分突出。

第三臺是物理 AI 計(jì)算機(jī)（Physical AI Computer），由 GROOT（通用機(jī)器人基礎(chǔ)程序）、Cosmos（世界模型）和 Jetson Thor（機(jī)器人端側(cè)芯片）構(gòu)成，負(fù)責(zé)讓機(jī)器人在真實(shí)世界中執(zhí)行任務(wù)，其中 Cosmos 是銜接仿真與現(xiàn)實(shí)的關(guān)鍵環(huán)節(jié)。

利用合成數(shù)據(jù)生成技術(shù)為 GROOT N 系列模型提供支持的流程

謝晨在直播中提到：“Cosmos 就像數(shù)據(jù)的放大器，我們將仿真生成的精準(zhǔn)數(shù)據(jù)、現(xiàn)實(shí)采集的少量數(shù)據(jù)輸入其中，它能生成更多樣、更貼近真實(shí)情況的數(shù)據(jù)，解決機(jī)器人訓(xùn)練的數(shù)據(jù)量難題。”

為何必須在虛擬世界訓(xùn)練機(jī)器人？謝晨用實(shí)例解釋：“要讓機(jī)器人學(xué)會疊衣服，現(xiàn)實(shí)中需招募大量人員采集數(shù)據(jù)，還得考慮衣服材質(zhì)、褶皺差異；但在仿真中，我們可生成上千種衣服模型、設(shè)置不同物理參數(shù)，讓機(jī)器人幾天內(nèi)完成相當(dāng)于現(xiàn)實(shí)幾年的訓(xùn)練量。”

Madison 補(bǔ)充道：“Sim2Real 的關(guān)鍵不是讓虛擬復(fù)制現(xiàn)實(shí)，而是讓虛擬覆蓋現(xiàn)實(shí)。通過場景隨機(jī)化、參數(shù)調(diào)整，讓機(jī)器人在虛擬中接觸足夠多的意外情況，到了現(xiàn)實(shí)中才能應(yīng)對自如。”

▍為什么是光輪智能？“從根本上來說，我們離不開光輪智能”

這場直播選擇謝晨作為對話嘉賓，不僅因他曾任職英偉達(dá)的經(jīng)歷，更核心的是其創(chuàng)立的光輪智能，與英偉達(dá) Sim2Real 技術(shù)路線高度契合。雙方已經(jīng)不局限于簡單的技術(shù)合作，而是形成了技術(shù)共生的關(guān)系。用Madison 的話說：“光輪智能是少數(shù)能在物理精度、交互邏輯、場景多樣性上，全面匹配英偉達(dá)物理智能生態(tài)需求的合作方。”

Madison 在直播中提到，當(dāng)前英偉達(dá)正重點(diǎn)推進(jìn) “物理 AI”（含機(jī)器人、自動駕駛、數(shù)字孿生）的技術(shù)落地與產(chǎn)業(yè)應(yīng)用，“核心痛點(diǎn)是缺乏海量真實(shí)、多樣化的物理交互數(shù)據(jù)，我們需要的是能真正落地的解決方案，而非停留在概念層面”。她表示，英偉達(dá)的技術(shù)布局需兩大支撐：一是能穩(wěn)定輸出高質(zhì)量數(shù)據(jù)的 “合成數(shù)據(jù)工廠”，二是與 “以 OpenUSD 為 SimReady 資產(chǎn)基礎(chǔ)” 愿景一致的合作伙伴。“光輪智能成立的時機(jī)，恰好是英偉達(dá)最需要這樣一支團(tuán)隊(duì)的時候，他們理解我們的技術(shù)邏輯，且能快速將其轉(zhuǎn)化為實(shí)際成果”。“從根本上來說，我們離不開光輪智能“。

事實(shí)上英偉達(dá)這個方向與光輪智能在核心目標(biāo)上不謀而合，謝晨在直播中回憶到：“2023 年我們成立光輪智能，目標(biāo)是解決機(jī)器人領(lǐng)域的數(shù)據(jù)瓶頸。當(dāng)時機(jī)器人領(lǐng)域尚處早期，我們先從自動駕駛合成數(shù)據(jù)切入，進(jìn)而與英偉達(dá)自動駕駛團(tuán)隊(duì)展開合作，后續(xù)隨著合作深入，我們陸續(xù)聯(lián)動 Gear Lab 團(tuán)隊(duì)，以及 Omniverse 團(tuán)隊(duì)，如今還在和 Cosmos 團(tuán)隊(duì)協(xié)作，已逐步融入英偉達(dá)的生態(tài)鏈條”。

謝晨在直播中強(qiáng)調(diào)雙方對 SimReady 資產(chǎn)的共識：“很多人誤以為 SimReady 只是數(shù)字 3D 模型，但我和英偉達(dá)的看法一致：它必須具備真實(shí)的物理屬性，比如冰箱鉸鏈的阻尼、微波爐材質(zhì)的摩擦系數(shù)”。他透露，光輪的核心工作是通過專業(yè)設(shè)備采集真實(shí)物理數(shù)據(jù)，再植入 SimReady 資產(chǎn)，“我們用物理設(shè)備從不同方向、位置采集力數(shù)據(jù)，在仿真中搭建同類傳感器采集信息，通過對比真實(shí)與仿真的力測曲線，確保物理屬性匹配。”

▍結(jié)語與未來

外界分析認(rèn)為，此次直播是英偉達(dá)物理智能版圖的非正式亮相：從OpenUSD（3D數(shù)據(jù)標(biāo)準(zhǔn)）、SimReady（仿真資產(chǎn)標(biāo)準(zhǔn)），到Newton（物理計(jì)算）、Cosmos（世界模型），英偉達(dá)正構(gòu)建物理智能全鏈路體系，而光輪智能正是該體系中的關(guān)鍵合作伙伴。隨著雙方合作的進(jìn)一步加深，未來有望改變傳統(tǒng)機(jī)器人產(chǎn)業(yè)的技術(shù)路徑。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.