衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
具身機器人在60分鐘內(nèi),不間斷抓取100多個沒見過的物體(透明的、金屬的、軟質(zhì)的),目前能達到什么水平?
一個最新模型給了份令人驚喜的答案:
首試抓取成功率約98%,兩次嘗試內(nèi)幾乎100%。
![]()
而且,驅(qū)動這次抓取測試的模型,訓(xùn)練時沒有用過哪怕一條真機數(shù)據(jù),把純仿真路線貫徹到底。
這樣亮點十足的成績,來自一家此前極度低調(diào)、但已被頂級投資人和產(chǎn)業(yè)客戶持續(xù)押注的具身智能公司。
蘇度科技。
量子位最新獲悉,剛剛歸國就任復(fù)旦大學(xué)浩清特聘教授、通用物理智能研究院院長的蘇昊,正是蘇度科技的首席技術(shù)顧問,支持該公司技術(shù)方向的發(fā)展。
今天上午,蘇度官網(wǎng)發(fā)布首個技術(shù)Blog,正式介紹了軟硬件全棧自研的機器人系統(tǒng)#Sudo R1。
它采用世界模型與強化學(xué)習(xí)一體化設(shè)計,在不使用任何真機數(shù)據(jù)的前提下,實現(xiàn)了關(guān)鍵任務(wù)近100%的Zero-shot成功率,首次在業(yè)內(nèi)達成這一成就。
看到這兒,想必你和我有一樣的疑問:
在真機數(shù)據(jù)采集成本高昂、難以規(guī)模化的行業(yè)困境下,#Sudo R1是實現(xiàn)如此驚艷的效果的?
交卷的#Sudo R1,走了一條怎樣的路線?
我們先從#Sudo R1的實測表現(xiàn)說起。
可以看到,#Sudo R1在這段60分鐘、未經(jīng)剪輯的視頻中,不間斷執(zhí)行抓取任務(wù)。
![]()
視頻中,#Sudo R1的200多次抓取測試覆蓋了透明、柔性、反光、不規(guī)則形狀等多類真實場景中常見的硬骨頭。
且測試環(huán)境包含不同光照條件(暗室、日光、夜景燈光)以及隨機物理干擾:
![]()
動態(tài)背景(用電視屏幕模擬各種場景):
![]()
還有障礙物約束、空間約束等等。
團隊人為制造了各種不同的環(huán)境和突然情況,盡可能模擬日常生活中的真實任務(wù)對象和工作環(huán)境。
在沒有cherry-pick的情況下,zero-shot成功率接近100%。
理論上來講,把搭載了#Sudo R1的具身機器人丟到任意一個環(huán)境,它都能在0示意教學(xué)的前提下直接抓放東西了~
![]()
必須跟大家說道說道,#Sudo R1能有如此高的成功率,很大程度上得益于蘇度選擇的訓(xùn)練路線。
目前最主流的具身模型路線以PI(Physical Intelligence)和Generalist旗下模型為代表。
它們通常依賴few-shot方式來適配,即需要針對具體場景進行示教,針對每個場景單獨調(diào)參,在限定環(huán)境與物體條件下才能獲得較高成功率。
凡事有利有弊。
這樣做的弊端就是一旦環(huán)境或物體發(fā)生變化,往往難以跨場景遷移,就必須重新采集數(shù)據(jù)、重新訓(xùn)練。
或者這么說吧,目前的主流具身模型訓(xùn)練方法本質(zhì)上更接近“任務(wù)優(yōu)化”,而非更通俗意義上的泛化。
蘇度沒有選擇這樣的路線。
團隊表示“不想針對任何具體場景做適配”,更希望讓模型具有通用泛化能力,在zero-shot的條件下就實現(xiàn)開箱即用的效果。
遵循這樣的思路,蘇度走上了純仿真數(shù)據(jù)訓(xùn)練模型的路。
于是,沒有真機數(shù)據(jù),沒有遙操作,沒有人工標注,團隊開始訓(xùn)練模型。
![]()
他們也想同時來驗證“純仿真訓(xùn)練結(jié)合零真機數(shù)據(jù)”的方式,是否能獨立支撐起模型的Sim2Real落地路徑。
現(xiàn)在,#Sudo R1這個最新出爐的模型告訴大家,答案是肯定的。
#Sudo R1是怎么做到的?
與此同時,#Sudo R1還直面了當(dāng)前具身智能發(fā)展的兩個核心瓶頸。
首先是數(shù)據(jù)供給問題。
盡管遙操、人類視角采集和UMI這些當(dāng)下行業(yè)主流依賴的真機數(shù)據(jù)采集路徑不斷在優(yōu)化成本和效率,但只要想規(guī)模化擴展,都不是特別理想。
人力、設(shè)備、時間成本重重疊加,數(shù)據(jù)供給難以隨算力線性增長。所以說如果僅僅只是把真機數(shù)據(jù)作為模型訓(xùn)練的單一基礎(chǔ),至少在很長一段時間內(nèi),都會限制模型能力的提升上限。
其次,也是更本質(zhì)的問題。真機數(shù)據(jù)雖然同時包含視覺和動作信息,但涉及動力學(xué)(dynamics)時,包含的信息既不完備,也不直接。
但動力學(xué)的重要性不容忽視,它可是物理世界最最核心的要素之一。
如果模型對動力學(xué)的刻畫不精準,那么它學(xué)到的物理交互規(guī)律也難以達到強穩(wěn)定性和強泛化性。
這也是多數(shù)具身系統(tǒng)在真實環(huán)境中表現(xiàn)不穩(wěn)定、難以規(guī)模化的根本原因。
![]()
面對這兩個瓶頸,蘇度的解法是重新定義數(shù)據(jù)范式,通過數(shù)據(jù)與模型的組合構(gòu)建一條可規(guī)模化路徑。
講道理,仿真數(shù)據(jù)和真實數(shù)據(jù)之間不是替代的關(guān)系,兩者各有各的優(yōu)勢。
所以思考的重點不應(yīng)該局限在仿真和真實數(shù)據(jù)孰優(yōu)孰劣,更應(yīng)該費心考慮,怎么針對性地根據(jù)具體場景,來動態(tài)平衡兩者的配比,以實現(xiàn)最優(yōu)結(jié)果。
在蘇度團隊看來,仿真數(shù)據(jù)天然包含完整的物理交互信息,在成本和規(guī)模化層面具備顯著優(yōu)勢,非常適合為模型搭建廣度認知與物理常識的基礎(chǔ)。
而真機數(shù)據(jù)則自帶真實噪聲、傳感器誤差及復(fù)雜環(huán)境擾動等現(xiàn)實特征,能提供與真實場景分布對齊的關(guān)鍵信號。
但考慮到它的成本居高不下,綜合來看,這類數(shù)據(jù)更適合作為模型后期做真實場景對齊與效果校正的稀缺資源。
![]()
但問題的關(guān)鍵在于,模型訓(xùn)練的哪個階段該主攻仿真數(shù)據(jù),又在哪個階段需要提升真機數(shù)據(jù)的占比?
要找到這一問題的最優(yōu)解,既需要對仿真器具備足夠深入的理解,也需要精準判斷不同場景下仿真與真機數(shù)據(jù)的協(xié)同方式,這種能力絕非短時間內(nèi)能夠積累而成。
蘇度的數(shù)據(jù)體系建立在高保真仿真器之上,天然包含了對物理dynamics的直接表達,使模型能夠?qū)W習(xí)到可泛化的物理規(guī)律,更適合作為具身模型的預(yù)訓(xùn)練數(shù)據(jù)引擎。
包含多維物理信息的數(shù)據(jù)問題被解決,模型架構(gòu)才能真正發(fā)揮威力。
我們還了解到,蘇度是目前行業(yè)唯一能在底層模型中系統(tǒng)性實現(xiàn)世界模型與強化學(xué)習(xí)一體化設(shè)計的團隊。
這種一體化架構(gòu),讓純仿真訓(xùn)練能夠獨立支撐模型跨越現(xiàn)實世界的復(fù)雜性與不確定性,實現(xiàn)本文開頭提到的近100% zero-shot成功率。
沒錯,#Sudo R1是蘇度底層數(shù)據(jù)路線與模型架構(gòu)共同作用的階段性成果,它在泛化性、敏捷性、魯棒性和空間智能四個維度上同時逼近生產(chǎn)級水準。
說它打破了行業(yè)長期以來對Sim2Real路徑的根本性質(zhì)疑,毫不為過。
蘇度一鳴驚人,但一切都在情理之中
#Sudo R1是蘇度公開發(fā)布的第一個模型。
首次亮相就拿出這樣的成績,看得出背后團隊實力一定不容小覷。
工商信息顯示,上海蘇度科技有限公司成立于2025年5月。公司董事韓錚,也是公司的聯(lián)合創(chuàng)始人兼CEO。
蘇度的幾位投資人告訴量子位,韓錚是一位連續(xù)創(chuàng)業(yè)者,在AI和硬件產(chǎn)品領(lǐng)域具備多次0-1及規(guī)模化落地經(jīng)驗,曾多次帶領(lǐng)所在團隊實現(xiàn)全球化業(yè)務(wù)與并購?fù)顺觥?/p>
業(yè)界人士這樣評價他:“(韓錚是)具身領(lǐng)域少有的兼具技術(shù)理解與商業(yè)經(jīng)驗的CEO,更具備扎實的產(chǎn)品能力。在當(dāng)前具身賽道日益項目化的背景下,業(yè)界看好他打破這一路徑依賴,推動具身智能走向真正的產(chǎn)品化。”
![]()
本文開頭已經(jīng)提到,復(fù)旦蘇昊是蘇度的首席技術(shù)顧問。
熟悉具身智能領(lǐng)域的旁友們對這位大佬絕對不陌生。
蘇昊師從美國三院院士Leonidas Guibas教授、中科院院士李未教授、美國工程院和英國皇家學(xué)院院士沈向洋教授、美國三院院士李飛飛教授,不僅僅是ImageNet的核心締造者之一,也曾主導(dǎo)ShapeNet、PointNet等3D視覺奠基性工作。
歸國前,他在UCSD任終身副教授、具身智能實驗室主任;上周他官宣歸國任教,擔(dān)任復(fù)旦大學(xué)浩清特聘教授、通用物理智能研究院院長。
![]()
目前該公司內(nèi)的技術(shù)負責(zé)人徐澤祥,是前Adobe 3D Gen AI的負責(zé)人。
據(jù)公開信息了解,他師從圖形學(xué)領(lǐng)域權(quán)威、UCSD計算機科學(xué)系教授Ravi Ramamoorthi。
徐澤祥長期與蘇昊開展合作研究,聯(lián)合發(fā)表多篇具有行業(yè)影響力的學(xué)術(shù)成果,在技術(shù)路徑與核心方法論上形成高度一致的認知。
谷歌學(xué)術(shù)顯示,他的論文被引用數(shù)量超1.1萬次。
同時,徐澤祥還兼具深厚的產(chǎn)業(yè)落地與團隊管理經(jīng)驗。
另外我們還得知,蘇度硬件負責(zé)人是源碼資本前投資人陳潤澤。
據(jù)透露,他在投資人生涯中,曾主導(dǎo)公司對宇樹科技的押注。
張校珩擔(dān)任蘇度的戰(zhàn)略負責(zé)人。
公開資料顯示,他曾任職于ABB、華為及藍馳創(chuàng)投,具備產(chǎn)業(yè)與投資雙重經(jīng)驗,在投資多家具身智能與先進制造明星企業(yè)后,選擇回歸產(chǎn)業(yè)一線。
此外,蘇度目前的團隊核心成員來自原Hillbot項目的多位骨干。
創(chuàng)業(yè)者、學(xué)者、投資人、產(chǎn)業(yè)老兵……綜合來看,蘇度的核心團隊背景多元,這樣的復(fù)合型配置,兼具了產(chǎn)業(yè)實操、學(xué)術(shù)積淀、資本視野與行業(yè)經(jīng)驗。
資本市場和產(chǎn)業(yè)從不同視角表達了對蘇度科技的肯定。
資本層面,雖然該公司自成立以來保持較低的對外曝光,但量子位還是從多個信源處求證,蘇度已經(jīng)持續(xù)獲得產(chǎn)業(yè)界頭部客戶與全球一線投資機構(gòu)的認可和支持。
投資方陣容很豪華,包括寧德時代溥泉資本、阿里、高瓴創(chuàng)投、國壽股權(quán)、綠洲、騰訊、螞蟻、IDG、藍馳、數(shù)字未來、孚騰、復(fù)旦科創(chuàng)、云暉等。
據(jù)了解,蘇度最新已完成新一輪融資,估值突破20億美元,并持續(xù)獲得多家頭部及產(chǎn)業(yè)機構(gòu)的支持與加入。
值得關(guān)注的是,這份投資方名單中的大多數(shù)機構(gòu)均以長期技術(shù)研判與產(chǎn)業(yè)深度理解為核心優(yōu)勢,對于通用模型能力的搭建(而非單一場景下的短期擬合)有著明確且一致的認知。
![]()
與此同時,蘇度在產(chǎn)業(yè)側(cè)的進展也很亮眼。
我們最新獲悉,蘇度的模型在zero-shot與高成功率能力下即可完成初步部署,無需采集客戶敏感數(shù)據(jù),正是這一關(guān)鍵認知,在產(chǎn)業(yè)側(cè)獲得了更高的認可度。
該公司還計劃以平臺化方式提供系統(tǒng)接口與開發(fā)者工具,方便客戶快速完成場景適配和系統(tǒng)集成。
有消息稱,蘇度基于通用模型能力,正在構(gòu)建行業(yè)首個實現(xiàn)多工位覆蓋的機器人系統(tǒng),使同一套模型能夠在不同工位之間穩(wěn)定遷移,并支持多產(chǎn)品的快速切換與連續(xù)作業(yè)。
跨工位的泛化能力才能支撐起柔性制造的需求。對實際生產(chǎn)場景來說,這一點的重要性不言而喻。
還有消息稱,蘇度已與寧德時代在多個核心制造場景中開展聯(lián)合開發(fā),圍繞電池生產(chǎn)與物流環(huán)節(jié)推進具身智能系統(tǒng)的落地驗證。
蘇度官網(wǎng)鏈接:
https://www.sudo.ai/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.