近一年來(lái),人形機(jī)器人持續(xù)火熱。不過(guò),當(dāng)下人形機(jī)器人仍依賴人類遙控,普遍缺乏擁有自主決策能力的機(jī)器人“大腦”,因此也頻遭外界質(zhì)疑。
12月18日,大曉機(jī)器人召開(kāi)發(fā)布會(huì),推出開(kāi)悟世界模型3.0(Kairos 3.0)。據(jù)悉,大曉機(jī)器人由商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛創(chuàng)立,由澳大利亞科學(xué)院院士陶大程擔(dān)任首席科學(xué)家,該公司主要研究方向?yàn)闄C(jī)器人“大腦”及軟硬件協(xié)同。
欲攻克機(jī)器人“大腦”難題
目前,國(guó)內(nèi)人形機(jī)器人廠商大多聚焦于機(jī)器人本體及小腦,機(jī)器人大腦的研究相對(duì)匱乏。而大曉機(jī)器人主研方向正是機(jī)器人大腦。
王曉剛接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示:“大曉機(jī)器人在產(chǎn)品化落地方面,輸出的是軟硬一體的方案,針對(duì)各個(gè)場(chǎng)景。”
從大曉機(jī)器人研發(fā)團(tuán)隊(duì)也可以看出,更加偏向“大腦”的研發(fā),而并非機(jī)器人本體。
據(jù)悉,陶大程曾獲IEEE計(jì)算機(jī)學(xué)會(huì)技術(shù)成就獎(jiǎng),也曾出任京東探索研究院創(chuàng)始院長(zhǎng)、優(yōu)必選人工智能首席科學(xué)家。此外,大曉機(jī)器人匯集來(lái)自南洋理工大學(xué)、香港大學(xué)和香港中文大學(xué)的全球稀缺的AI領(lǐng)域前沿科學(xué)家呂健勤、李鴻升、劉子緯、潘新鋼、趙恒爽、劉希慧。
![]()
大曉機(jī)器人核心科學(xué)家團(tuán)隊(duì) 圖片來(lái)源:大曉機(jī)器人供圖
王曉剛表示:“我們團(tuán)隊(duì)強(qiáng)在‘大腦’和軟件。同時(shí),在過(guò)去兩年時(shí)間,商湯也投資了一系列本體和零部件公司。然而,在實(shí)際場(chǎng)景中,現(xiàn)有的本體硬件與實(shí)際需求仍存在較大差距。因此,大曉會(huì)根據(jù)場(chǎng)景需求進(jìn)行軟硬件聯(lián)合優(yōu)化,協(xié)同供應(yīng)鏈生態(tài)伙伴,重新設(shè)計(jì)硬件,使產(chǎn)品更符合客戶需求。”
機(jī)器人“大腦”為何仍不盡人意?
王曉剛表示:“具身智能被期待擁有一個(gè)強(qiáng)大的大腦,這源于過(guò)去幾年在大語(yǔ)言模型和多模態(tài)模型上取得的突破,大家期待將這種語(yǔ)言模型的能力賦予機(jī)器人,以實(shí)現(xiàn)通用化能力。”
那么,為何當(dāng)下機(jī)器人“大腦”仍然不盡人意?
王曉剛認(rèn)為:“現(xiàn)有技術(shù)路線有明顯缺陷。VLA(視覺(jué)、語(yǔ)言、動(dòng)作)模型是以機(jī)器為中心的,通過(guò)輸入指令、圖像和視頻,直接輸出動(dòng)作,它不太需要去理解真實(shí)的物理世界和物理規(guī)律。我們期待將來(lái)有一個(gè)更強(qiáng)的‘大腦’能去理解世界,這就是我們提出的世界模型。與之伴隨的是我們提出的ACE環(huán)境式采集范式。”
其具體解釋稱:“以前以機(jī)器為中心,基于不同物理結(jié)構(gòu)的本體采集真機(jī)數(shù)據(jù),很難綜合得到一個(gè)比較通用化的‘大腦’。現(xiàn)在環(huán)境式采集是‘以人為中心’,通過(guò)第一視角、第三視角和多模態(tài)數(shù)據(jù),更好地對(duì)人和物理世界的交互進(jìn)行建模,并利用這些數(shù)據(jù)訓(xùn)練我們的世界模型。簡(jiǎn)單粗暴地使用端到端或VLA并不能解決具身智能對(duì)‘大腦’的期望。”
此前,有行業(yè)人士認(rèn)為,汽車自動(dòng)駕駛尚未完全實(shí)現(xiàn),而具身智能更加復(fù)雜。對(duì)此,王曉剛告訴每經(jīng)記者:“汽車自動(dòng)駕駛與人形機(jī)器人應(yīng)用場(chǎng)景不太一樣,不能說(shuō)汽車自動(dòng)駕駛的場(chǎng)景更加簡(jiǎn)單。這是因?yàn)樽詣?dòng)駕駛過(guò)程中,車速通常非常快,因而對(duì)乘客體驗(yàn)及安全性要求都非常高。”
其補(bǔ)充表示:“如果我們想象的場(chǎng)景是人形機(jī)器人在家庭中能夠完全取代人、完成各種長(zhǎng)程復(fù)雜的任務(wù),并且保證安全性,這確實(shí)需要在未來(lái)的五年甚至更長(zhǎng)的時(shí)間才能達(dá)到。但這并不妨礙機(jī)器人在各種場(chǎng)景中逐漸落地。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.