![]()
在機(jī)器人領(lǐng)域,AI才剛剛開始展露頭角。
不久前,一家名為Figure的初創(chuàng)企業(yè),估值高達(dá)26億美元,由一群來自波士頓動力、特斯拉、谷歌DeepMind和Archer Aviation的前員工成立。今天,他們與新投資者及合作伙伴OpenAI的首次合作問世,著實(shí)令人眼前一亮。
Figure的聯(lián)合創(chuàng)始人兼CEO Brett Adcock在社交平臺X上分享了一段視頻,展示了他們的全尺寸人形機(jī)器人Figure 01的能力。
視頻中,這位機(jī)器人展示了它與人類和環(huán)境互動的能力:遵循人類的指令,找到并遞給他們物品(比如一個(gè)蘋果),同時(shí)描述它正在做什么并與人對話(盡管反應(yīng)時(shí)間比人與人交流時(shí)稍有延遲),自主識別、規(guī)劃并執(zhí)行有益的任務(wù)(比如撿垃圾和把盤子放到晾碗架上)。
視頻如科幻電影般展開:
人類詢問“嘿,F(xiàn)igure One,你現(xiàn)在看到了什么?”
機(jī)器人回答:“我看到桌子中央有個(gè)紅蘋果,一個(gè)晾碗架里有杯子和盤子,還有你,手搭在桌子上。”
“太好了,我能吃點(diǎn)什么嗎?”人類問道。
“當(dāng)然可以。”Figure One回答,小心翼翼地伸手抓起蘋果,遞給人類——它明白蘋果是桌面上唯一可食用的物品,即使人類沒有特別指明。
接著,視頻展示了Figure撿起垃圾,把盤子和杯子放入晾碗架的場景。
OpenAI新模型的問世?OpenAI VLM
Adcock在X上的帖子中提到,F(xiàn)igure的機(jī)載攝像頭輸入到由OpenAI訓(xùn)練的大型視覺語言模型(VLM)中,但目前還不清楚這是否是GPT-4的一個(gè)版本,是GPT-4V,還是完全新的模型。
![]()
Adcock還宣稱:“視頻展示了端到端的神經(jīng)網(wǎng)絡(luò)。沒有遙控操作。此外,視頻是以1.0倍速拍攝并連續(xù)拍攝的。”換句話說:視頻沒有加速,這一點(diǎn)與以往的人形機(jī)器人演示視頻常做的不同,那些視頻通常加速以展現(xiàn)更流暢的動作,并且沒有人在幕后遠(yuǎn)程控制機(jī)器人的動作。
Figure接下來的路
Figure的演示視頻似乎是人形、通用目的機(jī)器人互動領(lǐng)域的一大飛躍——展示了一臺機(jī)器人與人相當(dāng)自然地互動,聽從人的指令,憑直覺做出反應(yīng),并且動作比許多其他公司和研究者的示例要流暢得多。
當(dāng)然,這依然只是一個(gè)演示,而且是一個(gè)原型。要讓這樣的機(jī)器人做好商業(yè)部署的準(zhǔn)備,并將其出售給企業(yè)或個(gè)人,可能還需要大量的工作。
然而,Adcock在X上的帖子中明確表示,“我們的目標(biāo)是訓(xùn)練一個(gè)世界模型,使億級單位的人形機(jī)器人運(yùn)行。”
在Figure的網(wǎng)站上寫到:“Figure的目標(biāo):開發(fā)出對人類有積極影響的通用人形機(jī)器人,為后代創(chuàng)造更美好的生活。這些機(jī)器人可以消除不安全和不受歡迎的工作——最終讓我們過上更快樂、更有目的的生活。”
![]()
然而,Adcock繼續(xù)說,“我們的公司旅程將持續(xù)數(shù)十年——需要一支致力于使命的冠軍團(tuán)隊(duì)、數(shù)十億美元的投資和工程創(chuàng)新,以實(shí)現(xiàn)大規(guī)模市場影響。我們面臨高風(fēng)險(xiǎn)和極低的成功機(jī)會。”
他還承諾:“我們不會將人形機(jī)器人用于軍事或防御應(yīng)用,也不會用于需要對人類造成傷害的角色。”
Adcock和Figure今天展示的進(jìn)展,得益于OpenAI的支持,可能會給像特斯拉的Optimus項(xiàng)目和與亞馬遜合作的人形機(jī)器人初創(chuàng)公司Agility等領(lǐng)域的競爭對手帶來更大的壓力。
此外,隨著越來越多的公司進(jìn)入這一領(lǐng)域,包括Hugging Face(它剛剛聘請了一位前特斯拉Optimus科學(xué)家來領(lǐng)導(dǎo)其新宣布的開源機(jī)器人項(xiàng)目)和昨天宣布的一家名為Physical Intelligence的初創(chuàng)公司,競爭將變得更加激烈。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.