![]()
在機器人領域,AI才剛剛開始展露頭角。
不久前,一家名為Figure的初創企業,估值高達26億美元,由一群來自波士頓動力、特斯拉、谷歌DeepMind和Archer Aviation的前員工成立。今天,他們與新投資者及合作伙伴OpenAI的首次合作問世,著實令人眼前一亮。
Figure的聯合創始人兼CEO Brett Adcock在社交平臺X上分享了一段視頻,展示了他們的全尺寸人形機器人Figure 01的能力。
視頻中,這位機器人展示了它與人類和環境互動的能力:遵循人類的指令,找到并遞給他們物品(比如一個蘋果),同時描述它正在做什么并與人對話(盡管反應時間比人與人交流時稍有延遲),自主識別、規劃并執行有益的任務(比如撿垃圾和把盤子放到晾碗架上)。
視頻如科幻電影般展開:
人類詢問“嘿,Figure One,你現在看到了什么?”
機器人回答:“我看到桌子中央有個紅蘋果,一個晾碗架里有杯子和盤子,還有你,手搭在桌子上。”
“太好了,我能吃點什么嗎?”人類問道。
“當然可以。”Figure One回答,小心翼翼地伸手抓起蘋果,遞給人類——它明白蘋果是桌面上唯一可食用的物品,即使人類沒有特別指明。
接著,視頻展示了Figure撿起垃圾,把盤子和杯子放入晾碗架的場景。
OpenAI新模型的問世?OpenAI VLM
Adcock在X上的帖子中提到,Figure的機載攝像頭輸入到由OpenAI訓練的大型視覺語言模型(VLM)中,但目前還不清楚這是否是GPT-4的一個版本,是GPT-4V,還是完全新的模型。
![]()
Adcock還宣稱:“視頻展示了端到端的神經網絡。沒有遙控操作。此外,視頻是以1.0倍速拍攝并連續拍攝的。”換句話說:視頻沒有加速,這一點與以往的人形機器人演示視頻常做的不同,那些視頻通常加速以展現更流暢的動作,并且沒有人在幕后遠程控制機器人的動作。
Figure接下來的路
Figure的演示視頻似乎是人形、通用目的機器人互動領域的一大飛躍——展示了一臺機器人與人相當自然地互動,聽從人的指令,憑直覺做出反應,并且動作比許多其他公司和研究者的示例要流暢得多。
當然,這依然只是一個演示,而且是一個原型。要讓這樣的機器人做好商業部署的準備,并將其出售給企業或個人,可能還需要大量的工作。
然而,Adcock在X上的帖子中明確表示,“我們的目標是訓練一個世界模型,使億級單位的人形機器人運行。”
在Figure的網站上寫到:“Figure的目標:開發出對人類有積極影響的通用人形機器人,為后代創造更美好的生活。這些機器人可以消除不安全和不受歡迎的工作——最終讓我們過上更快樂、更有目的的生活。”
![]()
然而,Adcock繼續說,“我們的公司旅程將持續數十年——需要一支致力于使命的冠軍團隊、數十億美元的投資和工程創新,以實現大規模市場影響。我們面臨高風險和極低的成功機會。”
他還承諾:“我們不會將人形機器人用于軍事或防御應用,也不會用于需要對人類造成傷害的角色。”
Adcock和Figure今天展示的進展,得益于OpenAI的支持,可能會給像特斯拉的Optimus項目和與亞馬遜合作的人形機器人初創公司Agility等領域的競爭對手帶來更大的壓力。
此外,隨著越來越多的公司進入這一領域,包括Hugging Face(它剛剛聘請了一位前特斯拉Optimus科學家來領導其新宣布的開源機器人項目)和昨天宣布的一家名為Physical Intelligence的初創公司,競爭將變得更加激烈。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.