網易首頁 > 網易號 > 正文申請入駐

OpenAI與Figure的人形機器人“Figure 01”問世！

2024-03-14 11:37:28　來源: 北茗的AI茶館

北京舉報

分享至

在機器人領域，AI才剛剛開始展露頭角。

不久前，一家名為Figure的初創企業，估值高達26億美元，由一群來自波士頓動力、特斯拉、谷歌DeepMind和Archer Aviation的前員工成立。今天，他們與新投資者及合作伙伴OpenAI的首次合作問世，著實令人眼前一亮。

Figure的聯合創始人兼CEO Brett Adcock在社交平臺X上分享了一段視頻，展示了他們的全尺寸人形機器人Figure 01的能力。

視頻中，這位機器人展示了它與人類和環境互動的能力：遵循人類的指令，找到并遞給他們物品（比如一個蘋果），同時描述它正在做什么并與人對話（盡管反應時間比人與人交流時稍有延遲），自主識別、規劃并執行有益的任務（比如撿垃圾和把盤子放到晾碗架上）。

視頻如科幻電影般展開：

人類詢問“嘿，Figure One，你現在看到了什么？”
機器人回答：“我看到桌子中央有個紅蘋果，一個晾碗架里有杯子和盤子，還有你，手搭在桌子上。”
“太好了，我能吃點什么嗎？”人類問道。
“當然可以。”Figure One回答，小心翼翼地伸手抓起蘋果，遞給人類——它明白蘋果是桌面上唯一可食用的物品，即使人類沒有特別指明。
接著，視頻展示了Figure撿起垃圾，把盤子和杯子放入晾碗架的場景。

OpenAI新模型的問世？OpenAI VLM

Adcock在X上的帖子中提到，Figure的機載攝像頭輸入到由OpenAI訓練的大型視覺語言模型（VLM）中，但目前還不清楚這是否是GPT-4的一個版本，是GPT-4V，還是完全新的模型。

Adcock還宣稱：“視頻展示了端到端的神經網絡。沒有遙控操作。此外，視頻是以1.0倍速拍攝并連續拍攝的。”換句話說：視頻沒有加速，這一點與以往的人形機器人演示視頻常做的不同，那些視頻通常加速以展現更流暢的動作，并且沒有人在幕后遠程控制機器人的動作。

Figure接下來的路

Figure的演示視頻似乎是人形、通用目的機器人互動領域的一大飛躍——展示了一臺機器人與人相當自然地互動，聽從人的指令，憑直覺做出反應，并且動作比許多其他公司和研究者的示例要流暢得多。

當然，這依然只是一個演示，而且是一個原型。要讓這樣的機器人做好商業部署的準備，并將其出售給企業或個人，可能還需要大量的工作。

然而，Adcock在X上的帖子中明確表示，“我們的目標是訓練一個世界模型，使億級單位的人形機器人運行。”

在Figure的網站上寫到：“Figure的目標：開發出對人類有積極影響的通用人形機器人，為后代創造更美好的生活。這些機器人可以消除不安全和不受歡迎的工作——最終讓我們過上更快樂、更有目的的生活。”

然而，Adcock繼續說，“我們的公司旅程將持續數十年——需要一支致力于使命的冠軍團隊、數十億美元的投資和工程創新，以實現大規模市場影響。我們面臨高風險和極低的成功機會。”

他還承諾：“我們不會將人形機器人用于軍事或防御應用，也不會用于需要對人類造成傷害的角色。”

Adcock和Figure今天展示的進展，得益于OpenAI的支持，可能會給像特斯拉的Optimus項目和與亞馬遜合作的人形機器人初創公司Agility等領域的競爭對手帶來更大的壓力。

此外，隨著越來越多的公司進入這一領域，包括Hugging Face（它剛剛聘請了一位前特斯拉Optimus科學家來領導其新宣布的開源機器人項目）和昨天宣布的一家名為Physical Intelligence的初創公司，競爭將變得更加激烈。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.