![]()
一臺人形機器人站在“客廳”中,用機械臂精準夾起散落的T恤,平鋪、折袖、收角,一套動作行云流水,1分鐘內(nèi)便將衣物疊成規(guī)整的方塊……機器人“埋頭苦干”的場景,在賽場隨處可見。

今天起,來自全國各地、超百支具身智能參賽隊伍將在上海參加一次重要“考試”。機器人不僅將在現(xiàn)場比拼“插花”“疊衣服”“沖咖啡”這些生活技能,還會像老技工一樣,靠“手感”去擰一顆螺絲……它們在工業(yè)、商業(yè)、家庭等多個場景中大顯神通,不炫技,純干活。
是誰幫助形態(tài)各異的機器人實現(xiàn)從“花架子”到“實干派”的轉(zhuǎn)變?是誰讓它們開始融入我們的生產(chǎn)生活,漸漸成長為可靠“搭子”?
玩“VR游戲” 讓機器人學人干活
![]()
2000年出生的鄭玉儀最近很忙碌,幾天前她從北京飛到上海,參加今天在上海張江舉辦的2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽。
她大專畢業(yè)后在北京的互聯(lián)網(wǎng)企業(yè)寫了2年代碼,做前端開發(fā),覺得沒什么成就感,去年年底就“任性”辭職了。“我愛做手工,搭樂高、織毛衣都挺喜歡的。但對職業(yè)規(guī)劃,其實有點迷茫。”
她去云南昆明玩了一趟,在斗南鮮花市場,被繽紛花海觸動,萌生了“能否讓機器人識別花材、處理花枝甚至完成插花”的想法。“我在現(xiàn)場看到很多人在分揀鮮花,效率低,也很勞累,就想如果讓機器人來做這些工作呢?但是流水線很復雜、鮮花也很嬌弱,當時覺得不太可能。”但正是這一閃念,將她引向了具身智能的嶄新領域。今年4月,她加入了初創(chuàng)企業(yè)靈御智能,彼時該公司成立才2個月。
她還記得面試時,招聘人員問了她兩個問題:“《黑神話:悟空》游戲通關了沒?戴上VR設備頭暈不暈?”
入職后,她發(fā)現(xiàn)自己的工作就像戴著VR設備打游戲:坐在操控臺前,戴上VR頭部顯示設備,眼前出現(xiàn)屏幕,這里面有機器人的 “眼睛”(實時畫面),能看清遠處的情景;有 “身體數(shù)據(jù)”(電量、力量值),像游戲血條一樣直觀;還有 “指令面板”。手上拿著手柄,以第一視角操控機器人,機器人的“胳膊”和“手”隨著她的手勢緩緩移動,精準地將一塊塊積木摞在一起,“看上去很酷”。
遙操作不僅是一個控制手段,更是一種數(shù)據(jù)采集方式,讓機器人“看著你怎么做”,一步步學會自己的任務。“我可能一天記錄了1000條關于拿放這個動作的數(shù)據(jù),就能把數(shù)據(jù)‘喂’給團隊自研的控制平臺,讓機器人學習,下次它的動作就會更精準。”
采集數(shù)據(jù)的過程往往是三四個小時重復同一個動作,跟過去寫代碼相比,似乎同樣枯燥。但鄭玉儀不這么看。“過程中我能及時得到反饋,機器人學會了我的動作,我會很有成就感。現(xiàn)在機器人在我的訓練下,搭積木、疊衣服、倒水、套圈、擰瓶蓋、分揀垃圾都會做,越來越能干了。再說了,訓練它的時候,我還能聊天、聽歌。”
更讓小鄭有收獲的是,她覺得在陪伴、訓練機器人的過程中,自己也在飛速成長。“有一次出差時操控機器人出現(xiàn)了問題,我只能到處找人遠程教我,挺崩潰的。后來,我自己就學會了處理這些情況,不用再麻煩別人了。每一次解決問題,都是學習的過程。不僅要機器人更能干,還要減少故障,讓它更耐用。”
入行8個月,小鄭親眼見證了機器人從“笨拙”到“靈巧”的蛻變歷程。她曾面對機器視覺模糊不清的困擾,如今已升級至高清4K畫面;從最初設備一天重啟三十次,到如今連續(xù)運行三十天不宕機;從操作時機械臂揮舞不協(xié)調(diào),到如今幾乎零延遲復刻她的動作。她也收獲了職業(yè)生涯的高光時刻——上個月,她和團隊帶著機器人伙伴TeleAvatar參加了中關村具身智能機器人應用大賽,在7個細分賽項中斬獲一等獎。也是在這次大賽中積累的信心,讓她毫不猶豫報名參加此次在上海舉辦的具身智能技能大賽。“我們團隊幾乎參加了所有跟遙操作相關的賽道,很期待跟來自全國各地的隊伍比拼、交流。”
“‘遙操作’技術讓機器人能應對復雜多變的場景,比如,我們可以在遠離機器人的位置,甚至跨城市、跨國家完成遠程控制,特別適用于危險場景的勞動力替代。比如,在隧道爆破作業(yè)中,需將炸藥精準裝填至預先鉆設的炮孔內(nèi)。現(xiàn)在,我們就能在安全、明亮的控制室里,遠程操控機器人完成爆破任務。”
回想起置身斗南鮮花市場的場景,她設想機器人能自己走到鮮花堆放處,挑出粉色玫瑰、白色洋桔梗、黃色小雛菊……把它們搬運到指定的位置,再根據(jù)顧客需求插到不同的花瓶中。“若要讓機器人完全自主地完成這樣精細靈動的任務,通常需要依賴海量的場景數(shù)據(jù)與復雜的算法推演。而遙操作技術的優(yōu)勢在于,它能讓人工智能系統(tǒng)立刻投入工作——操作員遠程引導機器人執(zhí)行任務的同時,也在真實環(huán)境中高效采集著寶貴數(shù)據(jù),大幅降低了后續(xù)訓練與迭代的時間成本,正加速推動機器人向更高階的自主性邁進。我相信,未來讓機器人自主‘動手’,在鮮花市場當分揀員、插花師,肯定能實現(xiàn)。”
從祛魅到癡迷 打磨機器人“小手”
在科幻大片中,機器人幾乎無所不能。從人形機器人走進大眾視野,這個賽道變得火熱,不少人對機器人走進日常生活也有了更急迫的期待。
![]()
工科出身的汪航卻坦言,入行后,第一感覺是對機器人“祛魅”。“它不像我想象的那么厲害,很多環(huán)節(jié)都需要人來配合,更像是個剛會走路的小孩。有了AI和大模型的助力,它成長的速度正在變快。”
1998年出生的汪航,去年從上海理工大學生物醫(yī)學工程專業(yè)碩士畢業(yè)。同學大多去了醫(yī)院或者醫(yī)療器械公司,他卻加入了以研發(fā)仿生手和靈巧手為主的上海傲意信息科技有限公司。“很幸運,也水到渠成。我在學校時就參與過研發(fā)下肢康復機器人,進公司就加入了靈巧手團隊。”
何為靈巧手?它是一種模擬人類手部功能的高自由度機器人末端執(zhí)行器,被稱為人形機器人走向大規(guī)模商業(yè)應用的“最后一厘米”。“相當于機器人本體中的一個小腦,通過算法,讓它執(zhí)行不同的動作。”
對汪航來說,最大的挑戰(zhàn)是探索人機交互的邊界,而這個領域并沒什么經(jīng)驗可借鑒。比如,要讓靈巧手抓豆腐,如何讓它抓得又穩(wěn)又準,還要保證豆腐完好無損?“這個過程需要算法支持,算法怎么設計和調(diào)優(yōu),一開始很困難,我只能請教更有經(jīng)驗的工程師或者跟客戶反復溝通,把他們的需求一步步反映在算法的優(yōu)化過程中。通過大量的訓練,調(diào)整參數(shù),去尋找最優(yōu)解。”
今年年中,傲意發(fā)布了能精準力控的新一代靈巧手,具備6個主動自由度,11個運動關節(jié),單指負載可達8公斤。“跟以往產(chǎn)品比,最大的不同在于搭載了高密度點陣觸覺傳感器,這使得靈巧手具有了‘神經(jīng)末梢’,能實時感知細微壓力變化,無論是捏取一片薯片還是握持重型工具,都能精準適配力度。但接入傳感器的過程并不容易,當時新品馬上要發(fā)布,我們兩三個人花了三天時間,把傳感器的各個接口都摸透了,能采集到數(shù)據(jù),打通了鏈路。那一刻,非常有成就感。”
今年開始,汪航的工作轉(zhuǎn)到了應用開發(fā)部門,密切與客戶溝通,做好技術支持。“我們研發(fā)的每一步都緊扣真實場景需求,靈巧手已在很多場景中落地應用了,比如商品分類、廚房作業(yè)輔助、精密裝配等,所以實踐中遇到任何問題,我們都會快速響應。”
傲意科技為具身智能技能大賽提供了30臺靈巧手,作為參賽團隊的核心工具,在賽事中接受工業(yè)、服務等復雜城市場景的高強度考驗。這幾天,汪航和團隊忙著為30臺靈巧手部署與調(diào)試,為保障賽事用靈巧手的穩(wěn)定性與可靠性,他們每天需完成幾十萬次的高強度測試。
“我還參與團隊一起研制自由度更高、感知更靈敏的新一代靈巧手。我覺得機器人行業(yè)充滿生機,初創(chuàng)企業(yè)多,年輕人多,愛好者多,挑戰(zhàn)與樂趣并存。從醫(yī)療康復到智能機器人,我始終相信技術應當為人服務,讓機器更好地輔助人類。”
自研模型 讓機器人在“技校”越練越聰明
走進位于上海張江模力社區(qū)的人形機器人麒麟訓練場,宛如來到一個機器人技校。在大廳一側(cè)的“流水線”上,機器人井然有序地站在“工位”前,兢兢業(yè)業(yè)地“學習”著不同工種的“技能”:整理桌面、放置商品、清理核電板管……
![]()
1998年出生的算法工程師張浩然最近經(jīng)常泡在這里訓練機器人。兩年前,他從英國謝菲爾德大學畢業(yè)后,回國求職。“我當時還覺得自己挺優(yōu)秀的,想著學以致用、報效祖國,結果發(fā)現(xiàn)國內(nèi)的就業(yè)市場不需要我。”他開玩笑說,當時投了一圈簡歷,發(fā)現(xiàn)跟自己一起參加筆試面試的國內(nèi)學生都太優(yōu)秀了,自己顯得“平平無奇”。
機緣巧合,他加入了人形機器人(上海)有限公司。“當時我們公司也剛成立,很需要做語言模型訓練的人。最初條件很簡陋,數(shù)據(jù)采集只能依賴主從機械臂,數(shù)據(jù)格式也不統(tǒng)一,我們團隊五個人常常擠在一套設備前協(xié)同操作。但正是這種從零到一的過程,讓我深入理解了算法與硬件結合落地的復雜性。”
張浩然連續(xù)兩年參加了世界人工智能大會,感受到機器人的飛速成長。“去年,我們還主要在探索通過視覺和文本的判斷來調(diào)用不同模型,構建一個‘大腦控制小腦’的簡易系統(tǒng);而到了今年,我們已經(jīng)能夠在多種異構機器人上成功部署我們自研的視覺-語言-動作(VLA)模型,實現(xiàn)了在復雜場景下的多任務執(zhí)行能力。”也就是說,機器人能先看清楚、想明白(讀懂文字指令,結合看到的情況做簡單思考),再調(diào)用專門的“動作程序”干活,微調(diào)一下,就能適配不同場景。
“我認為這個改變和進步是巨大的。這個領域和純粹的大模型研究不同,我們既要應對算法的快速演進,又要直面硬件和部署中的真實挑戰(zhàn)。但在一次次解決問題的過程中,我們也獲得了更強的成就感。”
最讓他崩潰的一次,他花費了很多精力訓練出的模型,預想應該有很好的推理效率,但機器人執(zhí)行不了。“當時真的想破腦袋,幾千行代碼一行一行查詢、驗證,最后才發(fā)現(xiàn),是相機的顏色錯了,相當于機器人的‘眼睛’讀取的內(nèi)容錯了。其實只需要加一行代碼就跑通了,但我們發(fā)現(xiàn)這個問題花了整整一禮拜的時間。看到機器人終于可以按照我們的模型準確抓取東西時,我激動得都快哭了。”
![]()
張浩然這次要參加家政賽道。“這個賽道要求機器人在居家情境下執(zhí)行衣物折疊、餐具整理等多種任務,且環(huán)境較為復雜,非常考驗模型的泛化性和魯棒性。”他解釋說,泛化性是“機器人會靈活變通、舉一反三”,魯棒性是“機器人抗造耐折騰”,兩者都是衡量機器人“靠譜程度”。
“我們讓機器人熟練完成居家服務賽道的各類任務,訓練中采集的數(shù)據(jù)會匯總到模型中重新訓練,再部署到機器人身上,以此提升任務完成率。”
金海岸工作室
作 者 |葉薇
圖 片 |葉薇
編 輯| 任天寶
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.