撰稿 |Vicky Xiao
編輯 | 陳茜
大家覺(jué)得讓機(jī)器人學(xué)會(huì)走路難,還是讓它學(xué)會(huì)打開(kāi)一聽(tīng)可樂(lè)難?我猜大部分人都會(huì)說(shuō)走路難吧,畢竟人類花了幾百萬(wàn)年才學(xué)會(huì)直立行走,波士頓動(dòng)力的機(jī)器人摔了無(wú)數(shù)次才學(xué)會(huì)后空翻。
但我最近在采訪的時(shí)候,才發(fā)現(xiàn)一個(gè)完全顛覆我認(rèn)知的事實(shí):在機(jī)器人世界里,開(kāi)可樂(lè)這件事比走路可難太多了!也就是說(shuō),控制靈巧手要比控制軀體難上至少十倍,而從目前的售價(jià)對(duì)比上我們也能感受到:

中國(guó)Unitree G1人形機(jī)器人(會(huì)走路):1.6萬(wàn)美元;
波士頓動(dòng)力Atlas機(jī)器人(會(huì)后空翻):預(yù)估14萬(wàn)美元;
英國(guó)Shadow Robot的靈巧手(會(huì)擰瓶蓋):價(jià)格未公開(kāi),但業(yè)內(nèi)估計(jì)超過(guò)10萬(wàn)美元
也就是說(shuō):一只手的價(jià)格接近一個(gè)完整的頂級(jí)機(jī)器人!這是什么概念?這好比一個(gè)方向盤(pán)的價(jià)格接近整輛特斯拉。所以機(jī)器人的靈巧手為什么難做?目前技術(shù)發(fā)展到什么階段了?業(yè)內(nèi)的技術(shù)派系有哪些、有什么值得關(guān)注的公司?
今天我們就來(lái)聊聊,這個(gè)讓全世界頂級(jí)機(jī)器人工程師都頭疼的終極難題——機(jī)器人靈巧手。以及我們與特斯拉前靈巧手負(fù)責(zé)人創(chuàng)業(yè)的團(tuán)隊(duì)TetherIA一起聊聊,一個(gè)300多美元的“Android版機(jī)器人靈巧手”如何試圖顛覆這個(gè)被壟斷了30年的高端市場(chǎng)。
(本文為視頻改寫(xiě),歡迎大家收看以下視頻)
01
機(jī)器人的“最后一公里”
為什么我們能看到機(jī)器人在工廠里分揀產(chǎn)品,在倉(cāng)庫(kù)里搬運(yùn)貨物,但卻很少看到它們能像人一樣靈活地?cái)Q開(kāi)可樂(lè)瓶蓋,或者精準(zhǔn)地拿起一顆螺絲釘?答案就在于:手的復(fù)雜性遠(yuǎn)超我們的想象。

人類的手有27個(gè)自由度,包含27塊骨頭、29個(gè)關(guān)節(jié)、34塊肌肉,以及數(shù)不清的神經(jīng)末梢——這是一個(gè)經(jīng)過(guò)了數(shù)百萬(wàn)年進(jìn)化的“精密儀器”。更神奇的是,這個(gè)“儀器”讓我們能夠既有力量握緊工具,又有精度穿針引線。這樣的能力造就了人類文明,但對(duì)機(jī)器人來(lái)說(shuō),要復(fù)刻這樣的能力,就非常有挑戰(zhàn)了。
![]()
Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 大家看一下人手的構(gòu)造,就會(huì)發(fā)現(xiàn)其實(shí)人手非常靈活,里面關(guān)節(jié)非常多。我們以大拇指舉例:大拇指從上往下,有IP joint(拇指指間關(guān)節(jié))、MCP joint(拇指掌指關(guān)節(jié)),這兩個(gè)關(guān)節(jié)都可以實(shí)現(xiàn)屈伸和彎曲。再往下的關(guān)節(jié)叫CMC joint(拇指腕掌關(guān)節(jié)),這個(gè)關(guān)節(jié)就明顯靈活很多,可以做側(cè)擺動(dòng)作,也可以做彎曲和伸直動(dòng)作,甚至還能原地旋轉(zhuǎn)。而且它的運(yùn)動(dòng)范圍非常大。你會(huì)看到,關(guān)節(jié)之間的連接非常小,這就是為什么人手既能靈活,又能保持非常小的體積的原因。
而這,就是機(jī)器人工程師們面臨的終極挑戰(zhàn)——機(jī)器人靈巧手,英文叫Dexterous Hand,在機(jī)器人學(xué)里,它專門(mén)指高度仿人、具有多自由度、能夠完成精細(xì)操作的機(jī)器人手。它能夠模擬人手的抓取、操作和感知功能。那什么樣的機(jī)器人手才能稱得上“靈巧”?
第一,它得有足夠多的“關(guān)節(jié)”。我們?nèi)耸钟?7個(gè)自由度,而機(jī)器人靈巧手通常需要6個(gè)以上,高端產(chǎn)品能達(dá)到20-27個(gè)。這就像是給機(jī)器人裝上了真正能“動(dòng)手指”的手。
第二,它得有“繡花”般的精細(xì)控制。我們說(shuō)的是毫米級(jí)甚至更精細(xì)的操作——想象一下用機(jī)器人手穿針引線,或者像我們一會(huì)兒要看到的那樣,精準(zhǔn)抓取只有5毫米的M5螺絲釘。
第三,它得有“觸覺(jué)”。不只是能看到,還要能“感受”。觸覺(jué)傳感器、力覺(jué)傳感器、位置傳感器等等,就像給機(jī)器人裝上了神經(jīng)系統(tǒng),讓它知道抓得是輕是重,是軟是硬。
第四,它得會(huì)“察言觀色”。遇到圓的就用一種抓法,遇到方的就換另一種。看到玻璃杯就輕拿輕放,看到鐵塊就可以用力一些。這就是自適應(yīng)抓取的能力。
最后,它得長(zhǎng)得像人手。人類世界的所有工具都是為人手設(shè)計(jì)的。如果機(jī)器人能夠模仿人手的結(jié)構(gòu)、功能和配置,它們就能快速且經(jīng)濟(jì)高效地應(yīng)用,而無(wú)需改變我們的環(huán)境。
如果我們看看歷史會(huì)發(fā)現(xiàn),靈巧手從有這個(gè)概念,到現(xiàn)在逐步趨向成熟,已經(jīng)走過(guò)了40多年的歷程。
![]()
1980年代:開(kāi)山之作
Stanford/JPL Hand開(kāi)創(chuàng)了靈巧手的先河,3根“人形”手指,每根三個(gè)關(guān)節(jié),配備觸覺(jué)/力反饋。但它更像是證明“這事兒能做”的概念機(jī)。
![]()
1990-2000年代:百家爭(zhēng)鳴到夾爪稱王
Utah/MIT Hand、DLR Hand等各顯神通,技術(shù)路線百花齊放,但都停留在實(shí)驗(yàn)室:能演示,但離實(shí)用還差十萬(wàn)八千里。
就在靈巧手還在實(shí)驗(yàn)室“紙上談兵”時(shí),簡(jiǎn)單粗暴的兩指夾爪已經(jīng)占領(lǐng)了工廠。雖然只能“抓”和“放”,但便宜、穩(wěn)定、夠用。這就像是功能機(jī)時(shí)代——雖然簡(jiǎn)陋,但解決了核心需求。
![]()
2000-2010年代:商業(yè)化破冰
Shadow Robot、Allegro Hand等陸續(xù)商業(yè)化,價(jià)格高達(dá)數(shù)萬(wàn)美元,主要服務(wù)科研機(jī)構(gòu)。這個(gè)階段就像早期個(gè)人電腦——功能有了,但普通人買不起。
2020年代:巨頭入場(chǎng)
特斯拉入局改變游戲規(guī)則。馬斯克不只要做靈巧手,還要規(guī)模化生產(chǎn)。同時(shí),GPT等AI大模型的突破為機(jī)器人控制打開(kāi)了新世界的大門(mén)。
![]()
2025年:轉(zhuǎn)折點(diǎn)
特斯拉22個(gè)自由度的新手、TetherIA的300美元開(kāi)源革命、各路開(kāi)源項(xiàng)目涌現(xiàn)。靈巧手即將迎來(lái)“智能手機(jī)時(shí)刻”——從極客玩具變成人人可得的工具。
然而,靈巧手雖然迎來(lái)了巨大的突破,但還是有很多的難點(diǎn)。這個(gè)難點(diǎn)并不僅僅在技術(shù)上的突破,更重要的是要兼顧性能,成本還有可靠性,這就成了一個(gè)“不可能三角”。
02
靈巧手的“不可能三角”性能、成本、可靠性
在現(xiàn)場(chǎng)采訪中,我才知道一個(gè)可能會(huì)顛覆很多人認(rèn)知的觀點(diǎn):靈巧手的控制比整機(jī)控制要難10倍!
在TetherIA位于硅谷的辦公室,我見(jiàn)到了他們一路以來(lái)設(shè)計(jì)的各種迭代版本,以及他們剛發(fā)布上線的這款開(kāi)源的靈巧手產(chǎn)品Aero Hand Open。
在我自己真正上手嘗試去控制靈巧手之前,我都非常不理解,一個(gè)完整的人形機(jī)器人要平衡、要走路、要導(dǎo)航,怎么可能比一只手還簡(jiǎn)單呢?但當(dāng)我自己嘗試去控制這只手的時(shí)候,發(fā)現(xiàn)真是沒(méi)那么容易。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們覺(jué)得這個(gè)難點(diǎn)其實(shí)是多方面的。因?yàn)闄C(jī)器人是一個(gè)復(fù)雜的系統(tǒng),現(xiàn)在大家比較關(guān)注的是AI控制的層面,主要是VLA模型(Vision-Language-Action 視覺(jué)-語(yǔ)言-動(dòng)作)的泛化能力,這毫無(wú)疑問(wèn)是一個(gè)很大的難點(diǎn)。 另外,我們覺(jué)得從整個(gè)整機(jī)系統(tǒng)角度來(lái)說(shuō),這個(gè)手的硬件本身也是很大的一個(gè)卡點(diǎn)。人手是非常靈巧的,它的相對(duì)尺寸很小,每個(gè)關(guān)節(jié)都很靈活,手指又非常纖細(xì),還能做到速度和力量之間的平衡,并且特別經(jīng)久耐用。
我們?nèi)祟愔饕强侩p手和外界進(jìn)行接觸,但在傳統(tǒng)的機(jī)器人里,更多的是避免機(jī)器人和外界接觸,因?yàn)橐坏┙佑|就是碰撞,對(duì)機(jī)器人就有損傷,而手恰恰需要和外界接觸,所以綜合起來(lái),這些都是硬件上的難點(diǎn)。 除了硬件和控制的難點(diǎn),其實(shí)還有很多更不為外行所知的地方。比如,你在控制的同時(shí),希望能夠讓human-in-the-loop(人機(jī)回圈),讓人在其中對(duì)機(jī)器人產(chǎn)生影響和作用,這就牽扯到遙操系統(tǒng),以及開(kāi)發(fā)過(guò)程當(dāng)中的仿真系統(tǒng),以及背后整個(gè)體系。其實(shí)都有很多的困難。
我在操作的過(guò)程中感覺(jué)到視覺(jué)與力量的協(xié)作,是非常關(guān)鍵的。由于我是完全感知不到觸感和力度,我抓握的完全是空氣,只能憑借我的眼睛觀察靈巧手與物體的接觸反饋來(lái)及時(shí)調(diào)整。這就很像軟件驅(qū)動(dòng)靈巧手的過(guò)程。
我們知道,人類的抓握過(guò)程依賴于神經(jīng)系統(tǒng)、肌肉控制和多模態(tài)感知。
![]()
人類抓握力的調(diào)整分為兩個(gè)閉環(huán)控制:第一是前饋控制(Feedforward Control),也就是大腦基于視覺(jué)和經(jīng)驗(yàn),在抓取前預(yù)測(cè)所需力量。例如,看見(jiàn)一瓶水時(shí),大腦會(huì)預(yù)估重量,先設(shè)定一個(gè)初始抓力。
第二個(gè)階段是反饋控制(Feedback Control),在手指接觸物體后,實(shí)時(shí)通過(guò)觸覺(jué)和滑動(dòng)信息進(jìn)行調(diào)整。如果物體開(kāi)始滑動(dòng),神經(jīng)系統(tǒng)將在<100毫秒內(nèi)反射性增加力量。這是一種快速的“感知和反應(yīng)”的閉環(huán)。
如果靈巧手要完全復(fù)制人手的這個(gè)反饋閉環(huán),需要的不只是傳感器和控制算法的堆疊,而是一個(gè)更接近人類神經(jīng)系統(tǒng)的分層控制架構(gòu)。可以類比為“大腦控制”和“小腦控制”:大腦控制依賴視覺(jué)、經(jīng)驗(yàn)和推理,用于規(guī)劃動(dòng)作和做出高層決策;而小腦控制則依靠觸覺(jué)、力反饋和實(shí)時(shí)的平衡調(diào)整,負(fù)責(zé)細(xì)節(jié)上的動(dòng)態(tài)微調(diào)與協(xié)調(diào)。
![]()
把多模態(tài)傳感(力/力矩、觸覺(jué)、視覺(jué))與感知—判斷—調(diào)整的閉環(huán)控制結(jié)合,再通過(guò)深度強(qiáng)化學(xué)習(xí)不斷優(yōu)化整個(gè)系統(tǒng)的策略,真的是非常有挑戰(zhàn)的研發(fā)過(guò)程。
所以在2023年年底,BC特斯拉的第二代人形機(jī)器人Tesla Optimus Gen 2發(fā)布捏雞蛋的demo那么受到關(guān)注,正是因?yàn)樗谝曈X(jué)的“大腦”和基于力控的“小腦”在協(xié)作進(jìn)步。
雖然實(shí)現(xiàn)這一切很難,但要真正實(shí)現(xiàn)機(jī)器人在多場(chǎng)景下的應(yīng)用,還真是得依靠靈巧手不可。這個(gè)邏輯很簡(jiǎn)單:人類世界是為人類設(shè)計(jì)的。所有的工具、設(shè)備、環(huán)境都是按照人的尺寸和能力來(lái)設(shè)計(jì)的。要讓機(jī)器人真正融入人類世界,最有效的方法就是讓它們具備類似人類的能力。
所以,要想讓靈巧手真的走向產(chǎn)業(yè)化、還有一個(gè)難題要解決,那就是靈巧手的”不可能三角”。如果把機(jī)器人靈巧手比作一個(gè)三角形,那么它的三個(gè)頂點(diǎn)分別是:性能、成本、可靠性,而這個(gè)三角形有個(gè)殘酷的特點(diǎn):你只能優(yōu)化其中兩個(gè)角,第三個(gè)必然會(huì)受到犧牲。

而如果想要高性能,英國(guó)Shadow Robot公司的靈巧手就是完美的例子。它擁有超過(guò)120個(gè)傳感器,可實(shí)現(xiàn)觸覺(jué)感知,擁有20個(gè)電動(dòng)關(guān)節(jié)和24個(gè)自由度,其尺寸、形狀和運(yùn)動(dòng)范圍與人手相當(dāng),非常適合執(zhí)行專為人手設(shè)計(jì)和優(yōu)化的任務(wù)。但是,它的價(jià)格超過(guò)10萬(wàn)美元!

想要低成本?市面上有很多開(kāi)源項(xiàng)目,比如DexHand和Amazing Hand,可以3D打印,成本能控制在300美元。但性能嘛...只能說(shuō)是“擺造型”,抓取功能基本是沒(méi)法使用的,甚至一些入門(mén)級(jí)的商業(yè)產(chǎn)品在這方面也不足。
想要高可靠性?那就得簡(jiǎn)化設(shè)計(jì),減少故障點(diǎn)。越復(fù)雜的系統(tǒng),維護(hù)成本越高,故障率也越高。但這樣一來(lái),性能又會(huì)大打折扣。
Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因?yàn)闄C(jī)械手每一個(gè)關(guān)節(jié)、每一個(gè)自由度的運(yùn)動(dòng)都需要有電機(jī)來(lái)控制,如果把電機(jī)做得很小,它的功率輸出和性能就會(huì)相應(yīng)變?nèi)酢K裕肫ヅ淙耸值淖杂啥取⑷耸值某叽纭⒁约叭耸值牧敵龊退俣龋褪且粋€(gè)非常困難的“不可能三角”。
這就像是在玩一個(gè)永遠(yuǎn)無(wú)法獲勝的游戲,除非你能夠找到突破這個(gè)三角形的新方法,而在產(chǎn)業(yè)中,大家一直在尋找這樣的方法來(lái)突破不可能三角,這也衍生出了靈巧手江湖中的6大門(mén)派。
03
技術(shù)流派大揭秘
6大門(mén)派的江湖恩怨
為了解決靈巧手的“不可能三角”,在機(jī)器人靈巧手的江湖里,主要有六大門(mén)派,各自有著不同的武功路數(shù):
Chapter 3.1直驅(qū)派:簡(jiǎn)單粗暴的“搭積木選手”
![]()
這一派的哲學(xué)很簡(jiǎn)單:需要?jiǎng)幽睦铮驮谀睦锓艂€(gè)電機(jī)。就像韓國(guó)Wonik Robotics的Allegro Hand,16個(gè)自由度,16個(gè)電機(jī),電機(jī)“一對(duì)一”服務(wù);還有最新出的國(guó)產(chǎn)產(chǎn)品SharpaWave,Wuji Hand以及XHand,都是這個(gè)路線。
這種設(shè)計(jì)的優(yōu)點(diǎn)在于方便精細(xì)控制。缺點(diǎn)在于,電機(jī)驅(qū)動(dòng)器體積小、抗沖擊差、不可反驅(qū)、指末端力輸出小,而且維護(hù)和維修都不太方便。
![]()
Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因?yàn)闄C(jī)械手每一個(gè)關(guān)節(jié)、每一個(gè)自由度的運(yùn)動(dòng)都需要有電機(jī)來(lái)控制,如果把電機(jī)做得很小,它的功率輸出和性能就會(huì)相應(yīng)變?nèi)酢K裕肫ヅ淙耸值淖杂啥取⑷耸值某叽纭⒁约叭耸值牧敵龊退俣龋褪且粋€(gè)非常困難的“不可能三角”。Chapter 3.2 繩驅(qū)派:最接近人體的“仿生學(xué)大師”
![]()
這一派的代表是特斯拉的Optimus和Shadow Robot。特斯拉大家都熟悉了,而Shadow Robot這家英國(guó)公司就像是靈巧手界的“勞斯萊斯”。近30年的技術(shù)積累讓他們?cè)诟叨耸袌?chǎng)占據(jù)統(tǒng)治地位,但高昂的價(jià)格也限制了他們的市場(chǎng)擴(kuò)張。
他們的設(shè)計(jì)思路最接近人體:把“肌肉”(電機(jī))放在前臂,通過(guò)“肌腱”(鋼絲繩或高強(qiáng)度合成纖維)來(lái)控制手指運(yùn)動(dòng)。
這就像是控制木偶一樣——所有的線都連到一個(gè)中央控制臺(tái),通過(guò)拉動(dòng)不同的線來(lái)實(shí)現(xiàn)復(fù)雜的動(dòng)作。這種設(shè)計(jì)的優(yōu)點(diǎn)是輕量化、力量輸出穩(wěn)定、具備一定自適應(yīng)能力,而且布局和人體更接近。特斯拉最新的Optimus手宣稱它擁有22個(gè)自由度,已經(jīng)非常接近人手的27個(gè)自由度了。我們實(shí)地探訪的TetherIA他們現(xiàn)在推出的這款高性價(jià)比靈巧手也是采用的繩驅(qū)方案。
![]()
但是,繩驅(qū)動(dòng)也有自己的麻煩。
Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 雖然特斯拉是堅(jiān)定走“繩驅(qū)”路線——但是我們看到其實(shí)很多創(chuàng)業(yè)公司,真正跟隨特斯拉技術(shù)路線的并不多,而且很多人會(huì)質(zhì)疑特斯拉。為什么呢?我們覺(jué)得,因?yàn)椤袄K驅(qū)”最根本的優(yōu)勢(shì),就是剛才我介紹的,能夠?qū)崿F(xiàn)比較好的力輸出和自適應(yīng)。但它根本的劣勢(shì)在于,尤其是對(duì)于欠驅(qū)動(dòng)來(lái)說(shuō),它沒(méi)有辦法實(shí)現(xiàn)精準(zhǔn)控制。因?yàn)樗乔夫?qū)動(dòng),每個(gè)地方的力輸出會(huì)隨著自適應(yīng)的情況不同而不同。 這個(gè)時(shí)候,就需要我們能夠在軟件里,對(duì)“繩驅(qū)靈巧手”的各個(gè)模塊進(jìn)行精準(zhǔn)的建模。只有你很好地理解這個(gè)手在不同條件下會(huì)發(fā)生什么樣的變化,你才可能實(shí)現(xiàn)精準(zhǔn)的控制。
Chapter 3.3液壓派:追求極致力量的“暴力美學(xué)”
![]()
加拿大Sanctuary AI公司就走的液壓驅(qū)動(dòng)派系。他們的Phoenix機(jī)器人配備了21個(gè)自由度的液壓手,能夠產(chǎn)生強(qiáng)大的力量輸出。
液壓系統(tǒng)的優(yōu)勢(shì)是力量大、響應(yīng)快、功率密度高,能完成高負(fù)載任務(wù),但傳統(tǒng)上液壓系統(tǒng)都很龐大。Sanctuary AI的突破在于將液壓組件小型化到硬幣大小,并且經(jīng)過(guò)了20億次循環(huán)測(cè)試而無(wú)泄漏。
這就像是把挖掘機(jī)的液壓系統(tǒng)縮小到了手表的尺寸,技術(shù)難度可想而知。不過(guò),液壓系統(tǒng)依然面臨成本、維護(hù)、噪音和能效方面的挑戰(zhàn),因此目前主要用于特定工業(yè)和研發(fā)場(chǎng)景。
Chapter 3.4 連桿派:發(fā)揮機(jī)械美學(xué)的“優(yōu)雅派”
![]()
這一派的代表作是源自韓國(guó)研究團(tuán)隊(duì)提出的ILDA靈巧手,通過(guò)精巧的連桿設(shè)計(jì)實(shí)現(xiàn)高自由度動(dòng)作。它的哲學(xué)是:將驅(qū)動(dòng)器全部集成在手掌內(nèi)部,用連桿、搖臂、滑塊等機(jī)構(gòu)把多個(gè)直線動(dòng)作“分配”到多個(gè)關(guān)節(jié),讓手指多個(gè)關(guān)節(jié)彎曲,擺出類似人類手指的各種姿態(tài)。
這種方案的優(yōu)點(diǎn)是結(jié)構(gòu)緊湊、自由度高、外形優(yōu)雅,充分展現(xiàn)了機(jī)械設(shè)計(jì)的美感;但它的缺點(diǎn)也很突出——抗沖擊性較差,在復(fù)雜或高負(fù)載場(chǎng)景下可靠性不足,導(dǎo)致整體實(shí)用性偏低。
Chapter 3.5 混合派:工程師的“中庸之道
![]()
還有一些設(shè)計(jì)嘗試將直驅(qū)、繩驅(qū)、連桿機(jī)構(gòu)等組合起來(lái),折中成本、重量和性能。例如一些開(kāi)源或?qū)W術(shù)手就采用連桿+部分驅(qū)動(dòng)的方案,用較少的執(zhí)行器實(shí)現(xiàn)更多自由度,在科研和教學(xué)中很受歡迎。
混合方案之前一直停留在學(xué)術(shù)研究領(lǐng)域,而TetherIA正在通過(guò)混合派路線,開(kāi)發(fā)他們旗下的另外一款高自由度靈巧手方案。他們通過(guò)剖析人手的具體功能和結(jié)構(gòu)(結(jié)合繩驅(qū)及拉桿方案),將上面提過(guò)的繩驅(qū)、拉桿等方案有機(jī)結(jié)合在一起,通過(guò)強(qiáng)大的工程化實(shí)現(xiàn)能力,開(kāi)發(fā)出了一款既高效又可靠的高自由度靈巧手方案。
Chapter 3.6 值得一提的“開(kāi)源派”
![]()
他們是亂拳打死老師傅——不拼技術(shù)精度,不比硬件豪華,而是用開(kāi)源的方式打破行業(yè)壁壘。雖然單個(gè)產(chǎn)品可能不如Shadow Robot那樣精密,但它們的威力在于“群狼戰(zhàn)術(shù)”:把靈巧手的價(jià)格門(mén)檻做到最低,讓全世界的工程師都能玩得起靈巧手,從而反過(guò)來(lái)推動(dòng)技術(shù)的進(jìn)步。
從DexHand到ORCA Hand,越來(lái)越多的開(kāi)源項(xiàng)目正在降低技術(shù)門(mén)檻。這就像是Android系統(tǒng)對(duì)手機(jī)行業(yè)的影響一樣,可能會(huì)徹底改變游戲規(guī)則。
而TetherIA在研發(fā)一款高自由度、非常接近人手性能的靈巧手的同時(shí),發(fā)現(xiàn)系統(tǒng)其實(shí)可以極致簡(jiǎn)化,于是也做出了一款低自由度、但據(jù)說(shuō)也是市面上性能最好之一的靈巧手。這款靈巧手已經(jīng)在前陣子發(fā)布,并全部開(kāi)源,售價(jià)僅僅為300美元。

團(tuán)隊(duì)對(duì)我們說(shuō),他們這款靈巧手是極度任務(wù)導(dǎo)向的。雖然自由度較低,但能完成很多接近人手的任務(wù)。那我們就來(lái)看看,這雙手已經(jīng)能完成哪些復(fù)雜的任務(wù)。
04
四個(gè)Deomo背后的技術(shù)密碼
接下來(lái)通過(guò)四個(gè)TetherIA的最新產(chǎn)品展示demo,我們來(lái)看看每個(gè)看似簡(jiǎn)單的動(dòng)作背后隱藏著什么樣的技術(shù)挑戰(zhàn)。
Chapter 4.1 抓取螺絲釘
M5螺絲釘直徑只有5毫米,這個(gè)demo看起來(lái)簡(jiǎn)單,實(shí)際上是對(duì)精細(xì)控制能力的終極考驗(yàn)。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 小物體的難度在于也是多方面的:一個(gè)是在于它的精準(zhǔn)控制能力;另外一個(gè)是在于,當(dāng)你抓小物體的時(shí)候,如果力輸出的方向沒(méi)有辦法很好的配合,往往會(huì)把小物體抓飛。這其實(shí)都體現(xiàn)了:既要有硬件設(shè)計(jì)上實(shí)現(xiàn)很好的自適應(yīng),以及力輸出的一致性,另外其實(shí)也是我們整個(gè)軟件系統(tǒng)要相應(yīng)配合,實(shí)現(xiàn)對(duì)這個(gè)相對(duì)復(fù)雜的“繩驅(qū)靈巧手”的精準(zhǔn)操作。
Chapter 4.2 抓取大物件
抓大盒子的挑戰(zhàn)完全不同。這時(shí)候,機(jī)器人手只有指尖的一小部分在接觸物體,就像是用指甲尖去抓握一個(gè)籃球。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因?yàn)檫@個(gè)盒子幾乎和機(jī)器人的手一樣大,因此必須非常精準(zhǔn)地去抓住它。基本上這種情況下,你只能用指尖來(lái)施力,也就是靠機(jī)器手最后一節(jié)關(guān)節(jié)來(lái)提供力量。所以對(duì)于機(jī)械手來(lái)說(shuō),這樣的抓取就變得相當(dāng)棘手。這個(gè)盒子的大小,已經(jīng)是人手大小能夠抓的最接近的尺寸了。手的大小對(duì)于人類來(lái)說(shuō)是限制,對(duì)于機(jī)器人靈巧手來(lái)說(shuō)也是。但是你可以看到我們的靈巧手,對(duì)于處理這種接近它手大小極限的物體的時(shí)候也是沒(méi)有問(wèn)題的。Chapter 4.3 開(kāi)可樂(lè)
開(kāi)可樂(lè)是最讓人印象深刻的dem,因?yàn)樗嬲宫F(xiàn)了機(jī)器人手的“人性化”特征。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 這是體現(xiàn)了我們硬件結(jié)構(gòu)設(shè)計(jì)上的一些創(chuàng)新,以及我們對(duì)手的實(shí)用性的一些理解。我們覺(jué)得,其實(shí)人在很多情況下,指甲都起到很重要的作用。一個(gè)就是您剛才提到的可樂(lè)瓶,我們需要有一個(gè)自適應(yīng),能夠在狹小的空間里實(shí)現(xiàn)相對(duì)較大的力輸出。 另外,在生活中很多細(xì)節(jié)上,比如洗菜、做飯、剝菜的過(guò)程中,其實(shí)都會(huì)用到。我們這里不僅僅是一個(gè)“指甲”,更重要的是手前端的設(shè)計(jì),能夠用軟物質(zhì)包裹,自適應(yīng),而且曲率非常接近人手的曲率,所以才能夠?qū)崿F(xiàn)這些功能。

我本來(lái)想使個(gè)壞,使勁搖晃了下可樂(lè)罐,本來(lái)想讓靈巧手給我開(kāi)個(gè)“噴氣式”可樂(lè)的,但是...怎么這么平靜?這次使壞失敗,大家如果知道怎么能讓可樂(lè)罐搖晃打開(kāi)能噴出來(lái)的給我留個(gè)言,我下次再去找靈巧手試試。
Chapter 4.4 拿iPhone——桌面操作的“終極考驗(yàn)”
這個(gè)看似最簡(jiǎn)單的動(dòng)作,實(shí)際上是技術(shù)含量最高的。iPhone緊貼桌面,手指必須伸入只有幾毫米的縫隙中,還不能與桌面發(fā)生硬碰撞。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們發(fā)現(xiàn)iPhone其實(shí)是一個(gè)非常窄小的空間,需要在這個(gè)狹小空間里使用比較大的力,并且拿穩(wěn)。這個(gè)過(guò)程中有若干難點(diǎn),其中一個(gè)難點(diǎn)是:很多靈巧手的末端設(shè)計(jì),如果曲率是向外的,在抓的過(guò)程中,力的方向會(huì)斜向外,不容易抓穩(wěn)。 另外一個(gè)難點(diǎn)是:抓的時(shí)候,手指會(huì)不可避免地跟桌面接觸,從而增加靈巧手損傷的概率。我們的手能解決這些問(wèn)題:一是有自適應(yīng)過(guò)程,在抓的時(shí)候能夠調(diào)整力的方向,讓它抓穩(wěn)并拿起來(lái);二是因?yàn)槲覀兪恰袄K驅(qū)”方案,讓手在接觸桌面的時(shí)候自適應(yīng),而不是直接碰撞和對(duì)抗,從而減少損傷。
05
AI大模型時(shí)代的靈巧手
目前,我們正處在一個(gè)特殊的歷史時(shí)刻:AI大模型的突破為機(jī)器人技術(shù)帶來(lái)了前所未有的可能性。
比如前面說(shuō)的Vision-Language-Action(VLA)模型,就給機(jī)器人的“大腦升級(jí)”。傳統(tǒng)的機(jī)器人需要為每個(gè)任務(wù)編寫(xiě)專門(mén)的程序,而VLA模型讓機(jī)器人能夠理解自然語(yǔ)言指令,并將其轉(zhuǎn)化為具體的動(dòng)作。這就像是給機(jī)器人裝上了“翻譯機(jī)”——它能夠?qū)ⅰ皫臀业贡边@樣的自然語(yǔ)言翻譯成具體的動(dòng)作序列。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們發(fā)現(xiàn)我在做的過(guò)程當(dāng)中靈巧手的操縱很大的一個(gè)難點(diǎn),就是如何進(jìn)行遙操。因?yàn)樗淖杂啥缺容^多會(huì)比夾爪復(fù)雜很多,特別是對(duì)于我們繩驅(qū)的方案,所以我們基于這個(gè)痛點(diǎn)做了一款A(yù)I小腦,這個(gè)AI小腦在用戶操縱的過(guò)程當(dāng)中能夠?qū)崿F(xiàn)自適應(yīng),對(duì)于不同的任務(wù),用戶并不需要精準(zhǔn)地告訴操縱我們靈巧手的力輸出甚至力輸出的方向,手會(huì)給予任務(wù)來(lái)進(jìn)行自適應(yīng)的調(diào)整,極大的提高了這個(gè)遙操的絲滑程度。

此外,Sim2Real(仿真到現(xiàn)實(shí))技術(shù)正在解決機(jī)器人訓(xùn)練的成本問(wèn)題。在虛擬環(huán)境中,機(jī)器人可以進(jìn)行數(shù)百萬(wàn)次的試錯(cuò),而不用擔(dān)心損壞硬件。但是,仿真和現(xiàn)實(shí)之間總是存在差距。
Evan Tao TetherIA聯(lián)合創(chuàng)始人兼CEO 這個(gè)的確是機(jī)器人在做的過(guò)程中的一些難點(diǎn),主要是在于,因?yàn)槲锢硎澜缡欠浅?fù)雜的,我們仿真的過(guò)程中肯定是簡(jiǎn)化了很多的一些參數(shù)。比如像物體比較多的摩擦力、剛性、柔軟的程度,仿真的模型并不能夠很好的去體現(xiàn)。并且我們?cè)谖锢硎澜缭O(shè)計(jì)機(jī)械手、生產(chǎn)機(jī)械手的過(guò)程也會(huì)有一些的誤差,所以這也是我們一直在克服的東西。
這就像是在游戲中練習(xí)開(kāi)車和在現(xiàn)實(shí)中開(kāi)車的區(qū)別——基本技能可以學(xué)會(huì),但真正的路感還是需要實(shí)際體驗(yàn)。
不僅如此,甚至在硬件上,AI也在發(fā)力。機(jī)器人昂貴的一個(gè)原因,是它的供應(yīng)鏈比較缺乏。很多這種驅(qū)動(dòng)器都是專門(mén)為了機(jī)器人定制的,目前來(lái)說(shuō)產(chǎn)量也比較低,所以整個(gè)行業(yè)的成本還沒(méi)有辦法做得非常便宜。并且,傳統(tǒng)機(jī)器人的設(shè)計(jì)是通過(guò)不斷提高產(chǎn)品的精度,來(lái)實(shí)現(xiàn)很多高級(jí)、炫酷的功能。但是現(xiàn)在有了AI的加持,對(duì)機(jī)器人硬件的精度要求就不會(huì)再繼續(xù)那么高,所以整體的價(jià)格我們相信會(huì)越來(lái)越低。

而TetherIA推出的這款繩驅(qū)方案的開(kāi)源靈巧手,就是想讓硬件以便宜的價(jià)格被更多機(jī)器人和科技愛(ài)好者所采用,在此之上去更好的用AI開(kāi)發(fā)軟件來(lái)加速靈巧手和機(jī)器人的技術(shù)進(jìn)步。
Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們這款低自由度的產(chǎn)品,是結(jié)合了我們?cè)谠O(shè)計(jì)高自由度的過(guò)程當(dāng)中,對(duì)于整個(gè)整體結(jié)構(gòu)設(shè)計(jì)的一些經(jīng)驗(yàn),然后并且采用了市面上主流的off-the-shelf(現(xiàn)成的)的這種電機(jī),所以能夠做到極致的低成本。
![]()
Evan Tao TetherIA聯(lián)合創(chuàng)始人兼CEO 我們的計(jì)劃和特斯拉是不一樣的,因?yàn)槲覀儾幌裉厮估心敲炊嗟馁Y金去完全投入在研發(fā)中,我們是要和我們的社群一起去成長(zhǎng)的過(guò)程。為什么我們對(duì)我們低自由度的手非常有信心,而且覺(jué)得會(huì)是一個(gè)爆款的產(chǎn)品,是在于我們通過(guò)300美金的硬件成本能夠做到超越別人幾千美金、甚至幾萬(wàn)美金的產(chǎn)品的功能性。這樣的好處是,不僅僅是很多很頂尖的公司和很頂尖的科研院所可以使用這樣的產(chǎn)品,更多的愛(ài)好者也可以一起參與到這個(gè)靈巧手算法的應(yīng)用的開(kāi)發(fā)過(guò)程中來(lái)。
![]()
圖片來(lái)源:TechCrunch
這就像是Google的Android策略——雖然蘋(píng)果的iOS可能在單個(gè)產(chǎn)品上更優(yōu)秀,但Android通過(guò)開(kāi)放生態(tài)獲得了更大的市場(chǎng)份額。而且通過(guò)開(kāi)源硬件,全世界的研究者都成為數(shù)據(jù)貢獻(xiàn)者。
06
機(jī)器人走進(jìn)家庭的前夜:
從擁有一雙真正靈巧的手開(kāi)始
回顧機(jī)器人靈巧手的發(fā)展史,其實(shí)就是人類技術(shù)進(jìn)步的一個(gè)縮影。我們從模仿自然開(kāi)始,逐步理解其中的原理,然后用工程的方式去實(shí)現(xiàn),最終可能會(huì)超越自然的原型。
我們?cè)诓稍L中發(fā)現(xiàn),TetherIA的故事特別有意思,因?yàn)樗砹艘环N新的發(fā)展模式:通過(guò)開(kāi)源降低門(mén)檻,通過(guò)眾包加速創(chuàng)新,通過(guò)生態(tài)建設(shè)推動(dòng)產(chǎn)業(yè)發(fā)展。這就像是Linux對(duì)操作系統(tǒng)行業(yè)的影響,或者Android對(duì)移動(dòng)行業(yè)的影響一樣。
當(dāng)然,從300多美元的開(kāi)源版本到真正實(shí)用的家庭機(jī)器人,這中間還有很長(zhǎng)的路要走。技術(shù)上的挑戰(zhàn)、成本上的壓力、應(yīng)用場(chǎng)景的探索,每一個(gè)環(huán)節(jié)都充滿了不確定性。

但是,正如受訪者在采訪最后說(shuō)的那樣:我們相信五年之后,我們會(huì)看到機(jī)器人在很多地方部署,它不會(huì)是一個(gè)停留在視頻里或者概念里的東西,就像我們現(xiàn)在每天接觸ChatGPT一樣,它會(huì)真正在我們生活當(dāng)中產(chǎn)生巨大的價(jià)值。
也許再過(guò)數(shù)年,我們回頭看2025年,會(huì)發(fā)現(xiàn)這是機(jī)器人真正走向普及的起點(diǎn)。到那時(shí),每個(gè)家庭都可能有一個(gè)機(jī)器人助手,能夠幫我們做飯、打掃、照顧老人、陪伴孩子。而這一切的起點(diǎn),就是讓機(jī)器人擁有一雙真正靈巧的手。
以上就是我們機(jī)器人系列的第一期的內(nèi)容,之后我們還會(huì)走訪硅谷明星初創(chuàng)公司和一線研發(fā)機(jī)器人的團(tuán)隊(duì),從大腦、AI算法、數(shù)據(jù)、腦機(jī)接口等多個(gè)維度來(lái)深度聊聊機(jī)器人如今的研發(fā)現(xiàn)狀。關(guān)于機(jī)器人,大家還有什么想問(wèn)的、想聊的,歡迎在評(píng)論區(qū)一起告訴我們吧。
![]()
視頻有視覺(jué)和音樂(lè)的加持,更能呈現(xiàn)出這些精彩的故事細(xì)節(jié)。 請(qǐng)?zhí)D(zhuǎn)至硅谷101【視頻號(hào)】收看完整版
注:部分圖片來(lái)源于網(wǎng)絡(luò)
【本期節(jié)目不構(gòu)成任何投資建議】
【視頻播放渠道】
國(guó)內(nèi):B站|騰訊|視頻號(hào)|西瓜|頭條|百家號(hào)|36kr|微博|虎嗅
海外:Youtube
聯(lián)系我們:video@sv101.net
【創(chuàng)作團(tuán)隊(duì)】
監(jiān)制|泓君 陳茜
撰稿 |Vicky Xiao
主持|陳茜
剪輯/動(dòng)效|踹 AK12 橘子
運(yùn)營(yíng)|王梓沁 孫澤平 朱婕
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.