![]()
圖片來(lái)自動(dòng)漫《玩具總動(dòng)員》劇照
?有界UnKnown原創(chuàng)
作者丨錢(qián)江
編輯|山茶
傳言許久的蘋(píng)果機(jī)器人終于迎來(lái)了新的進(jìn)展。
近期,蘋(píng)果公布了一項(xiàng)名叫“ELEGNT”的新研究框架,它可以讓非人形機(jī)器人展現(xiàn)更自然、更富有表現(xiàn)力的動(dòng)作。
蘋(píng)果用一盞臺(tái)燈機(jī)器人展示了這個(gè)新技術(shù)的效果。
比如你問(wèn)它外面天氣怎么樣,它會(huì)將“臉”轉(zhuǎn)向窗外“看一眼”,再扭過(guò)頭告訴你天氣;如果你和它傾訴“渴了”,它還會(huì)萌萌地用燈頭“小心翼翼”地將杯子推向面前;如果它遇到一個(gè)自己辦不到的事情,還會(huì)“低頭”表現(xiàn)出懊惱的情緒。
![]()
▲搭載蘋(píng)果ELEGNT技術(shù)框架的臺(tái)燈,與人類(lèi)互動(dòng),來(lái)源X@Nacho Mellado
通過(guò)這樣一個(gè)架構(gòu),一束光影、一個(gè)燈頭,以及一根6自由度、能夠靈活扭曲的機(jī)械燈臂,就能訴出萬(wàn)般情愁。讓皮克斯電影開(kāi)頭動(dòng)畫(huà)中的機(jī)器人走出熒幕,成為能真正陪在人們左右、提供情緒價(jià)值的“伙伴”。
當(dāng)然,蘋(píng)果并不是這一領(lǐng)域的先行者。2024年以來(lái),桌面機(jī)器人就成為AI落地的熱門(mén)方向,各類(lèi)AI桌面機(jī)器人層出不窮。
比如受到馬斯克點(diǎn)贊的Looi Robot,哈工大的XGO Rider,以及LIVING.AI的Emo和Aibi等等等。
那么,AI為什么會(huì)把目光聚焦到桌面?它們想依靠這種形式實(shí)現(xiàn)怎樣的愿景?又在面臨怎樣的挑戰(zhàn)?
![]()
陪伴AI,從虛擬走進(jìn)現(xiàn)實(shí)
桌面機(jī)器人并不是一個(gè)新事物,最早的桌面機(jī)器人可以追溯到1999年,一個(gè)名叫Poo-chi的、由日本富士通推出的電子寵物狗。即便是更為人所熟知的Emo和Vector桌面機(jī)器人,也都有六七年的歷史了。
所以這一輪桌面機(jī)器人熱,并不完全是之前這一批桌面機(jī)器人升級(jí)突破。我們更愿意將其看作是AI大模型從虛擬走向現(xiàn)實(shí)的一種結(jié)果。
2022年,ChatGPT還沒(méi)有引爆這一輪AI浪潮的時(shí)候,兩家主打AI陪伴的軟件公司Character.AI和Inflection就已經(jīng)在硅谷悄然成立了。
與ChatGPT這種百科全書(shū)式的AI助手不同,Character.AI和Inflection專(zhuān)注開(kāi)發(fā)富有同情心、幽默創(chuàng)新、能夠給人以情感陪伴的AI機(jī)器人。說(shuō)得簡(jiǎn)單一點(diǎn),他們想要讓2014年上映的電影《Her》走進(jìn)現(xiàn)實(shí)。
后來(lái),ChatGPT引爆AI奇點(diǎn),當(dāng)全球所有人都在為大模型尋找PMF的時(shí)候,AI陪伴就成了最合適的落地場(chǎng)景(之一)。
借助ChatGPT的熱度,Character.AI和Inflection在硅谷一度風(fēng)頭無(wú)兩。
2023年3月,Character.AI完成1.5億美元融資,估值達(dá)10億美元,進(jìn)入獨(dú)角獸行列。3個(gè)月后,Inflection AI完成13億美元融資,估值達(dá)到40億美元,成為當(dāng)時(shí)AI領(lǐng)域融資額僅次于OpenAI的公司。
在國(guó)內(nèi),各類(lèi)基于大模型的情感陪伴應(yīng)用也如雨后春筍般層出不窮,比如MiniMax的星野、閱文旗下筑夢(mèng)島、字節(jié)跳動(dòng)旗下的貓箱等。
這類(lèi)AI陪聊軟件的共性,是極致追求擁有高情商、個(gè)性化、情感化的虛擬聊天對(duì)象。但人類(lèi)真的需要一個(gè)無(wú)限了解自己的AI“靈魂伴侶”嗎?當(dāng)存在一個(gè)無(wú)限了解自己內(nèi)心的虛擬產(chǎn)品出現(xiàn),卻又看不見(jiàn)、摸不著的時(shí)候,就未必是一件值得慶幸的事情了。
2024年2月28日,美國(guó)佛羅里達(dá)州一名14歲少年,與Character.AI創(chuàng)建的一個(gè)虛擬聊天對(duì)象丹妮進(jìn)行最后一次談話后,因希望能夠與丹妮“永遠(yuǎn)在一起”而選擇開(kāi)槍自殺。為此,少年的母親將Character.AI告上了法庭。
![]()
▲CNN Business報(bào)道因青少年因Character.AI自殺
人性的悲劇成為壓倒Character.AI的其中一根稻草,更現(xiàn)實(shí)的問(wèn)題是,由于缺乏收入來(lái)源,相關(guān)公司很快就陷入資金鏈短缺的漩渦中。
2024年,Character.AI和Inflection先后爆出資金鏈短缺的問(wèn)題,然后其創(chuàng)始人連帶著部分員工分別被谷歌和微軟人工智能部門(mén)收編。
就這樣,一場(chǎng)以AI豐富人類(lèi)情感陪伴的故事就到這里草草結(jié)束。但業(yè)界對(duì)于這類(lèi)能夠給人類(lèi)提供情感陪伴的項(xiàng)目探索熱情卻并沒(méi)有結(jié)束。
大家普遍思考的問(wèn)題是,如果《Her》這種完全虛擬的故事無(wú)法在商業(yè)上講通,那么讓這種虛擬的陪伴成為現(xiàn)實(shí),故事又是否能夠繼續(xù)講下去?
![]()
桌面機(jī)器人,從玩具到工具
Meta首席科學(xué)家Yann Lecun的一個(gè)觀點(diǎn),為情感陪伴AI走向陪伴機(jī)器人提供了一個(gè)方向指引。他認(rèn)為,真正的AGI應(yīng)該能實(shí)現(xiàn)與真實(shí)的物理環(huán)境交互。
2024年初,在大模型普遍面臨應(yīng)用困境的時(shí)候,具身智能開(kāi)始受到越來(lái)越多的關(guān)注,并成為一個(gè)新的熱門(mén)方向,陪伴機(jī)器人也在這個(gè)時(shí)候,在AI的加持下嶄露頭角。
當(dāng)然,在探索的過(guò)程中,不同的陪伴機(jī)器人也在開(kāi)始產(chǎn)生差異化。
首先是一批老牌的“表情系”陪伴機(jī)器人,它們借助大模型對(duì)傳統(tǒng)產(chǎn)品進(jìn)行改造升級(jí),增進(jìn)了與人類(lèi)互動(dòng)的陪伴作用。
2024年年初,Engineered Arts公布第二代Ameca上線,這款A(yù)meca擁有視覺(jué)感知和聲音克隆能力,她在回答人類(lèi)問(wèn)題的時(shí)候,能夠直視對(duì)方,并且還會(huì)歪頭端詳、垂眼思考。但Ameca到現(xiàn)在為止還不能走動(dòng)。
![]()
▲Engineered Arts旗下表情機(jī)器人Ameca
表情系的AI陪伴機(jī)器人一般都做成人形,既需要攻克仿生皮膚技術(shù),也要做到表情逼真以跨越“恐怖谷”,需要投入大量的時(shí)間和資金進(jìn)行探索,實(shí)用性也不強(qiáng)。
于是,AI陪伴機(jī)器人賽道涌入了一批更輕量化“寵物系”的機(jī)器人,也就是用寵物形態(tài)做陪伴機(jī)器人。
日本機(jī)器人公司GROOVE X,打造的家庭陪伴機(jī)器人LOVOT,就是典型的寵物系陪伴機(jī)器人。
LOVOT的眼睛由6層動(dòng)態(tài)燈光構(gòu)成,能呈現(xiàn)出眨眼、瞳孔擴(kuò)張、眼神追隨等表情,并且全身遍布觸摸傳感器,能夠感知到人類(lèi)的輕拍、撫摸動(dòng)作,雖然它不會(huì)幫人類(lèi)做事、和人類(lèi)說(shuō)話,但可以陪伴人類(lèi)。
![]()
▲Groove X旗下Lovot機(jī)器人
LOVOT的體溫常年在37°-39° 之間,接近人類(lèi)體溫,抱在懷里十分溫暖。當(dāng)你摸摸它的鼻子時(shí),它的雙眼會(huì)瞇成月牙,還會(huì)發(fā)出可愛(ài)的娃娃音。
除了做一款外表可愛(ài)的“寵物”,聯(lián)合知名IP構(gòu)建陪伴機(jī)器人也是“寵物系”的玩法,比如Engineering AI將威震天變形金剛進(jìn)行改造,這類(lèi)改造還獲得了馬斯克點(diǎn)贊。
![]()
▲Elon Musk點(diǎn)贊Engineering AI
不論是“表情系”還是“寵物系”的陪伴機(jī)器人,它們都是人類(lèi)追求情感陪伴的產(chǎn)物。但人類(lèi)似乎已經(jīng)不滿足于只和一個(gè)會(huì)嘻嘻哈哈、簡(jiǎn)單聊天的機(jī)器人做伴,他們希望在陪伴功能之外,還能有一些實(shí)用性。
從需求的角度來(lái)講,人們不希望自己花錢(qián)購(gòu)買(mǎi)的產(chǎn)品只是一個(gè)玩具,它更應(yīng)該成為一個(gè)能夠在日常生活和工作中提供幫助的“助手”。這其實(shí),恰恰也是AI的訴求,畢竟單純的情感陪伴無(wú)法挖掘用戶(hù)更深層次的需求,也無(wú)法打開(kāi)更廣泛的用戶(hù)市場(chǎng)。
于是,開(kāi)發(fā)者們開(kāi)始將眼光轉(zhuǎn)移到“桌面”,因?yàn)椤白烂妗蓖侨藗児ぷ骱蛫蕵?lè)的重要場(chǎng)景。所以,做一款既讓人類(lèi)解壓,又能在桌面完成一些簡(jiǎn)單任務(wù)的機(jī)器人,成為了開(kāi)發(fā)者們探索AI陪伴機(jī)器人的新任務(wù)。
當(dāng)然,“桌面”也不僅僅是這些機(jī)器人唯一的活動(dòng)范圍,但它代表著陪伴機(jī)器人從單純的“陪伴”走向“實(shí)用”的微妙轉(zhuǎn)型。
![]()
玩具總動(dòng)員,正在照進(jìn)現(xiàn)實(shí)
在CES2025上,已經(jīng)火了一批“桌面機(jī)器人”,其中最火爆的就是上面所說(shuō)的Looi Robot,它于2024年獲得64.8萬(wàn)美金眾籌,在Kickstarter和Indiegogo上以客單價(jià)129美元的價(jià)格募集總數(shù)量超4000臺(tái)。
不久后,類(lèi)似Looi Robot的桌面機(jī)器人也開(kāi)始廣泛受到關(guān)注,比如哈工大的XGO Rider、LIVING.AI的Emo和Aibi等桌面機(jī)器人也紛紛擁有了更智能化的互動(dòng)能力。
![]()
▲各家桌面雙輪(腿)機(jī)器人,有界UnKnown制圖
它們的長(zhǎng)相有一些共同特征:“頭大腿短”,頭部往往由一塊屏幕構(gòu)成,通過(guò)屏幕上的動(dòng)畫(huà)來(lái)展現(xiàn)各類(lèi)表情,“頭部”通常使用一雙動(dòng)畫(huà)眼睛來(lái)賦予表情,然后用輪子或者雙腿來(lái)充當(dāng)?shù)鬃?/strong>
除了外貌,它們清一色地都接入大模型實(shí)現(xiàn)和人類(lèi)更好的互動(dòng),小巧的身體可以在桌面上輕松來(lái)回移動(dòng)。
雖然這些桌面機(jī)器人核心作用依舊是情感陪伴,比如能聽(tīng)懂人類(lèi)語(yǔ)言,并通過(guò)屏幕上的畫(huà)面展示對(duì)其作出反饋,但它們的作用卻已經(jīng)不再局限于情感價(jià)值。
比如Looi Robot將手機(jī)和機(jī)器人合二為一,相當(dāng)于為手機(jī)開(kāi)發(fā)了一個(gè)新的應(yīng)用場(chǎng)景,讓它可以以機(jī)器人的形式做會(huì)議記錄、自動(dòng)攝影等工作。
哈工大團(tuán)隊(duì)研發(fā)的XGO- Rider除了提供專(zhuān)屬表情哄人類(lèi)開(kāi)心之外,它還能識(shí)別圖片、識(shí)別人臉和骨骼。除此之外,它還具備教育學(xué)習(xí)功能,允許用戶(hù)使用Blocky和Python進(jìn)行編程。
Living.AI旗下的Emo、Aibi也具備開(kāi)關(guān)燈、拍照等實(shí)用功能。
不僅初創(chuàng)公司進(jìn)廠做桌面機(jī)器人,大廠也看到了這類(lèi)機(jī)器人的未來(lái)潛力。2024年8月份,蘋(píng)果就曝光內(nèi)部的秘密機(jī)器人項(xiàng)目,代號(hào)為J595,根據(jù)Medium報(bào)道,這也是一款桌面機(jī)器人,并且預(yù)計(jì)最早于2026年首次亮相,售價(jià)為1000美元,據(jù)說(shuō)也是類(lèi)似于這種可以在桌面滾動(dòng)的小玩具。
雖然桌面機(jī)器人賽道目前已經(jīng)十分熱鬧,但它同樣也面臨一個(gè)致命性的問(wèn)題,即桌面機(jī)器人的技術(shù)門(mén)檻不高,并且有一部分通過(guò)大模型“套殼”的簡(jiǎn)單方式制作而成,普通用戶(hù)甚至都可以DIY出一個(gè)類(lèi)似的桌面機(jī)器人,以至于企業(yè)很難形成有效的護(hù)城河,這也導(dǎo)致目前市場(chǎng)上的桌面機(jī)器人同質(zhì)化嚴(yán)重。
那么,它們?nèi)绾巫龀霾町惢⑷绾螛?gòu)筑核心壁壘?
除了不斷強(qiáng)化大模型,來(lái)提升這些“新物種”的互動(dòng)能力之外,另一種思路是構(gòu)建具身模型來(lái)改造桌面上的已有物體。
比如蘋(píng)果ELEGNT技術(shù)讓臺(tái)燈擁有“肢體語(yǔ)言”,實(shí)現(xiàn)物體和人類(lèi)互動(dòng),同樣的思路也可以改造桌面上的其他家居產(chǎn)品。
除了ELEGNT之外,蘋(píng)果幾個(gè)月前還發(fā)布了另一項(xiàng)研究成果“EMOTION”,這項(xiàng)技術(shù)可以讓機(jī)器人的手勢(shì)與人類(lèi)自然互動(dòng),機(jī)器人可以像好朋友一樣,向你展示“剪刀手”來(lái)表示勝利。雖然EMOTION的研究主要在機(jī)械手的運(yùn)用上,但它實(shí)現(xiàn)的手勢(shì)互動(dòng)能力,其實(shí)也可以用于指向、抓取物品相關(guān)的桌面機(jī)器人。
這兩套框架的英文名字,一個(gè)接近“優(yōu)雅”(ELEGANT),一個(gè)意旨“情緒”(EMOTION),它們都運(yùn)用大語(yǔ)言模型和視覺(jué)語(yǔ)言模型等AI技術(shù),讓機(jī)器人變得更加富有“人味”。
這種將物體“擬人化”的技術(shù)探索,一旦成熟起來(lái),幾乎可以賦予任何家用產(chǎn)品,整個(gè)家就像一個(gè)小型的迪士尼樂(lè)園一樣,堆滿了各式各樣、可以和人類(lèi)互動(dòng)的小玩意。
而這或許是改變AI桌面機(jī)器人差異化和壁壘不足的一個(gè)重要方向。
![]()
結(jié)語(yǔ)
試著想象這樣一個(gè)場(chǎng)景,除了小貓小狗會(huì)到門(mén)口迎接你之外,你的落地?zé)粢矔?huì)自動(dòng)點(diǎn)亮,并向你點(diǎn)頭致意。
你的衣帽架會(huì)伸出手接過(guò)你脫下的衣服和包包,機(jī)器狗會(huì)為你遞上拖鞋,你的桌面小機(jī)器人會(huì)向你發(fā)出問(wèn)候,并貼心為你打開(kāi)屋里的燈光和電視,然后再向你匯報(bào)你不在家的時(shí)候,家里發(fā)生的事情。
衣服已經(jīng)洗好并烘干,鍋里的飯菜計(jì)算著時(shí)間,在你到家時(shí)剛好完成,熱茶已經(jīng)放在茶幾,等你休息一會(huì)兒就可以開(kāi)飯。
怎么樣?這樣的家即便只有你一個(gè)人也不會(huì)感到孤獨(dú)吧,這可能就是陪伴型機(jī)器人的作用。
他們不僅提供陪伴和情緒價(jià)值,他們也同樣為這個(gè)家提供切切實(shí)實(shí)的勞動(dòng)價(jià)值。
而這些,得益于AI技術(shù)的不斷進(jìn)步,我們相信像“玩具總動(dòng)員”一樣的世界,終有一天會(huì)照進(jìn)現(xiàn)實(shí)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.