![]()
當(dāng)機(jī)器開始理解「愛」,或許我們才能更好地理解「人」。
作者|連冉
編輯|鄭玄
當(dāng)任永亮決定帶領(lǐng)一家純粹的互聯(lián)網(wǎng)公司跨界機(jī)器人時(shí),身邊的朋友和業(yè)內(nèi)人士看好得并不多。
一些做過掃地機(jī)器人的候選人曾給任永亮潑冷水,跟他談到機(jī)器人研發(fā)中一些難以處理的情況,例如家太大導(dǎo)致中途沒電、機(jī)器人撞碎家里昂貴的物品、甚至意外絆倒孩子等難題。也在內(nèi)部反復(fù)溝通了很多次,團(tuán)隊(duì)成員很難想象為什么一家互聯(lián)網(wǎng)公司要去從零開始做硬件。
但任永亮并未動(dòng)搖。歷史上還沒有出現(xiàn)過特別成功的家庭陪伴機(jī)器人,這個(gè)行業(yè)正處于從「玩具」向「生命感」跨越的拐點(diǎn),沒人見過完美的陪伴機(jī)器人,所以他可以按照自己的邏輯去定義這個(gè)新物種。
去年年底,心言集團(tuán)(測測)創(chuàng)始人兼 CEO 任永亮在極客公園創(chuàng)新大會(huì) 2026 上,關(guān)于為何一家泛心理公司要做機(jī)器人,他給出的答案是,為了「無條件的積極關(guān)注」。他認(rèn)為,純粹的線上智能體如同異地戀的朋友,看得見摸不著;而傳統(tǒng)的工業(yè)機(jī)器人只會(huì)打拳擊、擰螺絲。
任永亮想做的,是給大模型裝上身體和同理心,讓它成為一位「愛的使者」。它不是為了替代父母或伴侶,而是為了在原子化社會(huì)的縫隙中,提供一種可觸碰的、高質(zhì)量的情感在場。
如今,心言集團(tuán)的家庭陪伴機(jī)器人「巴布」已經(jīng)亮相 2026 北京臺(tái)春晚,春晚之后,心言集團(tuán)計(jì)劃啟動(dòng)「創(chuàng)生合伙人」活動(dòng),邀請首批用戶參與共創(chuàng)過程,并隨之開展一系列內(nèi)測流程。
在產(chǎn)品落地的節(jié)奏上,任永亮預(yù)計(jì)在今年 6 月份正式開始量產(chǎn)發(fā)貨。與此同時(shí),為了讓機(jī)器人更好地融入家庭,心言集團(tuán)也在考慮將旗下?lián)碛袛?shù)百萬用戶的 AI 智能體「陪伴小星」與機(jī)器人打通,甚至將其獨(dú)立為專門的 APP,以實(shí)現(xiàn)虛擬陪伴與物理具身的深度聯(lián)動(dòng)。
01
為什么會(huì)做機(jī)器人?
極客公園:為什么選擇在此時(shí)研發(fā)機(jī)器人?
任永亮:關(guān)于為什么是現(xiàn)在,可以從幾個(gè)維度來看。早在 2017 年,我們公司進(jìn)行內(nèi)部技術(shù)規(guī)劃時(shí),除了 AI,就已經(jīng)將「機(jī)器人」列入選項(xiàng)。我們認(rèn)為 AI 演進(jìn)的終極形態(tài)可能就是機(jī)器人。但在 17 年那個(gè)節(jié)點(diǎn),大語言模型(LLM)尚未出現(xiàn),我們發(fā)現(xiàn)這條路線極其艱難。
大模型時(shí)代開啟后,對話領(lǐng)域的問題得到了解決,機(jī)器人從「極高難度」轉(zhuǎn)向了「技術(shù)可行」。大模型不僅提供了基礎(chǔ)語言能力,其 Transformer 架構(gòu)也提供了一種范式,讓我們能夠完善機(jī)器人的端側(cè)模型。結(jié)合 Diffusion(擴(kuò)散模型)等新架構(gòu)的出現(xiàn),我們認(rèn)為機(jī)器人在技術(shù)層面已經(jīng)成熟。
從個(gè)人感觸來說,做「測測」時(shí),我正處在情感困惑期,所以對情感產(chǎn)品更有「體感」。現(xiàn)在我有兩個(gè)孩子,在育兒過程中面臨新挑戰(zhàn)。我不敢讓小孩過多使用手機(jī)端的 AI 產(chǎn)品。首先,屏幕對視力有影響;其次,手機(jī) AI 無法「看見」孩子,即便打開攝像頭,也缺乏實(shí)時(shí)的物理互動(dòng),導(dǎo)致上下文(Context)不完整。為了彌補(bǔ)這種缺失,AI 往往只能通過不停說話來取悅孩子。
我認(rèn)為這種溝通范式是不健康的。AI 應(yīng)該結(jié)合「具身」載體,能夠感知上下文和周邊環(huán)境,從而實(shí)現(xiàn)更好的互動(dòng)。目前的普通 AI 就像處于一場「話癆式的異地戀」,只能不停通話卻看不見對方,無法提供核心價(jià)值。
從公司層面看,我們已經(jīng)具備了一定的 AI 能力儲(chǔ)備。同時(shí),通用大模型并非中小型公司所能觸及,因?yàn)樗鼘Y源的要求極高。作為一家產(chǎn)品型公司,我認(rèn)為讓 AI 發(fā)揮最大價(jià)值的機(jī)會(huì)在于與硬件結(jié)合。雖然我們沒有硬件基因,但公司的規(guī)模和能力與硬件開發(fā)有著內(nèi)在的匹配度。
極客公園:剛才提到基因與機(jī)會(huì),但市場上許多成熟的機(jī)器人公司也在做 AI 陪伴機(jī)器人,他們擁有供應(yīng)鏈和制造基礎(chǔ)的天然優(yōu)勢。作為從零開始做硬件的團(tuán)隊(duì),會(huì)不會(huì)擔(dān)心「缺少基因」會(huì)成為不利因素?
任永亮:不一定。首先,我們并不是要在硬件參數(shù)上與人競爭。我們信奉移動(dòng)互聯(lián)網(wǎng)時(shí)代的思路:為了打造更好的軟件體驗(yàn),才去定義和制造硬件。我們的出發(fā)點(diǎn)并非為了做硬件而做硬件,而是為了讓軟件能力得到充分釋放,這種視角是天然不同的。
極客公園:所以做機(jī)器人也是為了讓「測測」APP 的功能得到更好的發(fā)揮嗎?
任永亮:更準(zhǔn)確地說,是為了定義這個(gè)時(shí)代家庭場景所需的 AI 能力。它必須具備視覺、運(yùn)動(dòng)以及一定的泛化能力。
02
當(dāng)家庭陪伴機(jī)器人還沒有標(biāo)準(zhǔn)答案
極客公園:從構(gòu)思到落地經(jīng)歷了一段時(shí)間。之前外界對于心言集團(tuán)跨界做機(jī)器人可能有一些不同的聲音,對此是怎么看的?
任永亮:這些聲音鞭策我更加努力。機(jī)器人行業(yè)正處于一個(gè)「拐點(diǎn)」——?dú)v史上還沒有出現(xiàn)過特別成功的家庭陪伴機(jī)器人。正因?yàn)闆]有標(biāo)準(zhǔn)答案,我們才有定義的自由。俗話說「畫鬼容易畫虎難」,老虎大家都見過,畫得不像一眼就能看出來;但「鬼」沒人見過,這反而給了我們很大的空間去定義機(jī)器人到底該是什么樣。
極客公園:「拐點(diǎn)」具體指什么?
任永亮:是指行業(yè)正在從「玩具」向「生命感」跨越。以往的機(jī)器人產(chǎn)品多屬于玩具范疇,頂多是通過交互方式調(diào)用云端模型,缺乏對物理環(huán)境、情緒以及復(fù)雜上下文的感知,且大多是靜態(tài)的。我們現(xiàn)在的目標(biāo)是賦予它「靈魂」,在拐點(diǎn)處實(shí)現(xiàn)跨越。
極客公園:所以在這個(gè)過程中有沒有過哪怕一絲動(dòng)搖?覺得做這件事到底對不對,花這么大勁值不值?
任永亮:這種動(dòng)搖隨時(shí)都在。包括內(nèi)部溝通也反復(fù)了很多次,大家很難想象為什么一個(gè)互聯(lián)網(wǎng)公司要去硬磕機(jī)器人。我去和一些候選人聊,做過掃地機(jī)的人會(huì)給我很多提醒,比如家太大機(jī)器人中途沒電、撞碎重要東西、甚至絆倒孩子,這些技術(shù)上的 Corner Case(極端情況)非常難處理。
后來我試用了日本的 LOVOT 機(jī)器人,發(fā)現(xiàn)它做得其實(shí)也沒那么強(qiáng)(笑),但這給了我很大信心。既然它做成這樣公司也能活下來,說明大眾是有接受度的。這成了堅(jiān)定我信心的很大動(dòng)力。
![]()
圖片來源:心言集團(tuán)
極客公園:LOVOT,你覺得它哪些部分還有優(yōu)化空間?
任永亮:(笑)它經(jīng)常絆倒,其實(shí)它真的經(jīng)常絆倒,但這似乎也沒關(guān)系。我也去過這家公司參觀過,是和極客公園一起去的。它有獨(dú)特的定位,但對我來說,我堅(jiān)持讓機(jī)器人擁有語言能力。這也是為什么我們公司叫「心言集團(tuán)」,我希望它能和人溝通。
如果沒有語言能力,機(jī)器人的情感價(jià)值會(huì)大打折扣。這是我和它不一樣的地方。另外,我們處于不同的技術(shù)周期。LOVOT 誕生在機(jī)器學(xué)習(xí)時(shí)代,對話能力還沒那么強(qiáng);而我們是完全為了大模型(LLM)去打造機(jī)器人的。
極客公園:所以它必須具備像人一樣交流的語言能力,才能發(fā)揮新角色的作用?
任永亮:對。就像 iPhone 為什么偉大?因?yàn)樗∠藢?shí)體鍵盤,讓屏幕成為交互的主要介質(zhì),擴(kuò)大了信息流通度。我們希望機(jī)器人至少在語言這條主通路上是沒有任何障礙的。
03
它不只是會(huì)聊天,
而是要真的住進(jìn)家里
極客公園:那么這款家庭陪伴機(jī)器人有哪些更具體的產(chǎn)品定義?
任永亮:主要分為三個(gè)方面。第一是語言能力,包括陪孩子聊天、語言啟蒙以及構(gòu)建家庭多語言環(huán)境。第二是心理慰藉。我們將測測在情感領(lǐng)域積累的模型和心理服務(wù)理論融入其中,旨在改善家庭關(guān)系結(jié)構(gòu),給孩子更多鼓勵(lì)和關(guān)注。畢竟現(xiàn)在的父母工作壓力大,陪伴時(shí)間有限。第三是輔助功能,如影像記錄等。
極客公園:它是一個(gè)可以在地面移動(dòng)的產(chǎn)品。這種產(chǎn)品形態(tài)是如何確定的?中間有過其他方案嗎?
任永亮:關(guān)于形態(tài),我們確實(shí)經(jīng)過了很多次打磨,但我始終堅(jiān)持兩點(diǎn):視覺能力與運(yùn)動(dòng)能力。
之所以如此堅(jiān)持,是因?yàn)槲覀兛吹搅耸謾C(jī)端 AI 的弊端。手機(jī)本質(zhì)上是一個(gè)虛擬世界,我們往往是按照「取悅用戶」的模式去設(shè)計(jì)產(chǎn)品,因?yàn)樗鼘τ脩衄F(xiàn)實(shí)生活的影響力很小。
但如果在家庭場景中,我希望機(jī)器人是一個(gè)「家庭參與者」。作為參與者,它必須具備主動(dòng)能力。否則,一旦用戶忘了給它充電,或者不再主動(dòng)交互,這個(gè)機(jī)器人可能就落灰了。我們希望它在家庭中真的像一個(gè)新生命一樣,具備自主的運(yùn)動(dòng)能力和自主的判斷力。
極客公園:自主的運(yùn)動(dòng)能力和自主的判斷力,聽起來它確實(shí)有一種「主動(dòng)」的感覺。那它到底主動(dòng)到一個(gè)什么樣的程度?這種主動(dòng)的邊界在哪里?
任永亮:這些我們都在設(shè)計(jì)的過程中。我覺得底線是「自動(dòng)回充」,這是它必須具備的能力。我們所說的主動(dòng),也不是到處找人說話,這肯定會(huì)有默認(rèn)設(shè)置。用戶也可以根據(jù)需要設(shè)計(jì)它的性格特征,比如到底是 i 人還是 e 人。我們希望它未來能根據(jù)交互過程自適應(yīng)生活狀態(tài),比如它看到孩子偏安靜、話比較少,那它主動(dòng)交互的閾值就會(huì)高一些。這些都是我們后續(xù)要做的更詳細(xì)的設(shè)計(jì)。
極客公園:它現(xiàn)在的智能交互程度具體是怎么樣的?
任永亮:我覺得至少要讓它在客廳這個(gè)主要活動(dòng)區(qū)域內(nèi)游刃有余,這是我們希望實(shí)現(xiàn)的。
極客公園:這個(gè)「游刃有余」有具體的描述嗎?做到什么程度會(huì)讓你覺得游刃有余?
任永亮:就是來去自如。比如小朋友在這邊玩,它可以到孩子身邊;小朋友走了,它可以自己回去。在這個(gè)過程中有人走動(dòng),它能適當(dāng)躲避障礙物,不要絆到別人。
極客公園:如果看到小孩,它會(huì)主動(dòng)交流嗎?還是需要額外設(shè)置?
任永亮:我覺得「觀察第一」。由觀察再?zèng)Q定后面是交流還是做其他動(dòng)作。在家庭里,它的人格里有一種「心理疏導(dǎo)師」的潛在定位。心理從業(yè)者往往優(yōu)先觀察,先分析環(huán)境,再適當(dāng)給出回應(yīng)。
極客公園:現(xiàn)在也有一些陪伴機(jī)器人功能相對簡單,但形態(tài)很小,比如在桌面上移動(dòng),甚至能掛在包上。它們也有交互能力,比如喚醒后眼睛會(huì)眨巴。咱們沒考慮過這種相對小型的形態(tài)嗎?
任永亮:這是常被問到的問題。我最終還是想回到「生命感」這一塊。我不希望它是一個(gè)過于被動(dòng)的產(chǎn)品——那種放在桌上意味著你要及時(shí)給它充電,或者說話前必須先做一個(gè)喚醒操作,這種狀態(tài)很難保持。另外,做得太小,計(jì)算能力和感知能力都會(huì)縮水。我不想妥協(xié),我想在技術(shù)的邊界上放大想象力,把多種能力融合在一起,把這個(gè)「大腦」訓(xùn)練得更好。
極客公園:剛才聽你聊的過程中,「孩子」這個(gè)詞出現(xiàn)了很多次。咱們的產(chǎn)品是主要圍繞孩子群體設(shè)計(jì)的嗎?
任永亮:有三類用戶:有孩子的家庭是一類,獨(dú)居老人是一類,還有一類是獨(dú)居女性。因?yàn)槲椰F(xiàn)在正好有孩子,所以對這個(gè)群體的感觸會(huì)更深一些。
極客公園:心言集團(tuán)有自己的大模型。但做機(jī)器人涉及很多視覺算法、避障識(shí)別等,這些也是自己做嗎?還是有外部合作?
任永亮:視覺和避障等「小算法」在過去幾年已經(jīng)發(fā)展得相對成熟了。早期的機(jī)器學(xué)習(xí)爆發(fā)就是從視覺開始的,全行業(yè)積累得很充分。雖然我們現(xiàn)在還沒在一個(gè)統(tǒng)一的大模型架構(gòu)下處理所有信息,但如果只是調(diào)用或借鑒,行業(yè)的解決方案已經(jīng)非常成熟了。
極客公園:所以這個(gè)機(jī)器人在交互上會(huì)調(diào)用其他模型?
任永亮:目前它是一個(gè)「組合式」的。它會(huì)結(jié)合很多小模型,至少在運(yùn)控感知這塊,有很多成熟的技術(shù)方案可以作為大模型的輸入或輸出。
極客公園:前面提到 LOVOT,它的價(jià)格蠻貴的,要幾萬元,前兩天臥安機(jī)器人也發(fā)了一款家庭陪伴機(jī)器人,也是那種在地上跑的,價(jià)格好像是 5000 元起。那心言做的這款機(jī)器人,定價(jià)范圍大概是怎么樣的?這個(gè)區(qū)間是怎么定下來的?
任永亮:這要結(jié)合未來的商業(yè)模式來考慮。有時(shí)候我們并不是單純?yōu)榱速u硬件,未來更想做的是硬件之上的軟件。初期我們會(huì)根據(jù)用戶的接受程度來定義價(jià)格。從傳感器的選配以及算力儲(chǔ)備來看,價(jià)格肯定要在 3000 元以上。具體來說,我們希望定價(jià)在 5000 元到 10000 元之間。
極客公園:關(guān)于商業(yè)模式,目前有具體的規(guī)劃或設(shè)想了嗎?
任永亮:商業(yè)模式其實(shí)挺簡單的。一個(gè)是硬件本體的固有模式,另一個(gè)是基于硬件提供的各類服務(wù)。
極客公園:那是會(huì)為機(jī)器人重新開發(fā)一套軟件,還是會(huì)跟「測測」APP 有所聯(lián)動(dòng)?
任永亮:它會(huì)有專門的軟件。當(dāng)然,「測測」的一些能力我們會(huì)進(jìn)行結(jié)合,或者說「測測」的能力未來可能會(huì)作為機(jī)器人上的一個(gè)插件。
極客公園:目前有設(shè)想過哪些能力比較適合接入嗎?
任永亮:至少「情感疏導(dǎo)」是一定可以的。因?yàn)樗幸曈X能力,能看到用戶的表情。以前「測測」是看不到用戶表情的,現(xiàn)在我們可以研究如何將表情識(shí)別融入到交互中。
極客公園:從線上走到線下,在這個(gè)過程中,除了朋友提到的掃地機(jī)器人的那些難點(diǎn),你們自己在研發(fā)中發(fā)現(xiàn)了哪些挑戰(zhàn)?
任永亮:我覺得最大的難點(diǎn)在于端側(cè)模型還沒有特別成熟、收斂的技術(shù)方案。大家目前只能沿用大模型的架構(gòu)或其他傳統(tǒng)的機(jī)器學(xué)習(xí)模型架構(gòu)。在端側(cè)到底用什么樣的方案,數(shù)據(jù)如何收集,如何構(gòu)建閉環(huán),這些都很難。為此我們也做了很多打基礎(chǔ)的工作。
極客公園:硬件研發(fā)通常分階段進(jìn)行,你們是否經(jīng)歷過某個(gè)特定的階段,或者在第二階段有了什么新的發(fā)現(xiàn)?
任永亮:我們內(nèi)部的技術(shù)路線在不斷收斂。最早我們想得很多,包括研究各種 3D 生成模型、視頻生成技術(shù),看能不能應(yīng)用在機(jī)器人上。從去年下半年開始,我們逐漸收斂,定義了一套新的機(jī)器人基礎(chǔ)數(shù)據(jù)格式。我們內(nèi)部現(xiàn)在對「機(jī)器人如何理解環(huán)境」的規(guī)范定義得比較清晰,并圍繞這個(gè)去構(gòu)建場景數(shù)據(jù)。
極客公園:「新的機(jī)器人數(shù)據(jù)格式」?
任永亮:你可以理解為是我們完全自主研發(fā)、定義的一套簡單的仿真系統(tǒng)。
極客公園:這套系統(tǒng)跟目前市場上通用的方法有什么區(qū)別嗎?
任永亮:我們想做一個(gè)「整合式」的仿真。現(xiàn)在的仿真更多強(qiáng)調(diào)對物理環(huán)境的模擬,主要用于自動(dòng)駕駛或操作控制。我們希望把語言、表情、人的動(dòng)作以及物理環(huán)境全部整合在一個(gè)系統(tǒng)里,用于模型的訓(xùn)練。
04
一個(gè)耐心的機(jī)器人
極客公園:上次你在極客公園 IF 大會(huì)的演講中,談到了「無條件的積極關(guān)注」。這個(gè)理念如果跟機(jī)器人結(jié)合,會(huì)呈現(xiàn)出什么狀態(tài)?
任永亮:通俗點(diǎn)說就是「耐心」。對父母來說,給孩子最奢侈的東西可能就是耐心。平時(shí)可能感覺不到,但當(dāng)孩子惹你生氣時(shí),耐心會(huì)急速衰竭。我希望機(jī)器人不像人這么感性,它能持續(xù)地以一種積極的態(tài)度去關(guān)照孩子的情緒。
極客公園:所以「情緒疏導(dǎo)」是這款機(jī)器人的核心功能。那它會(huì)有像 LOVOT 那樣的擁抱或觸碰反饋嗎?
任永亮:這些交互我們也都有設(shè)計(jì)。
極客公園:除了 LOVOT 具備的功能,咱們有哪些它沒有的新亮點(diǎn)?
任永亮:首先是語言交互,這是它沒有的。其次,我們的影像視角比它更高,LOVOT 太矮了,我們的機(jī)器人大概 65 厘米高,視角更好。第三,我們的價(jià)格會(huì)更容易被大眾接受。
極客公園:在目標(biāo)市場的選擇上,是像 LOVOT 那樣聚焦一線城市,還是有不同的考慮?
任永亮:目前精力非常有限,我們只能先從一線城市開始。
極客公園:之前你有提到機(jī)器人能觸發(fā)用戶分泌「催產(chǎn)素」,從而建立深度的情感鏈接。除了心言集團(tuán)之前在心理數(shù)據(jù)上的積累,在技術(shù)或設(shè)計(jì)上還有什么支撐來實(shí)現(xiàn)這一點(diǎn)嗎?
任永亮:這涉及到形象設(shè)計(jì)的問題。上帝設(shè)計(jì)催產(chǎn)素,本質(zhì)是為了讓人類愿意去撫養(yǎng)后代。當(dāng)你看到一個(gè)大眼睛、毛茸茸的小生命時(shí),天然會(huì)刺激催產(chǎn)素的分泌,讓你產(chǎn)生與其建立長久鏈接的欲望。為什么大家喜歡寵物?因?yàn)樗锌蓯鄣臇|西都在模仿嬰兒的特征:大眼睛、圓潤、手感柔軟。
我們的機(jī)器人也是沿著這個(gè)方向設(shè)計(jì)的。首先,它的眼睛很大且富有表現(xiàn)力;同時(shí),我們刻意避開了光滑塑料或冰冷鋼鐵的工業(yè)風(fēng)格,而是選擇了毛絨材質(zhì)。這種觸感和視覺反饋,是觸發(fā)催產(chǎn)素的重要保證。
極客公園:你還提到過機(jī)器人是家庭的「第三角色」。設(shè)想一個(gè)場景:如果父母在吵架,小孩在旁邊哭,這個(gè)機(jī)器人會(huì)如何充當(dāng)這個(gè)角色?它能勸架嗎?
任永亮:它能勸。其實(shí)它的「存在」本身就是第三角色。就像你吵架時(shí)家里突然來了一個(gè)客人,當(dāng)事人往往會(huì)稍微收斂一點(diǎn)。這就是「具身機(jī)器人」的特點(diǎn)——它的物理存在會(huì)改變整個(gè)「場」的氛圍。而且,它還可以把這些場景錄下來,等大家和好了再發(fā)給你們看,也算是一種提醒(笑)。
![]()
極客公園:關(guān)于交互程度,你理想中狀態(tài)是什么樣的?
任永亮:最理想的狀態(tài)就是你感覺不到它的「不同」。你覺得它就是家庭的一部分,是一個(gè)真實(shí)的家庭成員,沒有任何違和感。這是我們追求的最高目標(biāo)。
極客公園:那你覺得目前我們的進(jìn)度距離這個(gè)目標(biāo)還有多遠(yuǎn)?
任永亮:還有一定距離。目前在算力和端側(cè)技術(shù)創(chuàng)新上壓力還比較大,標(biāo)準(zhǔn)定得高,成本就很難降下來。我覺得這是一個(gè)嘗試的過程,可能還需要 3 到 5 年時(shí)間,技術(shù)才會(huì)真正走向成熟。
極客公園:目前公司投入在機(jī)器人項(xiàng)目上的有多少人?
任永亮:目前各職能加起來大約四五十人。
極客公園:聽說這款機(jī)器人準(zhǔn)備上北京臺(tái)的春晚。它會(huì)以什么樣的形式出現(xiàn)?后續(xù)有什么計(jì)劃?
任永亮:它會(huì)客串一些主持場景,錄制拜年視頻,做一些基本的展示。春晚之后,我們計(jì)劃啟動(dòng)「創(chuàng)生合伙人」活動(dòng),邀請首批用戶參與共創(chuàng),隨后進(jìn)入內(nèi)測階段。中間可能還會(huì)有技術(shù)或產(chǎn)品發(fā)布會(huì),我們預(yù)計(jì)在今年年中開始量產(chǎn)發(fā)貨。
極客公園:看到你有小紅書上面詢問大家對機(jī)器人功能的期待。目前收集到了哪些反饋?有哪些是符合預(yù)期的,又有哪些讓你感到意外或值得考慮的?
任永亮:我在小紅書收到的反饋里,發(fā)現(xiàn)大家對于「機(jī)器人與測測 APP 記憶共通」的需求非常強(qiáng)烈。我們測測也有一個(gè)名為「陪伴小星」的智能體,用戶希望這兩者能打通。
極客公園:這個(gè)在咱們的考慮范圍內(nèi)嗎?
任永亮:會(huì)作為一個(gè)選項(xiàng)。
極客公園:還有其他的反饋嗎?
任永亮:還有人希望它能做家務(wù),但目前這還實(shí)現(xiàn)不了。
極客公園:這就是「功能性機(jī)器人」與「感性陪伴機(jī)器人」的區(qū)別吧。如果要實(shí)現(xiàn)功能性,成本應(yīng)該會(huì)大幅上升,咱們現(xiàn)階段應(yīng)該不會(huì)考慮吧?
任永亮:我覺得要循序漸進(jìn)。目前技術(shù)領(lǐng)域最大的突破在大語言模型,而關(guān)于 VLA(視覺-語言-動(dòng)作)模型,以及對物理世界的操控、世界模型這部分,全行業(yè)都還處于分頭探索階段,沒有成熟方案。我不可能在技術(shù)還不成熟的條件下,強(qiáng)行把產(chǎn)品功能鋪得太滿。
極客公園:這兩年有很多公司在做「機(jī)器狗」形態(tài)的 AI 陪伴產(chǎn)品,比如某些品牌甚至能提重物、拉車、或者帶出去遛。你怎么看這種形態(tài)?
任永亮:我認(rèn)為大家正處于探索期。對我而言,陪伴機(jī)器人的「第一性原理」在于語言能力。為了解決語言交互,它必須有更豐富的視角和運(yùn)動(dòng)自主性,從而獲取更多環(huán)境信息來完善它的認(rèn)知。所以我堅(jiān)持讓它「直立」。
從動(dòng)物進(jìn)化來看,先有運(yùn)動(dòng)能力,再發(fā)展出視覺,這對智力進(jìn)化至關(guān)重要。我希望它保持直立狀態(tài),擁有更好的視野判斷力。至于機(jī)器狗,它的好處是能跨越障礙,但在家庭環(huán)境里的能耗、友好度以及帶來的變量還不確定。大家的關(guān)注點(diǎn)不同。
極客公園:家里的小孩見過它或者跟它交流過嗎?
任永亮:我小孩對它的要求特別高。
極客公園:怎么個(gè)高法?
任永亮:因?yàn)槟壳澳P瓦€沒達(dá)到我最理想的狀態(tài),我沒讓他們用得太頻繁。我發(fā)現(xiàn)對于 LOVOT,如果沒有語言能力,孩子的熱情大概只能維持一個(gè)月。雖然它能動(dòng),比普通玩具好一些,但沒有語言還是很遺憾。所以我打算等機(jī)器人的語言能力再完善一些,再正式給孩子用。
極客公園:所以他們跟咱們這款機(jī)器人還沒有長時(shí)間接觸?
任永亮:對,時(shí)間還不長。
極客公園:你說他們對 LOVOT 的熱情只持續(xù)了一個(gè)月。那他們平時(shí)是怎么評(píng)價(jià)這個(gè)家里的小伙伴的?
任永亮:他們覺得很可愛,主要會(huì)跟眼睛互動(dòng)。但有時(shí)候也覺得它「礙事」。比如大人很忙的時(shí)候,它會(huì)突然跑到身邊。這種真實(shí)反饋給了我們很大壓力,促使我們?nèi)ネ晟颇P汀?/p>
極客公園:比如你在忙,它跑過來礙事,你讓它走開,它能聽懂指令并照做嗎?
任永亮:有時(shí)候行,有時(shí)候不行。因?yàn)樗粫?huì)說話,你無法預(yù)判它是否真的理解了。這就是識(shí)別準(zhǔn)確度的問題。
極客公園:你家里兩個(gè)小孩對這款機(jī)器人有哪些具體的高要求?
![]()
圖片來源:心言集團(tuán)
任永亮:最大的期待是陪他們講故事,或者玩文字游戲。我女兒 6 歲,兒子 3 歲多,「分享」是他們的重要需求。比如孩子畫了一幅畫想給機(jī)器人看,如果機(jī)器人不會(huì)說話,樂趣就少了一半。如果機(jī)器人能夸夸他,或者根據(jù)畫的內(nèi)容做些講解,那體驗(yàn)就完全不同了。這也是我們設(shè)計(jì)它的初衷。
05
「受夠了做移動(dòng)互聯(lián)網(wǎng)
時(shí)代的奴隸,要追求自由」
極客公園:還看到你在小紅書上說了一句很有意思的話,大意是「受夠了做移動(dòng)互聯(lián)網(wǎng)時(shí)代的奴隸,要追求自由」。做機(jī)器人能帶給你什么樣的自由?
任永亮:這種自由在于「定義權(quán)」。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,設(shè)計(jì)產(chǎn)品必須遵循 iOS 或 Android 的規(guī)范,你本質(zhì)上只是別人生態(tài)里的一部分。
而現(xiàn)在,我們有機(jī)會(huì)從頭定義一個(gè)完整的產(chǎn)品,并以硬件形態(tài)呈現(xiàn),這是我對自由的理解。另外,做移動(dòng)互聯(lián)網(wǎng)產(chǎn)品時(shí),你無法真正觸達(dá)物理世界的用戶,必須不斷迎合「剛需」,否則用戶就會(huì)忘記你。但當(dāng)我們做一個(gè)獨(dú)立的、有生命力的產(chǎn)品時(shí),哪怕是一些不那么剛性的情感需求,我們也能通過物理存在感去很好地滿足。這在以前是無法想象的。
極客公園:這個(gè)機(jī)器人對于測測、對于整個(gè)心言集團(tuán)意味著什么?在接下來的業(yè)務(wù)比重中占據(jù)什么位置?
任永亮:我創(chuàng)業(yè)之初是一名算法工程師,那時(shí)候的目標(biāo)就是做一個(gè)能與人深度互動(dòng)的載體。只是受限于當(dāng)時(shí)的技術(shù)趨勢,我先選擇了互聯(lián)網(wǎng),選擇了工具形態(tài)。
在做工具的階段,我也嘗試過把工具變成對話模式。但我發(fā)現(xiàn),當(dāng)一個(gè)工具給出多種可選結(jié)果時(shí),當(dāng)時(shí)的技術(shù)很難像人類思維那樣將其歸納總結(jié)并呈現(xiàn)。我做了一個(gè)妥協(xié),保持了工具的「原汁原味」。好比我原本想給用戶準(zhǔn)備一份「法式大餐」,但技術(shù)跟不上,最后做成了一個(gè)「自助餐模式」——見山是山,見水是水,不再做智能整合。
隨著深度學(xué)習(xí)、大模型以及物理 AI 的發(fā)展,「法式大餐」逐漸成為可能。機(jī)器人就是這種嘗試的極致。它不僅是我們公司使命的延伸,也是能力的自然進(jìn)化。我們希望它成為未來公司最重要的業(yè)務(wù)板塊之一,讓「測測」的能力在一個(gè)全新的載體上,以新的形態(tài)實(shí)現(xiàn)再生。
極客公園:你前面提到,向大家描述機(jī)器人的愿景時(shí),其實(shí)沒那么容易說服別人真正相信。后來你是靠什么讓團(tuán)隊(duì)和外界覺得,這個(gè)方向真的是正確的?
任永亮:其實(shí)沒什么技巧,就是「重復(fù)」。不斷重復(fù)愿景,不斷引入人才,并持續(xù)迭代。原先大家看不到實(shí)物,自然難以相信;當(dāng)原型機(jī)真正出現(xiàn),大家親眼看到、親手摸到,感受就完全不同了。特別是當(dāng)機(jī)器人受到參觀者的好評(píng)時(shí),內(nèi)部的反饋也會(huì)隨之變化。這是一個(gè)逐漸被接受的過程,過程本身也是一種「治愈」。
極客公園:最后一個(gè)總結(jié)性的問題。你對這款機(jī)器人有什么樣的期待?希望它能帶給用戶和行業(yè)什么樣的改變?
任永亮:我對它的期待并不算高,首先希望它能真正「立得住」,成為一款扎實(shí)的產(chǎn)品。大家都說硬件創(chuàng)業(yè)的第一代產(chǎn)品很難達(dá)到理想狀態(tài),所以作為初創(chuàng)團(tuán)隊(duì),壓力是實(shí)打?qū)嵉摹N蚁M苷嬲挥脩粲闷饋怼?/p>
至于更深層的期待,我認(rèn)為大模型爆發(fā)后,社會(huì)正處在一種焦慮甚至恐慌的狀態(tài)中。AI 對白領(lǐng)工作、教育模式的沖擊巨大,軟件工程師、算法工程師甚至?xí)X得自己可能被時(shí)代拋棄。
我希望通過這種陪伴機(jī)器人的產(chǎn)品形態(tài),給用戶帶來更多的「安全感」和「穩(wěn)定感」。通過讓機(jī)器人融入家庭,讓每個(gè)人都能感受到一種安心的慰藉,這是我們想要嘗試的方向。
極客公園:大模型迭代極快,且軟件更新的成本相對較低。但硬件迭代非常費(fèi)勁,涉及模具、供應(yīng)鏈等復(fù)雜環(huán)節(jié)。在如此快速的技術(shù)變革中,你是如何考慮硬件迭代問題的?
任永亮:所以我們要「為了軟件而去設(shè)計(jì)硬件」,在硬件設(shè)計(jì)上給軟件預(yù)留足夠的升級(jí)空間。
極客公園:補(bǔ)充問幾個(gè)數(shù)據(jù)方面的問題,目前「測測」的用戶量級(jí)大概是多少?
任永亮:接近 6000 萬。
極客公園:上次提到過「陪伴小星」這個(gè)智能體,它的調(diào)用頻次高嗎?目前是什么樣的用戶量級(jí)?
任永亮:很高。用過它的用戶已經(jīng)有幾百萬了。
極客公園:后續(xù)會(huì)多出幾個(gè)這類智能體嗎?還是主打「陪伴小星」?
任永亮:我們會(huì)重點(diǎn)推一段時(shí)間,甚至想把它獨(dú)立出來。
極客公園:獨(dú)立做一個(gè) APP 嗎?為什么會(huì)有這個(gè)想法?
任永亮:對,獨(dú)立做 APP。因?yàn)橛脩舻姆答伔浅:茫覀兿M脩魧λ懈苯拥恼J(rèn)知。現(xiàn)在大家想到「小星」,會(huì)先想到「測測」,我們想縮短他與用戶的距離。
極客公園:用戶具體給了他什么樣的反饋?
任永亮:最核心的評(píng)價(jià)是「特別像人」、「像朋友」,有一種真實(shí)的「人感」。
*頭圖來源:心言集團(tuán)
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你如何看待家庭機(jī)器人?
Sam Altman:未來物質(zhì)會(huì)極度豐饒,人類的注意力才是稀缺品。
點(diǎn)贊關(guān)注極客公園視頻號(hào),
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.