![]()
2026年Las Vegas的CES展會上人潮涌動,當(dāng)全球科技巨頭們還在討論人形機(jī)器人何時可以實現(xiàn)真實場景的商業(yè)閉環(huán)時,North Hall區(qū)一個60平米的展位前卻聚集了近百人圍觀。一臺擁有雙靈巧機(jī)械臂和生動數(shù)字人交互的咖啡機(jī)器人成為在場所有人關(guān)注的焦點,多位現(xiàn)場觀眾都給出了類似的評價——“這應(yīng)該是本屆CES里最落地的具身智能產(chǎn)品”。
這臺名為XBOT的咖啡機(jī)器人來自于一家聚焦消費場景的中國具身智能企業(yè):影智XBOT,而這家公司的創(chuàng)始人正是先后作為騰訊與小米的早期成員,主導(dǎo)了QQ表情、QQ空間、小愛音箱、小米路由器等爆款產(chǎn)品的唐沐。
![]()
當(dāng)大部分具身智能企業(yè)還在工業(yè)場景和家庭場景的紅海中搏殺內(nèi)卷之時,這位中國頂級產(chǎn)品經(jīng)理已經(jīng)用600臺機(jī)器人部署、400萬杯咖啡的銷售數(shù)據(jù),實現(xiàn)了具身智能首次以標(biāo)準(zhǔn)化商業(yè)產(chǎn)品形態(tài)進(jìn)入全球最高頻消費場景的突破,這不僅是影智科技交出的第一份商用具身智能的落地答卷,對于整個具身智能行業(yè)的商業(yè)落地進(jìn)程而言,也具有里程碑的意義。
如何讓機(jī)器人做出一杯不輸于人類咖啡師的精品咖啡?
“這可不是一臺裝了機(jī)械臂的咖啡機(jī),而是一臺真正會做精品咖啡的機(jī)器人。”影智XBOT的負(fù)責(zé)人對鈦媒體表示。XBOT的精品咖啡制作“手藝”的背后,是一套從數(shù)據(jù)采集、算法校準(zhǔn)到模型迭代的完整技術(shù)閉環(huán)。
在口感標(biāo)準(zhǔn)上,XBOT搭載了進(jìn)口全自動咖啡機(jī),預(yù)設(shè)超30種基礎(chǔ)飲品菜單,實現(xiàn)100%還原精品咖啡口味。通過智能研磨、電子布粉、智能萃取技術(shù),確保每次出品的濃縮咖啡和奶基咖啡都達(dá)到專業(yè)咖啡師的手工水準(zhǔn),口感一致,粉量誤差為±0.3g(人類咖啡師為±2g),另一方面保持了機(jī)器人的最大優(yōu)勢,即高效性(110秒即可完成兩杯咖啡制作,單日輸出超500杯)與品質(zhì)穩(wěn)定性。
精品咖啡核心情緒價值的顯性符號在“拉花工藝”上,為了讓XBOT能夠完美復(fù)刻人類頂級咖啡師的手部動作細(xì)節(jié),公司自建了好萊塢級機(jī)器人視覺實驗室,部署了11組攝像機(jī)與紅外光標(biāo)記點,全角度捕捉黑杯咖啡大賽冠軍等頂級咖啡師的雙手動作路徑。在積累了上百小時的視頻數(shù)據(jù)之后,通過數(shù)字孿生技術(shù)將三維動作數(shù)據(jù)轉(zhuǎn)譯為機(jī)械臂智能規(guī)劃路徑,實現(xiàn)重復(fù)精度±0.02毫米的精準(zhǔn)復(fù)刻。
體現(xiàn)在量產(chǎn)XBOT上,它不僅能完美復(fù)刻人類咖啡師擅長的愛心、天鵝等經(jīng)典拉花圖案,也能實現(xiàn)文字、圖片、節(jié)日主題等富含打卡屬性的多種創(chuàng)新印花咖啡。甚至能通過上傳自拍照片,通過AI大語言模型生成AI數(shù)字形象,制作成為用戶專屬定制的AI印花咖啡。
![]()
同時,為了解決具身行業(yè)常見的量產(chǎn)機(jī)械臂精度校準(zhǔn)誤差難題,影智XBOT自研了一套“自動校準(zhǔn)+虛實同步算法”。實現(xiàn)了在數(shù)字孿生調(diào)試好動作后,真實機(jī)械臂可自動校準(zhǔn)初始位置與定位精度,無需人工逐臺調(diào)整,結(jié)合AI對動作進(jìn)行微調(diào)優(yōu)化,將單臺機(jī)器人調(diào)試時間壓縮至3小時,極大降低了咖啡機(jī)器人量產(chǎn)與部署的難度。
更值得關(guān)注的是,影智XBOT還構(gòu)建了行業(yè)首個“咖啡大模型”,集成飲品知識庫、口味拼配算法與多模態(tài)交互能力。當(dāng)顧客向生動的數(shù)字人咖啡師提出口味要求,比如“要一杯熱帶風(fēng)情的咖啡”或“更濃/淡”時,大模型會自動解析語義,調(diào)整配方參數(shù)并生成制作腳本,實現(xiàn)“千人千面”的近百種個性化口感定制。甚至,即使用戶沒有發(fā)出主動要求的情況下,數(shù)字人咖啡師也會通過攝像頭識別用戶情緒與消費歷史,主動推薦專屬飲品,讓一杯咖啡成為有溫度、有記憶點的社交載體。
從動捕學(xué)習(xí)、自動校準(zhǔn)到大模型驅(qū)動,影智XBOT用三年400萬杯的咖啡制作數(shù)據(jù),將冰冷的機(jī)械臂訓(xùn)練成一位不知疲倦、千杯如一、還能讀懂人心的“賽博咖啡大師”。
二元產(chǎn)品基因,助力商業(yè)具身智能的最快落地
XBOT咖啡機(jī)器人的產(chǎn)品靈魂,深深烙印著創(chuàng)始人唐沐橫跨騰訊與小米兩大科技巨頭的雙重基因。湊巧,這兩家公司正好代表了國內(nèi)最強(qiáng)的互聯(lián)網(wǎng)產(chǎn)品能力和智能硬件產(chǎn)品能力。
兩大最強(qiáng)基因的融合為唐沐構(gòu)筑了一套獨特的產(chǎn)品設(shè)計哲學(xué),他自己曾在某次公開采訪中提到一套“天平理論”——“左邊是科技,右邊是美學(xué),正中間是情緒價值,基座是質(zhì)量、成本與交付。”而正是基于這套產(chǎn)品設(shè)計哲學(xué),才成就了XBOT今天順滑的交互體驗與扎實的硬件品質(zhì)。
![]()
情緒價值作為唐沐設(shè)計哲學(xué)的核心要素,體現(xiàn)在XBOT的每一個細(xì)節(jié)之中。為了弱化機(jī)械臂拒人于千里之外的冰冷氣質(zhì),唐沐毅然決定要給咖啡機(jī)器人加裝43英寸的交互大屏與AI數(shù)字人多模態(tài)交互系統(tǒng)。不同的數(shù)字人咖啡師還被賦予不同的MBTI人格,支持多種語言和方言的實時交互,讓用戶獲得真實“他鄉(xiāng)遇故知”的親近感。當(dāng)攝像頭識別到老用戶,數(shù)字咖啡師用親切的鄉(xiāng)音主動喊出用戶的名字并推薦道“還是老樣子?一杯少冰冰美式?”,行業(yè)所普遍追求的“有溫度的具身智能”已經(jīng)呼之欲出。同時,XBOT重金研發(fā)的定制拉花能力,又讓每一杯咖啡成為“可飲用的社交貨幣”,這種“裂變”的營銷玩法自然也傳承至騰訊領(lǐng)先全球的社交基因。
唐沐在采訪中坦言:“機(jī)器人必須突破工具屬性,具備多模態(tài)交互與情緒感知能力。”這正是他在騰訊十年打磨億級用戶產(chǎn)品所沉淀的核心認(rèn)知——技術(shù)必須服務(wù)于人性的溫度。
而另一方面,傳承自小米的硬件供應(yīng)鏈能力,則讓XBOT實現(xiàn)從概念到量產(chǎn)的跨越。小米在硬件生態(tài)上的快速迭代、性能翻倍和價格減半的極致風(fēng)格,被唐沐同樣帶到了影智XBOT。從XBOT初代機(jī)售價60萬,二代機(jī)降至38萬,Lite版直擊18.9萬元,價格降至三分之一的同時各項功能提升50%,這種跨越式迭代的背后正是影智XBOT全鏈條自研能力的硬支撐,正如同小米當(dāng)年對各類供應(yīng)鏈的極致整合。
![]()
當(dāng)被問到為什么不做人形,唐沐說道:“十五五規(guī)劃建議用的是具身智能而非人形機(jī)器人,這個表述讓我特別振奮。”在他看來,人形機(jī)器人是具身智能的“子集”而非“全集”,追求形態(tài)像人不如追求能力解決問題。“比如養(yǎng)老場景需要的是智能助浴系統(tǒng)而非站立不穩(wěn)的機(jī)器人護(hù)工,而咖啡場景需要的是穩(wěn)定精準(zhǔn)的機(jī)械臂而非會走路的咖啡師。強(qiáng)行賦予人形,是資源浪費,更是安全隱患。”
今年11月,影智XBOT還落地了上海首家XBOT機(jī)器人7S服務(wù)中心,涵蓋銷售、服務(wù)、配件、信息反饋、金融、數(shù)據(jù)運營、設(shè)備回購全鏈條服務(wù)。閉環(huán)了整個設(shè)備的交付和服務(wù)過程,也將客戶決策和部署的門檻降到了最低。
根據(jù)影智XBOT提供信息,截至發(fā)稿,XBOT已部署涵蓋商業(yè)地產(chǎn)、文旅、城市圖書館、影院、劇場等落地場景,落地國家和地區(qū)15+,覆蓋城市100+,全球落地總量600+,累計為全球用戶提供精品咖啡超400萬杯。預(yù)計2026年,XBOT的總部署量將突破3000臺。對于整個具身智能行業(yè)的商業(yè)落地進(jìn)程而言,影智XBOT的快速落地案例無疑非常具有里程碑意義。而在唐沐眼中,這只是其真正想要打造的具身智能消費生態(tài)的第一步。
以咖啡機(jī)器人為切口的消費具身革命
當(dāng)XBOT咖啡機(jī)器人憑借雙臂協(xié)同、視覺感知與咖啡大模型在600余個點位完成400萬杯咖啡的交付后,其沉淀的硬件物理能力與AI模型能力已展現(xiàn)出驚人的泛化性。XBOT這套通用身體+AI大腦,如同一個可插拔的U盤,讓同一套技術(shù)底座得以快速遷移至冰淇淋、牛排、拉面、調(diào)酒、快餐等十余個消費品類。其中,XBOT的冰淇淋機(jī)器人已經(jīng)實現(xiàn)量產(chǎn),在本次CES上也同步展出,占地僅1.35㎡,零售價15.9萬元。這種“一機(jī)多腦、平臺+插件”的架構(gòu),極大縮短了新消費品類機(jī)器人的研發(fā)周期,均攤了初期的消費場景拓展成本,將XBOT的產(chǎn)品線從單一的消費設(shè)備升級為可規(guī)模復(fù)制的跨品類解決方案。
![]()
而唐沐眼中的終局還遠(yuǎn)不止如此。當(dāng)這些機(jī)器人高密度部署于文旅景區(qū)、商業(yè)綜合體、醫(yī)院、圖書館、企業(yè)總部等高流量場景時,它們共同構(gòu)建起一個覆蓋大量真實消費行為的數(shù)據(jù)入口。每臺機(jī)器人將不止是消費行為的交付工具,更是實時采集用戶消費偏好、消費動線、復(fù)購率、情緒反饋的智能終端。機(jī)器人不再僅是替代人力服務(wù)的“效率工具”,而是成為連接消費者、商戶、供應(yīng)鏈的“場景智能體”。這些分散在物理空間的消費行為數(shù)據(jù)將成為引發(fā)消費具身革命的基礎(chǔ),既能進(jìn)一步為消費者提供更加智能和個性化的服務(wù),更能為商業(yè)體等消費場景提供運營優(yōu)化、投資行為的決策意見,這正是物理AI賦能商業(yè)場景的深層價值。
工業(yè)具身智能優(yōu)化的是生產(chǎn)流程與資源配置,家庭具身智能滿足的是個體需求與情感陪伴,而消費具身智能,則需要同時解決消費者的非標(biāo)服務(wù)需求和商業(yè)場景的運營優(yōu)化需求,本身就是一件更為復(fù)雜的任務(wù)。消費生態(tài)具身智能或?qū)⒖梢葬绕馂楠毩⒂诠I(yè)場景與家庭場景之外的第三大具身智能賦能領(lǐng)域,但相較于工業(yè)場景的真實訂單數(shù)量優(yōu)勢和家庭場景的C端故事優(yōu)勢,消費具身智能還需要更多時間來被資本和客戶認(rèn)知。
XBOT在CES的火熱只是個開始,唐沐也深知他自己選擇這條路線的坎坷,而無論前路如何艱難,影智XBOT正以咖啡機(jī)器人為切口,拉開的是一個萬億級線下消費生態(tài)智能化升級的序幕。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.