![]()
1961年,世界第一臺工業機器人“尤尼梅特”在美國通用汽車工廠上線,重復著從壓鑄機中取出熾熱金屬零件的簡單動作,開啟了機器人替代重復性勞動的時代。
半個多世紀后,一臺具身智能機器人正端坐于麻將桌前,“雙眼”掃視牌面,“雙手”靈活地抓牌、理牌、判斷、出牌。近三十分鐘的牌局,考驗的不只是技巧,更是機器人持續的觀察、思考與精準操作能力。
![]()
機器人正端坐于麻將桌前打牌思考的過程
“我們是用麻將這一復雜任務,展示機器人的長程思考與靈巧操作能力。”靈初智能商務和采購負責人孟福剛道出打造麻將機器人的深意。
完成這一挑戰的并非國際科技巨頭,而是一家成立僅一年、團隊不過百人的創業公司——靈初智能。在具身智能這片火熱的新戰場上,當大多數玩家為機器人“能跑會跳”而歡呼時,這家小公司卻選擇潛入深水區,專攻靈巧操作——這正是行業未來真正的價值高地。
![]()
具身智能是當下最炙手可熱的賽道之一。在近日舉辦的騰訊云城市峰會上,騰訊集團副總裁李強透露:“今年1至9月,中國具身智能領域投融資近200起,融資金額近300億元。”資本的熱浪背后,是市場對機器人的高度期待。特斯拉的Optimus能空手接網球,Figure在學習做家務,小鵬的PX5以仿人形態穩健行走,吸引了眾多目光。
“具身智能不應只是機器,至少要實現人的部分功能。”孟福剛指出喧囂之下的關鍵問題,盡管機器人在“運動”上進步顯著,但若不能像人一樣靈活使用工具、完成精細工作,就難以真正融入人類生產和生活場景。這意味著,在需要精細操作的“智能作業”方面,行業仍處在突破前夜。
而精細操作的瓶頸,恰恰卡在了“手”上——這在國內幾乎是一片技術空白。拿筆寫字、翻書、精準插拔都需要高自由度手部與觸覺反饋才能完成。人手加腕部共有24個自由度,每個關節都能靈活運動。而市面上常見的靈巧手,主動自由度只有11個或6個,其余手指只能被動帶動。“手機充電的精度要求達到0.01毫米,這對硬件是極大考驗。”孟福剛認為,誰能攻克“手”的難題,實現靈巧操作,誰就抓住了下一個價值高地。
![]()
靈初智能商務和采購負責人孟福剛
而頗有靈巧手這一技術基因的靈初智能,選擇在這片“無人區”押注未來。
CEO王啟斌曾任京東機器人總裁,在硬件及商業化領域擁有超過20年的實戰經驗,成功主導機器人產品從定義、開發、上市再到全球化的完整商業閉環;聯合創始人陳源培作為“00后”技術天才,曾在全球范圍內首次實現利用強化學習在真實世界同時控制雙臂、雙手多技能操作;公司首席科學家楊耀東,是北京大學人工智能研究院助理教授,2022年時,他帶領華人團隊獲得NeurIPS 2022具身靈巧操作冠軍。這個由“行業老兵+天才少年+科學家”組成的鐵三角,成為靈初智能攻堅核心難題的底氣所在。
![]()
要攻克“靈巧操作”,靈初智能面臨算力、數據與模型的三重挑戰。
具身智能的核心模型需處理視覺、語言與動作的協同任務,算力需求極大。以靈巧手執行30分鐘以上的長程任務為例,訓練、推理與仿真過程消耗的算力呈指數級增長,對創業公司而言無疑是沉重的負擔。
數據稀缺問題更為棘手。“真機操作數據的成本一小時高達150美金,而更高質量的人類操作數據更是極度稀缺。”孟福剛揭示了行業的殘酷現實,機器人達到理想水平,至少要200萬小時的數據積累。
在技術路徑上,靈初選擇的“大小腦”分層路線也面臨新挑戰。靈初智能聯合創始人陳源培坦言:“如何實現大腦與小腦的高效銜接?又該如何通過強化學習提升整體操作成功率和泛化性?”
為應對這些難題,靈初智能選擇與騰訊云合作。在騰訊云發布Tairos具身智能開放平臺之初,雙方就迅速建立合作。“雙方優勢互補,靈初智能強在具身算法與靈巧操作的垂直攻堅,而騰訊云提供了從底層算力到頂層AI平臺的全棧能力。”孟福剛表示,合作讓公司將有限資源聚焦于核心創新,而非重復“造輪子”。
![]()
靈初智能公司近期發布的創新之作——Psi R0
在算力上,騰訊云高性能計算集群(HCC)提供了強勁動力,支撐靈初智能“每三個月一次軟件模型迭代”的快速研發節奏。
為了解決高質量數據稀缺的瓶頸,陳源培介紹,團隊佩戴數據手套,深入便利店、物流倉庫、工廠車間等場景,直接采集人類手部操作數據,再通過騰訊云Tairos平臺完成從數據準備、訓練、評測到部署的全流程管理,模型的訓練效率不僅提升50%,還借助數據分層技術將存儲成本降低70%。
針對大小腦訓練的整體性問題,開源開放的Tairos平臺成為破題關鍵。孟福剛評價:“從數據采集、任務分發到模型訓練,Tairos跨業務平臺的協作能力大幅提升了團隊的作戰效率。”此外,騰訊云領先的音視頻技術還將遙操的延時壓縮至100毫秒以內,為機器人的遠程搖操監管奠定了基礎。
![]()
當靈巧手在牌桌上贏得掌聲時,一個更深刻的問題擺在整個行業面前:技術演示之外,機器人的商業化路徑究竟在哪里?
基于對上百個場景的深入調研,靈初智能將重點錨定在物流行業。孟福剛解釋:“中國物流有近萬億市場規模,物品類型多樣、場景復雜度高,具備良好的泛化訓練基礎,也具備出海潛力。”在陳源培看來,物流場景中處理的商品與家庭物品高度重疊,可視為機器人進入家庭前的“理想訓練場”。
![]()
在探索商業化路徑的過程中,靈初智能與騰訊云的合作也為行業提供了重要啟示。騰訊云構建統一的智能中樞與云服務,為行業提供“水電煤”,讓靈初智能這類創業公司能從“全棧開發”的重負中解脫,形成專業化分工、提升創新效率。這種分工協作讓靈初智能找到了自己的生態定位——成為專業的“靈巧操作”解決方案提供商,與硬件廠商形成賦能共生的關系。
《中國發展報告2025》顯示,具身智能市場規模有望在2030年達到4000億元,2035年突破萬億元,帶動多個應用領域新質生產力躍升。資本市場也率先投下信任票,國內人形機器人領軍企業“宇樹科技”啟動上市流程,預示著行業正逐步走出實驗室,邁向商業化落地的前夜。
面對市場升溫,孟福剛保持著冷靜的判斷。他認為,明年下半年將有望看到一系列精細化操作落地,但大規模應用“至少還需三年”,這個預期還是建立在數據積累、算法迭代和成本下降的客觀規律之上。實現規模收入尚需時間,但增長空間已經打開。靈初智能陸續獲得日韓、中東地區的訂單,中國具身智能技術正獲得全球認可,也向行業出海探索傳遞了積極信號。
當靈初智能在精細化操作上不斷突破,當騰訊云等科技巨頭以開源生態加速行業創新,這背后不僅是一家企業的成長,更是一個產業生態逐步走向成熟。大浪淘沙后,那些選擇在最艱難處下功夫,并能清晰回答“誰為何付費”這一問題的實干者,正是推動整個行業向前的關鍵力量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.