![]()
2026年的具身智能賽道,氣氛和兩年前已經完全不同。
近期,在北京舉行的人形機器人與具身智能標準化年會上,智元機器人聯合創始人彭志輝的判斷頗為明確:“國內人形機器人整機企業已經超過140家,發布產品達330款。行業已經從實驗室炫技、Demo展示,正式進入工程化競爭、場景化競爭的下半場。”
這句話,其實可以看作是對整個行業階段的重新定性。
過去幾年,人形機器人最容易出圈的是視頻。誰走路更像人,誰跑得更穩,誰能翻跟頭、飛檐走壁,誰就能在社交媒體上引發轉發與融資熱潮。那是“展示態”的時代。但在這次演講中,彭志輝反復強調一個詞——“部署態”。
“2024年到2025年初,大家還在比拼誰家的機器人走路更直、更自然。現在,本體靈活性已經達到實用化階段,接下來要比的,是誰的干活能力更強。不僅在國內比,還要跟海外頭部企業比,看誰能在‘部署態’真正落地。”
當一個技術行業開始從“能不能動”轉向“能不能干活”,它就從概念期走向工程期。對于投資者而言,這是風險結構變化的信號。
如果說此前是算法與融資的競賽,那么現在比拼的是系統工程能力。
彭志輝開場就坦率表示:“整個具身智能行業目前還在共同探索,沒有任何一家企業可以獨自給出正確答案。我們要在正確的時間做正確的事情。”這句話聽上去謙遜,但背后其實隱含判斷——技術窗口已經打開,單點突破的時代結束,系統整合的時代開始。
為什么是現在?
彭志輝給出的答案并不復雜:“根本原因是AI技術的發展帶來的突破。”他把過去十年的AI演進拆解成三段:深度學習帶來的感知智能,大模型帶來的認知智能,以及當下由AI與機器人結合驅動的物理智慧世界。
“我們過去幾年完成了數字AI的規模化,現在要挑戰的是物理AI的規模化,從數字世界走向物理世界。”
這是一條更長、更難的路。
在數字世界,“代碼跑錯了可以重啟”;但在物理世界,“有物理成本,有失效成本”。機器人摔倒一次,可能就是硬件損傷與現金流消耗。因此,他提出一個工程范式——“一體三智”。
所謂“一體”,指的是機器人本體。
“本體是AI在真實世界的約束接口。”彭志輝強調,“真實物理世界充滿摩擦、碰撞、形變、誤差、老化、噪聲。本體設計不是簡單的硬件堆疊,而是可靠性工程、供應鏈工程和安全工程的綜合體。”
對資本市場來說,這段話等于把賽道邏輯從“算法故事”拉回“制造業能力”。
他把核心零部件拆得非常清晰:“當前最重要的兩個部件,一個是關節,決定運動能力上限;一個是靈巧手,決定操作能力上限。這兩個部件占據整機成本的絕大部分。”
這幾乎是一張成本結構圖。
早期行業里,執行器技術路徑多種多樣,液壓、直線驅動、高速高剛度方案并存。
但“從2023年開始,方案開始收斂到新型關節。”他甚至做了一個類比:“人形機器人的硬件技術和新能源車非常類似,核心是所謂的‘三電系統’。”
不同之處在于復雜度。汽車電機工況相對簡單,而機器人“需要高動態、高頻的正反轉,全身少則數十個、多則上百個自由度。”不同關節之間的規格差異極大,手指和大腿的扭矩需求完全不在一個量級。
“如果為每個關節單獨設計規格,那會是量產的災難。”彭志輝直言。
智元的解法,是系列化與標準化。“我們把五大系列、近10款產品,全部規整到8款系列化關節設計上。這8款關節用在所有產品上,能夠滿足所有部位需求。這就是標準化帶來的收益。”
當一家企業開始講“系列化規劃”而不是單款產品性能時,它已經在為規模化做準備。
靈巧手的挑戰則更復雜。“一方面要把10到20個自由度塞進比人手還小的空間,另一方面對高維感知能力要求極高,尤其是觸覺。”他說。
彭志輝給出一個非常直觀的判斷:“接近80%人類做得好、傳統自動化做不好的工序,都和觸覺強相關。”裝配工人憑“咔嚓一聲”判斷是否成功,這種經驗如何數字化,是行業瓶頸。
“視覺是先有標準傳感器,再有標準數據格式,再有標準數據集,最后才是算法爆發。”彭志輝表示,“但觸覺傳感器的技術路徑還沒有收斂,也沒有標準。”
這段話對投資者而言意味著什么?意味著觸覺一旦標準化,將帶來新的技術與成本拐點。
如果“一體”是軀體,“三智”就是靈魂。
運動智能近兩年突飛猛進。彭志輝總結原因:“一是算法范式從模型驅動轉向強化學習;二是仿真框架普及,使大規模并行訓練成為可能;三是關節技術收斂,降低控制難度。”綜合收益之下,動態性能大幅提升。
但運動只是底座。彭志輝指出,“交互智能提供情緒價值,作業智能提供生產力價值。”
交互智能大量復用大模型成果,但“未來的機器人不能只聽懂語音指令,它要看到你的情緒、聽懂你的語氣,甚至預判你的意圖。”在他看來,情緒價值“比很多人想象得大”,這也是春晚機器人表演能引發廣泛討論的原因。
真正決定商業價值的,是作業智能。
為了降低訓練門檻,智元推出“靈創平臺”。“我們把動作訓練流程簡化到像發抖音一樣,上傳一段視頻,平臺自動完成關鍵點檢測、動作遷移、訓練和部署。”彭志輝說,這意味著行業要從科研人員的“開發態”,走向大眾參與的“創作態”,最終實現低成本“部署態”。
部署,是貫穿整場演講的核心詞匯。
談到場景選擇時,他提出“沿途下蛋”的策略。“我們把任務維度分為場景復雜度和任務復雜度。場景復雜度是一種約束,不體現價值;任務復雜度才能體現價值。”
自動駕駛是在復雜環境下做簡單任務,而人形機器人當前更適合“在簡單場景做復雜任務”。例如結構化工廠環境里的高自由度操作。
“最終,自動駕駛和具身智能都會走向復雜環境做復雜任務。”彭志輝說,“但現在,我們要選擇現實可行的路徑。”這是一種階段性務實,而非終局浪漫。
在演講后段,彭志給出一個形象比喻,把人形路線的邏輯講得非常清楚。“Computer Use是數字世界的人形接口,而人形機器人就是物理世界的通用接口。”
理論上,讓AI直接生成底層代碼效率更高,但現實世界的軟件生態是為鼠標鍵盤設計的,因此通過界面操作反而成為最通用路徑。
同樣,現實世界的門把手高度、樓梯尺寸、工具形態,都是為人類身體設計的。“既然環境是圍繞人類構建的,那么AI要實現最大化的通用性和兼容性,終端形態大概率也要長得像人。”彭志說,“它未必效率最高,但一定兼容性最強。”
這句話,其實回答了資本市場最常見的疑問:為什么一定要做人形?因為它是接口。
最后,他把行業中局定性為“基礎設施,而非單點產品”。“物理AI規模化的關鍵在于數據閉環、可靠性工程以及可運維能力的標準化。”彭志說,“我們既要跑得快,也要跑得穩。”
當一家機器人公司開始反復強調數據治理、評測體系、運維經驗與標準共建時,它的視角已經不再是產品發布,而是產業體系。
對于投資者而言,2026年可能并不是爆發元年,而是分化元年。
展示態結束,部署態開始;情緒溢價退潮,工程能力定價上升。關節良率、系列化規劃、真實場景運行小時數、數據回流效率,這些指標將逐漸取代舞臺動作難度,成為估值核心。
從數字AI走向物理AI,是一次更漫長的產業遷移。彭志輝在結尾說:“標準化不僅是技術規范,更是產業落地的加速器。”
當行業開始談標準,意味著它正在準備規模。而規模,從來不是喊出來的,是一顆關節、一只靈巧手、一條供應鏈、一套運維體系,慢慢堆出來的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.