商用具身智能丨白皮書
核心摘要:
具身智能徹底火了。國外市場,FIGURE營收為零,最新估值已達390億美金。國內市場,十五五規劃明確將具身智能納入重點產業布局。國內頭部廠家陸續拿到工商業場景訂單,宇樹科技宣稱2025年營收突破10億元。具身智能市場,既不是中國自彈自唱,也不是空中樓閣了。萬億級市場脈絡已打開,且看中美具身智能的精彩角逐。
![]()
定義闡釋:具身智能的全球理解
匯聚學術與產業觀點,確立統一評估基準
具身智能是人工智能的重要發展方向,被普遍認為是實現人工通用智能的重要路徑。其核心特征在于智能體依托物理身體,通過感知—理解—決策—行動的閉環,與環境進行強交互并持續學習,進而展現出自主性、泛化性和適應性。全球專家普遍強調,具身智能不僅是機器學習、計算機視覺與機器人技術的綜合體現,更是AI走向落地化和實用化的重要標志。
![]()
商用場景的分類和區別
技術支撐多樣形態,跨界滿足多元需求
不同形態的具身智能機器人正并行演進,滿足零售、餐飲、工廠、物流、教育、醫療等場景需求。商用具身智能服務于零售、餐飲、醫療、安防等復雜動態環境,更依賴多模態感知、人機交互和泛化能力,旨在提升服務體驗與靈活運營。工業具身智能主要面向制造、能源、礦山等高度結構化場景,強調高精度、高負載和長周期穩定性,目標是提升效率與保障安全。兩者在能力要求與技能瓶頸上差異較大,但正共同推動具身智能于不同維度的落地發展。
![]()
戰略意義:中美科技競爭的關鍵戰役
通過全鏈路創新與應用落地發展具身智能,加速縮小中美科技差距
具身智能是推動科技產業鏈升級和培育新興產業的重要力量,不僅有助于先進制程芯片、精密傳感器、AI大模型、先進能源等產業鏈環節的協同創新,還將帶動制造、交通、零售、醫療等場景轉型升級。中美正展開先進科技的關鍵戰略競爭,中國具身智能的突破既關乎長期經濟效益,更關乎科技自立自強與國家競爭力的提升,是未來十年“彎道超車”的關鍵賽點。
![]()
政策激勵:中國具身智能占據天時地利
國家與地方協同推動標準化、試點示范與產業落地
近兩年來,中國將具身智能納入國家戰略,中央層面密集出臺行動方案、發展指導意見與資金支持,強調技術攻關、產業鏈協同和場景開放。與此同時,地方政府也陸續發布專項規劃和試點示范舉措,出臺多種政策支持產業發展,設立基金為人形機器人/具身智能企業提供資金,并建立機構/聯盟以促進產業合作,推動行業加速發展。
![]()
![]()
發展階段:全球演進與中美競逐
回顧歷史三階段,中美在基礎模型、算力與落地應用上展開競爭
具身智能的發展歷程可分為三個階段:從1950年起的哲學思辨與概念萌芽,到2000–2020年的技術積累期,再到2020年以來的大模型驅動與應用拓展期。全球進入快速演進的新拐點,美國憑借算力基礎、頂尖模型與資本生態實現先發優勢;中國則依托政策支持、場景驅動與產業鏈協同加速追趕,形成本土特色里程碑。未來五年,中美將在基礎模型、算力和應用落地上比拼,各自路徑和優勢也將進一步顯現。
![]()
瓶頸待破:訓練效率與商業落地考驗
四大瓶頸制約具身智能的大規模商用
具身智能正加速從實驗室走向產業化,但仍面臨多重挑戰。首當其沖是數據收集,和大語言模型不用,物理世界的多模態數據匱乏,高質量實操數據稀缺,仿真數據仍存在缺陷,且缺乏數據評價機制。此外,靈巧手、泛化能力與Sim2Real遷移等技術尚未成熟;成本方面,核心部件與算力投入居高不下;商業與社會層面,ROI周期長、倫理安全問題仍待解決。只有協同突破,才能推動具身智能真正實現大規模應用。
![]()
核心數據挑戰
四類數據采集方式并存,但高質量數據不足、成本高企是最大障礙
當前具身智能領域的數據獲取主要依賴四種方式:遙操作、仿真合成、動作捕捉以及互聯網視頻圖像。盡管路徑多樣,但真正推動模型泛化落地的高質量數據依然高度稀缺,導致數據成為行業發展的關鍵瓶頸。
![]()
核心數據突破
從世界模型到采集訓練場,數據困境正逐步緩解
面對高質量數據稀缺與高成本困境,業界正通過“世界模型”“采集基地”“工具創新”等方式探索解決方案。2025年起,北京、上海等地加快建設具身智能數據采集訓練場,企業端也在嘗試通過便攜化工具和仿真優化來降低成本。數據獲取的多元路徑正在形成,為大規模商業落地提供可能。
![]()
模型演進:VLA模型成為發展共識
VLA的持續迭代或催生具身智能領域的“GPT時刻”
在大語言模型成熟之后,具身智能模型正經歷在端到端的范式演進,核心主線是:通過多模態統一框架,將大型語言模型的推理能力與真實世界的感知、行動能力深度融合,催生出能夠跨場景、自主學習的“機器人大腦”。這一進程早期由谷歌等巨頭引領,并隨著英偉達以及新進入者的入局和開源模式的興起而加速,逼近類似GPT-3智能爆發的臨界點。
![]()
模型趨勢:架構融合多種模型能力
單一模型無法滿足復雜現實場景,分層融合是架構演進的必然趨勢
傳統成熟算法如SLAM等安全可靠,但缺乏泛化能力,而VLA和世界模型通用性更高但存在幻覺等問題,因此混合模型架構,取長補短是必然趨勢。行業共識是通過高層大模型進行認知、理解與規劃,同時結合底層成熟算法實現可靠、精準的執行。這種“大腦”與“小腦”協同的模式,兼顧了智能的泛化性與任務的可靠性,是推動具身智能從實驗室走向規模化商業應用的關鍵。
![]()
靈巧手是核心部件的關鍵一環
兼顧結構緊湊性、敏捷性與可靠性,難度高、成本占比大
靈巧手也是亟需突破的關鍵環節,特別是應用落地難度最大的家庭場景。它既是實現人機交互與精細操作的核心部件,又因小型化設計、敏捷控制和成本可靠性“三難困境”而備受關注,是核心部件中技術、工藝難度最大的環節。
![]()
![]()
商用具身智能自主化程度
類比自動駕駛,具身智能的自主程度處于L2-L3的過渡階段
類比自動駕駛,具身智能已初步掌握L2級別的自主移動能力,并邁入L3級別低技能操作的初期探索。類比LLM的時間線,則已達到GPT-2的水平,驗證了scaling law的可行性。未來2-3年或達到關鍵的臨界點,實現模型能力的質變性飛躍。自主性智能涌現后,具身智能的驅動因素將不僅僅是優化成本,而更能真正深入復雜場景、創造全新商業價值
![]()
具身智能商業化的突破點
迎來大規模商業化的轉折點,需在以下五個關鍵維度實現突破
具身智能的商業化并非如LLM大語言模型的單點突破,而是復雜的系統工程。其大規模應用的拐點將在續航、延遲、執行、可靠性與經濟效益等五大維度均跨過可用門檻,并形成正向增強的價值飛輪之時。當前,行業正處于從技術驗證到價值閉環的關鍵攻堅期。
![]()
商業化趨勢:不同場景的滲透速度
復雜程度相對較低、ROI高的場景率先開始應用
具身智能的商業化正沿著價值階梯演進。當前,產業應用以高ROI、低復雜度的“確定性”場景為核心突破口,如工業制造、倉儲自動化和餐飲零售的基礎場景正迎來訂單加速釋放期。未來,隨著技術成熟度提升,應用將向高復雜度、高價值的“戰略性”場景滲透,最終實現通用化服務,開啟更廣闊的市場空間。
![]()
商業化趨勢:付費模式演進
交易模式或將從純硬件銷售逐步過渡到服務訂閱+落地效果
一次性整機銷售是目前具身智能主要的商業模式,同時輔以部分的軟件服務銷售。展望未來,具身智能的商業模式可能將從傳統的純硬件整機銷售,逐步演進為降低客戶前期投入的“機器人即服務(RaaS)”模式,最終發展至與客戶業務價值深度綁定的“按任務完成效果付費”新階段。
![]()
全球科技發展曲線的啟示
歷經六次技術革新浪潮,具身智能即將進入第七次的主升浪中
1960年以來,全球歷經了六次主要的科技浪潮,可簡單概括成大型主機、電腦、網絡設備、桌面互聯網、移動互聯網和云&SaaS。每次浪潮都經歷了經典的S型增長曲線,歷史重復上演,每一次浪潮都由關鍵創新引爆,在若干年內商業化,創造出巨大商業價值。具身智能當前處于S曲線早期階段,隨著關鍵技術成熟和成本下降,預計5年左右進入爆發臨界點。
![]()
中國硬科技三大件的發展啟示
回顧三大萬億市場歷史,具身智能既有萬億空間,亦需久久為功
今天中國的光伏、鋰電、電車三大萬億市場,放眼全球用遙遙領先不為過,但回顧發展歷史,也經歷多次產業周期和過剩淘汰的慘痛教訓。中國已擁有機器人領域最完備、成本最有優勢的工業體系和供應鏈,以及最大的應用市場。國內具身智能或許也會面臨短暫瓶頸期,但循序漸進、久久為功,終將不斷突破。
![]()
![]()
全球具身智能產業鏈圖譜
以大腦、硬件和本體為劃分的代表企業示例
具身智能的產業鏈復雜度不亞于汽車等制造業,涵蓋從執行器硬件、傳感與感知、計算和存儲、機身與外殼、電池與散熱、自動化、基礎模型等漫長鏈條。產業圖譜可通過硬件、大腦和集成商三個維度來區分。目前個別產業鏈的優勢仍集中在歐美日韓企業手中,但中國企業在產業環節覆蓋度上已占據顯著優勢,并在下游的整機集成和應用場景上展現出巨大潛力。
![]()
資本鏖戰:中美具身智能融資火熱
融資金額與頻率齊升,A輪融資額1-3億美金已是常態
作為第七次科技浪潮的主升浪,全球資本市場絕不會缺席具身智能。僅過去不到一年,中美具身智能企業的單輪融資額不斷創新高,9月Figure C輪融資超10億美金,估值近400億美金,隨即1X也啟動新一輪10億美金融資。中國具身智能企業上半年近億美元融資達4筆以上。
![]()
全球市場規模預測
當前仍處于未來10年指數級增長的前夜
當前,具身智能仍處于大規模商業化的前夜,根據摩根士丹利、高盛等全球頂尖研究所預測,2025年全球具身智能規模達到192億元人民幣,且未來五年的復合增長率達73%,并預計在十年左右時間達到年萬億級市場需求。這一判斷的關鍵變量即具身智能價格隨著規模量產而下降,單臺機器人的售價將從目前的百萬級人民幣在十年左右將至20多萬,且在發展中國家的售價會更低。
![]()
中國市場規模預測
率先進入降本通道,十年實現百余倍增長
中國本土市場對具身智能的需求已初步顯現,除政府鼓勵帶動的科研教育、公共場所和科技園區外,零售、餐飲以及頭部汽車廠已嘗試將人形機器人納入較為簡單的上下料、搬運環節。憑借全球最完善、最具競爭力的工業體系和供應鏈,中國預計會在五年左右進入快速降本通道,并在5-10年區間率先觸及經濟性拐點。保守估計,市場規模將從2025年21億到2035年超過2,800億,實現十年百余倍增長。
![]()
中國具身智能出海加速
從核心能力出海到場景落地,中國企業在海外實現技術驗證與商業閉環
2024-2025 年,中國具身智能產業進入出海加速期,商業服務與工業機器人出口同比增長顯著,形成全球第二大出口市場。代表企業正從“單點出貨”邁向“體系化落地”階段:上游以自研核心部件與算法驅動技術出海,下游通過本地化運營和服務體系實現長期滲透。宇樹科技與擎朗智能的出海案例分別體現了技術自主創新與本地化適配兩條典型路徑,驗證了中國具身智能在全球高標準市場的商業化可行性。
![]()
![]()
三路玩家同臺競技
通用技術挑戰者、場景資源先行者和自帶需求的跨界巨頭
全球和中國的具身智能的競爭格局顯現出類似的三股核心力量。以Figure為代表的AI原生挑戰者,憑借頂尖技術、創業精神和資本加持,旨在搶占技術制高點。以ABB、擎朗為首的傳統工業、商業機器人頭部玩家,依托深厚的硬件工程能力與扎實的2B客戶根基,正從專用場景向更泛化的智能應用升級。以特斯拉、亞馬遜為代表的跨界巨頭,則從自身海量的真實需求出發,成為未來推動產業商業化加速的重要引擎。
![]()
中期整合趨勢不可避免
產品同質化已初現,第一輪洗牌不會太遠
從光伏、鋰電到電車,國內萬億級市場總會面臨滯后的市場準入和監管。近兩年的具身智能融資,已經出現產品同質化現象,但仍有初創企業加入該賽道。回顧電車產業的發展歷程,從百家爭鳴到如今幾乎個位數的主流市場品牌,具身智能在未來三年的整合趨勢不可避免,第一輪洗牌也不會太遠。高昂的研發投入、復雜的供應鏈管理、規模化生產挑戰以及構建“AI+硬件+生態”閉環的巨大難度,最終競爭格局仍是少數玩家的市場。
![]()
初創企業如何脫穎而出?
面對巨頭的夾擊攻勢,初創企業應找到生存之道
科創企業的靈活高效、快速創新、定制服務等是核心競爭力,但也面臨資源緊張、生產成本、持續融資的挑戰。面對傳統制造業巨頭和互聯網巨頭陸續進場,科創企業要比巨頭看的更準、行動更快、人效更高,同時找到能帶來長期賦能價值的戰略伙伴和投資人,以避免未來被這兩大類巨頭夾擊。
![]()
![]()
Optimus
從概念發布到 Gen 2:邁向產業化的人形機器人
特斯拉自 2021 年 AI Day 首次提出 Optimus 概念以來,持續推進人形機器人的研發迭代。2022 年 Bumble C 原型登場,標志著從概念到工程樣機的跨越;2023 年底發布的 Gen 2 展示了更輕、更快、更靈巧的動作能力,并采用全套自研執行器與傳感器;2024 年的多次演示進一步驗證其在工業與日常場景中的潛力。當前 Optimus 已進入快速迭代期,馬斯克預測最早 2025 年底將對外銷售,并在 2026 年實現批量生產,長期目標是在未來十年內實現百萬級年產量。
![]()
Figure AI
打造通用自主人形機器人
Figure AI 成立于 2022 年,總部位于美國,是全球專注于通用人形機器人的代表性企業。公司估值已達 390 億美元,致力于通過具身智能打造能夠在工業、商業與家庭場景中廣泛應用的自主機器人。其產品 Figure 系列機器人經歷了快速迭代,從早期展示基本運動能力的 Figure 01,到具備更強硬件和靈巧操作的 Figure 02,再到引入 Helix 自研通用 VLA 模型,逐步邁向能執行復雜任務、具備跨場景泛化能力的“類人勞動力”。
![]()
擎朗智能
多維能力協同驅動,構建機器人產業生態閉環
依托全棧自研的技術體系與“研發—智造—供應鏈”全鏈條能力,擎朗智能實現了人形機器人與輪式機形機器人雙線協同布局:人形機器人代表未來的通用智能方向,機形機器人支撐當前的高頻商業化落地,形成“前瞻技術 × 穩定收益”的雙引擎格局。同時,擎朗圍繞配送、酒店、清潔、醫療、人形五大產品家族,構建出行業最完整的具身機器人生態矩陣,覆蓋餐飲、酒店、醫療、工廠、商超等多場景。憑借強大的算力平臺、感知算法與整機設計能力,擎朗已成為全球服務機器人產業化與智能化并進的標桿企業。
![]()
商業落地經驗為人形機器人奠定基礎
起步于餐飲、酒店等場景的輪式服務機器人,擎朗在高頻真實任務中積累了豐富的導航、避障、調度與人機交互經驗,為其向具身智能演進提供堅實基礎。通過算法遷移與多模態融合,擎朗正從結構化服務向通用智能具身化邁進,成為中國機器人產業由“場景智能”走向“通用智能”的代表樣本。
![]()
服務場景的綜合技術力第一
在具身智能的產業化競爭中,擎朗智能率先形成了以“場景理解 + 通用智能 + 崗位專精”為核心的系統化技術壁壘。公司在全球長期服務實踐中沉淀出豐富的真實任務與環境數據,構建了業內最完整的場景知識體系與算法反饋閉環。在場景方案積累、數據庫規模、崗位定制能力、人機對話能力、全球覆蓋度及系統穩定性六大維度上,擎朗均顯著高于行業平均水平,展現出從“可落地”到“可規模化復制”的技術成熟度。這一領先的綜合技術力,為其后續多場景協同與通用人形機器人商業化應用奠定了堅實基礎。
![]()
打造全球首個通用+專用機器人智慧酒店
2024 年 10 月,香格里拉集團旗下的上海虹橋機場盛貿酒店正式啟用 8 臺擎朗具身機器人,覆蓋迎賓、配送、清潔等核心服務崗位,成為全球首個“通用 + 專用”機器人協同運營的智慧酒店。本項目由擎朗智能自主研發的 VLA 大模型 KOM2.0 與垂直優化模型 KEENON ProS 提供智能驅動,通過“崗位化”設計實現多類型機器人協同與任務分配標準化。該合作不僅展示了中國具身智能技術的商業成熟度,也為高端酒店行業的智能化運營提供了可復制的驗證樣本。
![]()
全球化布局與本地化創新實踐
依托全棧自研與產業化能力,擎朗智能正以“通用智能 × 本地化創新”雙輪驅動,在全球范圍內構建覆蓋60余個國家、80+運營中心的服務機器人網絡。公司在日韓、歐洲、中東、北美等市場建立子公司及技術中心,形成研發、生產、銷售與服務一體化的全球運營體系。通過“崗位化”理念與多模態算法優勢,擎朗實現了產品與場景的本地化適配與智能化迭代,推動服務機器人從單一場景落地向全球規模化復制邁進,成為中國具身智能出海的技術與商業化標桿。
![]()
節卡機器人
多元具身智能產品生態
節卡有豐富的具身智能產品矩陣,從靈巧協作的機器人整機(如JAKA Kargo, Lumi)到面向數據采集與訓練的系統(如K1),覆蓋了具身智能從感知、決策到執行的關鍵環節。同時還研發了EVO具身智能平臺為產品的智能底座,賦能節卡機器人實現自我感知、自主學習與適應性進化,從而打造了軟硬件一體、高效協同的具身智能生態。
![]()
機器人已在多樣化工業制造等場景規模化落地
節卡憑借多年的產品研發和客戶沉淀,打造了具備深厚垂直行業know-how的解決方案,已在汽車、電子等復雜工業場景開展大規模部署,從而有機會獲取海量、高質量的運行數據。這些數據反哺其具身智能技術平臺,為終端客戶提供進一步深度價值,同時又將成熟的工藝模型和應用能力開放給集成商,極大地降低了機器人應用的門檻和成本。
![]()
數據優勢和架構創新形成具身智能時代不可復制的壁壘
面對機器人行業在數據采集和模型可靠性上的雙重瓶頸,節卡依托其龐大的存量設備網絡構建了獨特的數據采集渠道,同時創新仿真數據生成方式形成了難以復制的數據壁壘。同時,節卡創新性設計了一套分層混合架構,有效平衡了前沿AI模型與工業場景所需的穩定性和高頻性的不匹配,推動技術快速在真實場景落地。
![]()
因時機器人
前瞻性自研微型伺服電缸,靈巧手的鋼“筋”鐵“骨”
具身智能的可靠性和準確性催生了靈巧手,而靈巧手的發展高度依賴于執行器技術的突破。傳統的伺服系統體積大、集成度低,難以滿足新一代具身智能,特別是人形機器人靈巧手對空間、精度和響應速度的極致要求,微型伺服電缸是驅動靈巧操作的關鍵技術節點。因時機器人是微型伺服電缸的領導者,實現除芯片外全棧部件的自研和規模化量產,也推動了在多個領域的商業化落地。
![]()
垂直整合自研核心部件,突破靈巧手不可能三角
靈巧手是機器人與物理世界交互的關鍵,傳統工業夾爪只能完成重復性的“抓取”,而靈巧手則可實現復雜的“操作”,即像人手一樣使用工具、適應未知物體。這一迭代并非簡單的結構堆砌,而是感知、控制與驅動技術的高度融合。因時基于其自研的一體化線性執行器,推出了系列化的靈巧手產品矩陣,展現了卓越的單點技術性能。
![]()
精密驅動核心,賦能具身智能核心場景
因時機器人以核心的微型精密伺服技術為基石,靈巧手為產品形態,占據了具身智能的關鍵生態位。因時在產能、品控和成本上獨具行業競爭力,已在幾個關鍵垂直領域率先實現規模化價值落地。
![]()
附錄1:全球人形機器人發布全景
自2022年以來主要人形機器人發布情況
![]()
附錄2:全球人形機器人發布全景
自2022年以來主要人形機器人發布情況
![]()
歡迎關注艾瑞數智獲取更多內容
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.