
譯者按· 2026.01.26
2025年12月14日,摩根士丹利全球具身智能團隊推出研究報告《機器人年鑒·第二卷:如何訓練你的機器人》,并在報告中提出,機器人產業正迎來“雙重逃逸”的發展變局:其一,是應用場景的空間遷移,機器人從傳統的工廠流水線走向家庭、農場、城市、海洋乃至太空等更廣闊的場域;其二,是技術范式的核心轉換,發展重心從以“大腦”為核心的通用大模型,轉向以“身體”為核心的物理動作控制技術。
報告指出,這場“雙重逃逸”將深刻重塑全球算力產業版圖,而邊緣推理芯片、模擬引擎、機器人傳感器三大賽道,有望成為未來十年最具硬核競爭力的投資主線。此外,這份報告還強調,AI驅動的機器人正經歷一場歷史性躍遷,其應用邊界正從工廠車間向多元場景拓展,技術訓練的焦點也隨之從“認知智能”轉向“物理智能”,這一轉變將觸發邊緣計算領域的新一輪激烈角逐。
傳統工業機器人到Post AI時代:
跳脫結構化牢籠
摩根士丹利在報告中指出,傳統工業機器人(Pre—AI Robotics)被鎖死在“結構化牢籠”當中,局限于任務單一、固定產險、無需感知與學習能力的環境中。然而如圖3所示,先進Post AI時代(Post—AI Robotics)機器人場景發生轉變:Post-AI時代的機器人已經可以出現在多個應用場景內(包含家庭、農場、海洋等)。
“跳脫結構化牢籠”標志著機器人產業從“工具型”向“自主型”轉變,場景拓展打開市場空間,技術重心的轉移則為產業升級提供了核心支撐。隨著場景從結構化走向復雜多變,技術研發已從“單一程序執行”轉向“多模態感知+自主決策+精細控制”的綜合能力構建。
對中國而言,這些技術突破不僅讓機器人具備了適應動態環境的自主能力,更推動中國機器人產業在具身智能、運動控制等核心領域躋身世界前列。例如,2025年4月,北京人形機器人創新中心研發的“天工Ultra”創造人形機器人半程馬拉松世界紀錄 ;銀河通用機器人發布全球首個跨本體、全域環視導航基座大模型NavFoM,率先突破小時級長程導航與動態避障 。
長期來看,企業需以場景為牽引、以技術為支撐,突破工程化與供應鏈瓶頸,形成“場景倒逼技術、技術賦能場景”的良性循環,才能在新一輪變革中占據優勢。場景拓展的廣度直接決定了市場增長的天花板。過去局限于流水線作業的機器人,如今已在中國的多種非結構化場景中落地生根。例如北京橡鹿科技的炒菜機器人能自主完成顛勺、調味、出菜全流程,覆蓋八大菜系并在連鎖餐飲門店規模化應用,既降低了商家運營成本,又保障了菜品標準化; 上海虹橋香格里拉酒店引入擎朗智能的人形機器人與專用機器人協同作業,實現接客問候、行李運送、客房引領、餐飲配送的全流程自主服務,讓場景應用從單一功能走向系統協同。 這些場景的突破,讓機器人產業從工業制造的細分賽道,拓展到多元化的高潛力領域,市場空間實現指數級擴容。
![]()
圖1: 傳統工業機器人 (Pre-AI Robotics) 特征簡介(圖源:摩根士丹利)
![]()
圖2: Post-AI Robotics 特征簡介(圖源:摩根士丹利)
![]()
圖3: 從Pre AI時代至Post AI時代機器人的轉變(圖源:摩根士丹利)
訓練模式的轉變:
從“大腦”最佳化到“身體控制”
如圖4所示,報告將人工智能訓練劃分為兩大核心賽道:其一為以大語言模型(LLM)、視覺語言模型(VLM)為代表的“認知賽道”,聚焦于構建文字與圖像之間的抽象關聯邏輯;其二是以視覺-語言-動作模型(VLA)為典型的“物理賽道”,核心目標是實現從像素信息到關節扭矩的精準映射。而這一劃分,恰恰讓莫拉維克(Moravec)悖論的效應清晰顯現——對人類來說,“走路”這類肢體活動遠比微積分運算簡單,可在人工智能的訓練邏輯里,二者的難易程度卻呈現出截然相反的圖景。目前,為了獲取物理資料,產業界已形成如圖5所示的三條收集訓練數據的技術路線:遠程操作(Teleoperation)、模擬訓練(Simulation)和視訊學習(Videos)。
![]()
圖4: Foundation models — Understanding the connections人工智能訓練的兩大核心賽道 (圖源:摩根士丹利)
![]()
圖5: 產業界收集訓練數據的三條技術路線(圖源:摩根士丹利)
![]()
![]()
圖6: 三條技術路線的優劣勢分析(圖源:摩根士丹利)
遠程操作,是指人類借助動作捕捉技術操控機器人,使其復刻自身行為的一種方式。然而這種方式不僅耗時費力,擴展性也欠佳,未來或將逐步被更先進的技術所取代。模擬訓練技術依托數字孿生技術,能夠在虛擬環境中無限復現各類復雜場景,比如極端天氣、突發障礙物等,并結合強化學習算法持續優化機器人的動作指令。目前,虛幻引擎、Unity等主流游戲引擎公司已深度入局這一領域,英偉達的Omniverse平臺正是憑借其在游戲GPU領域長期積累的技術優勢搭建而成。視頻學習技術可直接從海量人類行為視頻(如YouTube平臺的相關視頻)中提取動作模式,無需進行物理層面的交互,就能完成機器人模型的訓練。谷歌DeepMind的Genie 3、Meta的V-JEPA 2等一眾“世界模型”,均采用了類似的技術思路,它們不僅能識別動作模式,還可精準預測物體的運動軌跡以及物理交互的最終結果。
視頻學習技術的出現,讓AI身體控制訓練從“物理世界的試錯”轉向“數字世界的洞察”。Genie3、V-JEPA2等世界模型的探索,證明了“看海量視頻學控制”的可行性,也為AI從“認知智能”走向“具身智能”打開了一扇新的大門。目前,視頻學習技術已在工業機器人、智能制造、教育培訓、影視與內容創作、醫療健康、智能家居與服務機器人等行業取得顯著成果,核心體現在“無交互預訓練—物理規律建模—控制策略遷移”的全鏈路價值落地。例如在教育培訓領域,其運用于實訓操作教學:AI生成設備操作、實驗步驟的動態視頻,替代教師重復演示,代表產品有猿輔導“小猿AI”等。
從發展現狀來看,我國機器人領域的視頻學習技術正實現從“看會”到“做好”的關鍵跨越,其核心演進方向聚焦于多模態深度融合、行業垂直適配與倫理合規強化三大維度,最終目標是讓AI真正達成“看視頻即懂物理、懂規則即能控制”的能力躍升。具體實踐中,智元具身研究中心推出的GenieReasoner二代系統堪稱多模態深度融合的典范之作,該系統成功攻克VLA模型語義推理與動作控制的對齊難題,同時開源ERIQ(聚焦于真機操控全流程的具身推理評測基準),充分驗證了其達到業界頂尖水平的推理能力與跨本體泛化性能,推動具身智能向邏輯深度與執行精度的全新高度邁進 ;靈犀X2機器人則深耕行業垂直適配,被廣泛用于替代護工的繁瑣工作,如搬運病人、取藥以及陪同行走等任務。靈犀X2通過情感計算以及開源特性,正在改變機器人的角色,并為未來的廣泛普及奠定基礎 ;思靈Diana 7 Med通過中國國家藥品監督管理局(NMPA)認證與歐盟CE-MDD醫療設備指令,針對不同地區倫理規范提供差異化適配而非“一刀切” 。
邊緣算力需求爆發:
實時推理與分布式計算
報告指出,未來邊緣算力將呈現兩大趨勢。一是專用邊緣芯片迎來普及浪潮,英偉達的Jetson Thor便是這一領域的典型標桿。這款面向邊緣實時推理的設備,單套定價約3500美元,已成功斬獲波士頓動力、亞馬遜機器人等行業頭部企業的青睞。它的核心競爭力,在于能夠在低功耗的前提下釋放強大算力,精準匹配機器人動態避障等場景對實時響應的嚴苛需求。二是分布式推理網絡架構革新正在提速。特斯拉率先提出“機器人即算力節點”的創新構想:假設有1億臺算力達2500 TFLOPS的機器人部署全球,僅需實現50%的利用率,就能聚合形成125000 ExaFLOPS的龐大算力,這一數值相當于700萬顆單算力18 PetaFLOPS 的NVIDIA B200 GPU的總和。這種分布式模式的價值不止于此,它既有效降低了對中心化數據中心的依賴,更能借助機器人之間的協同聯動,實現整體運行效率的躍升。
據摩根士丹利預測,到2030年全球機器人邊緣計算需求將大幅增長,人形機器人、自動駕駛汽車、無人機等各類機器人形態都將貢獻顯著的算力需求。預計到2050年全球將售出14億臺機器人,將推動邊緣AI算力需求達到數百萬個B200芯片當量。
邊緣AI芯片,是一類專為處理邊緣計算環境中人工智能應用海量運算任務而生的核心模塊。它通常被集成于邊緣設備之中,賦能設備在本地完成實時的數據處理、分析與決策,極大提升了邊緣終端的智能化水平,讓各類應用場景的運行更高效、更靈活、更安全。專用邊緣芯片的普及,正從算力架構、行業應用、產業格局、安全合規四大維度全面重構數字生態。其核心邏輯在于以“低延遲本地決策+云邊端協同+高能效算力”的三重優勢,推動物理AI與自主系統走向規模化落地。
在算力架構層面,這一趨勢加速了云邊端協同模式的定型:云端集中發力大模型的訓練與迭代優化,邊緣側則肩負起實時推理與本地決策的核心重任,終端設備專注執行低延遲指令,最終將端到端的響應時延壓縮至毫秒級。
在行業應用層面,專用邊緣芯片實現了深度賦能。以人形機器人領域為例,它不僅支撐起機器人的實時感知與智能決策,更有效優化了動態避障、機械臂精準抓取、多傳感器數據融合等關鍵功能,為商業化落地掃清了技術障礙。
在產業格局層面,市場競爭呈現出鮮明的分化態勢:英偉達Jetson、AMD Versal等國際巨頭憑借技術優勢領跑高性能邊緣芯片賽道;而國產廠商則在中低端物聯網與工業場景中加速推進替代進程,持續提升自主芯片IP核的適配率與市場份額。
在安全合規層面,專用邊緣芯片更凸顯出獨特價值。依托本地數據處理的特性,敏感數據無需上云即可完成計算分析,大幅降低了數據泄露風險,完美適配《數據安全法》、歐盟《通用數據保護條例》(GDPR)等國內外合規要求,為數據隱私保護筑牢了技術防線。
目前,我國國產專用邊緣芯片廠商已構建起全棧巨頭引領、創新新銳競跑的多元發展格局,產品矩陣全面覆蓋車載、工業、人工智能物聯網(AIoT)、安防等核心應用場景。昇騰310B作為華為推出的高性能AI加速芯片,憑借其參數優勢,成為眾多企業國產化方案的首選。在算力方面,昇騰910完全達到了設計規格,即:半精度(FP16)算力達到256 Tera-FLOPS ,整數精度(INT8)算力達到512 Tera-FLOPS ,重要的是,達到規格算力所需功耗僅310W,明顯低于設計規格的350W。
寒武紀思元270/370等芯片憑借其高性價比和多場景運用成為創新新銳。近年來,寒武紀在智慧金融、智慧能源及智慧交通等行業與合作伙伴共同完成了諸多落地案例。例如同招商銀行合作上線的思元270智能模型,憑借其高效的推理服務,得到了金融客戶的認可。
![]()
寒武紀思元270芯片,面向高能效比云端AI推理(圖源:寒武紀官網)
“機器人即算力節點”的構想,對AI未來的發展從多維度的角度產生了影響。具體而言,這一概念將從算力供給、技術架構、應用落地、安全治理等多維度重塑人工智能的發展路徑,推動AI從中心化云端走向分布式邊緣協同,加速通用人工智能與具身智能的演進。
例如算力供給層面,突破了中心化算力瓶頸,形成分布式超級算力池。同時在技術架構層面推動AI從云端集中式走向邊緣分布式協同。技術架構層面加速了邊緣計算與分布式推理普及,減少數據回傳延遲,滿足機器人動態避障、自動駕駛等實時決策需求,提升AI系統響應速度與可靠性。此外這一構想拓展了AI場景邊界,加速具身智能與行業融合,從而促進應用落地。對安全治理而言,數據本地化處理減少傳輸風險,提升隱私保護能力,但也帶來節點認證、數據一致性、惡意節點攻擊等新安全挑戰。最后,AI產業鏈分工與競爭格局將被重塑,加速機器人與AI企業協同,形成“機器人制造—算力運營—AI服務”的一體化商業模式,改變傳統AI產業依賴數據中心的發展路徑。
結語
當前,機器人產業正迎來全方位的升級變革,發展趨勢凸顯出多重核心特征。一方面,機器人的應用場景正從傳統工業制造向醫療健康、民生服務、特種作業等多元領域加速延伸,覆蓋范圍與滲透深度持續拓展;另一方面,技術范式也在發生根本性轉變,從過往的指令式編程逐步轉向以具身智能、視頻學習為核心的知識驅動與數據驅動融合模式,實現從“看會”到“做好”的能力躍升。與此同時,隨著端側復雜任務對實時決策、自主控制的需求日益攀升,未來機器人的邊緣算力將迎來顯著提升,為復雜場景下的高效響應與精準執行筑牢技術根基。尤為關鍵的是,機器人產業的高質量發展,需在聚焦核心技術突破、運動控制持續攻堅、多模態融合等關鍵難題的同時,將倫理規范、安全保障與場景適配貫穿于研發、生產、應用的全流程,推動機器人技術真正實現高效、安全、合規的落地,賦能千行百業的智能化轉型。
![]()
在2025中國醫學裝備展覽會拍攝的手術機器人演示現場(圖源:新華社)
本文作者
于劼芊:香港中文大學(深圳)前海國際事務研究院研究助理。
黃平:香港中文大學(深圳)公共政策學院副教授兼助理院長,前海國際事務研究院副院長。
*原創聲明:本文版權歸微信訂閱號“大灣區評論”所有,未經允許任何單位或個人不得轉載、復制或以任何其他方式使用本文部分或全部內容,侵權必究。公眾號授權事宜請直接于文章下方留言,其他授權事宜請聯系IIA-paper@cuhk.edu.cn。
GBA Review 新傳媒
校對 | 李 征
排版 | 許梓烽
初審 | 王炳云
終審 | 馮簫凝
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.