![]()
![]()
編輯:前沿在線 編輯部
當大多數(shù)具身智能企業(yè)還在實驗室里為一次成功的抓取反復調(diào)試參數(shù),在展會舞臺上用編排好的動作博取觀眾驚嘆時,智元已經(jīng)把人形機器人送進了全球頂級 ODM 廠商的 3C 高速主產(chǎn)線,以“正式員工”的身份,完成了長達 8 小時無預演、無剪輯、全透明的量產(chǎn)作業(yè)直播。
![]()
2026 年 4 月 14 日,江西南昌龍旗科技園,鏡頭對準了高速運轉(zhuǎn)的平板測試產(chǎn)線。
多臺智元精靈 G2 人形機器人以產(chǎn)線 “正式員工” 的身份,深度融入真實 3C 作業(yè)產(chǎn)線,正在產(chǎn)線上完成平板電腦出廠前的多媒體集成測試全流程:從每秒移動 0.5 米的流水線上精準抓取待測平板,穿越緊湊復雜的產(chǎn)線空間,將設備嚴絲合縫送入測試治具,與測試裝備完成實時通信后,再將成品與不良品分類放回流水線。
![]()
整場直播實測數(shù)據(jù)顯示,精靈 G2在產(chǎn)線連續(xù)作業(yè)過程中,累計連續(xù)執(zhí)行 2283次精密上下料,實現(xiàn)了 100% 作業(yè)成功率、0% 故障率的工業(yè)級表現(xiàn),單臺機器人每小時可完成310 件產(chǎn)品的上下料作業(yè),完美適配 3C 產(chǎn)線的高速生產(chǎn)節(jié)拍要求。
![]()
這場持續(xù) 8 小時的直播,不僅是智元為期一周的「AGIBOT AI Week」的收官之作,更是全球具身智能行業(yè)發(fā)展史上的里程碑事件。
這是具身智能機器人第一次真正切入消費電子精密制造的核心生產(chǎn)鏈路,第一次完成從技術驗證到商業(yè)閉環(huán)的全鏈條跑通,第一次用工業(yè)量產(chǎn)的硬核數(shù)據(jù),向行業(yè)證明:具身智能已經(jīng)走出實驗室,正式進入可量產(chǎn)、可并線、可復制、可創(chuàng)造經(jīng)濟效益的工業(yè)級部署態(tài)。
![]()
從 4 月 7 日到 4 月 14 日,智元以“每日一項核心突破”的節(jié)奏,完成了從全域真實場景數(shù)據(jù)集開源、仿真平臺重磅升級、VLA 基座大模型架構(gòu)迭代、世界模型能力重構(gòu),到零代碼應用平臺落地的全鏈路技術布局,最終用龍旗產(chǎn)線的量產(chǎn)數(shù)據(jù),完成了全棧技術能力的終極驗證。
![]()
在具身智能行業(yè)深陷“Demo 繁榮、量產(chǎn)啞火”的困局多年后,智元用一套完整的、全棧自研的、可閉環(huán)迭代的技術體系,擊穿了橫亙在技術研發(fā)與產(chǎn)業(yè)落地之間的生死線。
這場為期一周的發(fā)布與最終的產(chǎn)線直播,不止是一家企業(yè)的技術成果秀,更是整個具身智能行業(yè),從實驗室研發(fā)態(tài)邁入工業(yè)化部署態(tài)的元年宣言。
![]()
從 “花拳繡腿” 到 “真槍實彈”:具身智能的七年困局與生死命題
從 2019 年波士頓動力 Atlas的后空翻視頻刷屏全球,到 2022 年特斯拉 Optimus首次亮相掀起人形機器人熱潮,再到 2025 年全球數(shù)十家企業(yè)扎堆發(fā)布具身智能機器人 Demo,短短數(shù)年間,具身智能已經(jīng)從科幻概念,成為了全球科技競爭的核心賽道。
![]()
據(jù)行業(yè)調(diào)研機構(gòu)數(shù)據(jù)顯示,2025 年全球具身智能賽道融資規(guī)模超過120 億美元,中國市場占比超過 35%,僅國內(nèi)就有超過百家企業(yè)布局具身智能機器人研發(fā),從本體制造、算法研發(fā)到場景落地,產(chǎn)業(yè)鏈條看似已經(jīng)完整。
![]()
但與資本熱潮和 Demo 狂歡形成鮮明對比的,是行業(yè)始終無法突破的落地困局。截至 2026 年一季度,全球范圍內(nèi)真正實現(xiàn)工業(yè)產(chǎn)線規(guī)模化并線落地的具身智能機器人,數(shù)量為零。
絕大多數(shù)企業(yè)的產(chǎn)品,始終停留在實驗室 Demo、展會演示的階段,即便有少數(shù)企業(yè)實現(xiàn)了單點場景的試點落地,也無法實現(xiàn)規(guī)模化復制,更無法進入量產(chǎn)級的工業(yè)產(chǎn)線。
![]()
“具身智能行業(yè)從來不缺驚艷的演示,缺的是能夠穩(wěn)定復制、持續(xù)升級、面向產(chǎn)業(yè)落地的價值閉環(huán)。”
智元在發(fā)布周官宣文中的這句話,精準戳中了行業(yè)的核心痛點。在這場龍旗產(chǎn)線直播的訪談環(huán)節(jié),上海市人工智能行業(yè)協(xié)會秘書長鐘俊浩更是直言不諱:“過去大家看到的很多機器人展示,都是‘花拳繡腿’,是在賣藝、提供情緒價值,而今天智元在龍旗產(chǎn)線上做到的,是‘真槍實彈’,是讓機器人真正變成了工廠里的打工人,這是全球第一例真正進入主產(chǎn)線、實現(xiàn) 7×24 小時連續(xù)作業(yè)的具身智能落地案例。”
![]()
在與數(shù)十位具身智能行業(yè)從業(yè)者、制造業(yè)客戶的交流中,我們發(fā)現(xiàn),行業(yè)始終無法突破量產(chǎn)落地的瓶頸,根源在于四大無法破解的系統(tǒng)性困局,而智元的全鏈路布局,恰恰對每一個痛點都給出了系統(tǒng)性的解決方案。
1. 數(shù)據(jù)困局:實驗室 “溫室數(shù)據(jù)”,養(yǎng)不出能適應真實世界的模型
數(shù)據(jù)是 AI 模型的基石,對于直面物理世界的具身智能而言,數(shù)據(jù)的質(zhì)量直接決定了模型的泛化能力和落地表現(xiàn)。
![]()
但長期以來,行業(yè)內(nèi)絕大多數(shù)具身智能模型的訓練數(shù)據(jù),都來自于高度受控的實驗室環(huán)境:整潔的桌面、固定的物體位置、標準的光照條件、無任何動態(tài)干擾的場景,甚至連操作路徑都是預設好的。
這種 “溫室里培育出來的數(shù)據(jù)”,雖然能讓模型在實驗室環(huán)境里跑出漂亮的指標,但一旦進入真實場景,面對遮擋、雜亂擺放、光照變化、動態(tài)人流、來料偏差等真實世界的不確定性,模型就會立刻 “水土不服”。
更關鍵的是,傳統(tǒng)的具身數(shù)據(jù)集,大多只關注視覺與動作軌跡的記錄,忽略了機器人與物理世界交互的核心 ——力控、觸覺、本體狀態(tài)等多模態(tài)數(shù)據(jù)。
![]()
機器人在真實世界作業(yè),不是只靠 “看”,更要靠 “感受”,抓取物體的力度、接觸物體的反饋、操作過程中的力控變化,這些數(shù)據(jù)的缺失,讓模型永遠無法學會真實世界的物理交互邏輯。
同時,數(shù)據(jù)采集范式的落后,也讓數(shù)據(jù)集的價值大打折扣。傳統(tǒng)數(shù)據(jù)集大多采用固定腳本的采集方式,每一條數(shù)據(jù)都是 “標準答案式” 的完美操作,沒有錯誤、沒有修正、沒有應對突發(fā)情況的調(diào)整。
但真實世界里,沒有任何一次操作是完美的,真正的智能,恰恰體現(xiàn)在出現(xiàn)偏差時的糾錯能力。這種只記錄 “正確操作” 的數(shù)據(jù)集,讓模型永遠學不會應對真實世界的不確定性。
![]()
2. 架構(gòu)困局:語義與運動的割裂,機器人永遠 “想得到、做不到”
如果說數(shù)據(jù)是基石,那么模型架構(gòu)就是具身智能的大腦。過去幾年,隨著大語言模型、多模態(tài)大模型的爆發(fā),具身智能的VLA(視覺 - 語言 - 動作)模型也實現(xiàn)了快速發(fā)展,機器人的語義理解能力、任務規(guī)劃能力已經(jīng)達到了極高的水平。
![]()
但行業(yè)始終面臨一個核心的架構(gòu)性難題:語義與運動的割裂,也就是行業(yè)內(nèi)常說的“語義 - 運動鴻溝”。
傳統(tǒng)的具身智能系統(tǒng),是一套典型的割裂式鏈路:高層的大語言模型負責理解自然語言指令、拆解任務步驟、生成動作規(guī)劃;底層的運動控制系統(tǒng)負責接收規(guī)劃指令,生成機器人的關節(jié)控制信號,完成動作執(zhí)行。這兩個環(huán)節(jié)之間,是完全脫節(jié)的。
![]()
高層模型生成的規(guī)劃,是抽象的、語義化的,它能告訴機器人 “把平板放到測試治具里”,但無法告訴機器人,手臂應該以怎樣的軌跡運動、抓取平板的力度應該是多少、遇到治具位置偏差時應該怎么調(diào)整。
而底層的運動控制系統(tǒng),只能接收瞬時的控制信號,無法理解高層的任務意圖,一旦環(huán)境出現(xiàn)變化,就只能繞過規(guī)劃,靠瞬時視覺反饋重新生成動作,最終導致長程任務的誤差持續(xù)累積,規(guī)劃與執(zhí)行完全脫節(jié)。
這就導致了行業(yè)普遍存在的問題:機器人能 “想得明明白白”,卻 “做得磕磕絆絆”。它能完美拆解任務步驟,卻無法穩(wěn)定完成執(zhí)行;它能在仿真環(huán)境里跑出 100% 的成功率,到了真實環(huán)境里,卻連最簡單的抓取都頻頻失敗。
![]()
更關鍵的是,這種割裂式的架構(gòu),無法形成持續(xù)迭代的閉環(huán)。規(guī)劃環(huán)節(jié)的問題,無法反饋到執(zhí)行環(huán)節(jié);執(zhí)行環(huán)節(jié)的偏差,也無法反哺優(yōu)化規(guī)劃模型。最終,機器人的能力永遠被鎖死在 “單次 Demo 成功” 的階段,無法實現(xiàn)持續(xù)進化。
3. 工程化困局:定制化開發(fā)的死循環(huán),規(guī)模化復制成為奢望
即便企業(yè)解決了數(shù)據(jù)與模型的問題,實現(xiàn)了單點場景的落地,依然會面臨工程化的核心難題:部署門檻高、周期長、成本高,無法實現(xiàn)規(guī)模化復制。
傳統(tǒng)的機器人應用落地,是一套典型的項目制定制開發(fā)模式。一個制造業(yè)客戶的場景落地,需要工程師團隊先到現(xiàn)場進行場景評估、方案設計,然后從零開始搭建行為樹、編寫代碼、調(diào)試算法、現(xiàn)場測試,每一個環(huán)節(jié)都需要高門檻的工程能力,一個簡單的上下料場景,部署周期就長達數(shù)周甚至數(shù)月,部署成本動輒數(shù)十萬。
![]()
更致命的是,這種定制化開發(fā)的模式,完全無法實現(xiàn)跨場景復制。同一個工廠里,換一條產(chǎn)線、換一個工序,就需要重新進行全流程的定制開發(fā);同一個行業(yè)的不同客戶,因為產(chǎn)線布局、設備型號、工序要求的不同,也無法復用之前的方案。
這就導致了行業(yè)的死循環(huán):每一個落地項目,都要從零開始,投入大量的人力物力,項目交付周期長、利潤低,客戶的付費意愿也隨之降低,最終行業(yè)陷入 “做一個項目虧一個項目” 的困境,規(guī)模化落地完全成為奢望。
同時,傳統(tǒng)的部署模式,還面臨極高的試錯成本。機器人的現(xiàn)場調(diào)試,需要產(chǎn)線停產(chǎn)配合,每一次測試、每一次調(diào)整,都意味著工廠的產(chǎn)能損失;
而一旦機器人出現(xiàn)碰撞、故障,還可能導致產(chǎn)線設備損壞,給客戶帶來巨大的經(jīng)濟損失。這種極高的試錯風險,也讓大量制造業(yè)客戶對具身智能機器人望而卻步。
4. 商業(yè)模式困局:從 “賣硬件” 到 “賣服務”,行業(yè)始終找不到可持續(xù)的盈利路徑
技術與工程化的困局,最終傳導到商業(yè)模式上,讓行業(yè)始終找不到可持續(xù)的盈利路徑。
目前,行業(yè)內(nèi)絕大多數(shù)企業(yè)的商業(yè)模式,依然是傳統(tǒng)的工業(yè)機器人模式:賣硬件本體。但具身智能人形機器人的硬件成本極高,單臺設備的成本動輒數(shù)十萬甚至上百萬,遠遠超過傳統(tǒng)的工業(yè)機械臂,而制造業(yè)客戶對設備的投資回報周期要求,普遍在1-2 年以內(nèi)。高昂的硬件成本,讓絕大多數(shù)客戶無法接受,硬件銷售的模式,根本無法實現(xiàn)規(guī)模化放量。
![]()
少數(shù)企業(yè)嘗試轉(zhuǎn)型“機器人即服務(RaaS)”的模式,按作業(yè)量、按月向客戶收費,但這種模式的前提,是機器人能夠?qū)崿F(xiàn)規(guī)模化、穩(wěn)定的作業(yè),能夠持續(xù)為客戶創(chuàng)造價值。
而在行業(yè)無法解決穩(wěn)定落地、規(guī)模化復制的前提下,RaaS 模式根本無法跑通:企業(yè)需要承擔硬件成本、部署成本、運維成本,而機器人的作業(yè)效率、穩(wěn)定性無法保障,最終只能陷入持續(xù)虧損的境地。
四大困局環(huán)環(huán)相扣,形成了具身智能行業(yè)無法突破的死循環(huán)。而智元本次 AI 發(fā)布周的全鏈路技術布局,以及龍旗產(chǎn)線的落地驗證,恰恰用一套完整的技術閉環(huán),系統(tǒng)性地破解了這四大困局,為行業(yè)找到了一條從實驗室走向量產(chǎn)、從 Demo 走向規(guī)模化落地的可行路徑。
![]()
![]()
從數(shù)據(jù)到落地的全鏈路閉環(huán):智元重構(gòu)具身智能研發(fā)范式
智元的破局,從來不是單點技術的突破,而是從底層數(shù)據(jù)到產(chǎn)業(yè)落地的全鏈路、系統(tǒng)性重構(gòu)。
這場為期一周的 AI 發(fā)布周,智元沿著“數(shù)據(jù)底座 - 仿真引擎 - 核心大腦 - 落地橋梁 - 產(chǎn)業(yè)驗證”的完整邏輯鏈條,層層遞進地搭建起了一套全棧自研、可閉環(huán)迭代的具身智能技術體系,每一項技術發(fā)布,都精準命中了行業(yè)的核心痛點,每一項技術成果,最終都在龍旗的產(chǎn)線上得到了終極驗證。
![]()
1. 數(shù)據(jù)底座:AGIBOT WORLD 2026,讓機器人在真實世界里 “學會成長”
發(fā)布周首日,智元就放出了 “大招”—— 開源全球首個覆蓋具身智能全域研究的真實場景數(shù)據(jù)集 AGIBOT WORLD 2026,從根源上破解了行業(yè)的 “溫室數(shù)據(jù)” 困局。
![]()
與行業(yè)內(nèi)普遍的實驗室數(shù)據(jù)集不同,AGIBOT WORLD 2026 的所有數(shù)據(jù),100% 采集自商業(yè)空間、酒店餐飲、家居、安防、工業(yè)物流等真實場景,沒有任何預設的理想環(huán)境,完整保留了真實世界里的遮擋、雜亂擺放、光照變化、動態(tài)干擾等所有不確定性。
這意味著,數(shù)據(jù)集里的每一條數(shù)據(jù),都不是 “被設計出來的”,而是機器人在真實世界里 “真實經(jīng)歷的”,天然具備遷移到真實應用場景的價值。
![]()
為了采集到高質(zhì)量的多模態(tài)數(shù)據(jù),智元基于新一代工業(yè)級精靈 G2 通用機器人搭建了采集平臺,搭配 Swift Picker 夾爪與 OmniHand 五指靈巧手,在采集過程中,同步記錄多視角RGB(D)、觸覺、LiDAR點云、IMU、全身關節(jié)狀態(tài)、力傳感器等全維度數(shù)據(jù)。
機器人在采集過程中 “看到了什么、感受到了什么、做了什么動作、得到了什么反饋”,都被完整地記錄下來,讓數(shù)據(jù)集不再只是 “動作軌跡的集合”,而是完整的物理世界交互過程。
![]()
更具行業(yè)顛覆性的,是智元在數(shù)據(jù)采集與標注范式上的創(chuàng)新。在采集范式上,智元摒棄了傳統(tǒng)的固定腳本采集,推出了創(chuàng)新的“自由采集范式”:數(shù)據(jù)采集員在真實場景中,根據(jù)實時情況靈活設計操作流程,自然覆蓋不同物體種類、不同操作順序、不同動作路徑的組合,全面覆蓋多維度泛化需求。
同時,通過全身控制、超視距遙操作、力控采集 三大技術,讓采集到的數(shù)據(jù),完全還原機器人在真實場景中的作業(yè)狀態(tài),而不是人為拼接的動作片段。
![]()
在標注體系上,智元構(gòu)建了一套覆蓋多層級的標注體系,將一個完整的任務,拆解為從目標描述、步驟執(zhí)行,到原子技能、2D 邊界框的完整結(jié)構(gòu),讓機器人不僅能看到 “做了什么動作”,更能理解 “為什么要做這個動作”。
最關鍵的是,智元在數(shù)據(jù)集中完整保留了錯誤修正過程的軌跡記錄,讓模型能夠?qū)W習到,當操作出現(xiàn)偏差時,應該如何調(diào)整、如何糾錯,這恰恰是機器人適應真實世界不確定性的核心能力。
![]()
目前,AGIBOT WORLD 2026將分五個階段持續(xù)開源,首期開放的 “模仿學習” 主題數(shù)據(jù)集,已經(jīng)同步在 Hugging Face 上線,同時開源的還有 1:1 數(shù)字孿生的仿真數(shù)據(jù),與后續(xù)發(fā)布的 Genie Sim 3.0 形成強協(xié)同效應,為全球開發(fā)者提供了高質(zhì)量的真實數(shù)據(jù)底座。
2. 仿真引擎:Genie Sim 3.0,把具身智能研發(fā)帶入 “高鐵時代”
如果說真實數(shù)據(jù)集是機器人成長的 “真實教材”,那么仿真平臺就是機器人無限試錯、快速成長的 “虛擬訓練場”。
發(fā)布周次日,智元發(fā)布了升級后的Genie Sim 3.0 一站式仿真開發(fā)平臺,實現(xiàn)了 “自然語言造世界” 的質(zhì)變,徹底解決了傳統(tǒng)仿真平臺“搭建慢、與真機脫節(jié)、迭代效率低”的核心痛點。
![]()
傳統(tǒng)的仿真環(huán)境搭建,需要專業(yè)的建模工程師,通過 3D 建模軟件,一點點搭建場景、調(diào)試物理參數(shù)、配置交互邏輯,一個簡單的工業(yè)產(chǎn)線場景,搭建周期就長達數(shù)小時甚至數(shù)天,效率極低。
而Genie Sim 3.0 的核心突破,就是實現(xiàn)“輸入即場景” 的自然語言生成能力,用戶只需輸入一句話、一張圖,平臺就能通過空間世界模型,在分鐘級生成可交互、可漫游、可訓練的三維場景,環(huán)境構(gòu)建效率提升數(shù)十倍,徹底打破仿真環(huán)境的搭建門檻。
![]()
更關鍵的是,Genie Sim 3.0解決了行業(yè)長期存在的“仿真與現(xiàn)實脫節(jié)”的核心問題。平臺在生成場景時,能夠同步輸出RGB、深度、激光雷達等多模態(tài)數(shù)據(jù),與真實世界的機器人采集數(shù)據(jù)完全對齊,實現(xiàn)仿真數(shù)據(jù)與真實世界的高度一致。
同時,智元搭建了Genie Sim Benchmark 全維度評測體系,針對機器人的語言指令理解、空間關系認知、原子技能操作、環(huán)境擾動適應、零樣本跨域遷移五大核心能力,設計專屬的任務套件,兼容 GO 系列、π 系列、GR00T 系列等所有主流具身基座模型,能夠系統(tǒng)性評估模型的綜合能力。
實測數(shù)據(jù)顯示,使用Genie Sim Benchmark仿真數(shù)據(jù)訓練的模型,零樣本遷移到真實世界后,仿真環(huán)境與真實世界的評測差異小于 10%,真正實現(xiàn) “仿真驗證即真機效果”。
這意味著,開發(fā)者無需真機部署,就能在仿真環(huán)境中完成模型的驗證與迭代,大幅降低研發(fā)成本,提升算法迭代效率。
![]()
在龍旗產(chǎn)線的落地過程中,Genie Sim 3.0更是發(fā)揮了不可替代的核心作用。智元合伙人、具身業(yè)務部總裁姚卯青在現(xiàn)場分享中明確表示:“我們對真實的工業(yè)場景落地,都會分步驟進行研發(fā),第一步就是把產(chǎn)線完全數(shù)字孿生到仿真環(huán)境里,用三維重建和生成式 AI 技術做到以假亂真,90% 左右的研發(fā)工作都在仿真環(huán)境里完成并測試完整,然后再來到真實世界落地。”
正是這套“仿真先行”的范式,讓智元團隊將傳統(tǒng)數(shù)月的現(xiàn)場調(diào)試,壓縮到36 小時完成產(chǎn)線并線,場景標定最快5 分鐘,換型重訓小于4 小時,幾乎不影響產(chǎn)線的正常生產(chǎn),徹底解決工業(yè)場景部署的試錯成本難題。
同時,Genie Sim 3.0還推出Genie Sim x RLinf 開源方案,提供一套完整的強化學習工具鏈。平臺實現(xiàn)物理與渲染引擎的解耦,支持1000Hz 高精度物理模擬與高保真實時視覺觀測,通過大規(guī)模并行計算,大幅提升采樣效率,加速模型收斂。
同時,平臺提供通用標準 Gym 接口,無縫適配 RLinf 及社區(qū)其他算法環(huán)境,以低成本的強化學習后訓練,打通模型從 “泛化理解” 到 “精準微操” 的最后一公里。
![]()
從場景生成、模型訓練,到評測驗證、強化學習,Genie Sim 3.0搭建了一套完整的仿真開發(fā)閉環(huán),與AGIBOT WORLD 2026真實數(shù)據(jù)集形成“真實數(shù)據(jù)+高效仿真” 的雙輪驅(qū)動底座,為上層模型的訓練與迭代,提供堅實的基礎。
3. 核心大腦雙引擎:GO-2 與 GE-Sim 2.0,讓機器人實現(xiàn) “知行合一、自主進化”
有了堅實的底座,還需要強大的大腦。發(fā)布周第三、四日,智元先后發(fā)布新一代 VLA 基座大模型 GO-2,以及世界模型 Genie Envisioner 2.0(GE-Sim 2.0),雙引擎協(xié)同,徹底彌合語義與運動的鴻溝,讓機器人從 “被動執(zhí)行指令”,升級為 “能思考、能規(guī)劃、能預見、能進化” 的智能體。
![]()
首先是GO-2 基座大模型,它的核心目標,就是解決行業(yè)長期存在的 “語義 - 運動鴻溝”,讓機器人實現(xiàn)真正的“知行合一”。為了實現(xiàn)這個目標,GO-2 在架構(gòu)上實現(xiàn)兩大顛覆性創(chuàng)新。
第一個創(chuàng)新,是首創(chuàng)動作思維鏈(Action Chain-of-Thought)。傳統(tǒng)的 VLA 模型,通常直接從感知輸入生成控制信號,“思考” 和 “執(zhí)行” 被壓縮在同一個瞬間完成,沒有中間的推理過程,模型既要理解任務,又要完成精細控制,最終兩頭都顧不好。
而GO-2的動作思維鏈,摒棄在語言或視覺空間做推理的傳統(tǒng)模式,直接在動作空間完成高層動作序列的推理。模型不會立即輸出控制信號,而是先生成一段高層動作序列,作為任務的整體規(guī)劃,描述行為的方向、結(jié)構(gòu)、執(zhí)行路徑,形成可以被執(zhí)行系統(tǒng)直接理解的中間表示。
![]()
通過這種方式,復雜的長程任務被拆解為有序的動作步驟,機器人的執(zhí)行過程,不再依賴瞬時的視覺反饋,而是建立在已經(jīng)形成的結(jié)構(gòu)化路徑之上,從 “邊看邊做” 升級為 “想清楚再做”,執(zhí)行偏差大幅降低,長程任務的穩(wěn)定性顯著提升。這項創(chuàng)新成果,已被計算機視覺頂級會議CVPR2026接收。
![]()
第二個創(chuàng)新,是異步雙系統(tǒng)架構(gòu)。為了解決規(guī)劃與執(zhí)行脫節(jié)的問題,GO-2將 “規(guī)劃” 和 “執(zhí)行” 拆分為兩個不同節(jié)奏的模塊,同時保持二者的緊密協(xié)同。其中,慢系統(tǒng)以較低的頻率運行,負責通過動作思維鏈生成結(jié)構(gòu)化的高層動作序列,持續(xù)為執(zhí)行環(huán)節(jié)提供指導,從宏觀動作到子動作,再到細粒度的行為片段,形成層次化的動作表示,讓高層規(guī)劃成為持續(xù)約束執(zhí)行方向的 “意圖流”;而快系統(tǒng)以更高的頻率運行,持續(xù)接收慢系統(tǒng)的動作規(guī)劃,結(jié)合當前的視覺觀測,生成具體的控制信號,同時實時應對環(huán)境變化,進行局部修正與動態(tài)調(diào)整。
![]()
這種“低頻規(guī)劃 + 高頻執(zhí)行”的組合,讓機器人既能保持長程任務的整體一致性,又能靈活應對局部的環(huán)境變化,確保高層規(guī)劃在動態(tài)環(huán)境中能夠被持續(xù)、穩(wěn)定地執(zhí)行。
在訓練階段,GO-2 還引入帶噪聲的強制教學機制,讓模型能夠在 “接近正確但不完美” 的規(guī)劃條件下,依然保持穩(wěn)定執(zhí)行,大幅提升模型在真實場景中的魯棒性。這項成果,也已被自然語言處理頂級會議ACL2026接收。
![]()
在性能表現(xiàn)上,GO-2在多個主流具身智能基準測試中,全面刷新行業(yè) SOTA。其中,在LIBERO Benchmark的Spatial、Object、Goal、Long四類任務上,GO-2均排名第一,平均成功率達到 98.5%;在包含多種環(huán)境擾動的LIBERO-Plus Benchmark零樣本測試中,取得86.6% 的平均成功率;在面向真實世界遷移的Genie Sim 3.0評測中,GO-2在僅使用仿真數(shù)據(jù)訓練的前提下,真實環(huán)境零樣本測試成功率達到82.9%,顯著超越 π0.5、NVIDIA GR00T 等國際主流模型。
![]()
如果說GO-2解決了機器人 “聽得懂、做得穩(wěn)” 的問題,讓機器人實現(xiàn) “知行合一”,那么GE-Sim 2.0 世界模型,則賦予機器人 “預見未來、自主進化” 的能力,讓機器人從 “理解世界”,升級為“成為世界”。
在智元的技術路徑里,世界模型一直沿著兩條主線生長:一條是世界動作模型(WAM),專注于動作表征的深度建模;另一條是世界模擬器(World Simulator),負責打造可交互、可推演、可訓練的完整環(huán)境。
而GE-Sim 2.0的發(fā)布,實現(xiàn)兩條主線的深度融合,完成世界模型從 “表征模型” 到 “環(huán)境級系統(tǒng)基礎設施” 的本質(zhì)躍遷,成為真正可訓練、可交互、可決策的 “物理進化引擎”。
![]()
GE-Sim 2.0 具備六大核心能力:
能夠嚴格響應機器人的動作信號,生成高保真、符合物理與語義邏輯的環(huán)境變化,實現(xiàn)動作驅(qū)動的物理級環(huán)境演化;支持分鐘級長時序穩(wěn)定推演,從零散的視頻片段,升級為完整任務過程的連續(xù)生成;
實現(xiàn)多視角視覺、跨視角 3D 一致性與機器人本體狀態(tài)的統(tǒng)一建模,讓機器人面對的不再是孤立的 “畫面”,而是完整的具身世界;內(nèi)置通用激勵模型,首次具備自評估能力,無需人工 Reward,就能完成模型內(nèi)的強化學習;
實現(xiàn)近實時運行,支持在模型世界內(nèi)完成評估、強化學習、遙操作,從離線工具升級為實時交互的系統(tǒng)環(huán)境。
![]()
這意味著,機器人從此擁有一個無限延伸的虛擬訓練場,它可以在GE-Sim 2.0生成的模型世界里,完成大規(guī)模的試錯、訓練、迭代,無需在真實世界里付出高昂的試錯成本,徹底突破真實數(shù)據(jù)稀缺性的束縛。
更重要的是,機器人的能力上限,從此不再被人類的經(jīng)驗限制,它可以在模型世界里,自主探索、自主學習、自主優(yōu)化,從 “復現(xiàn)人類經(jīng)驗的執(zhí)行者”,變成 “突破人類經(jīng)驗上限的學習者”。
4. 落地橋梁:Genie Studio Agent,零代碼平臺擊穿規(guī)模化部署門檻
有了強大的大腦,還需要一座連接技術與場景的橋梁,讓復雜的技術能力,能夠低成本、高效率地落地到產(chǎn)業(yè)場景中。發(fā)布周第五日,智元推出Genie Studio Agent 零代碼應用平臺,徹底擊穿具身智能的部署門檻,宣告機器人部署正式進入 “零代碼時代”。
Genie Studio Agent是一套貫穿機器人從開發(fā)到部署、從運行到優(yōu)化的全生命周期軟件基礎設施,它的核心創(chuàng)新,就是把視覺感知、運動控制、導航規(guī)劃、VLA 模型、強化學習工具鏈等所有復雜的技術能力,全部進行模塊化重組,封裝成可以直接調(diào)用的能力組件。
平臺內(nèi)置無代碼 / 低代碼任務流編輯器,用戶無需任何工程背景,無需編寫一行代碼,只需拖拽相應的節(jié)點、簡單配置參數(shù),就能快速構(gòu)建屬于自己的機器人任務流程,搭建專屬的機器人應用。
![]()
這種模式,徹底顛覆傳統(tǒng)的定制化開發(fā)模式。過去需要數(shù)周甚至數(shù)月才能完成的機器人應用開發(fā),現(xiàn)在通過Genie Studio Agent,只需要半小時就能完成,開發(fā)周期從數(shù)周壓縮至小時級,部署成本也大幅降低。
更重要的是,機器人應用的定義權,從工程師手中,交還給一線的場景用戶,用戶可以根據(jù)自己的業(yè)務需求,自主定義機器人的作業(yè)流程,真正實現(xiàn) “應用定義機器人”。
除了零代碼編排能力,Genie Studio Agent還具備四大核心能力,徹底解決部署環(huán)節(jié)的所有痛點。
![]()
其一,仿真先行的預演能力。平臺內(nèi)置三維場景重建與仿真系統(tǒng),用戶在真實部署前,就能在虛擬環(huán)境中,完成作業(yè)全流程的預演、路徑規(guī)劃驗證、碰撞檢測、節(jié)拍調(diào)試,把所有可能的風險、誤差、故障,在數(shù)字世界里提前規(guī)避,大幅縮短現(xiàn)場調(diào)試時間,降低試錯成本,避免產(chǎn)線停產(chǎn)調(diào)試的產(chǎn)能損失。
![]()
其二,真機強化學習的持續(xù)優(yōu)化能力。機器人部署上線后,并非靜態(tài)地重復既定策略,而是能通過力控反饋與視覺識別,精準捕捉每一次操作的細節(jié)偏差,持續(xù)優(yōu)化動作精度與作業(yè)效率,在一次次的作業(yè)中,不斷逼近更優(yōu)的執(zhí)行方式,讓機器人的能力具備持續(xù)的成長性。
![]()
其三,全生命周期的集群監(jiān)管能力。平臺提供機器人集群監(jiān)管平臺,將機器人集群的運行數(shù)據(jù)、設備狀態(tài)、異常情況,全部納入可視化體系,幫助企業(yè)實時掌握產(chǎn)線作業(yè)情況,當設備出現(xiàn)潛在故障、運行異常時,系統(tǒng)會提前預警,讓運維模式從 “被動響應故障、事后維修” 升級為 “主動預判風險、提前管控”,保障生產(chǎn)節(jié)奏的連續(xù)性與穩(wěn)定性。
![]()
其四,開箱即用的行業(yè)場景模板。平臺針對半導體封測、3C 制造、汽車零部件制造等高端制造場景,內(nèi)置開箱即用的標準化解決方案與行業(yè)場景模板,用戶可以直接復用,進一步降低場景落地的門檻。
![]()
目前,Genie Studio Agent已經(jīng)在多個高端制造場景完成落地驗證,交出亮眼的成績單。在半導體封測場景,智元的生態(tài)合作伙伴基于平臺,僅用半小時就完成 Tray 盤上下料全流程的應用編排,最終實現(xiàn)99.999% 以上的作業(yè)成功率,掉盤率低于 0.001%,系統(tǒng)平均無故障運行時間超過 168 小時;
在汽車零部件制造場景,合作伙伴基于平臺,為頭部汽車零部件企業(yè)實現(xiàn)安全帶卷收器精密上料作業(yè),作業(yè)成功率穩(wěn)定在 99.9% 以上,單次作業(yè)節(jié)拍控制在 13 秒以內(nèi)。
![]()
這些案例證明,Genie Studio Agent不僅解決 “部署難、復制難” 的行業(yè)痛點,更實現(xiàn)具身智能落地模式的根本改變:從 “項目制定制交付” 升級為“平臺化生態(tài)共建”。
智元正在向所有合作伙伴開放平臺能力,無論是系統(tǒng)集成商,還是行業(yè)客戶,都能基于平臺進行二次開發(fā),快速構(gòu)建貼合自身需求的解決方案,推動具身智能的規(guī)模化復制。
![]()
龍旗產(chǎn)線的終極驗證:具身智能智造范式跑通商業(yè)閉環(huán)
所有的技術突破,最終的價值都要在真實產(chǎn)業(yè)場景中兌現(xiàn)。4 月 14 日,智元在龍旗科技南昌工廠的8 小時連續(xù)作業(yè)直播,不僅是本次 AI 發(fā)布周的收官之作,更是對全鏈路技術能力的終極驗證,它用最硬核的量產(chǎn)數(shù)據(jù),向行業(yè)證明:具身智能已經(jīng)真正具備工業(yè)級規(guī)模化落地的能力。
![]()
龍旗科技是全球智能產(chǎn)品 ODM 龍頭企業(yè),年出貨量達數(shù)千萬臺,其 3C 產(chǎn)線是典型的“多品種、快節(jié)奏、高精度”產(chǎn)線,對設備的節(jié)拍、精度、穩(wěn)定性、柔性化能力,都有著極致的要求。
傳統(tǒng)的非標自動化設備,只能實現(xiàn) “專機專用”,一旦產(chǎn)品型號更換、產(chǎn)線調(diào)整,就需要重新改造設備,靈活性極差,無法適配 3C 行業(yè)快速迭代的生產(chǎn)需求。而智元精靈 G2 機器人的并線作業(yè),完美解決這個痛點。
![]()
這場直播,不是預設腳本的 Demo 演示,而是完全真實的量產(chǎn)級作業(yè)。精靈 G2 機器人全面搭載本次發(fā)布周的所有核心技術成果,真正并入高速運轉(zhuǎn)的產(chǎn)線,與工人并肩完成平板測試工序的精密上下料、人機協(xié)同全流程作業(yè)。
最終的實測數(shù)據(jù),刷新行業(yè)對具身智能落地能力的認知。龍旗科技 2111 實驗室具身機器人應用項目負責人張龍在現(xiàn)場披露:“從 3 月 16 日并線到直播當天,機器人已經(jīng)累計運行144 小時以上,峰值 UPH 316,每小時均值穩(wěn)定在 296,一次作業(yè)成功率達到 99.9%,單作業(yè)流程僅需 18-20 秒,完美適配11.6秒的產(chǎn)線節(jié)拍,一臺機器人可承擔雙工序工作量,實現(xiàn) 24 小時雙班倒恒定輸出。”
![]()
更關鍵的是,精靈 G2 機器人徹底破解 3C 制造行業(yè)幾十年的剛性痛點。依靠視覺 + 高靈敏度力控融合,機器人可自主識別治具微小偏移,毫秒級動態(tài)規(guī)劃路徑,完成毫米級精密插拔與放置,自動適應產(chǎn)線擾動、尺寸公差與位置偏差;
無需定制專用夾具與工裝,可自適應 1cm 以內(nèi)尺寸差異的不同型號平板,智能識別顏色與產(chǎn)品差異,設備復用率高達 95%,真正實現(xiàn)從 “非標定制” 到 “通用標準” 的轉(zhuǎn)型。
在現(xiàn)場交流中,行業(yè)一直存在的核心疑問也得到明確解答:3C 產(chǎn)線已有成熟的機械臂,為什么還要用具身智能機器人?龍旗科技機器人業(yè)務部總經(jīng)理李龍給出清晰的答案:“機械臂和具身機器人之間,不是替代關系,而是協(xié)同關系。機械臂解決的是單點自動化,具身智能解決的是全場景柔性化。傳統(tǒng)機械臂高度依賴定制工裝、固定軌跡、結(jié)構(gòu)化環(huán)境,一機一用、換型難、復用低;
![]()
而精靈 G2是具備感知、決策、控制、執(zhí)行全鏈路能力的通用智能體,它用‘眼’看環(huán)境、識偏差,用‘腦’做規(guī)劃、自適應,用‘手’完成精密裝配與檢測,用‘數(shù)字孿生 + 真機強化學習’快速學習新任務,快速復制到新產(chǎn)線。”
鐘俊浩在現(xiàn)場更是直言:“我特意觀察產(chǎn)線工位,這條產(chǎn)線有十多米長,機器人需要長距離來回跑、前后轉(zhuǎn),不同的盒子要不同地撿,這對傳統(tǒng)機械臂來說是根本無法完成的挑戰(zhàn)。這個工位對人的體力要求極高,員工每天要走幾萬步,高頻次轉(zhuǎn)身操作,人員流動性極大,而機器人可以 7×24 小時穩(wěn)定作業(yè),不會有情緒波動,不會出現(xiàn)良率波動,這就是具身智能不可替代的價值。”
從商業(yè)價值來看,這套方案已經(jīng)跑通清晰的商業(yè)閉環(huán)。精靈 G2 機器人在龍旗產(chǎn)線的應用,可實現(xiàn)約 2 年的成本回本周期,ROI 清晰可量化,技術價值與商業(yè)價值在產(chǎn)線完成完美閉環(huán)。
據(jù)了解,智元與龍旗科技僅用 4 個月就完成從項目啟動到規(guī)模化投產(chǎn),目前多臺精靈 G2 已正式投產(chǎn)并線,按照規(guī)劃,2026 年 Q3 內(nèi)龍旗工廠的并線部署將達到 100 臺,形成規(guī)模化復制能力。
![]()
這場直播的背后,是發(fā)布周一至五日所有技術成果的協(xié)同落地,形成一套完整的 “從數(shù)據(jù)到落地” 的閉環(huán):AGIBOT WORLD 2026真實數(shù)據(jù)集,讓機器人從訓練階段就接觸真實世界的復雜性,具備應對產(chǎn)線動態(tài)擾動的泛化能力;
Genie Sim 3.0 仿真平臺,實現(xiàn) “仿真先行” 的部署范式,大幅縮短部署周期,降低試錯成本;GO-2 基座大模型,為機器人提供 “知行合一” 的核心能力,讓機器人既能精準理解工序要求,又能穩(wěn)定完成動作執(zhí)行;
GE-Sim 2.0 世界模型,完成作業(yè)策略的優(yōu)化迭代;Genie Studio Agent 零代碼平臺,實現(xiàn)作業(yè)流程的快速編排與部署,保障產(chǎn)線的柔性化能力。
從底層數(shù)據(jù)到仿真引擎,從核心模型到部署平臺,最終在工業(yè)產(chǎn)線完成落地驗證,智元用一套完整的全鏈路閉環(huán),實現(xiàn)具身智能從實驗室 Demo 到工業(yè)化量產(chǎn)的歷史性跨越。
![]()
從技術引領到生態(tài)共建:中國具身智能開啟全球化新征程
智元本次 AI 發(fā)布周的意義,早已超越一家企業(yè)的技術突破,它重構(gòu)具身智能行業(yè)的研發(fā)范式、評價體系與商業(yè)模式,重塑全球具身智能的競爭格局。而在 AI 發(fā)布周收官之后,智元的腳步并未停下,一場更大規(guī)模的生態(tài)盛會即將到來。
![]()
2026 年 4 月 17 日,智元將在上海舉辦2026 合作伙伴大會,這也是業(yè)內(nèi)規(guī)模最大、覆蓋范圍最廣的合作伙伴盛會。屆時,將有2500 位來自 34 個國家與地區(qū)的合作伙伴齊聚上海,共商具身智能未來發(fā)展。
據(jù)了解,在本次合作伙伴大會上,智元將發(fā)布4 大本體新品、4 大創(chuàng)新AI 大模型、7 大解決方案及開放數(shù)據(jù)集,這也是繼 AI 發(fā)布周之后,智元在本體和 AI 大模型領域的又一系列重磅動作。
智元創(chuàng)始人、董事長兼 CEO 鄧泰華,與聯(lián)合創(chuàng)始人、總裁兼首席技術官彭志輝,將圍繞具身智能如何在現(xiàn)實世界更快更好發(fā)揮 “生產(chǎn)力” 效能,發(fā)表深刻洞察與前瞻觀點。
![]()
2026 年是智元從 “開發(fā)態(tài)” 進階到 “部署態(tài)” 的落地元年,在可靠本體以及扎實量產(chǎn)能力的牽引下,智元在 15 個月內(nèi)實現(xiàn)千臺到萬臺的十倍級跨越,刷新全球人形機器人量產(chǎn)速度紀錄。技術基座 + 場景落地雙輪驅(qū)動,智元正在引領行業(yè)從技術比拼,邁入規(guī)模化商用與價值創(chuàng)造的新紀元。
在本次大會上,智元將首次揭曉標桿客戶共創(chuàng)案例,多場景 “部署態(tài)” 落地物理世界的成功樣本,完整展現(xiàn)智元在 “部署態(tài)” 方面的應用范式,給行業(yè)提供可復制的成功商業(yè)模型。
同時,現(xiàn)場還將展示智元生態(tài)的全景布局,覆蓋技術生態(tài)、數(shù)據(jù)服務、商業(yè)合作、城市合伙人以及全球化戰(zhàn)略的全景圖譜,智元將通過全產(chǎn)業(yè)鏈布局與生態(tài)開放,攜手合作伙伴加速具身智能產(chǎn)業(yè)化落地,共贏具身智能生產(chǎn)力新時代。
![]()
對于具身智能的未來發(fā)展,姚卯青在現(xiàn)場明確智元的核心布局方向:“接下去,我們會圍繞具身智能的幾個核心方向持續(xù)大規(guī)模投入。
第一個是數(shù)據(jù),具身智能現(xiàn)在的有效數(shù)據(jù)量還很少,語言模型已經(jīng)是百萬億級的 Token,而具身智能加起來只有幾十萬小時,行業(yè)普遍認為需要到1 億小時的級別,才能迎來具身智能的「GPTMoment」。
今年我們會海量地構(gòu)建數(shù)據(jù)資產(chǎn),圍繞真實機器人的真機數(shù)據(jù)、仿真數(shù)據(jù),構(gòu)建千萬小時級的數(shù)據(jù)資產(chǎn)。”
![]()
“圍繞核心的大數(shù)據(jù)集,我們會在基座模型方向繼續(xù)演進,讓它做到更加知行合一,彌補多模態(tài)模型的語義理解與機器人關節(jié)運動控制之間的鴻溝;世界模型也是核心方向,有了世界模型,機器人可以在里面做很多閉環(huán)的訓練,實現(xiàn)基于模型的強化學習迭代,同時生成海量增廣的數(shù)據(jù),讓整個迭代形成飛輪效應,越來越快。”
而在全球競爭格局中,中國具身智能產(chǎn)業(yè)已經(jīng)展現(xiàn)出顯著的領先優(yōu)勢。姚卯青表示:“中國是所有人工智能技術新產(chǎn)品終極的訓練場,如果能在中國這樣一個競爭激烈且要求嚴苛的訓練場里訓練出來的企業(yè)和產(chǎn)品,走向全球都是沒有問題的。
![]()
出海是必選題,將來我們一定要把這個技術普惠到全球,發(fā)達國家面臨用工成本高企、人員招聘管理難度大的難題,在積極尋求人形機器人和具身智能的解決方案,我們今天在這里訓練出來的產(chǎn)品,可以很快代表中國走向全球。”
鐘俊浩則從行業(yè)發(fā)展的角度給出更高的判斷:“今天智元在龍旗產(chǎn)線的落地,不是簡單的設備升級,而是開創(chuàng)人機協(xié)作、硅基生命和碳基生命未來共存的全新社會形態(tài)。過去我們說人工智能是工具,而今天,具身智能與人形機器人的結(jié)合,已經(jīng)正兒八經(jīng)變成了勞動力。
![]()
中國所宣揚的一直是人工智能平權,是人類命運共同體,未來中國制造要走向世界,不是單純的設備和工藝出去,而是我們的機器人技術可以惠及更多發(fā)展中國家,幫助他們解決發(fā)展問題,這就是中國具身智能在全球治理中將要發(fā)揮的核心作用。”
![]()
從 2013 年 Atlas 首次亮相,到 2026 年智元精靈 G2 在 3C 產(chǎn)線完成 8 小時連續(xù)量產(chǎn)作業(yè),具身智能行業(yè)用 13 年的時間,終于從科幻概念,走進真實的工業(yè)產(chǎn)線,實現(xiàn)從 Demo 到量產(chǎn)的歷史性跨越。
智元本次 AI 發(fā)布周,用一套全鏈路自研的技術閉環(huán),擊穿橫亙在具身智能研發(fā)與產(chǎn)業(yè)落地之間的所有壁壘,為行業(yè)開啟部署態(tài)元年。
但這只是一個開始,當具身智能的技術飛輪開始高速運轉(zhuǎn),它的應用場景,將從工業(yè)制造,逐步延伸到商業(yè)服務、家居生活、公共服務等更廣闊的領域,真正實現(xiàn) “AI 走進物理世界,賦能千行百業(yè)” 的愿景。
![]()
當機器人真正走進產(chǎn)線,用穩(wěn)定的作業(yè)創(chuàng)造實實在在的商業(yè)價值,具身智能就不再是遙遠的科幻概念,而是正在重塑制造業(yè)的新質(zhì)生產(chǎn)力。智元已經(jīng)推開物理 AI 規(guī)模化落地的大門,而屬于具身智能的工業(yè)化時代,才剛剛拉開序幕。
![]()
![]()
前沿動態(tài)前沿大會
前沿人物
點「在看」,給前前加雞腿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.