<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      機器人秒變推理大師 星塵具身推理模型Lumo-1 VLA發布

      0
      分享至

      從走路、跳舞到后空翻,動作模仿教會了機器人「怎么動」,而到端盤子、分揀水果、熱食物等復雜操作時,機器人不能只模仿,更要識別復雜環境,理解「為什么做」的任務意圖,再轉化為「動手這么做」的連貫操作。

      人類的行動,一般都依托于上下文和意圖,核心就在于推理。對機器人而言,盡管大規?;ヂ摼W數據讓GPT、DeepSeek等AI具備了不錯的推理能力,但讓AI在真實物理世界里通過推理“準確動起來”,特別是處理多步驟長時序任務、模糊指令、未見過情景時,依然挑戰重重。

      主流視覺-語言-動作VLA模型依賴"軌跡記憶",通過海量數據學習"看到A+聽到B→做C"的映射。這種方式在標準場景表現尚可,但在開放環境中會暴露三大缺陷:抽象概念失效,比如理解"可樂",卻不懂什么是"補充能量的飲料";環境泛化困難,如白桌訓練、到木桌失效;長時序任務崩潰,比如微波爐加熱需多步連貫操作,一步出錯則全盤皆輸。

      AI機器人公司星塵智能提出端到端全身VLA模型——Lumo-1,旨在讓機器人心手合一,想清楚就干活,借助具身化VLM、跨本體聯合訓練、推理-動作真機訓練、以及強化學習校準對齊等方式,配合繩驅機器人S1的高質量真機訓練,將大模型“心智”轉化為全身到手的絲滑操作。

      項目頁面:www.astribot.com/research/Lumo1

      技術報告:https://arxiv.org/pdf/2512.08580


      Lumo-1展現了強大的操作智能與泛化能力,在多步驟長時序、精細靈巧操作、可泛化抓取放置等三大類核心操作任務中,全部超越了π0、π0.5等先進模型,尤其在未見過的物體、場景和指令等分布外情況(Out of Distribution,簡稱OOD),以及抽象、模糊、需擴展推理的指令中,優勢更為明顯。

      從"背菜譜"到"懂烹飪"

      人類執行復雜任務時不只是調用"動作庫",而是實時進行多層次推理——理解抽象語義、拆解子任務、感知空間關系、規劃運動路徑。讓機器人像人一樣推理,就更能像人一樣行動。

      "教會機器人思考推理,與喂飽它數據一樣重要。Lumo-1的三階段訓練架構:從具身化VLM,到跨本體聯合訓練,再到推理-動作真機訓練,最后用強化學習實現推理與動作的校準與對齊。

      如同從"背誦菜譜"到"理解烹飪原理",機器人開始擁有了"做決定"的能力。

      Lumo-1展現了強大的操作智能與泛化能力,在多步驟長時序、精細靈巧操作、可泛化抓取放置等三大類核心機器人任務中,全部超越了π0、π0.5等先進模型,尤其在未見過的物體、場景和指令等分布外情況(Out of Distribution,簡稱OOD),以及抽象、模糊、需擴展推理的指令中,優勢更為明顯。


      通用抓取放置測試結果


      長時序與靈巧操作任務對比結果

      三階訓練 VLM認知轉化為VLA智能

      Lumo-1 的訓練不是堆規模,而是精心設計的「智力遷移」過程。

      階段 1:具身化 VLM(Embodied VLM)。在精選的視覺-語言數據上持續預訓練,讓模型具備空間理解、規劃、軌跡推斷等「具身語義」。在 7 個經典具身推理基準中大部分超過 RoboBrain-7B、Robix-7B 等專用模型。


      精選數據集旨在不損傷預訓練VLM的通用多模態理解與推理能力前提下,強化核心具身推理能力。

      階段 2:跨本體聯合訓練。融合跨機器人、多視角軌跡、VLM數據上聯合訓練,強化了指令跟隨、物體定位與空間推理能力,使模型開始理解「動作是什么,與指令和觀測是什么關系」。

      階段 3:真機推理-動作訓練(S1軌跡)。利用繩驅機器人 Astribot S1 高度仿人的示教軌跡,進行帶推理過程的動作訓練,讓模型習得真實世界可執行的動作模式,比如:怎么用雙手協同處理物體、如何執行長序列操作、如何將推理一步步落實為軌跡等。


      Astribot S1機器人上收集的樣本任務。這些任務涵蓋了廣泛的日?;顒樱杉圆煌奈矬w、光照條件及環境場景。每項任務均涉及復雜、長時序行為,可自然分解為多個子任務,包含多樣化的基礎動作單元,例如清掃、削皮、傾倒、刷洗、折疊、按壓和旋轉等

      最后加入強化學習推理-行動對齊(RL Alignment),校準對齊高級推理與低級動作之間的誤差,設計了視覺、動作與推理一致、動作執行、推理格式等多維度的獎勵信號,通過基于GRPO的學習方案鼓勵模型選擇更準確、連貫、符合物理規則的動作。實驗表明,該方案使模型在任務成功率、動作合理性與泛化能力上顯著超越模仿專家示范的原始表現。

      三大技術拆解:層層遞進的"推理-動作"引擎

      動作空間建模:從"高頻噪聲"到"關鍵路徑"

      在 Lumo-1 里,通過動作空間建模SAT(Spatial Action Tokenizer),機器人將動作軌跡轉化為可復用、組合的「動作單詞庫」,能像寫句子一樣組合動作,或者復用、解釋和預測動作。技術上,SAT將連續動作軌跡壓縮成最短路徑點,并把旋轉/平移的增量動作聚類成緊湊token等,在保持動作空間意義時,減少數據收集引入的無關噪音,比FAST與分桶方法等更緊湊和穩定。


      結構化推理:讓機器人擁有"常識與思考能力"

      Lumo-1將推理拆解為兩個維度:文字推理與視覺推理。

      模型進行多種形式的具身文本推理:

      (1)抽象概念推理整合視覺觀測和指令以推斷隱含語義("低熱量"→排除可樂);

      (2)子任務推理旨在推斷到達最終目標的最優中間步驟(微波爐加熱→開門→取物→放入→關門→旋鈕→取出);

      (3)視覺觀測描述強調對顯著場景特征和可操作物體的準確識別和分析;

      (4)運動推理包括對夾爪空間關系的文字推斷,以及運動方向的闡述。

      然后再進一步執行視覺推理,以實現基于感知的推斷和運動估計。

      通過結構化推理(Structured Reasoning),機器人大腦不再死記軌跡,而是形成解釋動作的結構化推理鏈,從執行動作到「執行想法」,使「為什么這樣做」先于「怎么做」。最終,它把視覺理解映射為路徑點預測,讓 2D 預測自然落到 3D 控制上,實現更有目的性、情境化的動作生成。

      在S1真機部署中,這種能力展現得淋漓盡致。讓機器人"把代表愛情的花放進花瓶",S1能理解玫瑰代表的文化隱喻;當指令換成"把KFC里的東西放進藍色容器",它能推理出炸雞、漢堡等關聯物品。在"把畫海洋的工具放進綠盤子"這種任務中,S1也能準確找到藍色的畫筆。


      把可以畫海洋的文具放到綠盤子里

      強化學習推理-行動對齊(RL Alignment)

      推理很強 ≠ 執行一定成功。Lumo-1 在最后加入強化學習推理-行動對齊(RL Alignment),校準對齊高級推理與低級動作之間的誤差,在真實軌跡中反饋迭代,通過視覺、動作與推理一致、動作執行、推理格式等多維度GRPO風格獎勵信號,鼓勵模型選擇更準確、連貫、符合物理規則的動作。

      成果與影響

      Scaling Law驗證

      團隊采用數據受限擴展定律驗證訓練策略。結果顯示:在固定模型規模下,數據多樣性(場景、物體、指令的覆蓋面)對泛化能力的影響遠超數據重復次數。這為行業指明方向——除了堆數據量,也可以抓數據質量。

      技術成果:全面超越主流基線

      Lumo-1在7個多模態基準測試中的6個優于backbone模型Qwen2.5-VL-7B,并超越專門的具身模型RoboBrain-7B和Robix-7B。更關鍵的是,融入動作學習后,模型的核心多模態感知和推理能力未受損——這證明"推理"與"動作"并非零和博弈。

      在真實環境驗證中,S1展現出驚人的泛化能力:面對不同高度的容器,自動調整手臂姿態;菜單從印刷體換成手寫體,仍能精準識別食材配對(腸仔意面、胡蘿卜牛腩等)。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      好利來大公子穿女裝惹爭議!自稱是妹妹點贊網友評論,承認變女人

      好利來大公子穿女裝惹爭議!自稱是妹妹點贊網友評論,承認變女人

      萌神木木
      2025-12-16 15:56:34
      重大進展!我國自主研制,突破萬米大關!

      重大進展!我國自主研制,突破萬米大關!

      環球網資訊
      2025-12-17 09:17:03
      朱孝天批F4歌不符音樂審美 張震岳喊他「脫隊F1」中肯駁:很好聽

      朱孝天批F4歌不符音樂審美 張震岳喊他「脫隊F1」中肯駁:很好聽

      ETtoday星光云
      2025-12-17 10:10:04
      霉霉發13.9億獎金!伴舞500萬,卡車司機70萬,難怪張韶涵被挖人

      霉霉發13.9億獎金!伴舞500萬,卡車司機70萬,難怪張韶涵被挖人

      鋭娛之樂
      2025-12-16 20:35:07
      霉霉發近2億獎金,團隊當場哭成一片,全網打工人破防

      霉霉發近2億獎金,團隊當場哭成一片,全網打工人破防

      胡嚴亂語
      2025-12-15 15:48:25
      2020年,孫小果被執行死刑,母親為救他搭進去20年刑期,圖什么?

      2020年,孫小果被執行死刑,母親為救他搭進去20年刑期,圖什么?

      詩意世界
      2025-12-16 11:00:03
      雷霆12.4%概率抽到狀元簽!未來新星三選一?模板麥迪羅伊霍福德

      雷霆12.4%概率抽到狀元簽!未來新星三選一?模板麥迪羅伊霍福德

      羅說NBA
      2025-12-16 20:16:49
      女高中生憑顏值火出圈,評論區沸騰:妥妥的985長相

      女高中生憑顏值火出圈,評論區沸騰:妥妥的985長相

      蝴蝶花雨話教育
      2025-12-13 08:53:20
      追討工程款!一建工公司新增14項訴訟,合計金額超8億元,被告方含地方政府機構、大學、醫院等

      追討工程款!一建工公司新增14項訴訟,合計金額超8億元,被告方含地方政府機構、大學、醫院等

      每日經濟新聞
      2025-12-17 01:05:07
      CCTV直播!中國男足vs伊拉克,U23亞洲杯首輪盼爆冷,出線=創歷史

      CCTV直播!中國男足vs伊拉克,U23亞洲杯首輪盼爆冷,出線=創歷史

      大秦壁虎白話體育
      2025-12-17 09:17:15
      朱芳雨賭對了!CBA“新中鋒”打服杜鋒,加盟廣東隊成定局!

      朱芳雨賭對了!CBA“新中鋒”打服杜鋒,加盟廣東隊成定局!

      緋雨兒
      2025-12-17 11:53:33
      姚明攜15歲女兒姚沁蕾亮相,1米9的女兒身高出眾,一口流利英語為爸爸擔任現場翻譯

      姚明攜15歲女兒姚沁蕾亮相,1米9的女兒身高出眾,一口流利英語為爸爸擔任現場翻譯

      極目新聞
      2025-12-16 07:52:39
      貴州省貴陽市委原常委、宣傳部部長黃成虹被“雙開”

      貴州省貴陽市委原常委、宣傳部部長黃成虹被“雙開”

      界面新聞
      2025-12-17 10:35:49
      僅得13+3+6!哈登又不聽我的,泰倫盧說出心里話,他也認清現實了

      僅得13+3+6!哈登又不聽我的,泰倫盧說出心里話,他也認清現實了

      巴叔GO聊體育
      2025-12-17 12:41:29
      48年蔣介石得知遼沈戰役落敗后,立即下令處決謝士炎,這是為何?

      48年蔣介石得知遼沈戰役落敗后,立即下令處決謝士炎,這是為何?

      醉飲前山
      2024-11-22 10:05:49
      杭州小米交付中心車禍!事件經過曝光,有網友稱是自己堂弟沒了…

      杭州小米交付中心車禍!事件經過曝光,有網友稱是自己堂弟沒了…

      火山詩話
      2025-12-16 05:54:57
      開拓者官宣下放楊瀚森!隊記稱最大短板是對抗:需要簡化進攻動作

      開拓者官宣下放楊瀚森!隊記稱最大短板是對抗:需要簡化進攻動作

      羅說NBA
      2025-12-17 06:21:34
      韓國總統李在明著大明官服參拜明太祖朱元璋,行三跪九叩大禮

      韓國總統李在明著大明官服參拜明太祖朱元璋,行三跪九叩大禮

      環球熱點快評
      2025-12-17 00:05:12
      最能騙的上市公司,被姐弟倆5年掏空了

      最能騙的上市公司,被姐弟倆5年掏空了

      大貓財經Pro
      2025-12-16 18:29:58
      女教師跳樓越扒越寒心!同事曝猛料,在辦公室早有暗示,細節扎心

      女教師跳樓越扒越寒心!同事曝猛料,在辦公室早有暗示,細節扎心

      知法而形
      2025-12-16 09:44:35
      2025-12-17 14:08:49
      雷峰網 incentive-icons
      雷峰網
      關注智能與未來!
      68090文章數 656009關注度
      往期回顧 全部

      科技要聞

      無人駕駛邁關鍵一步 特斯拉股價觸歷史新高

      頭條要聞

      獨居女子去世遺產被收歸國有 遠親想幫買墓安葬遇難題

      頭條要聞

      獨居女子去世遺產被收歸國有 遠親想幫買墓安葬遇難題

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      鞠婧祎收入曝光,絲芭稱已支付1.3億

      財經要聞

      "祥源系"爆雷 有投資者數百萬元無法提現

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      房產
      親子
      教育
      公開課
      軍事航空

      房產要聞

      封關前夜!海南綠發20億拿下三亞重磅宅地!

      親子要聞

      8個多月的梅朵已經不愛喝奶粉,更喜歡吃糌粑這些輔食,會太早嗎

      教育要聞

      重磅!深圳這所公辦新校與北京十一學校合作辦學!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      最新現場:山東艦完成年度最后一次海上訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩内射美女人妻一区二区三区| 亚洲无码网| 在线视频91| 18无码粉嫩小泬无套在线观看| 欧美xxxxx高潮喷水| 亚洲高清aⅴ日本欧美视频| 99精品国产一区二区三区不卡| 亚洲色频| 新巴尔虎右旗| 亚洲中文字幕无码永久在线| 闺蜜张开腿让我爽了一夜| 毛片网站在线观看| 人妻?制服?丝袜| 人妻色综合| 强奷乱码中文字幕| 91少妇| 91乱子伦国产乱子伦海的味道| 婷婷色av| 国产午夜亚洲精品不卡| 肉大捧一进一出免费视频| 中文一区二区视频| 国产制服丝袜在线播放| 精品日韩人妻| 波多野结衣网站| 91精品91久久久久久| 欧美第3页| 久久99精品久久久久婷婷| 暖暖 在线 日本 免费 中文| 2020精品自拍视频曝光| 91福利姬| 久久天天躁狠狠躁夜夜不卡公司| 中文字幕熟妇人妻在线视频| 国产精品美女黑丝流水| 日本精品极品视频在线| 日韩中文字幕免费在线观看| 丝袜人妖av在线一区二区 | 亚洲天堂免费观看| 亚洲123| 国产又色又爽又黄的网站免费| 亚洲激情一区二区三区在线| 成人精品免费视频在线观看|