<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      機器人的手終于跟上腦子了?騰訊系創企推出端到端VLA模型

      0
      分享至


      機器人前瞻(公眾號:robot_pro)
      作者 許麗思
      編輯 漠影

      機器人前瞻12月11日報道,今天,星塵智能發布端到端全身VLA模型——Lumo-1,讓機器人心手合一,想清楚就干活,借助具身化VLM、跨本體聯合訓練、推理-動作真機訓練、以及強化學習校準對齊等方式,配合繩驅機器人S1的真機訓練,將大模型“心智”轉化為全身到手的絲滑操作。

      Lumo-1展現出較強的操作智能與泛化能力,在多步驟長時序、精細靈巧操作、可泛化抓取放置等三大類核心操作任務中,超越了π0、π0.5等先進模型,尤其在未見過的物體、場景和指令等分布外情況(Out of Distribution,簡稱OOD),以及抽象、模糊、需擴展推理的指令中,優勢明顯。


      ▲通用抓取放置測試結果


      ▲長時序與靈巧操作任務對比結果

      一、熱面包、整理文具、打包食物,讓機器人像人一樣推理、行動

      人類執行復雜任務時不只是調用“動作庫”,而是實時進行多層次推理——理解抽象語義、拆解子任務、感知空間關系、規劃運動路徑。

      從走路、跳舞到后空翻,動作模仿教會了機器人“怎么動”,而到端盤子、分揀水果、熱食物等復雜操作時,機器人不能只模仿,更要識別復雜環境,理解“為什么做”的任務意圖,再轉化為“動手這么做”的連貫操作。

      Lumo-1就賦予了機器人像人一樣推理,從而像人一樣行動的能力。

      比如,盡管沒見過這塊面包,Lumo-1可以讓機器人通過推理識別它,推理出加熱=用微波爐,以及開門、拿起、放入、關門、旋鈕、等待、取出等……無需編程,長序列全靠推理完成。


      機器人可以在混亂桌面中快速找齊文具,還能精細處理不同形狀、材質和尺寸的物品。


      在執行把可樂放進藍盤的任務時,當可樂靠近機器人左臂時,推理用左臂抓取;當人為在左臂與可樂間增加障礙物(未訓練場景),實時推理出“左臂受阻→右臂繞行成本更低”,自主切換策略。


      機器人在給玩偶配對時,能推理出不同玩偶(雪寶、米妮、三眼怪)與紙片上哪個角色(艾爾莎、米奇、巴斯光年)來自同一動畫。


      打包食物時,機器人全程快速絲滑,面對奧利奧、油條等分布外物體也能執行。


      在紙上機器人報個菜名,比如“腸仔意面”,它就能識別并挑選出對應食材。


      二、三階訓練,VLM認知轉化為VLA智能

      Lumo-1包括了三階段訓練架構:

      階段1:具身化VLM(Embodied VLM)

      在精選的視覺-語言數據上持續預訓練,讓模型具備空間理解、規劃、軌跡推斷等“具身語義”。Lumo-1在7個經典具身推理基準中大部分超過RoboBrain-7B、Robix-7B等專用模型。


      ▲精選數據集旨在不損傷預訓練VLM的通用多模態理解與推理能力前提下,強化核心具身推理能力

      階段2:跨本體聯合訓練

      融合跨機器人、多視角軌跡、VLM數據上聯合訓練,強化了指令跟隨、物體定位與空間推理能力,使模型開始理解“動作是什么,與指令和觀測是什么關系”。


      ▲Astribot S1機器人上收集的樣本任務

      階段3:真機推理-動作訓練(S1軌跡)

      利用繩驅機器人Astribot S1高度仿人的示教軌跡,進行帶推理過程的動作訓練,讓模型習得真實世界可執行的動作模式,比如:怎么用雙手協同處理物體、如何執行長序列操作、如何將推理一步步落實為軌跡等。

      最后,加入強化學習推理-行動對齊(RL Alignment),校準對齊高級推理與低級動作之間的誤差,設計了視覺、動作與推理一致、動作執行、推理格式等多維度的獎勵信號,通過基于GRPO的學習方案鼓勵模型選擇更準確、連貫、符合物理規則的動作。

      實驗表明,該方案使模型在任務成功率、動作合理性與泛化能力上顯著超越模仿專家示范的原始表現。

      三、三大技術拆解:層層遞進的“推理-動作”引擎

      1、動作空間建模:從”高頻噪聲”到”關鍵路徑”

      在Lumo-1里,通過動作空間建模SAT(Spatial Action Tokenizer),機器人將動作軌跡轉化為可復用、組合的“動作單詞庫”,能像寫句子一樣組合動作,或者復用、解釋和預測動作。

      技術上,SAT將連續動作軌跡壓縮成最短路徑點,并把旋轉/平移的增量動作聚類成緊湊token等,在保持動作空間意義時,減少數據收集引入的無關噪音,比FAST與分桶方法等更緊湊和穩定。

      2、結構化推理:讓機器人擁有“常識與思考能力”

      Lumo-1將推理拆解為兩個維度:文字推理與視覺推理。

      模型進行多種形式的具身文本推理:

      • 抽象概念推理整合視覺觀測和指令以推斷隱含語義(”低熱量”→排除可樂);
      • 子任務推理旨在推斷到達最終目標的最優中間步驟(微波爐加熱→開門→取物→放入→關門→旋鈕→取出);
      • 視覺觀測描述強調對顯著場景特征和可操作物體的準確識別和分析;
      • 運動推理包括對夾爪空間關系的文字推斷,以及運動方向的闡述。

      然后再進一步執行視覺推理,以實現基于感知的推斷和運動估計。

      通過結構化推理(Structured Reasoning),機器人大腦不再死記軌跡,而是形成解釋動作的結構化推理鏈,從執行動作到「執行想法」,使「為什么這樣做」先于「怎么做」。

      最終,它把視覺理解映射為路徑點預測,讓2D預測自然落到3D控制上,實現更有目的性、情境化的動作生成。

      在S1真機部署中,讓機器人“把代表愛情的花放進花瓶”,S1能理解玫瑰代表的文化隱喻;當指令換成”把KFC里的東西放進藍色容器”,它能推理出炸雞、漢堡等關聯物品。在“把畫海洋的工具放進綠盤子”這種任務中,S1也能準確找到藍色的畫筆。


      3、強化學習推理-行動對齊(RL Alignment)

      Lumo-1在最后加入強化學習推理-行動對齊(RL Alignment),校準對齊高級推理與低級動作之間的誤差,在真實軌跡中反饋迭代,通過視覺、動作與推理一致、動作執行、推理格式等多維度GRPO風格獎勵信號,鼓勵模型選擇更準確、連貫、符合物理規則的動作。

      四、AI模型能力提升,是機器人大規模落地的關鍵

      星塵智能團隊采用數據受限擴展定律驗證訓練策略,結果顯示:在固定模型規模下,數據多樣性(場景、物體、指令的覆蓋面)對泛化能力的影響遠超數據重復次數。這說明了,除了堆數據量,也可以抓數據質量。

      另外,Lumo-1在7個多模態基準測試中的6個優于backbone模型Qwen2.5-VL-7B,并超越專門的具身模型RoboBrain-7B和Robix-7B。更關鍵的是,融入動作學習后,模型的核心多模態感知和推理能力未受損——這證明“推理”與“動作”并非零和博弈。

      目前,AI模型能力不足是導致了機器人沒能真正大規模落地的關鍵原因。而當機器人不再只靠預設腳本,而是能夠在開放環境中理解語義、拆解任務并自主執行時,具身智能也就加快從“能動”走向“會做事”的新階段。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “性蕭條”才是這個時代真正的危機

      “性蕭條”才是這個時代真正的危機

      深藍夜讀
      2025-09-24 16:00:09
      果然是核動力,美媒斷言中國新航母:人類史上最大,2艘同時開建

      果然是核動力,美媒斷言中國新航母:人類史上最大,2艘同時開建

      軍霆說
      2026-01-11 03:02:04
      古代犯人發配需要衙役押送,往返幾千里路,衙役是不是也很遭罪?

      古代犯人發配需要衙役押送,往返幾千里路,衙役是不是也很遭罪?

      掠影后有感
      2026-01-10 13:57:42
      俄媒:美國經濟全球占比創新低

      俄媒:美國經濟全球占比創新低

      參考消息
      2026-01-11 14:26:41
      烏克蘭導彈擊毀克里米亞燃料火車!俄軍S300被打掉

      烏克蘭導彈擊毀克里米亞燃料火車!俄軍S300被打掉

      項鵬飛
      2026-01-09 20:53:01
      有哪些以為是小罪,其實是重罪,判刑很重的案例?網友:不敢了

      有哪些以為是小罪,其實是重罪,判刑很重的案例?網友:不敢了

      另子維愛讀史
      2026-01-11 19:22:33
      警惕供應鏈的物理轉移:誰來支撐年輕人的就業?

      警惕供應鏈的物理轉移:誰來支撐年輕人的就業?

      生命可以承受之輕
      2026-01-10 12:17:42
      中東國家都意識到了:就算中國高端武器再多,也沒辦法保護他們

      中東國家都意識到了:就算中國高端武器再多,也沒辦法保護他們

      肖茲探秘說
      2026-01-01 20:16:34
      如何評價康生?

      如何評價康生?

      特例的貓
      2026-01-12 07:48:10
      被大家猜中了!洗碗機的女主角起號成功,直播間人數超過3000…

      被大家猜中了!洗碗機的女主角起號成功,直播間人數超過3000…

      火山詩話
      2026-01-10 15:13:33
      笑岔氣了!果然斷句是中國人一生的宿敵,只能說中國文化博大精深

      笑岔氣了!果然斷句是中國人一生的宿敵,只能說中國文化博大精深

      夜深愛雜談
      2025-12-19 16:39:58
      特朗普對話20家美石油公司:已經虧的120億美元就算了,你不干還有25家愿意干

      特朗普對話20家美石油公司:已經虧的120億美元就算了,你不干還有25家愿意干

      紅星新聞
      2026-01-11 20:14:20
      價格腰斬!曾經的“天價神藥”,如今卻暴跌超6成,囤貨者虧慘了

      價格腰斬!曾經的“天價神藥”,如今卻暴跌超6成,囤貨者虧慘了

      觀察者海風
      2026-01-10 18:07:04
      曝許家印香港大宅挖出460平地牢,潛伏15年才被發現,是為藏啥?

      曝許家印香港大宅挖出460平地牢,潛伏15年才被發現,是為藏啥?

      小熊侃史
      2026-01-05 10:43:25
      老板大氣!蘇州一工廠給員工發年終獎,按工齡1年1000,上不封頂

      老板大氣!蘇州一工廠給員工發年終獎,按工齡1年1000,上不封頂

      火山詩話
      2026-01-12 06:54:34
      形勢危急:據稱,伊朗抗議活動的死亡人數急劇上升到500多人

      形勢危急:據稱,伊朗抗議活動的死亡人數急劇上升到500多人

      一種觀點
      2026-01-12 08:13:06
      太猛了,馬上兩倍~~

      太猛了,馬上兩倍~~

      初善投資
      2026-01-08 15:10:02
      高市開始反擊,派財務大臣造訪華盛頓,要剝奪中方一“特殊能力”

      高市開始反擊,派財務大臣造訪華盛頓,要剝奪中方一“特殊能力”

      小影的娛樂
      2026-01-12 12:13:06
      是理由嗎?名記:昨晚薩克拉門托酒店客滿,火箭只能住舊金山

      是理由嗎?名記:昨晚薩克拉門托酒店客滿,火箭只能住舊金山

      懂球帝
      2026-01-12 13:53:17
      真讓鄭麗文給做到了!藍營出現罕見一幕,但要警惕張亞中會壞事

      真讓鄭麗文給做到了!藍營出現罕見一幕,但要警惕張亞中會壞事

      特特農村生活
      2026-01-12 12:33:58
      2026-01-12 14:27:00
      機器人前瞻
      機器人前瞻
      專注于機器人報道的媒體
      300文章數 7關注度
      往期回顧 全部

      科技要聞

      小米二手車價大跳水:SU7半年跌5萬元

      頭條要聞

      臺媒:大陸在朱日和基地復制"總統府" 不可掉以輕心

      頭條要聞

      臺媒:大陸在朱日和基地復制"總統府" 不可掉以輕心

      體育要聞

      聰明的球員,不是教練教出來的

      娛樂要聞

      閆學晶:脫離群眾太久 忘了自己的根

      財經要聞

      揭秘“穩賺不賠”的代工項目騙局

      汽車要聞

      增配不加價 北京現代 第五代 勝達2026款上市

      態度原創

      手機
      旅游
      家居
      數碼
      公開課

      手機要聞

      消息稱泡泡瑪特本月推“潮玩手機”,或與“年輕化主流品牌”合作

      旅游要聞

      哈爾濱“鉆石海”浪漫賞落日

      家居要聞

      包絡石木為生 野性舒適

      數碼要聞

      2025年星閃終端產品出貨量突破1億臺 商用產品超600款

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕无码乱码人妻日韩精品| 亚洲色成人一区二区三区| 天堂资源中文| 柘荣县| 18禁男女爽爽爽午夜网站免费| 无码h| 日韩一本不卡一区二区三区| 久久精品国产只有精品96| 亚洲色成人网站www永久| 欧美激情在线播放| 69亚洲精品| 国产高清一区二区三区视频| 最新在线中文字幕| 无码日韩AV一区二区三区| 永久免费AV无码网站YY| 欧洲中文字幕国产精品| 久久婷婷五月综合色99啪| 安溪县| 中文成人在线| 日日夜干| 酒店大战丝袜高跟鞋人妻| 色色二区| 日韩精品人妻中文字幕不卡乱码| 亚洲色最新高清AV网站| 国产av剧情md精品麻豆| 三级做爰高清视频| 亚洲欧美伊人久久综合一区二区| 清纯小美女主播流白浆| 亚洲日韩在线中文字幕第一页| 97人人模人人爽人人喊网| 久久久久999| 小婕子伦流澡到高潮h| av高清| 无吗人妻一区二区| 成人亚洲| 九九re线精品视频在线观看视频 | 欧美人与动牲交A免费观看| 国产SUV精品一区二区四| 亚洲欧美日韩一区二区| 欧美日韩精品一区二区三区高清视频| 欧美黑吊大战白妞|