“把客廳收拾一下,再給客人做杯奶茶。”隨著指令下達,機器人環顧四周,識別出散落的物品。機械臂精準抓取掃帚,沿著計算好的路徑清掃地面;任務完成后,它轉向操作臺,取杯、加茶、加奶、攪拌、遞送,動作行云流水,一氣呵成。整個過程沒有人工干預,仿佛一位訓練有素的管家。
這是近日記者在天津大學深度強化學習實驗室里看到的一幕。機器人的“聰明勁”來自天津大學具身團隊自主研發的具身基座模型Embodied-R1.5。在這間實驗室里,一群年輕人正用行動讓人工智能從“會算”走向“會干”,讓實驗室里的創新成果加速落地轉化。
“大腦決策,小腦控制
該實驗室青年骨干湯宏垚副研究員告訴記者,讓機器人收拾房間、制作奶茶,聽起來不稀奇,但這背后的技術突破,并非那么簡單。
傳統的機器人只能在固定環境里按固定程序干活——工廠流水線上的機械臂,換個位置就不會動了;家里的掃地機器人,遇到障礙物常常“卡殼”。要讓機器人像人一樣靈活應對真實世界的變化,必須給它換一套“大腦”。
湯宏垚打了個比方:“我們給機器人設計了‘大腦+小腦’的分工架構。大腦是一個多模態大模型,負責理解任務意圖、感知環境、進行長時序推理和規劃。比如‘取水杯’這個指令,大腦要拆解成多個步驟,判斷哪個杯子能用、有沒有障礙物、先拿杯子還是先走過去。”
“小腦則是基于強化學習的決策控制模塊,負責具體動作的精準執行。”他解釋道,機械臂用多大力氣拿杯子、怎么拿才能穩當又不捏碎、移動過程中如何保持平衡——這些精細活,都是小腦在實時計算和調整。
該實驗室副教授馬億補充道,團隊近期的攻關重點,正是“大腦+小腦”的協同配合。“大腦決策,小腦控制,兩者配合好了,機器人在真實的居家環境里,就能自己琢磨著把活干好。”
搭載了新模型的機器人,不僅能收拾客廳、制作奶茶,還能按照指令擦花瓶、給手機充電、為客人沖咖啡、打包禮物。更關鍵的是,面對從沒見過的場景,它也能“零樣本適應”——不用提前學習,直接上手干活。
“這正是目前具身智能領域的前沿方向,也是未來家庭管家的雛形。”馬億說。
科研成果加速向產業一線延伸
走進這間實驗室,記者感受到的不僅是技術的突破,更是一種向“實”而生的氛圍。團隊的科研成果正加速向產業一線延伸。
不久前,深度強化學習實驗室憑借《基于強化學習的智能決策關鍵技術及應用》項目,榮獲2025年度中國圖象圖形學學會科技進步獎一等獎。
這一榮譽的背后,是實實在在的應用成效:在芯片設計領域,項目成果成功應用于國產芯片設計軟件的研發,支撐國內企業實現關鍵工具的自主可控;在文娛產業,技術落地于大型商業游戲,成為國內首個實現自動化測試的強化學習技術,極大提升了游戲開發和測試效率。
“我們希望能讓人工智能技術真正走進生活。”該實驗室成員、副教授鄭巖說。未來,團隊的研究成果將廣泛應用于物流倉儲、分揀運輸、自動駕駛等工業場景,也將在家居收納、公共區域衛生清掃等民生領域落地。
采訪結束時,該實驗室里的機器人仍在忙碌。它剛剛完成一杯奶茶的制作,機械臂穩穩地將杯子遞到記者面前。在它身后,一群年輕人圍在屏幕前,討論著下一次迭代的方向。
從實驗室的一行行代碼,到真實世界里的智能管家,天津大學深度強化學習實驗室的青年科研團隊將進一步聚焦具身智能關鍵核心技術攻關,讓前沿創新成果走出實驗室、走進產業一線、融入百姓生活。
來源:科技日報
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.