新刊速覽：具身智能在跨域無人系統(tǒng)的應(yīng)用專題 | 2025年第20期

2025-12-09 17:08:49　來源: 科技導(dǎo)報

北京舉報

分享至

隨著人工智能技術(shù)的快速發(fā)展，具身智能無人系統(tǒng)逐漸成為研究熱點。具身智能強調(diào)智能體通過與環(huán)境的交互來實現(xiàn)智能行為，而無人系統(tǒng)則擺脫了人類直接操控的限制，能夠自主完成任務(wù)。

《科技導(dǎo)報》2025年第20期推出了“具身智能在跨域無人系統(tǒng)的應(yīng)用專題”。本專題聚焦“具身智能在無人系統(tǒng)中的應(yīng)用”，系統(tǒng)探討視覺-語言-動作（VLA）模型、社會感知智能、無人船自主導(dǎo)航及人形機器人行走規(guī)劃等前沿方向；揭示了“感知-認知-行動”一體化閉環(huán)在實現(xiàn)無人系統(tǒng)自主決策、環(huán)境適應(yīng)與協(xié)同作業(yè)中的核心作用，涵蓋了從多模態(tài)語義理解、社會規(guī)則嵌入，到復(fù)雜地形步態(tài)生成、動態(tài)擾動恢復(fù)等關(guān)鍵技術(shù)突破；展示了具身智能在自動駕駛、水上無人艇、低空無人機等跨域場景中的實踐進展，為構(gòu)建具備更高智能性、可信性與協(xié)同能力的新一代無人系統(tǒng)提供了理論支撐與技術(shù)路徑。

卷首語

人工智能大模型推動具身智能無人系統(tǒng)發(fā)展

作者：王耀南

作者信息：機器人技術(shù)與智能控制專家，中國工程院院士，中國圖象圖形學(xué)學(xué)會理事長。現(xiàn)任湖南大學(xué)機器人視覺感知與控制技術(shù)國家工程研究中心主任。研究方向為智能機器人感知與控制技術(shù)及工程應(yīng)用。

摘要：人工智能大模型的出現(xiàn)，為具身智能無人系統(tǒng)的發(fā)展注入了強大動力。大模型具有強大的學(xué)習(xí)能力和泛化能力，能夠處理復(fù)雜的多模態(tài)數(shù)據(jù)，為無人系統(tǒng)的感知、決策和控制提供更高效、更智能的解決方案。

科技新聞

前沿動態(tài)

未來諾貝爾物理學(xué)獎的中國方向
中國學(xué)者推動分子結(jié)構(gòu)化學(xué)從1邁向100
“從礦到磁”的中國稀土體系與美國的重建之路
半導(dǎo)體單光子探測器體積更小、噪聲更低
病毒竟變身植物進化加速器
光“手術(shù)刀”切開生命微觀世界
二維-硅基混合架構(gòu)閃存芯片刷新存儲速率
富碘界面自動填充固態(tài)鋰電池表面裂縫
歐盟發(fā)布2項戰(zhàn)略加快人工智能應(yīng)用

卓越亮點

中國“朱雀基地”打造地外居住新范式
追蹤大氣中的“隱形鐵”：氣溶膠中的可溶性鐵

深度報道

長壽密碼：環(huán)狀GMP-AMP合成酶
光撥動“隱藏的秩序”

科技評論

人工智能到底是一門什么學(xué)問?

作者：李國杰

中國科學(xué)院計算技術(shù)研究所

摘要：人工智能作為一門發(fā)展近 80 年的學(xué)問，其發(fā)展過程中邊界持續(xù)擴大、研究方向不斷豐富，學(xué)界對其學(xué)科屬性、研究核心等問題仍存爭議。對人工智能的學(xué)科屬性進行了系統(tǒng)分析，剖析了人工智能的學(xué)科定位，分析了人工智能可以像人一樣思考、像人一樣行動、理性地思考和理性地行動這 4 個核心目標，指出了人工智能是一種方法而不僅是模擬人類，是求解復(fù)雜問題的新范式，人工智能已超越傳統(tǒng)計算機科學(xué)分支的范疇。強調(diào)了人工智能是科學(xué)技術(shù)的“元級探索方法”，目前仍處于“前范式科學(xué)”階段。

本刊專稿

光驅(qū)動微納馬達的機理及應(yīng)用

作者：陳剛1,2，劉云龍1，張冰洋

1. 鄭州輕工業(yè)大學(xué)能源與動力工程學(xué)院

2. 河南省能源高效轉(zhuǎn)化與利用國際聯(lián)合實驗室

摘要：近年來，光驅(qū)動微納馬達作為一種新興的微型動力裝置，因其能量輸入可調(diào)、開關(guān)狀態(tài)可逆且可遠程操控等優(yōu)勢，在水環(huán)境處理、生物醫(yī)療以及生物傳感等領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。梳理了光驅(qū)動微納馬達在材料設(shè)計、光能利用與驅(qū)動控制等方面的研究進展，重點分析了基于光熱效應(yīng)、光致異構(gòu)化以及光催化分解等不同機制的驅(qū)動機理，并列舉了分別利用紫外光、可見光與近紅外光驅(qū)動的微納馬達的獨特優(yōu)勢及其典型應(yīng)用。同時，該類馬達在實際應(yīng)用中仍面臨光能轉(zhuǎn)換效率較低、運動控制精度不足以及材料生物相容性和穩(wěn)定性不佳等問題。未來研究應(yīng)致力于提升光能轉(zhuǎn)換效率、開發(fā)高生物相容性材料、優(yōu)化運動控制策略，并探索多源驅(qū)動方式與多功能集成化設(shè)計，從而推動光驅(qū)動微納馬達性能的全面提升與應(yīng)用范圍的進一步擴展。

特色專題：具身智能在跨域無人系統(tǒng)的應(yīng)用

面向無人系統(tǒng)的具身社會感知智能：流程與框架

作者：范麗麗1，史光宇2，陳愷舸1，李創(chuàng)3，曾昌賢4，鄧方1

1. 北京理工大學(xué)人工智能學(xué)院

2. 北京理工大學(xué)（珠海）人工智能學(xué)院

3. 中國人民解放軍軍事科學(xué)院軍事智能研究院

4. 重慶大學(xué)機械與運載工程學(xué)院

摘要：自主智能無人系統(tǒng)在動態(tài)復(fù)雜、多主體耦合、信息不完備且社會約束強的真實開放環(huán)境中運行時，面臨合規(guī)性建模不足、社會風(fēng)險感知受限、協(xié)同沖突突出及異常響應(yīng)滯后等關(guān)鍵挑戰(zhàn)。為此，提出一種具身社會感知智能框架，該框架將具身感知（本體、內(nèi)部、外部、交互和意圖）與社會雷達融合，并引入代理式人工智能（Agentic AI）作為頂層決策與控制機制，實現(xiàn)多層級、自主化的認知決策。整體采用感知、推理、執(zhí)行、反饋與元控制 5 層結(jié)構(gòu)，實現(xiàn)從多模態(tài)感知到合規(guī)行為生成的動態(tài)閉環(huán)。通過融合物理與社會環(huán)境信息，該框架顯著提升了自主智能無人系統(tǒng)在城市治理、應(yīng)急救援和社會安全等復(fù)雜不確定場景中的任務(wù)適應(yīng)性、群體協(xié)同效率與合規(guī)可靠性，為實現(xiàn)可信賴、可解釋、可持續(xù)的自主智能系統(tǒng)提供新的技術(shù)路徑。

VLA架構(gòu)下的智能體演化：從機理建構(gòu)到應(yīng)用拓展

作者：張慧1，謝東錦2，梁姝彤1，李明軒1，賈曉豐3*，田永林4，馬思吉5，李浩然4，李浥東1

1. 北京交通大學(xué)計算機科學(xué)與技術(shù)學(xué)院

2. 新疆大學(xué)軟件學(xué)院

3. 北京市大數(shù)據(jù)中心

4. 中國科學(xué)院自動化研究所

5. 澳門科技大學(xué)創(chuàng)新工程學(xué)院

摘要：具身智能作為人工智能發(fā)展的新階段，正在實現(xiàn)從“感知?認知”到“感知?認知?行動”一體化的躍遷。視覺?語言?動作（vision?language?action，VLA）模型通過統(tǒng)一視覺感知、語言理解與動作生成，為智能體在真實世界中的自主操作提供了關(guān)鍵技術(shù)路徑。系統(tǒng)梳理了 VLA 技術(shù)的發(fā)展脈絡(luò)與典型成果，總結(jié)了其架構(gòu)范式，包括多模態(tài)感知輸入、語義融合機制、強化與模仿學(xué)習(xí)、世界模型和多層次動作輸出。結(jié)合自動駕駛、人機交互和工業(yè)裝備等應(yīng)用場景，進一步分析了 VLA 發(fā)展面臨的核心挑戰(zhàn)，包括數(shù)據(jù)資源匱乏、泛化與遷移能力不足、可解釋性與算力壓力等，并展望了未來趨勢。

“物?人?場”交互視域下的數(shù)字孿生技術(shù)研究進展

作者：游佳莉1，鄧佳文1*，焦子韻1，羅阿理2，宋軼晗2，邱波3，任福繼1*

1. 電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院

2. 中國科學(xué)院國家天文臺

3. 北京科技大學(xué)智能科學(xué)與技術(shù)學(xué)院

摘要：隨著新一代信息技術(shù)的融合創(chuàng)新，數(shù)字孿生（digital twin，DT）技術(shù)作為推動數(shù)字化轉(zhuǎn)型與智能系統(tǒng)演進的關(guān)鍵支撐，已廣泛應(yīng)用于工業(yè)制造、智慧城市、智能交通等領(lǐng)域。然而，現(xiàn)有研究主要聚焦于“物”的建模和分析，較少系統(tǒng)整合“人”和“環(huán)境”因素，難以滿足復(fù)雜智能系統(tǒng)對多層次、全方位交互的發(fā)展需求。鑒于此，引入“物?人?場”交互視域，從智能物理實體（物）、智能個體（人）以及虛實融合環(huán)境（場）3 大核心維度，全面且系統(tǒng)地剖析數(shù)字孿生技術(shù)的研究前沿與進展。首先，分析以“物”為核心的傳統(tǒng)數(shù)字孿生技術(shù)體系，重點介紹其理論起源、框架及應(yīng)用等。其次，探討 AI（人工智能）驅(qū)動下的數(shù)字人定義、發(fā)展脈絡(luò)、國家政策和核心技術(shù)等。最后，將視野拓展至“場”的維度，探究元宇宙多元場景中“場”的應(yīng)用實踐，深入研討“物”“人”和“場”3 個元素的深度融合交互機制，揭示三者如何相互作用、相互促進，為元宇宙的構(gòu)建提供支撐。進一步，圍繞“物?人?場”面臨的關(guān)鍵挑戰(zhàn)，提出 3 方面研究建議：（1）構(gòu)建智能化且具備多層架構(gòu)的數(shù)據(jù)融合框架；（2）研究 AIGC（生成式人工智能）賦能的智能虛實映射與虛擬原生進化；（3）構(gòu)建新的虛擬經(jīng)濟與智能化治理體系。研究成果為構(gòu)建具備多主體協(xié)同感知、多模態(tài)智能交互與虛實融合閉環(huán)反饋的新型數(shù)字孿生系統(tǒng)提供了理論基礎(chǔ)與實踐啟示。

無人船系統(tǒng)中的具身智能：關(guān)鍵技術(shù)與發(fā)展

作者：范麗媛1，王兆杰1*，楊戰(zhàn)2，劉鵬1，吳笑風(fēng)1

1. 中國艦船研究院

2. 北京理工大學(xué)人工智能學(xué)院

摘要：無人船系統(tǒng)的智能化正從遠程操控向具身自主形態(tài)深刻變革，其核心在于通過多模態(tài)感知、環(huán)境交互與閉環(huán)學(xué)習(xí)實現(xiàn)高級智能行為。梳理了具身智能在無人船上的關(guān)鍵進展，指出語義控制閉環(huán)、數(shù)字孿生驗證與評測體系正從方法探索走向工程集成，并已在港池與內(nèi)河等場景形成初步應(yīng)用支撐。然而，當(dāng)前技術(shù)在感知穩(wěn)定性、規(guī)則可解釋性及落地資源等方面仍存在瓶頸。為此，建議從強化自主閉環(huán)智能體系、構(gòu)建標準可信驗證環(huán)境、推進輕量化與協(xié)同部署等方向重點突破，以提升系統(tǒng)的可靠性、合規(guī)性和規(guī)模應(yīng)用能力，為中國智能船舶技術(shù)與海洋戰(zhàn)略實施提供支撐。

非結(jié)構(gòu)化環(huán)境下人形機器人行走規(guī)劃與控制

作者：曹屹峰1，何俊鵬2，李炳賢1，范麗麗3，田永林4，文偉松1，曹東璞5*

1. 香港理工大學(xué)航空及民航工程學(xué)系

2. 滑鐵盧大學(xué)電子與計算機學(xué)院

3. 北京理工大學(xué)人工智能學(xué)院

4. 中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室

5. 清華大學(xué)智能綠色車輛與交通全國重點實驗室

摘要：人形機器人因具有人體相似的形態(tài)與運動能力，被廣泛認為是未來服務(wù)、救援與工業(yè)應(yīng)用的潛在核心裝備，但在非結(jié)構(gòu)化環(huán)境中實現(xiàn)穩(wěn)定可靠的行走仍具有顯著挑戰(zhàn)。綜述了近年來在人形機器人行走規(guī)劃與控制方面的研究進展，重點涵蓋步態(tài)規(guī)劃、軌跡生成、全身控制及學(xué)習(xí)驅(qū)動方法等方向。系統(tǒng)梳理了典型方法的核心思想與實現(xiàn)框架，對其適用場景、優(yōu)勢與局限進行比較分析，并根據(jù)規(guī)劃與控制層級對現(xiàn)有研究進行分類總結(jié)。此外，討論了提升環(huán)境適應(yīng)性與動態(tài)穩(wěn)定性的關(guān)鍵技術(shù)瓶頸，展望了未來在多模態(tài)感知融合、學(xué)習(xí)與控制協(xié)同優(yōu)化、全身運動技能學(xué)習(xí)及安全性保障等方面的發(fā)展趨勢，并對相關(guān)技術(shù)的標準化與大規(guī)模應(yīng)用提出了建議。

研究論文

面向高速移動通信的多普勒頻移在線智能預(yù)測方法

作者：白新哲，于周源，胡小玲*，劉晨熙，彭木根

北京郵電大學(xué)信息與通信工程學(xué)院

摘要：隨著高速交通網(wǎng)絡(luò)的快速發(fā)展以及第 6 代移動通信技術(shù)的持續(xù)推進，高速移動場景下的用戶通信需求急劇增長。然而，用戶高速移動帶來的高多普勒頻移將導(dǎo)致信道快速時變，嚴重降低了通信的可靠性和傳輸質(zhì)量。針對該挑戰(zhàn)，提出結(jié)合通感一體化技術(shù)，基站在和高速用戶通信的同時，接收回波信號以預(yù)測多普勒頻移，并對多普勒頻移進行預(yù)先補償，從而降低接收端通信信號處理復(fù)雜度并提升通信質(zhì)量。針對高速移動場景下的正交頻分復(fù)用（orthogonal frequency division multiplexing，OFDM）通感一體化系統(tǒng)，提出了一種基于長短期記憶網(wǎng)絡(luò)（long short?term memory，LSTM）模型的在線多普勒頻移智能預(yù)測方法，該方法基站根據(jù)接收回波信號，估計當(dāng)前多普勒頻移，并利用 LSTM 模型實時預(yù)測下一時刻的頻移。為適應(yīng)動態(tài)環(huán)境，所提模型采用在線更新策略，在每次接收回波并估計得到新的多普勒頻移數(shù)據(jù)后實時更新 LSTM 模型參數(shù)。為評估模型性能，將 LSTM 預(yù)測結(jié)果與無跡卡爾曼濾波（unscented Kalman filter，UKF）模型及 Transformer 模型進行對比，分析其在不同移動速度和信噪比條件下的預(yù)測精度。仿真結(jié)果表明，所提 LSTM 在線預(yù)測模型對非線性多普勒頻移預(yù)測的準確性和魯棒性均優(yōu)于 UKF 模型和 Transformer 模型，為高動態(tài)通信環(huán)境下的頻移在線預(yù)測提供了高效可靠的解決方案。

中文版吞咽生命質(zhì)量量表在認知功能障礙患者中信度和效度研究

作者：王懿萱1，喬雨晨1，楊昆1，陳哲2，唐毅1*，秦琪1*

1. 首都醫(yī)科大學(xué)宣武醫(yī)院神經(jīng)疾病高創(chuàng)中心神經(jīng)內(nèi)科，國家神經(jīng)疾病醫(yī)學(xué)中心

2. 日照市中醫(yī)醫(yī)院腦病科

摘要：吞咽障礙在認知功能障礙患者中發(fā)生率高，并對其生存質(zhì)量造成嚴重影響。吞咽生命質(zhì)量（swallowing quality of life，SWAL?QOL）量表作為國際廣泛應(yīng)用的吞咽功能及相關(guān)生活質(zhì)量的評估工具，既往研究將認知障礙人群排除在適用對象之外。本研究系統(tǒng)性驗證中文版 SWAL?QOL 量表在輕—中度認知功能障礙患者中的適用性。研究納入 122 名輕—中度認知功能障礙患者，對受試患者的量表結(jié)果測量者間重側(cè)信度、同質(zhì)性信度、內(nèi)容效度及結(jié)構(gòu)效度進行探究。結(jié)果表示，該量表各維度測量者間信度系數(shù)（“食物選擇”維度除外）均高于 0.8，整體內(nèi)部一致性 Cronbach's α 值達到 0.971；結(jié)構(gòu)效度分析該量表與洼田飲水試驗（WST）、吞咽功能評估（EAT?10）量表等吞咽功能評估工具呈顯著相關(guān)，并提取出“心理社會功能”“營養(yǎng)攝入模式”和“生理功能調(diào)節(jié)”3 個公因子（累計方差貢獻率 72.742%），揭示吞咽障礙對患者心理、生理及社會功能的多維度影響。研究表明，中文版 SWAL?QOL 量表可作為輕—中度認知功能障礙患者吞咽相關(guān)生活質(zhì)量的可靠評估工具，為制定個體化干預(yù)策略以及提升患者生活質(zhì)量提供了理論支持。

政策建議

納米生物材料前沿進展與未來挑戰(zhàn)

作者：彭鄒君1,2，吳愛國1,2*

1. 中國科學(xué)院寧波材料技術(shù)與工程研究所先進診療材料與技術(shù)實驗室

2. 寧波慈溪生物醫(yī)學(xué)工程研究所

摘要：納米生物材料領(lǐng)域作為 21 世紀生物醫(yī)藥領(lǐng)域的戰(zhàn)略性科技領(lǐng)域，正深刻重塑疾病診療范式并驅(qū)動全球科技競爭格局變革。梳理了中國納米生物材料領(lǐng)域在產(chǎn)學(xué)研方面的發(fā)展現(xiàn)狀與戰(zhàn)略挑戰(zhàn)，通過對比揭示中國在生物醫(yī)用涂層材料、上轉(zhuǎn)換成像探針材料及納米酶等部分細分領(lǐng)域的領(lǐng)跑優(yōu)勢，同時指出當(dāng)前存在基礎(chǔ)研究與應(yīng)用脫節(jié)、跨學(xué)科協(xié)作壁壘、監(jiān)管與產(chǎn)業(yè)適配失衡等結(jié)構(gòu)性矛盾。在新型舉國體制框架下，通過借鑒成熟行業(yè)的技術(shù)躍遷經(jīng)驗，推演出中國納米生物材料領(lǐng)域可能的三階段演進軌跡，即從技術(shù)攻堅期的工藝突破，到產(chǎn)業(yè)擴張期的標準主導(dǎo)，最終實現(xiàn)全球引領(lǐng)期的范式革新。建議通過“臨床需求反向驅(qū)動”研發(fā)模式、千億級產(chǎn)業(yè)基金布局及國際標準突圍策略，中國有望構(gòu)建以納米生物材料驅(qū)動的“技術(shù)?產(chǎn)業(yè)?治理”三位一體中國方案的生物經(jīng)濟模式，為高水平科技自立自強提供實踐范本。

科技人文

讓中國碗盛滿中國糧——李振聲的農(nóng)業(yè)科技自強之路

作者：高文靜1，王以芳1，孟令耘1*，王傳超2

1. 中國科協(xié)科學(xué)技術(shù)傳播中心

2. 北京科技大學(xué)科技史與文化遺產(chǎn)研究院

摘要：李振聲是我國著名的小麥遺傳育種學(xué)家。通過回顧李振聲的學(xué)術(shù)成長歷程，梳理了其學(xué)術(shù)貢獻和科學(xué)精神，描繪了他作為戰(zhàn)略科學(xué)家所走出的農(nóng)業(yè)科技自強之路。他的科研生涯不僅濃縮了中華民族“以農(nóng)立國”到“科技強農(nóng)”的奮斗歷程，更是科學(xué)家精神的生動體現(xiàn)。李振聲少年時期經(jīng)歷饑荒，立下“讓國人吃飽飯”的志向，將傳統(tǒng)“農(nóng)為邦本”思想轉(zhuǎn)化為科研動力；他創(chuàng)新應(yīng)用染色體工程育種技術(shù)，攻克遠緣雜交世界難題，將育種周期從幾十年縮短至 3 年，奠定中國種業(yè)科技自立根基；他努力帶領(lǐng)青年科學(xué)家“把論文寫在麥田里”，使其團隊接力的“濱海草帶”計劃成為鹽堿地治理先鋒。

內(nèi)容為【科技導(dǎo)報】公眾號原創(chuàng)，歡迎轉(zhuǎn)載

白名單回復(fù)后臺「轉(zhuǎn)載」

《科技導(dǎo)報》創(chuàng)刊于1980年，中國科協(xié)學(xué)術(shù)會刊，主要刊登科學(xué)前沿和技術(shù)熱點領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評論、引領(lǐng)性的高端綜述，發(fā)表促進經(jīng)濟社會發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評論、專稿專題、綜述、論文、政策建議、科技人文等。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.