![]()
隨著人工智能技術(shù)的快速發(fā)展,具身智能無人系統(tǒng)逐漸成為研究熱點。具身智能強調(diào)智能體通過與環(huán)境的交互來實現(xiàn)智能行為,而無人系統(tǒng)則擺脫了人類直接操控的限制,能夠自主完成任務(wù)。
《科技導(dǎo)報》2025年第20期推出了“具身智能在跨域無人系統(tǒng)的應(yīng)用專題”。本專題聚焦“具身智能在無人系統(tǒng)中的應(yīng)用”,系統(tǒng)探討視覺-語言-動作(VLA)模型、社會感知智能、無人船自主導(dǎo)航及人形機器人行走規(guī)劃等前沿方向;揭示了“感知-認知-行動”一體化閉環(huán)在實現(xiàn)無人系統(tǒng)自主決策、環(huán)境適應(yīng)與協(xié)同作業(yè)中的核心作用,涵蓋了從多模態(tài)語義理解、社會規(guī)則嵌入,到復(fù)雜地形步態(tài)生成、動態(tài)擾動恢復(fù)等關(guān)鍵技術(shù)突破;展示了具身智能在自動駕駛、水上無人艇、低空無人機等跨域場景中的實踐進展,為構(gòu)建具備更高智能性、可信性與協(xié)同能力的新一代無人系統(tǒng)提供了理論支撐與技術(shù)路徑。
![]()
卷首語
人工智能大模型推動具身智能無人系統(tǒng)發(fā)展
作者:王耀南
作者信息:機器人技術(shù)與智能控制專家,中國工程院院士,中國圖象圖形學(xué)學(xué)會理事長。現(xiàn)任湖南大學(xué)機器人視覺感知與控制技術(shù)國家工程研究中心主任。研究方向為智能機器人感知與控制技術(shù)及工程應(yīng)用。
摘要:人工智能大模型的出現(xiàn),為具身智能無人系統(tǒng)的發(fā)展注入了強大動力。大模型具有強大的學(xué)習(xí)能力和泛化能力,能夠處理復(fù)雜的多模態(tài)數(shù)據(jù),為無人系統(tǒng)的感知、決策和控制提供更高效、更智能的解決方案。


科技新聞


前沿動態(tài)
未來諾貝爾物理學(xué)獎的中國方向
中國學(xué)者推動分子結(jié)構(gòu)化學(xué)從1邁向100
“從礦到磁”的中國稀土體系與美國的重建之路
半導(dǎo)體單光子探測器體積更小、噪聲更低
病毒竟變身植物進化加速器
光“手術(shù)刀”切開生命微觀世界
二維-硅基混合架構(gòu)閃存芯片刷新存儲速率
富碘界面自動填充固態(tài)鋰電池表面裂縫
歐盟發(fā)布2項戰(zhàn)略加快人工智能應(yīng)用
卓越亮點
中國“朱雀基地”打造地外居住新范式
追蹤大氣中的“隱形鐵”:氣溶膠中的可溶性鐵
深度報道
長壽密碼:環(huán)狀GMP-AMP合成酶
光撥動“隱藏的秩序”


科技評論


人工智能到底是一門什么學(xué)問?
作者:李國杰
中國科學(xué)院計算技術(shù)研究所
摘要:人工智能作為一門發(fā)展近 80 年的學(xué)問,其發(fā)展過程中邊界持續(xù)擴大、研究方向不斷豐富,學(xué)界對其學(xué)科屬性、研究核心等問題仍存爭議。對人工智能的學(xué)科屬性進行了系統(tǒng)分析,剖析了人工智能的學(xué)科定位,分析了人工智能可以像人一樣思考、像人一樣行動、理性地思考和理性地行動這 4 個核心目標,指出了人工智能是一種方法而不僅是模擬人類,是求解復(fù)雜問題的新范式,人工智能已超越傳統(tǒng)計算機科學(xué)分支的范疇。強調(diào)了人工智能是科學(xué)技術(shù)的“元級探索方法”,目前仍處于“前范式科學(xué)”階段。


本刊專稿


光驅(qū)動微納馬達的機理及應(yīng)用
作者:陳剛1,2,劉云龍1,張冰洋
1. 鄭州輕工業(yè)大學(xué)能源與動力工程學(xué)院
2. 河南省能源高效轉(zhuǎn)化與利用國際聯(lián)合實驗室
摘要:近年來,光驅(qū)動微納馬達作為一種新興的微型動力裝置,因其能量輸入可調(diào)、開關(guān)狀態(tài)可逆且可遠程操控等優(yōu)勢,在水環(huán)境處理、生物醫(yī)療以及生物傳感等領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。梳理了光驅(qū)動微納馬達在材料設(shè)計、光能利用與驅(qū)動控制等方面的研究進展,重點分析了基于光熱效應(yīng)、光致異構(gòu)化以及光催化分解等不同機制的驅(qū)動機理,并列舉了分別利用紫外光、可見光與近紅外光驅(qū)動的微納馬達的獨特優(yōu)勢及其典型應(yīng)用。同時,該類馬達在實際應(yīng)用中仍面臨光能轉(zhuǎn)換效率較低、運動控制精度不足以及材料生物相容性和穩(wěn)定性不佳等問題。未來研究應(yīng)致力于提升光能轉(zhuǎn)換效率、開發(fā)高生物相容性材料、優(yōu)化運動控制策略,并探索多源驅(qū)動方式與多功能集成化設(shè)計,從而推動光驅(qū)動微納馬達性能的全面提升與應(yīng)用范圍的進一步擴展。


特色專題:具身智能在跨域無人系統(tǒng)的應(yīng)用


面向無人系統(tǒng)的具身社會感知智能:流程與框架
作者:范麗麗1,史光宇2,陳愷舸1,李創(chuàng)3,曾昌賢4,鄧方1
1. 北京理工大學(xué)人工智能學(xué)院
2. 北京理工大學(xué)(珠海)人工智能學(xué)院
3. 中國人民解放軍軍事科學(xué)院軍事智能研究院
4. 重慶大學(xué)機械與運載工程學(xué)院
摘要:自主智能無人系統(tǒng)在動態(tài)復(fù)雜、多主體耦合、信息不完備且社會約束強的真實開放環(huán)境中運行時,面臨合規(guī)性建模不足、社會風(fēng)險感知受限、協(xié)同沖突突出及異常響應(yīng)滯后等關(guān)鍵挑戰(zhàn)。為此,提出一種具身社會感知智能框架,該框架將具身感知(本體、內(nèi)部、外部、交互和意圖)與社會雷達融合,并引入代理式人工智能(Agentic AI)作為頂層決策與控制機制,實現(xiàn)多層級、自主化的認知決策。整體采用感知、推理、執(zhí)行、反饋與元控制 5 層結(jié)構(gòu),實現(xiàn)從多模態(tài)感知到合規(guī)行為生成的動態(tài)閉環(huán)。通過融合物理與社會環(huán)境信息,該框架顯著提升了自主智能無人系統(tǒng)在城市治理、應(yīng)急救援和社會安全等復(fù)雜不確定場景中的任務(wù)適應(yīng)性、群體協(xié)同效率與合規(guī)可靠性,為實現(xiàn)可信賴、可解釋、可持續(xù)的自主智能系統(tǒng)提供新的技術(shù)路徑。
VLA架構(gòu)下的智能體演化:從機理建構(gòu)到應(yīng)用拓展
作者:張慧1,謝東錦2,梁姝彤1,李明軒1,賈曉豐3*,田永林4,馬思吉5,李浩然4,李浥東1
1. 北京交通大學(xué)計算機科學(xué)與技術(shù)學(xué)院
2. 新疆大學(xué)軟件學(xué)院
3. 北京市大數(shù)據(jù)中心
4. 中國科學(xué)院自動化研究所
5. 澳門科技大學(xué)創(chuàng)新工程學(xué)院
摘要:具身智能作為人工智能發(fā)展的新階段,正在實現(xiàn)從“感知?認知”到“感知?認知?行動”一體化的躍遷。視覺?語言?動作(vision?language?action,VLA)模型通過統(tǒng)一視覺感知、語言理解與動作生成,為智能體在真實世界中的自主操作提供了關(guān)鍵技術(shù)路徑。系統(tǒng)梳理了 VLA 技術(shù)的發(fā)展脈絡(luò)與典型成果,總結(jié)了其架構(gòu)范式,包括多模態(tài)感知輸入、語義融合機制、強化與模仿學(xué)習(xí)、世界模型和多層次動作輸出。結(jié)合自動駕駛、人機交互和工業(yè)裝備等應(yīng)用場景,進一步分析了 VLA 發(fā)展面臨的核心挑戰(zhàn),包括數(shù)據(jù)資源匱乏、泛化與遷移能力不足、可解釋性與算力壓力等,并展望了未來趨勢。
“物?人?場”交互視域下的數(shù)字孿生技術(shù)研究進展
作者:游佳莉1,鄧佳文1*,焦子韻1,羅阿理2,宋軼晗2,邱波3,任福繼1*
1. 電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院
2. 中國科學(xué)院國家天文臺
3. 北京科技大學(xué)智能科學(xué)與技術(shù)學(xué)院
摘要:隨著新一代信息技術(shù)的融合創(chuàng)新,數(shù)字孿生(digital twin,DT)技術(shù)作為推動數(shù)字化轉(zhuǎn)型與智能系統(tǒng)演進的關(guān)鍵支撐,已廣泛應(yīng)用于工業(yè)制造、智慧城市、智能交通等領(lǐng)域。然而,現(xiàn)有研究主要聚焦于“物”的建模和分析,較少系統(tǒng)整合“人”和“環(huán)境”因素,難以滿足復(fù)雜智能系統(tǒng)對多層次、全方位交互的發(fā)展需求。鑒于此,引入“物?人?場”交互視域,從智能物理實體(物)、智能個體(人)以及虛實融合環(huán)境(場)3 大核心維度,全面且系統(tǒng)地剖析數(shù)字孿生技術(shù)的研究前沿與進展。首先,分析以“物”為核心的傳統(tǒng)數(shù)字孿生技術(shù)體系,重點介紹其理論起源、框架及應(yīng)用等。其次,探討 AI(人工智能)驅(qū)動下的數(shù)字人定義、發(fā)展脈絡(luò)、國家政策和核心技術(shù)等。最后,將視野拓展至“場”的維度,探究元宇宙多元場景中“場”的應(yīng)用實踐,深入研討“物”“人”和“場”3 個元素的深度融合交互機制,揭示三者如何相互作用、相互促進,為元宇宙的構(gòu)建提供支撐。進一步,圍繞“物?人?場”面臨的關(guān)鍵挑戰(zhàn),提出 3 方面研究建議:(1) 構(gòu)建智能化且具備多層架構(gòu)的數(shù)據(jù)融合框架;(2) 研究 AIGC(生成式人工智能)賦能的智能虛實映射與虛擬原生進化;(3) 構(gòu)建新的虛擬經(jīng)濟與智能化治理體系。研究成果為構(gòu)建具備多主體協(xié)同感知、多模態(tài)智能交互與虛實融合閉環(huán)反饋的新型數(shù)字孿生系統(tǒng)提供了理論基礎(chǔ)與實踐啟示。
無人船系統(tǒng)中的具身智能:關(guān)鍵技術(shù)與發(fā)展
作者:范麗媛1,王兆杰1*,楊戰(zhàn)2,劉鵬1,吳笑風(fēng)1
1. 中國艦船研究院
2. 北京理工大學(xué)人工智能學(xué)院
摘要:無人船系統(tǒng)的智能化正從遠程操控向具身自主形態(tài)深刻變革,其核心在于通過多模態(tài)感知、環(huán)境交互與閉環(huán)學(xué)習(xí)實現(xiàn)高級智能行為。梳理了具身智能在無人船上的關(guān)鍵進展,指出語義控制閉環(huán)、數(shù)字孿生驗證與評測體系正從方法探索走向工程集成,并已在港池與內(nèi)河等場景形成初步應(yīng)用支撐。然而,當(dāng)前技術(shù)在感知穩(wěn)定性、規(guī)則可解釋性及落地資源等方面仍存在瓶頸。為此,建議從強化自主閉環(huán)智能體系、構(gòu)建標準可信驗證環(huán)境、推進輕量化與協(xié)同部署等方向重點突破,以提升系統(tǒng)的可靠性、合規(guī)性和規(guī)模應(yīng)用能力,為中國智能船舶技術(shù)與海洋戰(zhàn)略實施提供支撐。
非結(jié)構(gòu)化環(huán)境下人形機器人行走規(guī)劃與控制
作者:曹屹峰1,何俊鵬2,李炳賢1,范麗麗3,田永林4,文偉松1,曹東璞5*
1. 香港理工大學(xué)航空及民航工程學(xué)系
2. 滑鐵盧大學(xué)電子與計算機學(xué)院
3. 北京理工大學(xué)人工智能學(xué)院
4. 中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室
5. 清華大學(xué)智能綠色車輛與交通全國重點實驗室
摘要:人形機器人因具有人體相似的形態(tài)與運動能力,被廣泛認為是未來服務(wù)、救援與工業(yè)應(yīng)用的潛在核心裝備,但在非結(jié)構(gòu)化環(huán)境中實現(xiàn)穩(wěn)定可靠的行走仍具有顯著挑戰(zhàn)。綜述了近年來在人形機器人行走規(guī)劃與控制方面的研究進展,重點涵蓋步態(tài)規(guī)劃、軌跡生成、全身控制及學(xué)習(xí)驅(qū)動方法等方向。系統(tǒng)梳理了典型方法的核心思想與實現(xiàn)框架,對其適用場景、優(yōu)勢與局限進行比較分析,并根據(jù)規(guī)劃與控制層級對現(xiàn)有研究進行分類總結(jié)。此外,討論了提升環(huán)境適應(yīng)性與動態(tài)穩(wěn)定性的關(guān)鍵技術(shù)瓶頸,展望了未來在多模態(tài)感知融合、學(xué)習(xí)與控制協(xié)同優(yōu)化、全身運動技能學(xué)習(xí)及安全性保障等方面的發(fā)展趨勢,并對相關(guān)技術(shù)的標準化與大規(guī)模應(yīng)用提出了建議。


研究論文


面向高速移動通信的多普勒頻移在線智能預(yù)測方法
作者:白新哲,于周源,胡小玲*,劉晨熙,彭木根
北京郵電大學(xué)信息與通信工程學(xué)院
摘要:隨著高速交通網(wǎng)絡(luò)的快速發(fā)展以及第 6 代移動通信技術(shù)的持續(xù)推進,高速移動場景下的用戶通信需求急劇增長。然而,用戶高速移動帶來的高多普勒頻移將導(dǎo)致信道快速時變,嚴重降低了通信的可靠性和傳輸質(zhì)量。針對該挑戰(zhàn),提出結(jié)合通感一體化技術(shù),基站在和高速用戶通信的同時,接收回波信號以預(yù)測多普勒頻移,并對多普勒頻移進行預(yù)先補償,從而降低接收端通信信號處理復(fù)雜度并提升通信質(zhì)量。針對高速移動場景下的正交頻分復(fù)用(orthogonal frequency division multiplexing,OFDM)通感一體化系統(tǒng),提出了一種基于長短期記憶網(wǎng)絡(luò)(long short?term memory,LSTM)模型的在線多普勒頻移智能預(yù)測方法,該方法基站根據(jù)接收回波信號,估計當(dāng)前多普勒頻移,并利用 LSTM 模型實時預(yù)測下一時刻的頻移。為適應(yīng)動態(tài)環(huán)境,所提模型采用在線更新策略,在每次接收回波并估計得到新的多普勒頻移數(shù)據(jù)后實時更新 LSTM 模型參數(shù)。為評估模型性能,將 LSTM 預(yù)測結(jié)果與無跡卡爾曼濾波(unscented Kalman filter,UKF)模型及 Transformer 模型進行對比,分析其在不同移動速度和信噪比條件下的預(yù)測精度。仿真結(jié)果表明,所提 LSTM 在線預(yù)測模型對非線性多普勒頻移預(yù)測的準確性和魯棒性均優(yōu)于 UKF 模型和 Transformer 模型,為高動態(tài)通信環(huán)境下的頻移在線預(yù)測提供了高效可靠的解決方案。
中文版吞咽生命質(zhì)量量表在認知功能障礙患者中信度和效度研究
作者:王懿萱1,喬雨晨1,楊昆1,陳哲2,唐毅1*,秦琪1*
1. 首都醫(yī)科大學(xué)宣武醫(yī)院神經(jīng)疾病高創(chuàng)中心神經(jīng)內(nèi)科,國家神經(jīng)疾病醫(yī)學(xué)中心
2. 日照市中醫(yī)醫(yī)院腦病科
摘要:吞咽障礙在認知功能障礙患者中發(fā)生率高,并對其生存質(zhì)量造成嚴重影響。吞咽生命質(zhì)量(swallowing quality of life,SWAL?QOL)量表作為國際廣泛應(yīng)用的吞咽功能及相關(guān)生活質(zhì)量的評估工具,既往研究將認知障礙人群排除在適用對象之外。本研究系統(tǒng)性驗證中文版 SWAL?QOL 量表在輕—中度認知功能障礙患者中的適用性。研究納入 122 名輕—中度認知功能障礙患者,對受試患者的量表結(jié)果測量者間重側(cè)信度、同質(zhì)性信度、內(nèi)容效度及結(jié)構(gòu)效度進行探究。結(jié)果表示,該量表各維度測量者間信度系數(shù)(“食物選擇”維度除外)均高于 0.8,整體內(nèi)部一致性 Cronbach's α 值達到 0.971;結(jié)構(gòu)效度分析該量表與洼田飲水試驗(WST)、吞咽功能評估(EAT?10)量表等吞咽功能評估工具呈顯著相關(guān),并提取出“心理社會功能”“營養(yǎng)攝入模式”和“生理功能調(diào)節(jié)”3 個公因子(累計方差貢獻率 72.742%),揭示吞咽障礙對患者心理、生理及社會功能的多維度影響。研究表明,中文版 SWAL?QOL 量表可作為輕—中度認知功能障礙患者吞咽相關(guān)生活質(zhì)量的可靠評估工具,為制定個體化干預(yù)策略以及提升患者生活質(zhì)量提供了理論支持。


政策建議


納米生物材料前沿進展與未來挑戰(zhàn)
作者:彭鄒君1,2,吳愛國1,2*
1. 中國科學(xué)院寧波材料技術(shù)與工程研究所先進診療材料與技術(shù)實驗室
2. 寧波慈溪生物醫(yī)學(xué)工程研究所
摘要:納米生物材料領(lǐng)域作為 21 世紀生物醫(yī)藥領(lǐng)域的戰(zhàn)略性科技領(lǐng)域,正深刻重塑疾病診療范式并驅(qū)動全球科技競爭格局變革。梳理了中國納米生物材料領(lǐng)域在產(chǎn)學(xué)研方面的發(fā)展現(xiàn)狀與戰(zhàn)略挑戰(zhàn),通過對比揭示中國在生物醫(yī)用涂層材料、上轉(zhuǎn)換成像探針材料及納米酶等部分細分領(lǐng)域的領(lǐng)跑優(yōu)勢,同時指出當(dāng)前存在基礎(chǔ)研究與應(yīng)用脫節(jié)、跨學(xué)科協(xié)作壁壘、監(jiān)管與產(chǎn)業(yè)適配失衡等結(jié)構(gòu)性矛盾。在新型舉國體制框架下,通過借鑒成熟行業(yè)的技術(shù)躍遷經(jīng)驗,推演出中國納米生物材料領(lǐng)域可能的三階段演進軌跡,即從技術(shù)攻堅期的工藝突破,到產(chǎn)業(yè)擴張期的標準主導(dǎo),最終實現(xiàn)全球引領(lǐng)期的范式革新。建議通過“臨床需求反向驅(qū)動”研發(fā)模式、千億級產(chǎn)業(yè)基金布局及國際標準突圍策略,中國有望構(gòu)建以納米生物材料驅(qū)動的“技術(shù)?產(chǎn)業(yè)?治理”三位一體中國方案的生物經(jīng)濟模式,為高水平科技自立自強提供實踐范本。


科技人文


讓中國碗盛滿中國糧——李振聲的農(nóng)業(yè)科技自強之路
作者:高文靜1,王以芳1,孟令耘1*,王傳超2
1. 中國科協(xié)科學(xué)技術(shù)傳播中心
2. 北京科技大學(xué)科技史與文化遺產(chǎn)研究院
摘要:李振聲是我國著名的小麥遺傳育種學(xué)家。通過回顧李振聲的學(xué)術(shù)成長歷程,梳理了其學(xué)術(shù)貢獻和科學(xué)精神,描繪了他作為戰(zhàn)略科學(xué)家所走出的農(nóng)業(yè)科技自強之路。他的科研生涯不僅濃縮了中華民族“以農(nóng)立國”到“科技強農(nóng)”的奮斗歷程,更是科學(xué)家精神的生動體現(xiàn)。李振聲少年時期經(jīng)歷饑荒,立下“讓國人吃飽飯”的志向,將傳統(tǒng)“農(nóng)為邦本”思想轉(zhuǎn)化為科研動力;他創(chuàng)新應(yīng)用染色體工程育種技術(shù),攻克遠緣雜交世界難題,將育種周期從幾十年縮短至 3 年,奠定中國種業(yè)科技自立根基;他努力帶領(lǐng)青年科學(xué)家“把論文寫在麥田里”,使其團隊接力的“濱海草帶”計劃成為鹽堿地治理先鋒。
內(nèi)容為【科技導(dǎo)報】公眾號原創(chuàng),歡迎轉(zhuǎn)載
白名單回復(fù)后臺「轉(zhuǎn)載」
《科技導(dǎo)報》創(chuàng)刊于1980年,中國科協(xié)學(xué)術(shù)會刊,主要刊登科學(xué)前沿和技術(shù)熱點領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評論、引領(lǐng)性的高端綜述,發(fā)表促進經(jīng)濟社會發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評論、專稿專題、綜述、論文、政策建議、科技人文等。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.