![]()
本文共同第一作者為西安交通大學(xué)碩士生常建磊和博士生梅若風(fēng)。柯煒為西安交通大學(xué)副教授。論文通訊作者為西安交通大學(xué)教授許翔宇,其研究方向涵蓋三維視覺、生成式 AI 與具身智能(個(gè)人主頁:https://xuxy09.github.io/)。
生成式模型正在成為機(jī)器人和具身智能領(lǐng)域的重要范式,它能夠從高維視覺觀測中直接生成復(fù)雜、靈活的動(dòng)作策略,在操作、抓取等任務(wù)中表現(xiàn)亮眼。但在真實(shí)系統(tǒng)中,這類方法仍面臨兩大「硬傷」:一是訓(xùn)練極度依賴大規(guī)模演示數(shù)據(jù),二是推理階段需要大量迭代,動(dòng)作生成太慢,難以實(shí)時(shí)控制。
針對(duì)這一核心瓶頸,西安交通大學(xué)研究團(tuán)隊(duì)提出了全新的生成式策略學(xué)習(xí)方法EfficientFlow。該方法通過將等變建模與高效流匹配(Flow Matching)深度融合在顯著提升數(shù)據(jù)效率的同時(shí),大幅壓縮推理所需的迭代步數(shù),在多個(gè)機(jī)器人操作基準(zhǔn)上實(shí)現(xiàn)了 SOTA 的性能,并將推理速度提升一個(gè)數(shù)量級(jí)以上。
相關(guān)論文《EfficientFlow: Efficient Equivariant Flow Policy Learning for Embodied AI》已被 AAAI 2026 接收,代碼已開源
![]()
- 論文地址:https://arxiv.org/pdf/2512.02020
- 項(xiàng)目主頁:https://efficientflow.github.io/
- GitHub:https://github.com/chang-jl/EfficientFlow
技術(shù)亮點(diǎn):用物理直覺重塑生成式策略
1. 加速度正則化:讓生成軌跡更直、更快
傳統(tǒng)流匹配的一大痛點(diǎn)是學(xué)習(xí)到的流場曲率過大,導(dǎo)致推理時(shí)仍需多步迭代才能擬合。
怎么讓生成軌跡變直? EfficientFlow 的設(shè)計(jì)靈感源于物理直覺:現(xiàn)實(shí)中平滑的運(yùn)動(dòng),往往加速度很小。 因此,EfficientFlow 在損失函數(shù)中引入了加速度正則項(xiàng),鼓勵(lì)樣本從噪聲分布向數(shù)據(jù)分布演化的過程也是平滑且接近勻速的:
![]()
![]()
加速度正則項(xiàng)可以近似為:
![]()
![]()
![]()
![]()
![]()
2. 等變網(wǎng)絡(luò):讓模型學(xué)會(huì)「舉一反三」
EfficientFlow 等變?cè)O(shè)計(jì)的核心邏輯非常直觀:如果輸入的視覺場景旋轉(zhuǎn)了一定角度,那么機(jī)器人輸出的動(dòng)作自然也該跟隨旋轉(zhuǎn)相同的角度。這帶來了巨大的數(shù)據(jù)優(yōu)勢(shì),相當(dāng)于一條數(shù)據(jù)就可以產(chǎn)生多條數(shù)據(jù)的效果。模型只需學(xué)習(xí)物體在一個(gè)角度下的操作,就能自動(dòng)泛化到多個(gè)旋轉(zhuǎn)角度,真正實(shí)現(xiàn)了「舉一反三」。
![]()
![]()
![]()
![]()
![]()
![]()
3. 時(shí)間一致性策略:快,還要穩(wěn)
![]()
![]()
為了保持模型探索多樣化行為的能力,模型引入了周期性重置:每 10 個(gè)預(yù)測周期,從批次中隨機(jī)選擇一條軌跡進(jìn)行執(zhí)行,而不是選擇最小化重疊距離的那一條。這種方法在保持多模態(tài)性的同時(shí)提高了時(shí)間一致性,并且由于并行化處理,批量化設(shè)計(jì)確保了推理時(shí)間的額外開銷極小。
實(shí)驗(yàn)效果:少數(shù)據(jù)、少步數(shù),也能打 SOTA
在 MimicGen 等多個(gè)機(jī)器人操作基準(zhǔn)中,EfficientFlow 在有限數(shù)據(jù)條件下展現(xiàn)出媲美甚至超過現(xiàn)有 SOTA 方法的成功率。更關(guān)鍵的是推理效率:在 1 步推理下,EfficientFlow 就能接近 EquiDiff 100 步推理的平均性能,單步推理速度提升 56 倍,5 步推理也有近20 倍加速。消融實(shí)驗(yàn)進(jìn)一步表明,加速度正則化與等變建模缺一不可,共同構(gòu)成了高效生成式策略的關(guān)鍵。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.