在大模型持續改寫數字世界之后,AI 正在加速進入物理世界。機器人能否真正走出實驗室、進入真實場景,成為當前具身智能產業最受關注的話題。
在 2026 中關村論壇年會上,螞蟻靈波科技首席科學家沈宇軍以《探索具身智能上限,打造機器人時代的智能基座》為題發表演講,系統闡述了螞蟻靈波對具身智能產業發展的判斷,以及圍繞“智能層”所進行的模型布局與開源實踐。
沈宇軍指出,具身智能走向產業化,關鍵在于改變每進入一個新場景都從頭開發的模式,通過基礎模型將共性能力前置,持續降低場景落地的邊際成本。基于這一判斷,螞蟻靈波選擇聚焦機器人的“大腦”,打造具身基座模型,并通過開源與開放協同,與生態伙伴共同降低行業創新和場景落地門檻。
![]()
(圖說:螞蟻靈波科技首席科學家沈宇軍發表在 2026 中關村論壇年會上演講)
產業化落地的關鍵,在于降低場景開發的重復成本
當前,具身智能產業鏈正在快速發展,從本體、零部件到模型,各個環節不斷涌現新進展。但在產業落地過程中,一個現實挑戰也日益突出:很多能力可以在單一任務中實現,卻難以快速復制到更多場景,導致開發成本居高不下。
針對這一問題,沈宇軍在演講中算了一筆賬:如果每家公司都各自投入 100 萬元完成一個場景開發,10 家公司就是 1000 萬元;但如果先投入 900 萬元把通用基礎能力做好,打好基礎之后,接下來每家公司只需花費 10 萬元,就能完成相應場景的開發。“表面上看,總和仍然是 1000 萬完成了 10 個場景,但當復制規模擴大時,后續每個場景的成本仍然僅需 10 萬元,也就是說邊際成本會逐漸降低。”
在他看來,這正是具身智能產業需要“智能基座”的重要原因。通用能力的持續沉淀,將有助于本體廠商、場景方和開發者在統一底座上更高效地開展適配與開發,這也是螞蟻靈波將自身定位為基模開發者的重要出發點。“我們希望通過提升并開放基模能力,推動整個行業的發展。”沈宇軍說。
從 VLA 到 VA,構建機器人的“大腦平臺”
今年 1 月,螞蟻靈波開源了四款模型,包括高精度空間感知模型 LingBot-Depth,具身基座模型 LingBot-VLA,世界模型 LingBot-World,以及視頻-動作模型 LingBot-VA。從空間感知、具身大腦到機器人的想象空間等,構建起一整個“大腦平臺”。
其中,LingBot-VLA 基于 9 種主流雙臂機器人構型、超過 2 萬小時真實世界操作數據進行預訓練,在部分任務中僅需少量演示數據即可實現遷移,體現出較強的跨環境泛化與復雜動作理解能力,在任務執行的穩定性和操作成功率上均處于行業先進水平。
在模型布局背后,是螞蟻靈波對機器人智能路徑的進一步思考。沈宇軍指出,機器人所面對的物理世界,本質上是一個持續變化、需要實時反饋的動態環境。相比一次性完成全部規劃,更重要的是在執行過程中持續感知環境變化,并根據反饋不斷修正動作。這意味著,機器人需要的不只是“理解并執行”,而是“邊感知、邊行動、邊調整”的閉環能力。
基于這一判斷,螞蟻靈波在業內率先探索了 VA(Video-Action)方向,嘗試更直接地建立視覺動態與動作輸出之間的聯系,讓機器人形成更貼近真實環境反饋的行為模式。
對未來一到三年的發展,沈宇軍認為,VLA、VA 與世界模型等路線將加速融合,隨著具身數據加快積累,機器人面向真實物理世界的閉環智能能力將持續演進。與此同時,安全能力也將加快從外部約束轉向模型內部,成為具身智能走向規模化應用的重要基礎。
開源協同,降低行業創新門檻
在演講中,沈宇軍還強調了開源對于具身智能產業發展的現實意義。
他表示,具身智能是高度綜合的領域,沒有任何一家企業能夠獨立完成所有環節。開源的意義,在于為開發者、合作伙伴和產業參與者提供一個可驗證、可適配、可迭代的共同基礎,加快技術能力向真實場景轉化。
同時,模型的“效果好”與開發者實際感受到的“好用”之間,往往還隔著一層適配鴻溝。開源能夠幫助發現并填平這道鴻溝,當模型被更多人使用、進入更多真實任務、接收到更多來自一線場景的反饋,相關能力才能進一步迭代演進。
目前,螞蟻靈波已與多家生態伙伴聯合推進模型在真實場景中的適配與落地。沈宇軍表示,團隊將圍繞機器人“智能層”持續完善基礎模型能力,通過開源開放和生態協同,推動具身智能規模化應用落地。
本文由極果用戶極果原創
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.