2026年4月,具身智能圈流傳出的一份成績單,悄然打破了賽道慣常的敘事邏輯。
在全球具身靈巧操作難度頂尖的真機賽事——Benjie's Humanoid Olympic Games(以下簡稱Benjie's Olympics)中,一家中國公司竟然在剝橘子、開鎖、翻襪子三項核心任務中,全面超越此前紀錄保持者Physical Intelligence(簡稱PI),從而引發行業熱議。
這個團隊來自星動紀元。
![]()
Beniie's Olympics公布
星動紀元獲兩項金牌難度任務(剝橘子、開鎖)第一
![]()
Beniie's Olympics公布
星動紀元獲銀牌難度任務(翻襪子)第一
![]()
01.
Benjie’s Olympics刷榜牛在哪?
如果要理解這份成績單的含金量,必須先理解這場賽事本身的殘酷規則。
Benjie’s Olympics被《科學美國人》(Scientific American)認定為人形機器人的終極挑戰,賽事核心邏輯直指具身智能領域最棘手的莫拉維克悖論(Moravec’s Paradox)。因為這場比賽比的項目,都是諸如疊衣服、用鑰匙開鎖、翻襪子這類對機器人而言難度極高的物理挑戰。
此外,這場賽事的規則近乎苛刻,不僅僅要求全自主執行,零人工干預,還禁止仿真,必須在真實物理環境中完成,且要求跨物體、跨材質、跨光照條件的泛化能力。因此,Benjie’s Olympics也是目前唯一一個PI會主動下場參賽的榜單。
這與在其他具身智能評測榜單上,別的團隊拿著PI公開發布的開源模型去測的數據成績是兩碼事。開源模型意味著什么?意味著那只是一個pi已經對外公開、供人參考的“歷史版本”。
但在Benjie’s Olympics上,PI都是團隊親自下場,而且用的是自己的閉源基礎模型π* 0.6。這是PI當前能力的真實天花板,代表著這家公司目前最高的技術水平,沒有對外開放,沒有任何削減。所以,星動紀元這次摸到并且打敗的,可能是PI拿出全部家底親自參賽時的最好成績。
![]()
星動紀元摘獲兩項金牌難度任務第一(剝橘子、開鎖),一項銀牌難度任務第一(翻襪子),共三項第一
在此之前,沒有任何團隊做到過這件事。
因為在這種賽項上,絕大多數團隊連銅牌難度都難以觸及;金牌難度任務被業內認為不太可能完成。在這樣的賽制下,星動紀元以三項全球第一的成績完賽,并成為該賽事目前唯一上榜的中國企業,這才是這次三項全球第一真正的分量所在。
02.
三項數據背后的技術含金量
成績本身已足夠說話,但數字背后的技術邏輯,才是這次勝利真正值得深讀之處。
星動紀元完成金牌難度任務剝橘子,用時僅1分47秒,比PI快35%,且不借助任何工具。
這一條就信息密度極高。PI此前的成績是2分46秒,已屬賽事領先水平,但PI使用了削皮刀。星動紀元不僅速度更快,更是賽事首個實現完全無工具純手剝操作的團隊。
剝橘子聽起來是人類日常,但技術難度在于,機器人需要精準區分果皮與果肉的細微視覺差異,實時跟蹤剝制過程中果皮持續的形變軌跡,視覺感知需具備極高魯棒性。放棄工具,意味著放棄了規避這一難度的捷徑,選擇了完全由模型能力來承載任務,這是一種主動提升挑戰維度的選擇。
另一個金牌難度任務開鎖,星動紀元用時僅49秒,比PI快25%,其表現也令人驚訝。
鑰匙孔是毫米級微小目標。機器人需同時完成鑰匙孔位置識別、角度判斷、鑰匙姿態理解,并在光照變化、金屬反光、視角偏差等多重干擾下實現毫米級對準。這是一個感知精度與執行穩定性高度耦合的任務,容錯率極低。
翻襪子這個銀牌難度任務更是非常有意思,星動紀元用時1分04秒,比PI快30%;但訓練樣本僅120組,比PI少32%。
這意味著,在數據效率(Data Efficiency)這一具身智能模型競爭的核心維度上,星動紀元建立了實質性優勢。少用32%的數據,做出30%更快的結果,這背后是模型知識遷移能力與小樣本泛化能力的直接體現。
因為具身智能真正的護城河,目前已經逐步收斂到數據效率與泛化能力的組合。那么,誰能用最少的數據,完成最多場景的任務,無疑意味著更高泛化性。星動紀元翻襪子任務中少32%數據獲勝,是一個看似微小卻意義重大的數字,它指向了星動紀元在數據經濟性上的獨特競爭力。
03.
具身大腦的底層邏輯
機器人大講堂認為,星動紀元的勝出,本質上得益于其自研VLA(Vision-Language-Action)具身智能模型在工程優化、感知精度、規劃效率三個層面系統性優勢的綜合體現。
第一層是基礎模型知識遷移,破解數據瓶頸。具身智能領域長期面臨高質量操作數據稀缺的困境,這是行業共識。星動紀元的破題路徑是通過基礎模型的預訓練知識遷移,大幅提升小樣本場景下的泛化能力,從而降低對真實數據量的依賴。翻襪子任務中少用32%樣本仍獲勝,是這一策略最直接的驗證。
第二層是通過引入自適應視覺注意力機制,解決精細操作感知難題。針對開鎖等高精度任務,星動紀元引入了自適應視覺注意力機制,實現了對微小目標的動態聚焦與特征增強。這一機制的價值不在于技術名詞本身,而在于它解決了一個長期困擾具身系統的實際問題,也就是當目標物體極小、干擾極多時,通用視覺模型的感知精度往往斷崖式下降。能在毫米級任務中穩定執行,說明其感知系統具備了從實驗室可用向工業級可靠遷移的基礎條件。
![]()
第三層是異步高頻推理與短時域規劃,抑制累積誤差。這是星動紀元在執行層面的核心創新之一。傳統VLA模型以固定頻率生成完整動作軌跡,而星動紀元采用異步推理架構,可以在當前軌跡未執行完畢時,即同步預測下一段軌跡,并在新軌跡生成后直接切換執行。
此策略的本質,是將感知-規劃-執行的閉環延遲壓縮至極低水平,使機器人具備對非預期擾動的實時響應能力。在翻襪子這樣的柔性物體任務中,襪子形變具有高度隨機性,異步高頻推理使系統得以實時跟蹤形變并動態修正,而非依賴既定軌跡蒙著走。
這三層技術邏輯疊加,構成了星動紀元在Benjie’s Olympics中系統性勝出的底層基礎。
04.
從WorldArena到Benjie’s Olympics的雙榜登頂
雖然這次比賽含金量極高,但理解星動紀元,也不能只看這一次比賽,對他們而言,學術成果涌現并且沖擊世界領先水平才是常態。
2026年2月,陳建宇團隊與斯坦福大學Chelsea Finn(PI聯合創始人)團隊聯合研發的Ctrl-World可控生成世界模型,已在WorldArena這個具身智能領域全球頂級世界模型權威評測榜單中擊敗谷歌、英偉達,斬獲具身任務能力全球第一,且在主體一致性、軌跡精度、深度準確性、策略評估一致性四大核心維度全部登頂。
此次Benjie’s Olympics三項全球第一,是在WorldArena登頂之后的再度問鼎。但兩份來自不同維度的頂級成績單,共同指向一個判斷,那就是星動紀元正在系統性構建具身智能模型能力的全球領先位置。
機器人大講堂發現,這里有一個細節值得特別關注,那就是Chelsea Finn既是PI的聯合創始人,也是此次被星動紀元超越記錄的對手,同時還是星動紀元合作研究的重要伙伴。這種既合作、又競爭的關系,在頂級科研生態中并不罕見,但在商業機器人公司之間如此高頻、如此深度地出現,本身就是一種信號,那就是星動紀元已真正進入了全球具身智能最核心的學術與技術圈層。
在媒體習慣的敘事里,中國科技公司的進步往往被描述為追趕。但如果仔細梳理星動紀元的研發時間線,會發現另一種敘事的存在。
在若干具身智能的關鍵技術方向上,他們是定義者,而非跟隨者。2024年9月,星動紀元率先推出HiRT快慢分層架構,全球首提分頻VLA,通過latent向量連接70億參數世界模型與4000萬參數執行模型,實現大腦與小腦的異頻協同;隨后,PI、Figure、Google、NVIDIA相繼于2024年10月至2025年3月發布各自的分頻VLA方案。
![]()
2024年12月,星動紀元發布VPP(Video Prediction Policy)算法框架,全球首個將世界模型融入具身大腦,將具身智能可用數據擴展至海量互聯網視頻數據,使機器人得以理解物理世界,實現邊想邊做。這一框架目前已開源。
2026年2月,陳建宇團隊與Chelsea Finn團隊再度合作,聯合提出VLAW框架,首次實現VLA策略與動作條件世界模型的協同迭代優化,VLA采集的真實交互數據用于提升世界模型物理保真度,世界模型生成的虛擬數據再強化VLA策略,形成互相促進的閉合正向循環。
目前,在全尺寸人形機器人全身及五指靈巧手精準控制方面,星動紀元ERA-42是全球僅有四個實現該能力的方案之一,另外三個為Figure Helix、特斯拉Grok及英偉達GR00T。
這是一張值得反復審視的技術地圖,在全球具身智能從概念走向實用的關鍵窗口期,星動紀元在多個核心方向上保持了與全球最頂尖團隊同步乃至領先的節奏。
05.
從榜單到工廠,真實世界的檢驗進行時
當然,成績單終究是成績單。具身智能的終極評判標準,是能否真正在現實世界中干活。這也是星動紀元有別于部分具身智能公司的另一個關鍵維度,其具身大腦ERA-42已在物流、制造、商業服務多個真實場景中實現落地。
在物流領域,ERA-42可完成藥品、日化品、包裹的分揀及掃碼;在制造領域,重點突破零部件抓取、高精度裝配、質量檢測等場景任務;在商業服務領域,可完成門店客座清潔、物品遞送、導游導覽等。部分場景效率當前已達到70%。
![]()
70%,這個數字在今天的具身智能領域已屬難得,它意味著系統已越過Demo可用的門檻,開始觸碰商業可用的下限。而Benjie’s Olympics的意義,恰恰在于其驗證了該系統在非預設、強泛化環境下的能力上限。
兩者形成了一個清晰的邏輯閉環,榜單驗證了技術上限,工廠驗證了實用下限;上限夠高,下限夠穩,具身大腦才真正成立。
06.
結語與未來
Benjie’s Olympics是一面照妖鏡,照出了誰在做真問題。
因為具身智能賽道并不缺融資故事與產品發布,但能在這一場為Demo而死的賽事中勝出的團隊,證明了自己研究的是真實世界全球級核心難題,而非實驗室精心布置的友好場景。星動紀元從分頻VLA的全球首提,到與PI創始人團隊的兩度聯合發表,再到雙榜登頂的成績,這已不是局部追趕,而是在某些方向上的系統性領跑,他們正在證明一件事,那就是中國具身智能公司有能力在全球技術議程上占據主動位置。
能過Benjie關,才叫工業級全棧;過不了,都是Demo。,這是目前機器人學界共識,星動紀元,過了這一關。下一關,是規模化量產的現實地獄。
這也意味著對星動紀元而言,這場游戲才剛剛開始,但對手或許并不多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.