![]()
智東西
作者 | 程茜
作者 | 漠影
智東西1月12日報道,今日,千尋智能正式開源具身大模型Spirit v1.5,就在前一天,該模型在全球具身智能模型評測平臺RoboChallenge上,綜合評測斬獲第一。
RoboChallenge的基準測試包含30項任務,包括擺放薯條、尋找固定顏色物體、貼膠帶等30項任務,Spirit-1.5綜合得分為66.09分,成功率達到50.33%,也是唯一一個成功率超過50%的模型。這些任務涵蓋了機器人一系列日常技能,考驗的正是機器人在陌生環境的泛化能力。
![]()
榜單截圖
這一成績意味著,其超越了已經霸榜RoboChallenge數月之久的Pi0.5模型。Pi0.5由美國機器人創企Physical Intelligence于2025年4月發布,以能讓機器人在全新環境中執行復雜家務任務而引起熱議。
RoboChallenge榜單由Dexmal原力靈機、Hugging Face全球知名機構聯合發起,是全球首個專為具身智能機器人量身打造的大規模真機評測平臺,主打讓機器人直接在真實物理世界里硬碰硬,檢驗模型的實戰泛化能力。
從Pi0.5霸榜時間之久也可以看出,其在真機實測領域的絕對實力。但值得注意的是,此次Spirit v1.5并不是靠某一項獨門絕技勝過Pi0.5,而是實現了綜合能力全面超車,這也意味著國產具身智能玩家,正式沖進全球第一梯隊的核心圈。
為了證明榜單成績來自自研模型且真實有效,千尋智能已經同步開源了Spirit v1.5的基模權重、推理代碼、使用樣例。
核心代碼開源地址:
https://github.com/Spirit-AI-Team/spirit-v1.5
模型開源地址:
https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
技術博客:
https://www.spirit-ai.com/en/blog/spirit-v1-5
一、30大貼近真實場景實操任務,Spirit v1.5多項實操任務完勝Pi0.5
實戰見真章,在RoboChallenge的30項任務中,可以看到在下面幾項任務,Spirit v1.5和Pi0.5的直觀對比。
首先是讓機器人往紙箱上貼膠布。Spirit v1.5使得機器人一下子就精準找到了膠布的位置,兩只手配合操作成功將膠布貼到了紙箱上,但Pi0.5經過多次嘗試,也沒能將膠布撕下。
Spirit v1.5模型實測過程(左)、Pi0.5模型實測過程(右)
在擺放物體的任務中,可以看到綠色物體被壓在最下方。Pi0.5模型會先將黃色物體放入箱子,待綠色物體露出后再精準拾取;而Spirit v1.5則是直接在堆疊的物品中主動搜尋綠色物體,沒有拾取錯誤顏色的物品。
Spirit v1.5模型實測過程(左)、Pi0.5模型實測過程(右)
插花任務中,Pi0.5不能識別到瓶口,將花插進去,而是橫放在了花瓶上,Spirit v1.5能通過移動關節,保證花保持豎直,并被插入花瓶中。
Spirit v1.5模型實測過程(左)、Pi0.5模型實測過程(右)
移動物體時,Spirit v1.5可以精準抓取到物品然后放到箱子里,但Pi0.5在執行任務時,無法判斷自己是否已經抓取到相應物品,而是機械操作固定步驟,也不能根據實際場景判斷抬升高度,確保物體順利放入箱內。
Spirit v1.5模型實測過程(左)、Pi0.5模型實測過程(右)
不難看出,貼膠布、物品拾取、插花、移動物體這類貼近實際應用場景的機器人實操任務,是實打實檢驗技術落地能力的關鍵。
其既可以驗證機器人在真實環境中的感知、抓取、協同操作等核心功能的實際表現,也能直觀暴露技術短板,為后續技術迭代、優化產品落地方案提供可落地、可復刻的真實測試依據,更對機器人技術落地及技術有效性有重要意義。
這也恰恰印證了該榜單的核心參考意義。
RoboChallenge的來頭不小,其于2025年成立,由Dexmal、Hugging Face海內外具身智能領域知名機構聯合發起。這一榜單通過真機測試評估模型在物理世界的泛化性,是具身智能領域少數以真實物理任務為核心的評測體系。
其中的30項測試任務正是針對傳統機器人測試場景碎片化、標準不統一,測試結果難以開展橫向比較的行業痛點,RoboChallenge通過制定統一的任務標準與評估指標,搭建跨模型對照機制,構建起一套開放、公正的具身智能評測體系,形成針對性解決方案。
更為關鍵的是,這一平臺可供全球研究者免費使用,還會公開任務數據與中間結果。
RoboChallenge榜單是具身智能飛速發展、落地加速的同時,行業對標準化評測的迫切需求催生出的硬核成果,也是給全球玩家實力較量搭起的公平擂臺,更凸顯出國產具身大模型登頂的含金量。
二、Spirit v1.5登頂背后,破解機器人泛化能力的核心密碼
要拆解Spirit v1.5高光表現背后的原因,首先需要破解制約機器人泛化能力的核心難題。
此前,各家機器人創企秀機器人技能時,很多機器人已能完成在全新環境疊衣服、清潔廚房等長序列復雜任務,大規模VLA(視覺-語言-動作)模型正逐步展現出真正的物理智能。
但這一亮眼表現背后,卻暗藏著關鍵技術隱患:不少業界頂尖模型在訓練階段,會對數據進行嚴苛的預處理,雖能降低機器人模仿人類操作的難度,卻也大幅限制了其實際的泛化能力。
因此,Spirit v1.5的核心就是,讓機器人在預訓練時轉向使用多樣化的、很大程度上不受控的數據,通過從這類貼近現實世界的混亂數據中學習,大幅提升機器人應對真實家庭環境中各類不可預測場景的能力。
千尋智能通過開放式、目標驅動的數據采集,讓操作員以某個目標為前提即興發揮。例如數據采集員的目標是“今天我要用機器人清理廚房臺面”、“給假人模特化妝”,但操作員如何規劃子任務、任務執行順序等都完全隨機。
通過這種方式構建數據集的優勢在于:能實現數據的高度多樣性讓機器人習得更多物理常識,還具備更強可擴展性。
在多樣性層面,依托數據操作員的實際執行過程,其會包含海量的物體交互、軌跡和環境轉換,會在短時間的操作中,包含拾取、放置、打開容器、打掃房間、野外導航等互相交織的數據。
這樣一來,機器人就不是機械學習某個單項任務的執行,而是通過學習整套技能及執行的前后順序,得到更具通用性的知識與能力。
在可擴展性層面,其數據集不需要為每個場景精心設備并定義詳細任務指導,便能在不線性增加管理成本的前提下,高效擴展數據采集規模。根據千尋智能內部實測,采用這種方法,人均有效采集時長增加了200%,并將對算法專家的干預需求削減了60%。
為了用數據說明這種數據集采集范式的有效性,千尋智能建立了兩組模型進行對比,一組是在包含30個精選演示任務的數據集上進行預訓練,一組在開放式多樣化采集的數據集上進行預訓練。
這兩組模型在全新的、未顯式出現在任一預訓練集中的任務上進行微調,結果顯示,多樣化模型達到相同性能所需的迭代次數比基線模型少了40%。
![]()
與此同時,其還發現模型的遷移效率與多樣化數據量呈顯著正相關:隨著數據集規模的持續增長,模型在新任務中的驗證誤差不斷下降,這也印證了模型正高效習得從現實世界的豐富內在多樣性中自主學習的能力。
![]()
這樣的實驗結果證明了,使用高多樣性、弱控制數據進行預訓練的可行性與有效性,為具身智能模型的研發提供了全新的實踐依據。
三、突破傳統數據瓶頸,Spirit v1.5定調技術新方向
當下具身智能行業的演進節奏持續加快,從產業端到技術端,國內具身智能正持續在全球舞臺展現硬實力。
在剛剛結束的全球最具影響力的科技盛會之一、“年度科技風向標”國際消費電子展CES 2026上,國產人形機器人驚艷亮相、強勢出圈,再加上此次Spirit v1.5又登頂權威評測榜單,國內玩家在全球具身智能賽道的話語權與行業影響力穩步提升。
在具身智能走向行業落地的關鍵階段,技術路線與創新架構不斷推新,從VLA架構到認知-動作一體化架構,從單模態感知到多傳感器融合,賽道技術探索百花齊放,而權威榜單的位次更迭,正是行業技術創新螺旋式上升的直觀體現。
此次Spirit v1.5的領先,正是其技術優勢的集中釋放,核心依托于模型在泛化性、穩定性、魯棒性等核心系統能力上的全面突破。
其創新采用高多樣性、弱約束的開放式數據采集范式,讓模型突破了傳統“干凈”數據的瓶頸,使得模型能在全新非結構化場景中靈活應對各類不可預測性。
需要注意的是,大模型領域的榜單更迭頻發,但具身智能賽道的位次變化,尤其此次Spirit v1.5登頂權威榜單,絕非單純的技術參數比拼,更不是短期算法調優的結果,而是對模型全鏈路技術路線的系統性驗證,更是其在泛化能力、工程落地性、場景適配性等核心維度的綜合實力體現。
此次,千尋智能Spirit v1.5登頂,證明其不僅已經成為中國具身智能模型最強力量,達到世界級水準,更標志著中國具身模型正式站上全球舞臺,與世界頂尖模型同臺角逐、比肩競技。
從更宏觀層面來看,綜合實力的提升,往往會與吸引頂尖人才、生態合作伙伴等這類長期價值的實現相輔相成。
因此,這一成果不僅能為千尋智能吸引全球頂尖的技術人才,進一步提升其在行業內的技術影響力,更能推動其與產業鏈上下游的生態合作深化,為技術的快速迭代、機器人本體的產品化落地筑牢基礎,也為國內具身智能賽道的技術演進提供了可參考的實踐范式,助力國內具身智能產業從技術突破向規模化落地加速邁進。
結語:中國具身智能的進階之路
我國具身智能產業正處于從技術探索邁向規模化落地關鍵期,疊加工業基礎、供應鏈集成能力和場景密度的獨特優勢,以Spirit v1.5為代表的技術突破,正加速具身智能突破技術邊界,圍繞具身通用大腦的能力探索不斷進階,以技術進化加速具身通用大腦的成熟,最終推動具身智能全面走進千家萬戶、融入日常生活。
未來隨著技術的不斷成熟與生態的持續完善,中國具身智能產業不僅能在全球競爭中鞏固領先優勢,更將開辟全新增長空間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.