網易首頁 > 網易號 > 正文申請入駐

具身智能DeepSeek時刻！千尋智能模型開源即登頂全球榜單

2026-01-12 12:44:12　來源: 智東西

北京舉報

分享至

智東西

作者 | 程茜

作者 | 漠影

智東西1月12日報道，今日，千尋智能正式開源具身大模型Spirit v1.5，就在前一天，該模型在全球具身智能模型評測平臺RoboChallenge上，綜合評測斬獲第一。

RoboChallenge的基準測試包含30項任務，包括擺放薯條、尋找固定顏色物體、貼膠帶等30項任務，Spirit-1.5綜合得分為66.09分，成功率達到50.33%，也是唯一一個成功率超過50%的模型。這些任務涵蓋了機器人一系列日常技能，考驗的正是機器人在陌生環境的泛化能力。

榜單截圖

這一成績意味著，其超越了已經霸榜RoboChallenge數月之久的Pi0.5模型。Pi0.5由美國機器人創企Physical Intelligence于2025年4月發布，以能讓機器人在全新環境中執行復雜家務任務而引起熱議。

RoboChallenge榜單由Dexmal原力靈機、Hugging Face全球知名機構聯合發起，是全球首個專為具身智能機器人量身打造的大規模真機評測平臺，主打讓機器人直接在真實物理世界里硬碰硬，檢驗模型的實戰泛化能力。

從Pi0.5霸榜時間之久也可以看出，其在真機實測領域的絕對實力。但值得注意的是，此次Spirit v1.5并不是靠某一項獨門絕技勝過Pi0.5，而是實現了綜合能力全面超車，這也意味著國產具身智能玩家，正式沖進全球第一梯隊的核心圈。

為了證明榜單成績來自自研模型且真實有效，千尋智能已經同步開源了Spirit v1.5的基模權重、推理代碼、使用樣例。

核心代碼開源地址：

https://github.com/Spirit-AI-Team/spirit-v1.5

模型開源地址：

https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5

技術博客：

https://www.spirit-ai.com/en/blog/spirit-v1-5

一、30大貼近真實場景實操任務，Spirit v1.5多項實操任務完勝Pi0.5

實戰見真章，在RoboChallenge的30項任務中，可以看到在下面幾項任務，Spirit v1.5和Pi0.5的直觀對比。

首先是讓機器人往紙箱上貼膠布。Spirit v1.5使得機器人一下子就精準找到了膠布的位置，兩只手配合操作成功將膠布貼到了紙箱上，但Pi0.5經過多次嘗試，也沒能將膠布撕下。

Spirit v1.5模型實測過程（左）、Pi0.5模型實測過程（右）

在擺放物體的任務中，可以看到綠色物體被壓在最下方。Pi0.5模型會先將黃色物體放入箱子，待綠色物體露出后再精準拾取；而Spirit v1.5則是直接在堆疊的物品中主動搜尋綠色物體，沒有拾取錯誤顏色的物品。

Spirit v1.5模型實測過程（左）、Pi0.5模型實測過程（右）

插花任務中，Pi0.5不能識別到瓶口，將花插進去，而是橫放在了花瓶上，Spirit v1.5能通過移動關節，保證花保持豎直，并被插入花瓶中。

Spirit v1.5模型實測過程（左）、Pi0.5模型實測過程（右）

移動物體時，Spirit v1.5可以精準抓取到物品然后放到箱子里，但Pi0.5在執行任務時，無法判斷自己是否已經抓取到相應物品，而是機械操作固定步驟，也不能根據實際場景判斷抬升高度，確保物體順利放入箱內。

Spirit v1.5模型實測過程（左）、Pi0.5模型實測過程（右）

不難看出，貼膠布、物品拾取、插花、移動物體這類貼近實際應用場景的機器人實操任務，是實打實檢驗技術落地能力的關鍵。

其既可以驗證機器人在真實環境中的感知、抓取、協同操作等核心功能的實際表現，也能直觀暴露技術短板，為后續技術迭代、優化產品落地方案提供可落地、可復刻的真實測試依據，更對機器人技術落地及技術有效性有重要意義。

這也恰恰印證了該榜單的核心參考意義。

RoboChallenge的來頭不小，其于2025年成立，由Dexmal、Hugging Face海內外具身智能領域知名機構聯合發起。這一榜單通過真機測試評估模型在物理世界的泛化性，是具身智能領域少數以真實物理任務為核心的評測體系。

其中的30項測試任務正是針對傳統機器人測試場景碎片化、標準不統一，測試結果難以開展橫向比較的行業痛點，RoboChallenge通過制定統一的任務標準與評估指標，搭建跨模型對照機制，構建起一套開放、公正的具身智能評測體系，形成針對性解決方案。

更為關鍵的是，這一平臺可供全球研究者免費使用，還會公開任務數據與中間結果。

RoboChallenge榜單是具身智能飛速發展、落地加速的同時，行業對標準化評測的迫切需求催生出的硬核成果，也是給全球玩家實力較量搭起的公平擂臺，更凸顯出國產具身大模型登頂的含金量。

二、Spirit v1.5登頂背后，破解機器人泛化能力的核心密碼

要拆解Spirit v1.5高光表現背后的原因，首先需要破解制約機器人泛化能力的核心難題。

此前，各家機器人創企秀機器人技能時，很多機器人已能完成在全新環境疊衣服、清潔廚房等長序列復雜任務，大規模VLA（視覺-語言-動作）模型正逐步展現出真正的物理智能。

但這一亮眼表現背后，卻暗藏著關鍵技術隱患：不少業界頂尖模型在訓練階段，會對數據進行嚴苛的預處理，雖能降低機器人模仿人類操作的難度，卻也大幅限制了其實際的泛化能力。

因此，Spirit v1.5的核心就是，讓機器人在預訓練時轉向使用多樣化的、很大程度上不受控的數據，通過從這類貼近現實世界的混亂數據中學習，大幅提升機器人應對真實家庭環境中各類不可預測場景的能力。

千尋智能通過開放式、目標驅動的數據采集，讓操作員以某個目標為前提即興發揮。例如數據采集員的目標是“今天我要用機器人清理廚房臺面”、“給假人模特化妝”，但操作員如何規劃子任務、任務執行順序等都完全隨機。

通過這種方式構建數據集的優勢在于：能實現數據的高度多樣性讓機器人習得更多物理常識，還具備更強可擴展性。

在多樣性層面，依托數據操作員的實際執行過程，其會包含海量的物體交互、軌跡和環境轉換，會在短時間的操作中，包含拾取、放置、打開容器、打掃房間、野外導航等互相交織的數據。

這樣一來，機器人就不是機械學習某個單項任務的執行，而是通過學習整套技能及執行的前后順序，得到更具通用性的知識與能力。

在可擴展性層面，其數據集不需要為每個場景精心設備并定義詳細任務指導，便能在不線性增加管理成本的前提下，高效擴展數據采集規模。根據千尋智能內部實測，采用這種方法，人均有效采集時長增加了200%，并將對算法專家的干預需求削減了60%。

為了用數據說明這種數據集采集范式的有效性，千尋智能建立了兩組模型進行對比，一組是在包含30個精選演示任務的數據集上進行預訓練，一組在開放式多樣化采集的數據集上進行預訓練。

這兩組模型在全新的、未顯式出現在任一預訓練集中的任務上進行微調，結果顯示，多樣化模型達到相同性能所需的迭代次數比基線模型少了40%。

與此同時，其還發現模型的遷移效率與多樣化數據量呈顯著正相關：隨著數據集規模的持續增長，模型在新任務中的驗證誤差不斷下降，這也印證了模型正高效習得從現實世界的豐富內在多樣性中自主學習的能力。

這樣的實驗結果證明了，使用高多樣性、弱控制數據進行預訓練的可行性與有效性，為具身智能模型的研發提供了全新的實踐依據。

三、突破傳統數據瓶頸，Spirit v1.5定調技術新方向

當下具身智能行業的演進節奏持續加快，從產業端到技術端，國內具身智能正持續在全球舞臺展現硬實力。

在剛剛結束的全球最具影響力的科技盛會之一、“年度科技風向標”國際消費電子展CES 2026上，國產人形機器人驚艷亮相、強勢出圈，再加上此次Spirit v1.5又登頂權威評測榜單，國內玩家在全球具身智能賽道的話語權與行業影響力穩步提升。

在具身智能走向行業落地的關鍵階段，技術路線與創新架構不斷推新，從VLA架構到認知-動作一體化架構，從單模態感知到多傳感器融合，賽道技術探索百花齊放，而權威榜單的位次更迭，正是行業技術創新螺旋式上升的直觀體現。

此次Spirit v1.5的領先，正是其技術優勢的集中釋放，核心依托于模型在泛化性、穩定性、魯棒性等核心系統能力上的全面突破。

其創新采用高多樣性、弱約束的開放式數據采集范式，讓模型突破了傳統“干凈”數據的瓶頸，使得模型能在全新非結構化場景中靈活應對各類不可預測性。

需要注意的是，大模型領域的榜單更迭頻發，但具身智能賽道的位次變化，尤其此次Spirit v1.5登頂權威榜單，絕非單純的技術參數比拼，更不是短期算法調優的結果，而是對模型全鏈路技術路線的系統性驗證，更是其在泛化能力、工程落地性、場景適配性等核心維度的綜合實力體現。

此次，千尋智能Spirit v1.5登頂，證明其不僅已經成為中國具身智能模型最強力量，達到世界級水準，更標志著中國具身模型正式站上全球舞臺，與世界頂尖模型同臺角逐、比肩競技。

從更宏觀層面來看，綜合實力的提升，往往會與吸引頂尖人才、生態合作伙伴等這類長期價值的實現相輔相成。

因此，這一成果不僅能為千尋智能吸引全球頂尖的技術人才，進一步提升其在行業內的技術影響力，更能推動其與產業鏈上下游的生態合作深化，為技術的快速迭代、機器人本體的產品化落地筑牢基礎，也為國內具身智能賽道的技術演進提供了可參考的實踐范式，助力國內具身智能產業從技術突破向規模化落地加速邁進。

結語：中國具身智能的進階之路

我國具身智能產業正處于從技術探索邁向規模化落地關鍵期，疊加工業基礎、供應鏈集成能力和場景密度的獨特優勢，以Spirit v1.5為代表的技術突破，正加速具身智能突破技術邊界，圍繞具身通用大腦的能力探索不斷進階，以技術進化加速具身通用大腦的成熟，最終推動具身智能全面走進千家萬戶、融入日常生活。

未來隨著技術的不斷成熟與生態的持續完善，中國具身智能產業不僅能在全球競爭中鞏固領先優勢，更將開辟全新增長空間。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

千尋Spirit v1.5模型登頂 RoboChallenge，終結 Pi0.5領跑時代

量子位 2026-01-12 16:03:12
0 跟貼 0
登頂全球第一后，這家中國公司把“具身大腦”開源了！

華爾街見聞官方 2026-01-12 18:48:49
0 跟貼 0

美國開發六足機器人，跑起來堪比飛人博爾特

裝甲鏟史官 2026-01-03 11:19:04
706 跟貼 706

中國“AI四巨頭”罕見同臺，阿里、騰訊、Kimi與智譜“論劍”：大模型的下一步與中國反超的可能性

華爾街見聞官方 2026-01-11 11:33:57
1 跟貼 1
新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
1 跟貼 1

具身數據戰開打！普通人都能上手，邊采邊篩，只喂機器人愛吃的

量子位 2026-01-12 12:20:02
0 跟貼 0

波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
19 跟貼 19
前谷歌研究員發文：算力崇拜時代該結束了

機器之心Pro 2026-01-12 18:27:12
0 跟貼 0

直擊WAIC丨當人形機器人走入康養場景，如何滿足人類多樣需求？

每日經濟新聞 2025-07-26 19:09:29
0 跟貼 0
機器人終于有自己的真機評測大考了

量子位 2025-10-15 20:05:44
0 跟貼 0
睿爾曼CES曬三大具身智能產品，演示跨洋實時遙操機器人拿東西

智東西 2026-01-12 12:01:08
0 跟貼 0
跳出手機屏幕，千問正在改變物理世界

經濟觀察報 2026-01-12 18:30:04
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
馬斯克：3年內機器人超越頂尖醫生

財聯社 2026-01-09 15:31:35
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
人形機器人產業突破關鍵在于“大腦”核心技術

每日經濟新聞 2025-09-16 20:30:32
0 跟貼 0
機器人疊衣，靈巧手抓萬物，超實用機器人組合來了

量子位 2025-07-29 03:31:41
0 跟貼 0
機器人當上火炬手了，機器狗傳遞全運會吉祥物

每日經濟新聞 2025-11-03 06:56:14
0 跟貼 0
機械手真正「活」了04

機器之心Pro 2025-11-06 14:07:32
0 跟貼 0
世界模型引擎驅動的具身智能學習新范式

機器之心Pro 2025-10-28 15:45:21
0 跟貼 0
LeCun爆料，機器人行業的驚天秘密！

機器之心Pro 2025-10-28 17:38:28
0 跟貼 0
三維空間太難懂？1

機器之心Pro 2025-12-31 13:49:25
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0
靈巧手作為獨立執行平臺，實現工業與家庭場景應用

量子位 2025-12-11 03:38:13
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
格斗冠軍機器人突然發瘋！嚇呆研究人員

量子位 2025-07-25 09:10:58
0 跟貼 0
英特爾具身智能機器人，竟解鎖了rap技能

機器之心Pro 2025-11-26 15:20:41
0 跟貼 0
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0
中美CIO對話：負責任AI的價值重構與跨境破局之道在哪？丨2025 T-EDGE全球對話

鈦媒體APP 2026-01-12 18:07:13
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
AI視頻是如何生成的？

DeepTech深科技 2026-01-12 17:09:47
0 跟貼 0
新“易中天”橫空出世！改寫“AI時代廣告營銷的底層邏輯”：GEO

華爾街見聞官方 2026-01-12 15:42:12
0 跟貼 0
成者會議星AI會議工作站評測：一臺把“開會”這件事變簡單的神器

雷科技 2026-01-12 18:54:54
0 跟貼 0
Anthropic掏出新模型，進軍醫療硬剛OpenAI，能讀5萬家醫院病歷

智東西 2026-01-12 19:35:52
0 跟貼 0
24小時就能孕育出一名嬰兒，而母親卻是機器人

三鴨侃劇 2026-01-11 09:33:59
24 跟貼 24
機器人界“華山論步”，九款機型步態大PK

網易科技態度見聞 2026-01-11 11:00:00
0 跟貼 0

智東西

聚焦智能變革，服務產業升級。

11058文章數 116941關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

游戲

教育

房產

藝術

家居要聞

手機 / 數碼

房產 / 家居

具身智能DeepSeek時刻！千尋智能模型開源即登頂全球榜單

面對SpaceX瘋狂“下餃子” 中國正面接招

女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

聰明的球員，不是教練教出來的

蔡少芬結婚18周年，與張晉過二人世界

倍輕松信披迷霧 實控人占用資金金額存疑

增配不加價 北京現代 第五代 勝達2026款上市

態度原創

包絡石木為生 野性舒適

《暗黑4》DLC全新區域地圖泄露：奈非天的故鄉!

剛迎超長寒假！北京中小學又撞上近十年“最短學期”？！

重磅調規！417畝商改住+教育地塊！海口西海岸又要爆發！

畫完這組畫，他抑郁了，后來自殺了

女子坐火車遇71歲初中班主任被一口叫出名字感動落淚

女子坐火車遇71歲初中班主任被一口叫出名字感動落淚

倍輕松信披迷霧實控人占用資金金額存疑

增配不加價北京現代第五代勝達2026款上市

包絡石木為生野性舒適