2月10日,原力靈機(jī)首場技術(shù)開放日重磅發(fā)布全球首個具身原生大模型 DM0、具身原生開發(fā)框架 Dexbotic 2.0、以及具身原生應(yīng)用量產(chǎn)工作流 DFOL。
![]()
“2026 年不是具身智能的元年,而是具身原生的元年。”原力靈機(jī)CEO唐文斌在現(xiàn)場表示:“過去大家在爭論用哪個大模型來改,我們直接跳出這個問題——為什么要改?為什么不從第一行代碼就為機(jī)器人而寫?”
01.
全球首個具身原生大模型 DM0,2.4B 參數(shù)量登頂全球真機(jī)評測
“具身智能和大模型最大的不一樣,就是要真真切切和物理世界打交道。大模型說錯話頂多是幻覺,但具身模型要是做錯動作,可能會摔碎碗、造成意外,責(zé)任和后果都要嚴(yán)重得多。”原力靈機(jī)合伙人周而進(jìn)表示,具身模型的設(shè)計(jì)從一開始就必須考慮因果責(zé)任,而具身原生正是DM0模型的最重要的研發(fā)準(zhǔn)則。
具身原生模型DM0論文下載地址:https://dexmal.com/DM0_Tech_Report.pdf
![]()
行業(yè)內(nèi)對具身數(shù)據(jù)采集有很多分歧,有人偏愛仿真,有人執(zhí)著真機(jī),但原力靈機(jī)認(rèn)為,關(guān)鍵不在于采集方式,而在于環(huán)境本身,環(huán)境的復(fù)雜程度、規(guī)則清晰度,直接決定了數(shù)據(jù)采集的方案和質(zhì)量。“就像下圍棋,規(guī)則清晰,數(shù)據(jù)本質(zhì)上就是算力,靠仿真和強(qiáng)化學(xué)習(xí)就能探索出好策略;但要是讓機(jī)器人收拾會議室,收拾干凈的標(biāo)準(zhǔn)模糊,數(shù)據(jù)就必須靠復(fù)現(xiàn)人類經(jīng)驗(yàn)來獲取。”周而進(jìn)解釋道。
![]()
基于這套邏輯,原力靈機(jī)提出“環(huán)境的熵在哪,數(shù)據(jù)就采向哪”。對于導(dǎo)航這類規(guī)則清晰的任務(wù),團(tuán)隊(duì)大規(guī)模采集3D掃描場景,通過3D重建和仿真器做強(qiáng)化學(xué)習(xí);對于抓取、全身控制這類模糊任務(wù),就靠大量真機(jī)采集數(shù)據(jù),還把設(shè)備推到真實(shí)場景中,靠場景多樣性提升模型泛化能力。
![]()
DM0 具有兩大優(yōu)勢:
一是從0開始訓(xùn)練的具身原生大模型,聯(lián)合階躍星辰聯(lián)合訓(xùn)練,除了深度融合多模態(tài)互聯(lián)網(wǎng)信息外,還涵蓋駕駛行為數(shù)據(jù)、機(jī)器人操作、導(dǎo)航等具身場景特有的多傳感數(shù)據(jù)。
![]()
二是 DM0 沒有把模型限制在單一硬件或特定場景,而是在預(yù)訓(xùn)練階段系統(tǒng)混合抓取、導(dǎo)航、全身控制3類核心任務(wù),并覆蓋 UR、Franka、ARX、UMI、Aloha、R1-Lite、Realman、DOS-W1 等8種差異顯著的機(jī)型,獲得強(qiáng)跨機(jī)型的泛化與遷移能力。
![]()
這樣的設(shè)計(jì)讓DM0實(shí)現(xiàn)了"小參數(shù)、高性能"的突破,僅2.4B參數(shù)量,卻在RoboChallenge榜單獲得單任務(wù)與多任務(wù)雙項(xiàng)第一,目前位居榜單全球第一。
![]()
更值得一提的是,它支持728x728的高分辨率輸入,解決了行業(yè)內(nèi)主流模型224-384分辨率在精細(xì)操作中容易偏差的問題,實(shí)時推理延遲僅 60ms,在工業(yè)精細(xì)操作中表現(xiàn)突出。并且,DM0模型能在4090、5090等消費(fèi)級顯卡上做二次開發(fā),大大降低了科研和產(chǎn)業(yè)端的使用門檻。
此外,DM0與真機(jī)強(qiáng)化學(xué)習(xí)具備高度適配性,疊加真機(jī)強(qiáng)化學(xué)習(xí)后,復(fù)雜靈巧操作的完成率能實(shí)現(xiàn)明顯提升。這也意味著,該模型并非停留在實(shí)驗(yàn)室階段,而是具備了向真實(shí)場景落地的核心能力。
02.
夯實(shí)具身基礎(chǔ)設(shè)施 Dexbotic 2.0 打造具身智能的 PyTorch
基礎(chǔ)設(shè)施是技術(shù)迭代效率的根本,也是一家AI公司真正的競爭力,原力靈機(jī)重磅發(fā)布全球首個具身原生開發(fā)框架Dexbotic 2.0。原力靈機(jī)合伙人汪天才表示,"PyTorch讓每個研究者都能快速驗(yàn)證想法,Dexbotic 2.0要做的是同樣的事——讓每個開發(fā)者都能用樂高式的方式搭建自己的具身應(yīng)用。"
![]()
Dexbotic2.0五大核心優(yōu)勢:
模塊化架構(gòu),將具身智能系統(tǒng)拆成三塊可自由組合的“樂高模塊”,V(Vision encoder)、L(LLM)、A(Action Expert)模可以獨(dú)立升級、替換和混搭,便于快速試驗(yàn)新模型,并適配不同硬件和任務(wù)場景。
![]()
二是全面支持多源數(shù)據(jù)混合訓(xùn)練,用同一套訓(xùn)練過程,讓模型同步學(xué)會“看懂世界”和“動手操作”;
![]()
此外,Dexbotic 2.0還實(shí)現(xiàn)統(tǒng)一具身操作與導(dǎo)航、統(tǒng)一模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)、標(biāo)準(zhǔn)化具身開發(fā)全流程,從“數(shù)據(jù)—訓(xùn)練—評測—硬件”四個環(huán)節(jié)形成閉環(huán)。
![]()
其中在統(tǒng)一模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)方面,Dexbotic 2.0 構(gòu)建了 “Foundation + Evolution” 的兩段式訓(xùn)練范式,先通過VLA 預(yù)訓(xùn)練和微調(diào),從多源數(shù)據(jù)中學(xué)習(xí)通用操作,形成基礎(chǔ)能力。之后再通過強(qiáng)化學(xué)習(xí)針對復(fù)雜任務(wù)持續(xù)優(yōu)化,提升實(shí)際場景中的穩(wěn)定性與可靠性。這種設(shè)計(jì)模式能夠有效降低對標(biāo)注數(shù)據(jù)的依賴,同時讓機(jī)器人更快掌握技能、更穩(wěn)定完成任務(wù),為真實(shí)環(huán)境下的精細(xì)操作提供了更成熟的技術(shù)方案。
![]()
目前,Dexbotic已經(jīng)服務(wù)數(shù)十家機(jī)構(gòu),包括清華、北大、普林斯頓、帝國理工等知名企業(yè),以及騰訊、北京具身智能機(jī)器人創(chuàng)新中心等知名企業(yè),覆蓋超千位研發(fā)者。
![]()
正如 PyTorch 曾為深度學(xué)習(xí)社區(qū)提供統(tǒng)一、開放的基礎(chǔ)設(shè)施,加速整個領(lǐng)域的繁榮,原力靈機(jī)聯(lián)合清華大學(xué)、無問芯穹,共同宣布打造具身智能的 PyTorch,Dexbotic 2.0與強(qiáng)化學(xué)習(xí)框架 RLinf 達(dá)成戰(zhàn)略合作,通過降低開發(fā)門檻,讓研究者與開發(fā)者專注于算法創(chuàng)新與場景突破。
03.
規(guī)模化落地:破解工程痛點(diǎn) DFOL解鎖具身應(yīng)用量產(chǎn)工作流
在夯實(shí)具身原生技術(shù)底座、打造基礎(chǔ)設(shè)施降低開發(fā)門檻的基礎(chǔ)上,原力靈機(jī)進(jìn)一步推動機(jī)器人走進(jìn)工廠,實(shí)現(xiàn)具身規(guī)模化場景落地,原力靈機(jī)發(fā)布具身應(yīng)用量產(chǎn)工作流 DFOL(Distributed Field Online Learning)。核心是通過“硬件通用+模型智能”的模式,使機(jī)器人既能保持較高效率與確定性,又擁有接近人類的靈活性和適應(yīng)性。
![]()
DFOL 關(guān)鍵創(chuàng)新在于數(shù)據(jù)回流機(jī)制:現(xiàn)場產(chǎn)生的訓(xùn)練片段(episode)與負(fù)樣本塊(negative chunk)實(shí)時回傳云端,形成“云端訓(xùn)練-現(xiàn)場執(zhí)行-數(shù)據(jù)回流-模型更新”的持續(xù)進(jìn)化閉環(huán),使系統(tǒng)能夠在真實(shí)工作環(huán)境中不斷自我改進(jìn),實(shí)現(xiàn)柔性生產(chǎn)力的持續(xù)優(yōu)化。
這不僅是一次技術(shù)升級,更是創(chuàng)造真實(shí)商業(yè)價(jià)值的關(guān)鍵一躍,有利于打破非標(biāo)自動化與人工的邊界,推動物理智能真正走向規(guī)模化和普惠化。
04.
2026年是具身智能真應(yīng)用涌現(xiàn)之年 物流分揀是首個落地突破口
對于商業(yè)化,原力靈機(jī)一直保持著清醒的認(rèn)知。聯(lián)合創(chuàng)始人范浩強(qiáng)表示,“整個具身智能產(chǎn)業(yè)在2026年肯定還實(shí)現(xiàn)不了商業(yè)化閉環(huán),這是業(yè)界共識。2025年更多是概念試點(diǎn),而2026年將是真應(yīng)用的涌現(xiàn)之年,會有更多真實(shí)能用的案例出現(xiàn),但還沒到規(guī)模化起量的階段。”
目前,原力靈機(jī)的業(yè)務(wù)主要分為兩塊:一是端到端的解決方案,聚焦工業(yè)和物流領(lǐng)域,圍繞倉庫、上下產(chǎn)線等場景,為客戶提供算法、硬件和系統(tǒng)實(shí)施的一體化服務(wù);二是科研產(chǎn)品,比如展會上發(fā)布的數(shù)采機(jī)型,和開源理念一致,希望分享硬件設(shè)計(jì)能力,促進(jìn)行業(yè)發(fā)展。
![]()
“我們不做單純的搬箱子業(yè)務(wù),因?yàn)槟壳癆GV小車已經(jīng)做得很好了。”范浩強(qiáng)透露,原力靈機(jī)的第一個落地突破口是多物料混合分揀,這是具身智能的真應(yīng)用,客戶需求也非常明確。此外,物流領(lǐng)域的打包、掃碼等高度非標(biāo)、依賴人工的環(huán)節(jié),也是重點(diǎn)布局方向。
原力靈機(jī)CEO唐文斌強(qiáng)調(diào),商業(yè)化的核心是“給客戶創(chuàng)造可衡量、可計(jì)算的價(jià)值”。“要么降本,要么增效,要么提升體驗(yàn),否則這個商業(yè)模式很難持續(xù)。”
在場景選擇上,原力靈機(jī)有自己的標(biāo)準(zhǔn):必須滿足錯誤容忍、時間容忍、泛化場景、長時間作業(yè)四個條件。“今天的技術(shù)還做不到100%成功,所以需要客戶允許犯錯;而且非標(biāo)場景用傳統(tǒng)自動化方案成本高,才適合具身智能發(fā)揮優(yōu)勢。”唐文斌說。
05.
基建開源+模型自研,原力靈機(jī)的長期目標(biāo)是做機(jī)器人產(chǎn)品公司
具身智能企業(yè)不能只做模型和框架,長期來看還是要做機(jī)器人本體,這也是原力靈機(jī)給自己的定位,其長期目標(biāo)是成為一家機(jī)器人產(chǎn)品公司,打造智能、有用、可信賴的機(jī)器人。而支撐這一目標(biāo)的,是基礎(chǔ)設(shè)施開源+核心模型自研+解決方案落地的三層布局。
在基礎(chǔ)設(shè)施層面,原力靈機(jī)堅(jiān)持開源策略。RoboChallenge測試平臺、Dexbotic2.0框架等核心基建均對外開源,團(tuán)隊(duì)認(rèn)為,開源不僅能降低行業(yè)開發(fā)門檻,還能收到更多的行業(yè)反饋,形成研發(fā)的正向循環(huán)。范浩強(qiáng)表示,偏精模、偏訓(xùn)練的基建環(huán)節(jié)會長期開源,而針對具體客戶、具體任務(wù)的模型和數(shù)據(jù)則不會開源,最終交付給客戶的,仍是軟硬一體的端到端解決方案。
![]()
唐文斌表示,基礎(chǔ)設(shè)施是算法公司的核心競爭力,原力靈機(jī)內(nèi)部打造的數(shù)據(jù)、訓(xùn)練、推理、硬件、評測全鏈路基建,讓其模型迭代速度大幅提升。而將內(nèi)部基建對外輸出,也是希望能推動整個具身智能行業(yè)的發(fā)展。
而在機(jī)器人產(chǎn)品的打造上,原力靈機(jī)強(qiáng)調(diào)有用和可信賴。所謂有用,是指機(jī)器人必須能創(chuàng)造可衡量的價(jià)值,而非單純的展品;所謂可信賴,既包括物理層面的穩(wěn)定性,也包括心理層面的安全感,讓用戶愿意將任務(wù)交給機(jī)器人。
2026年,原力靈機(jī)將加速探索商業(yè)化進(jìn)程,重點(diǎn)推進(jìn)物流、工業(yè)場景的客戶價(jià)值驗(yàn)證,同時持續(xù)迭代模型與框架。從 DM0 打破行業(yè) “改模型” 的路徑依賴,以 2.4B 參數(shù)量登頂全球真機(jī)評測榜首,到 Dexbotic 2.0 聯(lián)合 RLinf 立志扛起具身智能的 “PyTorch” 大旗、破解研發(fā)壁壘,再到 DFOL 攻克工程化難題、打通技術(shù)落地與商業(yè)化閉環(huán),原力靈機(jī)接連拋出的 “三枚重磅炸彈”,正從底層對具身智能產(chǎn)業(yè)進(jìn)行全方位重構(gòu)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.