![]()
12月18日,大曉機器人正式發(fā)布行業(yè)首創(chuàng)的ACE具身研發(fā)范式、首個開源且商業(yè)應用的開悟世界模型3.0(Kairos 3.0)、讓具身本體擁有自主空間智能的具身超級大腦模組A1,與行業(yè)伙伴共同構建全鏈自主可控、開放共贏的產業(yè)級生態(tài)體系。
據(jù)「TMT星球」了解,大曉機器人源于“大千世界,曉識萬象”,“大千世界”是廣闊、復雜、多樣、充滿細節(jié)的;“曉識萬象”是在浩瀚世界中知曉、洞察規(guī)律。讓機器人真正洞察并理解萬象規(guī)律,才能使其學會與世界精準交互。這正是大曉機器人的使命——讓每個機器人擁有“聰明的大腦”。
商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、大曉機器人董事長王曉剛表示「大曉機器人秉持持續(xù)創(chuàng)新的技術理念,攜手產業(yè)鏈伙伴共建開放協(xié)同的產業(yè)生態(tài),通過ACE具身研發(fā)范式、開悟世界模型及具身超級大腦等突破性成果,推動具身智能實現(xiàn)規(guī)模化商業(yè)落地與產業(yè)蓬勃發(fā)展,為中國在全球智能技術競爭中構建自主可控、引領未來的發(fā)展路徑。」
大曉機器人首席科學家陶大程兼具頂尖學術造詣與深厚產業(yè)實踐積淀。作為澳大利亞科學院院士,他榮獲IEEE計算機學會技術成就獎,在學術領域持續(xù)推動人工智能基礎研究的邊界拓展;同時,他曾出任京東探索研究院創(chuàng)始院長、優(yōu)必選人工智能首席科學家,深度參與科技企業(yè)的技術戰(zhàn)略布局與產品落地實踐。
大曉機器人匯集來自南洋理工大學、香港大學和香港中文大學的全球稀缺的AI領域前沿科學家:呂健勤、李鴻升、劉子緯、潘新鋼、趙恒爽、劉希慧;他們是環(huán)境智能、世界模型、具身模型領域的開拓者,其持續(xù)創(chuàng)新能力將助力大曉機器人搶占技術制高點。作為全球頂尖AI實驗室MMLab的核心成員,他們傳承的創(chuàng)新精神正引領人工智能打破數(shù)字世界和物理世界的邊界,開啟具身智能自主探索新時代。
“以人為中心”的ACE范式根本性革新具身智能研發(fā)路徑
人類的智能蘊藏于數(shù)據(jù)之中,數(shù)據(jù)始終是 AI 進化的核心支撐。AI 1.0的人工標注時代,包含1400萬張圖像、覆蓋數(shù)萬個類別ImageNet 數(shù)據(jù)集,若由單人全職完成全部標注,需長達10.5年。進入AI 2.0大語言模型時代,數(shù)據(jù)規(guī)模實現(xiàn)指數(shù)級躍升,以Common Crawl為代表的互聯(lián)網文本數(shù)據(jù)集,讓單人全職進行原創(chuàng)撰寫需超過12萬年才能完成。
邁入具身智能時代,行業(yè)面臨數(shù)據(jù)量級的斷崖式缺口。智能駕駛領域,特斯拉FSD V14 在世界模型仿真器的加持下,每日訓練量相當于人類駕駛員400萬小時,約等于500年的駕駛經驗。而當前具身智能領域的真機數(shù)據(jù)量級僅為10萬小時,這一懸殊差距清晰表明,具身智能的研發(fā)無法延續(xù)傳統(tǒng)研發(fā)路徑,必須實現(xiàn)范式上的根本性革新,才能突破發(fā)展瓶頸。
“以機器為中心”的研發(fā)范式,其根本局限在于將機器人本體及其硬件參數(shù)置于研發(fā)流程的核心,本質上是用極高的資源消耗,換取有限且僵化的“智能”。
通過采集員真機遙操,海量收集各類機器人的本體數(shù)據(jù),本質是讓人去適配和遷就機器的多樣性。這一路徑導致數(shù)據(jù)采集成本高昂、效率低下,且產出的技能模型嚴重綁定于特定硬件,“智能”被禁錮在單一軀殼之內,無法形成通用的認知與適應能力,已成為行業(yè)向規(guī)模化、通用化發(fā)展的關鍵障礙。
當前,特斯拉、Figure AI正集體放棄此前依賴的真機遙操路徑,轉而探索純視覺學習方案,其理想是讓機器人通過觀看海量視頻,直接習得人類的動作與智慧。但這種學習方式缺乏對三維物理世界的力學規(guī)律、物理屬性和動作意圖理解,學習曲線陡峭,存在難以逾越的“現(xiàn)實鴻溝”。
上述兩種路徑均無法理解人所處世界的物理規(guī)律和人類行為的因果一致性,陷入本質困境:前者是“為難人”,后者是“為難機器”。
![]()
大曉機器人率先提出“以人為中心(Human-centric)” 的ACE具身研發(fā)范式,為行業(yè)發(fā)展帶來根本性的革新。ACE具身研發(fā)范式中環(huán)境式數(shù)據(jù)采集可實現(xiàn)一年千萬小時的數(shù)據(jù)收集,開悟世界模型3.0則不斷放大真實數(shù)據(jù)價值,使其達到上億小時數(shù)據(jù)規(guī)模的效果。
ACE研發(fā)范式徹底顛覆傳統(tǒng)邏輯,將人類與物理世界的互動規(guī)律作為核心研究起點,以環(huán)境式數(shù)據(jù)采集為引擎,構建了一套從“環(huán)境式數(shù)據(jù)采集—開悟世界模型3.0—具身交互”的全鏈路技術體系。
ACE范式核心技術之一環(huán)境式數(shù)據(jù)采集技術,通過跨視角多模態(tài)設備,融合視覺、觸覺、語音、力學規(guī)律等多維度數(shù)據(jù),物理級建模與全場景覆蓋的創(chuàng)新設計,為具身智能模型訓練提供 “人—物—場”全要素精準數(shù)據(jù)支撐。
環(huán)境式數(shù)據(jù)采集技術以人為中心構建全要素采集體系,整合第一視角與第三視角視頻、力觸覺信息、運動軌跡、語音等多模態(tài)數(shù)據(jù),構建基于物理基礎的3D資產庫,全面覆蓋具身模型訓練所需的各類交互信息,實現(xiàn)了多視角協(xié)同、長程任務覆蓋與全維度信息捕捉的跨越式升級。
在數(shù)據(jù)處理環(huán)節(jié),通過時序一致性對齊、交互動態(tài)軌跡預測建模與物理正確性仿真校正,將采集到的“人—物—場”信息轉化為可直接用于模型訓練的動態(tài)場景數(shù)據(jù),實現(xiàn)從數(shù)據(jù)采集到應用的全鏈路打通。
該技術路徑的推出為具身智能帶來四大核心數(shù)據(jù)價值。1、數(shù)據(jù)維度更全面,完成超10個視角、8種模態(tài)、4大類物品屬性的多模態(tài)數(shù)據(jù)升級,實現(xiàn)全要素覆蓋;2、任務覆蓋更長程,支撐分鐘級、數(shù)百種原子動作的復雜任務;3、交互精度更高,達到亞像素級標準,可精準追蹤人手精細化操作等復雜動作;4、采集效率更具規(guī)模化,能快速完成從十萬小時到千萬小時的海量數(shù)據(jù)積累。
在即時零售倉儲場景中,該方案已實現(xiàn)多視角數(shù)據(jù)采集,覆蓋數(shù)萬種 SKU,完成倉儲分揀與打包全流程,涵蓋五大階段13個原子動作;在居家、零售等多元場景中,也已實現(xiàn)對人體自然行為、物品交互軌跡的精準捕捉,甚至能復現(xiàn)遙操作范式下難以實現(xiàn)的生鮮抓取、精細化放置等任務。
以環(huán)境式采集數(shù)據(jù)為基,大曉機器人發(fā)布了首個開源且商業(yè)化應用的世界模型——開悟世界模型3.0,形成跨本體的統(tǒng)一世界理解框架,融合物理規(guī)律、人類行為和真機動作,使機器不僅能“理解”物理世界因果規(guī)律,還能“生成”長時動靜態(tài)交互場景,進而“預測”萬千可能。
作為首個“多模態(tài)理解—生成—預測”的世界模型,開悟世界模型3.0通過視覺、3D 軌跡、觸覺、摩擦力等多維度信息輸入,深度理解真實世界的物理規(guī)律與人類行為的底層邏輯,讓模型能形成“知其然,知其所以然”的思維鏈。
基于多模態(tài)信息的深度融合,模型可生成長時動態(tài)交互場景視頻,在場景內實現(xiàn)各元素精準可控;并具備跨本體一鍵生成、多本體泛化、預測萬千演化路徑等特性,為具身智能提供高保真、可泛化的虛擬訓練環(huán)境。
基于上述優(yōu)勢,大曉機器人打造了開悟具身智能世界模型產品平臺,并于12月18日正式發(fā)布。開悟具身智能世界模型產品平臺集成“文生世界、像驅世界、跡塑世界”等多模態(tài)生成能力,內置支持11大類、54細類,累計328個標簽,覆蓋115個垂類具身場景,開發(fā)者只需輸入簡單指令,就能快速生成可視化的任務模擬內容,并可一鍵分享,大幅降低具身智能的開發(fā)門檻。
開悟世界模型3.0于12月18日面向全行業(yè)開源。通過領先的產品平臺,大曉機器人向全行業(yè)開放API,讓所有企業(yè)都可以使用開悟世界模型工具鏈,助力千行萬業(yè)的發(fā)展,推動各類輕量化、定制化具身智能產品快速涌現(xiàn),促進應用生態(tài)發(fā)展。
開悟世界模型3.0已與沐曦股份、壁仞科技、中科曙光等多款廠商國產芯片完成適配,極大提升了芯片性能,全面趕超國際頂尖芯片;如同DeepSeek與國產芯片的全鏈路生態(tài)所帶來的虛擬世界變革,開悟世界模型3.0與全產業(yè)伙伴共同構建空間智能創(chuàng)新生態(tài),形成從底層算力到上層智能應用的協(xié)同合力,重塑全球技術競爭格局。
具身超級大腦模組A1重磅發(fā)布
大曉機器人正式重磅推出具身超級大腦模組A1,并與行業(yè)伙伴共建具身智能創(chuàng)新生態(tài),加速機器人商業(yè)化落地,推進具身智能產業(yè)價值。
基于大曉機器人團隊領先的純視覺無圖端到端VLA模型優(yōu)勢,搭載具身超級大腦模組A1的機器狗無需預采高精地圖即可適應復雜、動態(tài)、陌生環(huán)境。依托模型的視覺理解和運動規(guī)劃能力,機器人能實現(xiàn)動態(tài)環(huán)境下魯棒、安全、合理的路徑生成,真正實現(xiàn)“自主行動”。
![]()
具身超級大腦模組A1具備擁有云端交互能力,依托云端模型平臺,能實時解析自然語言指令與圖像語義的意圖關系,像人一樣理解復雜的現(xiàn)實世界,生成可執(zhí)行的中間指令(如“前進50厘米”“繞過障礙”“靠近目標”),再由底層控制器精確執(zhí)行。這使得機器狗不僅能夠在復雜環(huán)境中完成自主巡檢、跟隨、避障等多樣任務,而且能根據(jù)自然語言指令精準完成任務。
此外,大曉機器人結合Insta360 全景感知方案與商湯方舟通用視覺平臺,構建起全方位、高精度的環(huán)境感知體系。不僅能覆蓋超10個行業(yè),還可實現(xiàn)超150個智能化應用場景適配,覆蓋從日常行為分析到特殊風險預警的全需求。
基于以上優(yōu)勢,具身超級大腦模組A1在安防、能源、交通、文旅等對設備可靠性要求極高的場景中,可實現(xiàn)長期穩(wěn)定工作,讓具身智能真正具備了走進產業(yè)一線的實用價值。
共建具身智能發(fā)展全鏈路自主創(chuàng)新生態(tài)
當前,具身智能產業(yè)進入加速落地的關鍵階段,大曉機器人以生態(tài)協(xié)同為核心,與具身廠商、硬件、芯片、云服務、數(shù)據(jù)廠商等多領域伙伴達成戰(zhàn)略合作,共同搭建全鏈路自主可控的具身智能生態(tài),推動技術從單點突破走向場景化落地。
![]()
在具身本體領域,大曉已攜手智元機器人、銀河通用、鈦虎機器人、國地中心等多家頭部企業(yè),打通全新技術范式、世界模型與機器人硬件的適配鏈路,共同打造適用于不同場景的解決方案。
芯片領域,開悟世界模型3.0已經與沐曦、壁仞科技、中科曙光、輝曦智能、影微創(chuàng)新等多款國產廠商芯片完成適配,極大提升了芯片性能,突破DeepSeek與國產芯片的全鏈路生態(tài)所帶來的虛擬世界變革,構建空間智能生態(tài),重塑全球技術競爭格局。
硬件領域,大曉機器人與Insta360、臥龍電驅、帕西尼等伙伴深度綁定,依托硬件廠商的感知等各類硬件,強化世界模型、模組產品對多視角、動態(tài)場景的信息采集能力。
在云服務與數(shù)據(jù)層面,大曉機器人聯(lián)合商湯大裝置、騰訊云、火山引擎、商湯方舟、算豐信息等平臺,構建全流程支持體系。借助云服務商的算力調度能力,降低中小廠商的研發(fā)成本;依托庫帕思、中建西南院的數(shù)據(jù)資源,持續(xù)優(yōu)化世界模型的場景泛化能力,讓方案能快速適配不同行業(yè)的個性化需求。
大曉機器人將持續(xù)技術創(chuàng)新、持續(xù)打造領先模型、持續(xù)推動智能化應用、持續(xù)深化生態(tài)協(xié)同,加速更多行業(yè)級具身智能方案的落地,引領中國具身智能產業(yè)的規(guī)模化發(fā)展,與行業(yè)伙伴共拓中國具身智能的未來版圖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.