![]()
![]()
編輯:前沿在線 編輯部
具身智能飛速發(fā)展的這幾年,我們共同見(jiàn)證了機(jī)器人在感知、決策、控制等核心能力上的跨越式進(jìn)化。模型越來(lái)越強(qiáng),算法越來(lái)越精,對(duì)深耕具身智能領(lǐng)域的我們而言,核心技術(shù)路徑正逐步跑通,行業(yè)正從“技術(shù)攻堅(jiān)”邁入“規(guī)模化擴(kuò)展(scaling)”的全新階段。
去年,我們發(fā)布了行業(yè)首個(gè)一站式具身智能模型開(kāi)發(fā)平臺(tái)Genie Studio,賦予用戶VLA模型“采、訓(xùn)、測(cè)、推”全流程能力。但當(dāng)訓(xùn)練好的模型真正走入真實(shí)的工廠車間、適配復(fù)雜的產(chǎn)業(yè)場(chǎng)景時(shí),一個(gè)更現(xiàn)實(shí)、更迫切的問(wèn)題浮出水面——如何讓機(jī)器人真正落地應(yīng)用,并且實(shí)現(xiàn)規(guī)模化復(fù)制?
很多企業(yè)在這一刻停住了腳步。機(jī)器人部署的門檻太高、周期太長(zhǎng)、風(fēng)險(xiǎn)太不可控:每一次上線都需要大量定制開(kāi)發(fā),每一次試錯(cuò)都可能帶來(lái)昂貴的停工代價(jià),每一個(gè)場(chǎng)景的復(fù)制都要重新投入大量人力物力。具身智能的規(guī)模化部署,已然成為橫亙?cè)诩夹g(shù)突破與產(chǎn)業(yè)應(yīng)用之間的一道關(guān)鍵門檻。
今天,智元希望以自身構(gòu)建的能力,與產(chǎn)業(yè)伙伴共同推動(dòng)具身智能跨越關(guān)鍵門檻,推動(dòng)整個(gè)行業(yè)朝著更廣泛、更高效的“部署態(tài)”再進(jìn)一步。
智元AI發(fā)布周第五日,我們正式推出
面向具身作業(yè)場(chǎng)景的零代碼應(yīng)用平臺(tái)——Genie Studio Agent,以一站式解決方案,讓機(jī)器人部署變得簡(jiǎn)單、高效、可復(fù)制。
這是一套貫穿機(jī)器人從開(kāi)發(fā)到部署、從運(yùn)行到優(yōu)化的全生命周期軟件基礎(chǔ)設(shè)施,覆蓋VLA模型、強(qiáng)化學(xué)習(xí)、視覺(jué)感知、運(yùn)動(dòng)控制、導(dǎo)航規(guī)劃等核心能力。
平臺(tái)搭載開(kāi)箱即用的標(biāo)準(zhǔn)化解決方案,在底層技術(shù)SDK基礎(chǔ)上,精心封裝了直觀的可視化界面與豐富的行業(yè)場(chǎng)景模板,即使是非工程技術(shù)人員也能輕松配置并部署機(jī)器人應(yīng)用,極大地降低具身智能的部署門檻。
![]()
四大核心能力,重新定義“部署效率”零代碼上手,完成作業(yè)流程編排
某種意義上,這是通往AGI時(shí)代的一場(chǎng)生產(chǎn)力重構(gòu)。在過(guò)去,開(kāi)發(fā)一個(gè)機(jī)器人應(yīng)用,往往意味著要從底層開(kāi)始“從零造輪子”:搭建行為樹(shù)、寫代碼、調(diào)算法、反復(fù)測(cè)試、不斷修正,每一個(gè)環(huán)節(jié)都依賴高門檻的工程能力,也意味著高昂的人力與時(shí)間成本。因此,有部署需求的企業(yè),往往需要尋求專業(yè)的具身智能企業(yè)或集成商,經(jīng)過(guò)漫長(zhǎng)的場(chǎng)景評(píng)估、立項(xiàng)、定制開(kāi)發(fā)、現(xiàn)場(chǎng)部署和項(xiàng)目交付,才能實(shí)現(xiàn)機(jī)器人落地。
而Genie Studio Agent徹底改變了這一現(xiàn)狀:我們將視覺(jué)感知、運(yùn)動(dòng)控制、導(dǎo)航規(guī)劃、VLA模型、強(qiáng)化學(xué)習(xí)(RL)工具鏈等復(fù)雜能力,全部進(jìn)行模塊化重組,封裝成可以直接調(diào)用的能力組件。
平臺(tái)內(nèi)置了強(qiáng)大的無(wú)代碼/低代碼任務(wù)流編輯器,真正實(shí)現(xiàn)“零代碼上手”,無(wú)工程背景的用戶也能輕松操作。
用戶無(wú)需輸入復(fù)雜的代碼與算法,只需拖拽相應(yīng)的節(jié)點(diǎn)、簡(jiǎn)單配置參數(shù),即可通過(guò)平臺(tái)快速構(gòu)建屬于自己的機(jī)器人任務(wù)流程,得到專屬的機(jī)器人應(yīng)用。
機(jī)器人應(yīng)用開(kāi)發(fā)不再是工程師的專屬,模型也不再是高門檻的能力,而成為每一個(gè)“有場(chǎng)景部署需求的人”直接定義機(jī)器人行為、編排的過(guò)程,讓機(jī)器人應(yīng)用的定義權(quán)從代碼回到場(chǎng)景本身。
仿真先行,在3D虛擬世界“預(yù)演”真實(shí)生產(chǎn)
Genie Studio Agent的出現(xiàn),也徹底重塑了機(jī)器人的部署方式。傳統(tǒng)機(jī)器人部署中,除了開(kāi)發(fā)成本,試錯(cuò)成本更是居高不下:現(xiàn)場(chǎng)調(diào)試往往伴隨著生產(chǎn)線停產(chǎn)等待、反復(fù)驗(yàn)證和不可預(yù)期碰撞、故障等風(fēng)險(xiǎn)。而Genie Studio Agent 內(nèi)置三維場(chǎng)景重建與仿真系統(tǒng),致力于解決這一痛點(diǎn)。
用戶在真實(shí)部署前,都能在虛擬環(huán)境中完成作業(yè)全流程的預(yù)演:每一條作業(yè)流程、每一條路徑規(guī)劃、每一次人機(jī)交互,都能在虛擬環(huán)境中被反復(fù)驗(yàn)證、優(yōu)化調(diào)整。可能的風(fēng)險(xiǎn)、碰撞、誤差,在數(shù)字世界里提前規(guī)避,大幅縮短現(xiàn)場(chǎng)調(diào)試時(shí)間,降低部署成本。
當(dāng)機(jī)器人真正進(jìn)入生產(chǎn)環(huán)境時(shí),它已經(jīng)不是“第一次嘗試”,而是經(jīng)過(guò)虛擬環(huán)境充分驗(yàn)證、優(yōu)化后的“成熟執(zhí)行”。
真機(jī)強(qiáng)化學(xué)習(xí),讓機(jī)器人具備持續(xù)優(yōu)化能力
真正有價(jià)值的機(jī)器人系統(tǒng),不應(yīng)該是靜態(tài)的。
在Genie Studio Agent平臺(tái)上,強(qiáng)化學(xué)習(xí)真正走進(jìn)真實(shí)作業(yè)場(chǎng)景、賦能實(shí)際生產(chǎn)。機(jī)器人部署上線后,并非機(jī)械地重復(fù)既定策略,而是能在實(shí)際操作中持續(xù)學(xué)習(xí)、不斷優(yōu)化策略。
通過(guò)力控反饋與視覺(jué)識(shí)別,精準(zhǔn)捕捉每一次操作的細(xì)節(jié)偏差,不斷優(yōu)化動(dòng)作精度與作業(yè)效率。在一次次抓取與放置之間,它逐漸逼近更優(yōu)的執(zhí)行方式、精度更高的作業(yè)能力,機(jī)器人的能力開(kāi)始具備成長(zhǎng)性。
從“部署完成”走向“持續(xù)運(yùn)營(yíng)”,讓機(jī)器人真正變成生產(chǎn)力
對(duì)于企業(yè)而言,部署應(yīng)用后緊接而來(lái)的挑戰(zhàn)是讓機(jī)器人長(zhǎng)期穩(wěn)定地運(yùn)行。平臺(tái)打破了“部署即結(jié)束”的傳統(tǒng)認(rèn)知,將視角延伸到機(jī)器人的長(zhǎng)期運(yùn)行全流程,提供全方位的運(yùn)行監(jiān)管能力。
機(jī)器人集群監(jiān)管平臺(tái)將機(jī)器人集群的運(yùn)行數(shù)據(jù)、狀態(tài)與異常統(tǒng)一納入可視化體系,幫助企業(yè)實(shí)時(shí)掌握設(shè)備狀態(tài),統(tǒng)計(jì)各產(chǎn)線表現(xiàn)。
當(dāng)設(shè)備出現(xiàn)潛在故障、運(yùn)行異常時(shí),系統(tǒng)會(huì)提前發(fā)出預(yù)警信號(hào),提醒工作人員及時(shí)處理。這讓機(jī)器人運(yùn)維從“被動(dòng)響應(yīng)故障、事后維修”,升級(jí)為“主動(dòng)預(yù)判風(fēng)險(xiǎn)、提前管控”。
這不僅降低了運(yùn)維成本,更保障了生產(chǎn)節(jié)奏的連續(xù)性和穩(wěn)定性。機(jī)器人應(yīng)用不再只是一次項(xiàng)目交付成果,而成為真正可以長(zhǎng)期運(yùn)營(yíng)、持續(xù)創(chuàng)造價(jià)值的生產(chǎn)力系統(tǒng)。
![]()
實(shí)踐驗(yàn)證:讓復(fù)雜工業(yè)場(chǎng)景的部署輕松落地
平臺(tái)真正的價(jià)值,最終要在真實(shí)作業(yè)場(chǎng)景中被驗(yàn)證。
目前,Genie Studio Agent已經(jīng)在多個(gè)高精度制造場(chǎng)景中完成落地驗(yàn)證,持續(xù)證明機(jī)器人部署不必再依賴長(zhǎng)周期、高成本的深度定制,而是可以通過(guò)標(biāo)準(zhǔn)化平臺(tái)能力,實(shí)現(xiàn)更高效的工程化復(fù)制。
此前,智元已在某頭部半導(dǎo)體封測(cè)企業(yè),基于 Genie Studio Agent 成功跑通“晶圓搬運(yùn)”全流程。從高精度位姿調(diào)整,到復(fù)雜環(huán)境下的路徑導(dǎo)航,再到力控抓取與強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的精密放置,十余個(gè)關(guān)鍵作業(yè)節(jié)點(diǎn)被整合進(jìn)統(tǒng)一流程,實(shí)現(xiàn)了穩(wěn)定且高效的連續(xù)執(zhí)行。過(guò)去往往需要數(shù)周才能完成的部署周期,如今通過(guò)平臺(tái)化配置被大幅壓縮,驗(yàn)證了 Genie Studio Agent 在高要求工業(yè)場(chǎng)景中的實(shí)際部署價(jià)值。
更具代表性的是,Genie Studio Agent平臺(tái)的能力,也正在被更多生態(tài)伙伴快速轉(zhuǎn)化為面向行業(yè)客戶的真實(shí)生產(chǎn)力。
目前,智元生態(tài)伙伴基于國(guó)際領(lǐng)先芯片企業(yè)半導(dǎo)體封測(cè)場(chǎng)景需求,借助 Genie Studio Agent 平臺(tái),成功完成了 Tray 盤上下料全流程作業(yè)驗(yàn)證。這不僅意味著機(jī)器人已具備在高精度、高合規(guī)要求的半導(dǎo)體封測(cè)場(chǎng)景中穩(wěn)定作業(yè)的能力,也驗(yàn)證了合作伙伴可以基于 Genie Studio Agent,自主完成復(fù)雜工業(yè)場(chǎng)景的工程化部署。
半導(dǎo)體封測(cè),是機(jī)器人落地最具挑戰(zhàn)的場(chǎng)景之一。這里對(duì)安全、精度、穩(wěn)定性有著極高要求,同時(shí)產(chǎn)線又對(duì)柔性化、智能化升級(jí)有著迫切需求。面對(duì) Tray 盤上下料這樣的精密作業(yè),機(jī)器人不僅要完成從待命點(diǎn)啟動(dòng)、料架識(shí)別、自適應(yīng)接近、精準(zhǔn)抓取,到機(jī)臺(tái)上下料、堆疊搬運(yùn)、物料歸位的完整閉環(huán),更要在料架存在 ±10cm 偏差、設(shè)備布局變化、現(xiàn)場(chǎng)干擾等復(fù)雜條件下,始終保持穩(wěn)定輸出。
伙伴基于 Genie Studio Agent 提供的作業(yè)智能開(kāi)發(fā)與部署平臺(tái),在真實(shí)生產(chǎn)環(huán)境復(fù)刻的實(shí)驗(yàn)室中,僅用半小時(shí)便完成應(yīng)用編排,將原本數(shù)天甚至數(shù)周的應(yīng)用開(kāi)發(fā)與調(diào)試周期壓縮至小時(shí)級(jí)。借助平臺(tái)的仿真試運(yùn)行能力,團(tuán)隊(duì)在正式部署前即可快速完成路徑驗(yàn)證、節(jié)拍測(cè)試和異常預(yù)演,大幅降低試錯(cuò)成本。
與此同時(shí),結(jié)合平臺(tái)內(nèi)置的強(qiáng)化學(xué)習(xí)能力,機(jī)器人在作業(yè)過(guò)程中持續(xù)優(yōu)化放置策略,實(shí)現(xiàn) Tray 盤高精度、低擾動(dòng)入位。
最終,生態(tài)伙伴順利跑通芯片封測(cè)場(chǎng)景的 Tray 盤上下料全流程,并交出了面向高端制造的穩(wěn)定答卷:作業(yè)成功率達(dá)到 99.999% 以上,掉盤率低于 0.001%,系統(tǒng)平均無(wú)故障運(yùn)行時(shí)間超過(guò) 168 小時(shí)。即便設(shè)備布局發(fā)生變化,機(jī)器人也可在 2 小時(shí)內(nèi)完成自適應(yīng)調(diào)試;任務(wù)流程調(diào)整后,10 分鐘內(nèi)即可完成配置生效。面對(duì)人員進(jìn)入作業(yè)區(qū)域、急停或人為阻擋等突發(fā)情況,機(jī)器人均實(shí)現(xiàn)了 100% 的安全避讓與斷點(diǎn)恢復(fù)。
生態(tài)伙伴基于Genie Studio Agent
跑通芯片封測(cè)Tray盤上下料場(chǎng)景
除了半導(dǎo)體封測(cè)場(chǎng)景,Genie Studio Agent 也在汽車零部件制造場(chǎng)景中展現(xiàn)出強(qiáng)大的適配能力。
智元的生態(tài)合作伙伴基于平臺(tái)提供的強(qiáng)化學(xué)習(xí)模型推理工具,為頭部汽車零部件企業(yè)成功實(shí)現(xiàn)了安全帶卷收器精密上料技能,形成了面向自動(dòng)化作業(yè)場(chǎng)景的解決方案。
這一場(chǎng)景同樣具有很高的實(shí)施難度。安全帶卷收器外殼屬于高反金屬物體,感知難、定位難、抓取穩(wěn)定性要求高;上料底座有 3 個(gè)定位稍,放置允許誤差小于 1mm,同時(shí),現(xiàn)場(chǎng)作業(yè)還對(duì)節(jié)拍、連續(xù)運(yùn)行穩(wěn)定性提有很高要求。基于 Genie Studio,伙伴在小時(shí)級(jí)快速訓(xùn)練后,即可完成對(duì)高反金屬物體的高難度三銷定位,并在復(fù)雜工況下保持穩(wěn)定輸出。實(shí)際驗(yàn)證顯示,方案作業(yè)成功率可穩(wěn)定達(dá)到 99.9% 以上,單次作業(yè)節(jié)拍控制在 13 秒以內(nèi)。
從半導(dǎo)體封測(cè)到汽車零部件制造,這些來(lái)自生態(tài)伙伴的實(shí)踐案例,驗(yàn)證的不只是某一個(gè)技能點(diǎn)、某一個(gè)模型能力,或某一臺(tái)機(jī)器人本體的單點(diǎn)表現(xiàn),而是 Genie Studio Agent 作為具身作業(yè)場(chǎng)景應(yīng)用平臺(tái)的完整部署能力:
從任務(wù)編排、仿真驗(yàn)證,到視覺(jué)感知、運(yùn)動(dòng)控制、強(qiáng)化學(xué)習(xí)優(yōu)化,再到異常恢復(fù)與穩(wěn)定運(yùn)行,合作伙伴可以基于平臺(tái)快速封裝和調(diào)用復(fù)雜能力,讓機(jī)器人在高精度、高合規(guī)要求的場(chǎng)景中也能穩(wěn)定作業(yè),真正把機(jī)器人引入“工業(yè)生產(chǎn)力”。
![]()
機(jī)器人交付方式的根本改變:從“項(xiàng)目交付”到“平臺(tái)生態(tài)”
當(dāng)部署不再依賴高度定制,當(dāng)核心能力可以被標(biāo)準(zhǔn)化調(diào)用,當(dāng)場(chǎng)景復(fù)制不再需要重復(fù)投入,機(jī)器人應(yīng)用才真正具備了規(guī)模化復(fù)制的可能。也正是基于這一理念,Genie Studio Agent被設(shè)計(jì)為一個(gè)開(kāi)放共贏的平臺(tái)。
我們正逐步向更多合作伙伴開(kāi)放平臺(tái)能力,無(wú)論是深耕工業(yè)場(chǎng)景的系統(tǒng)集成商,還是探索新型應(yīng)用的創(chuàng)新企業(yè),都可以基于這一平臺(tái)進(jìn)行二次開(kāi)發(fā)與系統(tǒng)集成,快速構(gòu)建貼合自身需求的解決方案,共同推動(dòng)具身智能產(chǎn)業(yè)發(fā)展。
從我們?nèi)ツ臧l(fā)布的一站式具身智能模型開(kāi)發(fā)平臺(tái)Genie Studio,到如今推出的系統(tǒng)化機(jī)器人應(yīng)用部署平臺(tái)Genie Studio Agent,智元完成了又一次重要的躍遷——從“提供技術(shù)能力”,走向“應(yīng)用產(chǎn)品化”;從“單一交付項(xiàng)目”,走向“搭建開(kāi)放生態(tài)”。
我們認(rèn)為,真正的智能不是被獨(dú)立開(kāi)發(fā)的。它需要在不同場(chǎng)景中被調(diào)用,在不同系統(tǒng)中被聯(lián)結(jié),在不同參與者之間被不斷放大。只有當(dāng)技術(shù)不再是門檻,應(yīng)用才能真正涌現(xiàn);只有當(dāng)部署變得簡(jiǎn)單,規(guī)模化才能真正實(shí)現(xiàn)。我們希望構(gòu)建一個(gè)用戶友好、協(xié)同創(chuàng)新的具身智能產(chǎn)業(yè)生態(tài)。當(dāng)機(jī)器人不再難以部署,當(dāng)應(yīng)用可以被快速?gòu)?fù)制,當(dāng)系統(tǒng)能夠持續(xù)自我優(yōu)化,這便是我們離廣域“部署態(tài)”最近的一步
邁出這一步,具身智能的快速scaling時(shí)代,才真正開(kāi)始顯現(xiàn)清晰輪廓。
![]()
前沿動(dòng)態(tài)前沿大會(huì)
前沿人物
點(diǎn)「在看」,給前前加雞腿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.