![]()
![]()
出品|搜狐科技
作者|梁昌均
編輯|楊 錦
具身智能的ChatGPT時刻,什么時候能夠到來,業內還沒有共識,機器人上春晚則有望延續這個行業的熱度。
這也吸引了不少企業入局,原力靈機就是其中的新玩家。2月10日,在成立的第330天,這家公司舉辦了首次技術開放日,核心創始團隊全員現身。
這家公司有著深深的曠視背景烙印,聯合創始人&CEO唐文斌是身兼千里科技和階躍星辰董事長的印奇在清華姚班的同學,也是印奇在曠視的創業伙伴之一。
曠視6號員工、原算法總監范浩強如今是原力靈機的聯合創始人,曠視原核心研究員周而進和汪天才則是合伙人,這些在曠視深耕計算機視覺的天才團隊希望為機器人造模型。
原力靈機成立不到一年,已完成三輪數億元融資,曠視的老股東阿里、啟明、聯想創投等再支持,還吸引了君聯資本、蔚來資本、洪泰基金和量化巨頭九坤等機構。
唐文斌此次提出了具身原生的概念,即數據原生、訓練原生和框架原生,表示要從第一行代碼就為機器人而寫,“今年將是具身原生的元年”。
原力靈機現場發布了全球首個具身原生大模型DM0,以及具身原生開發框架Dexbotic 2.0和具身原生應用量產工作流DFOL。
DM0模型具備2.4B參數,由原力靈機聯合階躍星辰從零開始訓練的具身原生大模型,融合多類數據,具備跨機型的泛化與遷移能力,并對外開源。
“這不僅僅是一個能在機器人上運行的大模型,而是一個智能本質和形成機制都根植于物理交互的新AI范式。”唐文斌說。
活動現場,唐文斌還和多位嘉賓,圍繞具身智能的發展進行了探討。
智源研究院院長王仲遠認為,機器人硬件進步很快,但具身智能模式還沒到ChatGPT時刻,距離大規模應用還有比較大的gap。
清華大學電子工程系長聘教授汪玉則提到,目前機器人仍局限在單一工作臺,在長程任務、跨模態等方面還有很大問題,需要從訓練、基礎設施、機器和物理環境交互等層面去解決。
至于中美目前在具身智能上的差異,汪玉則認為,美國在模型、數據等方面做得更早,中國有望在落地方面很快趕上。
“中國在具身上的投入強度已經比美國大,很多人說這是泡沫,但我覺得這可能是個好事。”汪玉表示。
具身智能的ChatGPT時刻什么時候能夠到來?嘉賓們認為,這需要定義什么是ChatGPT時刻。
階躍星辰創始人&CEO姜大昕認為,ChatGPT時刻的標志是零樣本地去做泛化,具身智能的ChatGPT時刻將面臨場景、任務和目標泛化挑戰和計算機視覺等具身技術挑戰。
在唐文斌看來,ChatGPT時刻是機器人變得有用可信賴,即在限定場景閉環解決所有問題,ROI算明白,實現批量化應用。“現在模型能力進展非常大,這個時刻并不是很遠。”
“當然還有DeepSeek時刻,全民都感知,這就要從工業物流走向商用、走向TOC。這個時刻還要再晚一些,但我覺得也不會很遠。 ”唐文斌說。
星海圖創始人&CEO高繼揚認為,具身智能今年會是智能爆發、應用閉環的一年。
“智能爆發的結果一定在某些領域形成應用的外溢,同時配合供應鏈和整機,尤其中國會顯著比美國強得多,周期會快5到10倍,成本低5到10倍。”
以下是論壇對話精編:
提問:現在具身智能模型主要有哪些主流的技術路線,處在一個什么樣的階段?
王仲遠:現在具身智能特別火熱,但我看到蠻多隱憂。一方面,硬件確實進步很快,現在連干活也開始又快又穩了,但它連續工作的穩定性、安全性、電池等還有一系列的問題要解決。
在具身模型上,還遠沒有到ChatGPT時刻,尤其當具身智能模型和硬件真機部署之后,離大規模應用還是有比較大的gap。技術路線整體還處于發展當中,還沒有到徹底突破的階段。
汪玉:現在的機器人應用,雖然已經有很大進步,但還是局限在一個工作臺上,把大小腦配合起來完成稍微長一點的任務,稍微跨多個模態,還是很難的問題。
這一方面是訓練維度,比如強化學習,能有更多進步。另一維度,從物理環境和機器交互的過程中,怎么樣更容易感知,去解決問題。
提問:怎么看在具身維度上,中國和美國的優劣勢?
汪玉:美國在模型、數據的層面,更早地開始做。但到落地這個層面,中國可以很快跟上。中國在具身上已經有比美國更強的投入了,有很多人說這是泡沫,我個人覺得可能是好事。
中國整個產業鏈、供應鏈比較完整,如果把應用開放的再多,在模型和應用層面的投入再加大,有可能比美國有更快的突破。
王仲遠:美國那邊做具身智能,投資人會看創業團隊里面有沒有華人,有華人的話才能確保有可能成功。另外,硬件經常損壞,我們經常一修就得兩個禮拜,但聽說美國得三個月。
可以看到中國確實在制造業上有優勢,也證明整個行業依然處在早期,都處在快速發展和迭代的階段,所以遠沒有到誰優誰劣、誰領先誰落后。
提問:具身智能的ChatGPT時刻是一個什么樣的時刻,它什么時候到來?
姜大昕:怎么定義ChatGPT時刻?我覺得一個標志就是零樣本地去做泛化。相較自然語言,我覺得具身智能的ChatGPT時刻會更加困難。
第一是具身的泛化,需要場景泛化,任務泛化,和目標泛化。泛化維度不一樣,導致我們在哪個維度上定義ChatGPT時刻,不同人會有不同的看法。
第二是具身智能技術牽扯到計算機視覺。它有些非常根本性的問題,還沒有形成共識,比如究竟怎么編碼,怎么做自監督預訓練,都需要突破,才能到ChatGPT時刻。
高繼揚:對于具身智能的ChatGPT時刻,我覺得是真的看到了它在某些限定范圍內具備商業價值的時刻,但它要具備的要素更多。
今年是應用閉環的一年,今年將迎智能爆發,結果一定是在某些領域形成應用外溢,同時配合供應鏈和整機,尤其中國會顯著比美國強得多,周期會快5到10倍,成本低5到10倍。
唐文斌:我覺得姜大昕講的ChatGPT時刻要求蠻高的,這已經是AGI時刻。我心中的定義,是它變得有用、可信賴。
它可以在限定場景,真正閉環解決所有的問題,ROI算明白,批量化應用。這個時候就是ChatGPT時刻,現在模型的能力進展非常大,這并不是很遠。
當然還有DeepSeek時刻,全民都感知,這就要從工業物流走向商用、走向TOC。這個時刻還要再晚一些,但我覺得也不會很遠。
提問:在具身智能領域,今年最期待看到的一個非常具體的事情或能解決的任務是什么?
汪玉:我希望能形成一套云邊端配合的體系,改變樓的裝修,以及所有建筑和基礎設施的能力,去構建面向機器和人共生環境的基礎設施,這套方案我覺得今年可能有一個雛形出來。
王仲遠:我最期待的是標準,現在不管是硬件的標準、數據的標準,包括模型輸出的標準,整個生態非常碎片化。如果標準能夠有突破,它有可能極大促進整個產業的發展。
高繼揚:我期待今年能夠在生產力端看到一條明確的增長路徑,讓后兩年之內能夠有單一場景,比如上萬臺的出貨,這是整個行業都迫切需要的。
唐文斌:我的目標是在一個場景、一千臺持續運行,不要很多場景,不是靠加法做起來,某種程度上可以走通一個場景的規模化閉環,我覺得今年有機會。
![]()
運營編輯 |曹倩
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.