文|邱曉芬
編輯|蘇建勛
朱森華是個把嚴謹刻進骨子里的人。
作為腦神經(jīng)科學的博士后,在我們訪談當天,他將我們提供的一份訪談提綱,寫成了一份七頁紙、近萬字的回復,當中還用字母、數(shù)字把觀點分門別類,并做了圖輔助理解,像是在完成一篇道地的學術(shù)論文。
研究大腦,就是研究人,這從朱森華的聊天習慣就能看出,他不會一直單方面的滔滔不絕,而是會停下來,詢問我們對某些問題的看法,也會因為我的“文科出身、媒體背景”,調(diào)整回答方式。
在華為的六年時間里,朱森華曾擔任華為云AI算法創(chuàng)新Lab主任,也是華為云AI部門智能機器人業(yè)務的開創(chuàng)者,同時還是“華為天才少年”們的面試官之一。
他曾帶領(lǐng)一支“博士軍團”,從零到一構(gòu)建了華為云的腦與類腦AI云平臺、華為云智能機器人業(yè)務,還孵化了華為云的首個具身大模型。
在這波具身智能浪潮中,華為不算高調(diào)。但如果對2023 年的華為HDC(開發(fā)者大會)有印象,應該會記得華為云搶在國內(nèi)一眾大廠之前發(fā)布了首個可真人交互的“具身工匠”能力原型。
![]()
△華為在2023年的HDC大會上首次發(fā)布具身大模型
這一原型搭載的便是朱森華主導研發(fā)的華為云首代盤古具身大模型。從當時的效果來看,這一具身大腦已經(jīng)具備了真人能力,能對復雜任務進行自主規(guī)劃,并自主生成動作指令等等。
2025年10月份,朱森華離職,創(chuàng)立具身大腦公司“具腦磐石”。選在此時創(chuàng)業(yè),朱森華形容為“萬事具備”。
成立兩個月后,“具腦磐石”核心團隊已搭建完畢,公司聯(lián)合創(chuàng)始人之一是極智嘉智能叉車&極智鏈產(chǎn)品事業(yè)部總經(jīng)理劉晉宇,其他成員來自華為、聯(lián)想、曠視、極智嘉,具備10年以上的Al+機器人研發(fā)交付經(jīng)驗。
《智能涌現(xiàn)》獨家獲悉,由朱森華創(chuàng)立的“具腦磐石”,近期已完成數(shù)千萬元的種子輪融資,資方為樂聚機器人、上海道禾長期投資、四川科創(chuàng)投集團、東方精工等。
在技術(shù)儲備上,和過去大眾熟知的端到端、分層等完全基于深度學習的具身智能技術(shù)路線不一樣的是,朱森華想要走一條更特別的路徑——用腦認知啟發(fā)(Nerual AI)的范式來改進具身智能VLA。
《智能涌現(xiàn)》了解到,「具腦磐石」將借鑒人腦的認知神經(jīng)機制,給具身智能VLA做算法架構(gòu)的改造,比如引進人腦特有的抽象概念學習、選擇性注意力等。通過這些算法“外掛”,減少機器人數(shù)據(jù)和算力的依賴,提升泛化性。
![]()
AI與NI的轉(zhuǎn)化關(guān)系
未來,隨著腦啟發(fā)算法工程實踐積累和迭代,朱森華預計在3-5年后完成深度學習算法范式更迭,徹底走向腦啟發(fā)的技術(shù)范式。
“人類的大腦是世界上唯一實現(xiàn)的最強具身智能大腦,我們沒有理由不以它為藍本進行技術(shù)迭代呢?”,朱森華表示。
這并不是朱森華的一家之言。在具身智能的架構(gòu)設計中借鑒“人”,也是近期行業(yè)一大風向。
比如,前Meta首席科學家、圖靈獎得主楊立昆(Yann Lecun)近期就向行業(yè)發(fā)出提醒,現(xiàn)有的LLM架構(gòu)是通往AGI的“死胡同”。他認為,AI應該向人類一樣學習,構(gòu)建內(nèi)部的“世界模型”。
讓具身智能學習人,難度要比以前更進一步,這要求設計者既懂AI和計算機,又了解人腦神經(jīng)機制。而朱森華正是這樣的稀缺角色。
“萬事具備”的另一面,是商業(yè)資源。
![]()
具腦磐石
朱森華告訴我們,「具腦磐石」已經(jīng)和國內(nèi)汽車零部件領(lǐng)域的龍頭上市公司紐泰格、另一智能制造上市公司達成合作。他將公司戰(zhàn)略定位為全球化,落地首站,他們選擇了亞太地區(qū)的商業(yè)服務和工業(yè)場景。
朱森華判斷,目前具身智能最大的矛盾在于,“半吊子”的具身機器人與人們過高期望之間的鴻溝。要落地,最難的是找到愿意為不夠成熟的具身智能買單的客戶。
在國內(nèi),“機器人完全替人”的商業(yè)模式短期內(nèi)還沒法大規(guī)模走通,而但不同于國內(nèi)的是,國外發(fā)達國家面臨的“事實性勞動力短缺”尤為嚴重。
以日本的便利店為例,其核心競爭力之一是在提供7×24小時服務,而當下日本店員的老齡化嚴重、勞動力供給不足,制約了這一服務模式。在便利店夜班場景里,為了正常的服務運轉(zhuǎn),具身機器人便能發(fā)揮作用,承擔起夜間值守、門店理貨等基礎(chǔ)性工作。
朱森華表示,在人力客觀供給不足的情況下,客戶就愿意為當下僅有六七十分能力的具身機器人付費,況且,機器人也在保持持續(xù)進化。
以下是《智能涌現(xiàn)》與朱森華的交流記錄:(略經(jīng)摘編)
深度學習,“有多少人工,就有多少智能”
《智能涌現(xiàn)》:當前的具身智能技術(shù)范式并不收斂,你認為應該怎么分類?你們的路線又有什么差異化?
朱森華:AI或具身智能當前主要有三個大的技術(shù)范式——
①壓縮即智能的聯(lián)結(jié)主義深度學習范式(DNN),這也是當前LLM-based AI的主流范式,以OpenAI等為代表。
該范式下大致有Transformer和Diffusion兩大技術(shù)方案。其中,快慢系統(tǒng)、分層、端到端,都只是這個技術(shù)范式下不同技術(shù)方案的排列組合或局部優(yōu)化變種。
②Trial-and-Error的行為主義強化學習范式(RL),強調(diào)Learn from Experience(從經(jīng)驗中學習),以Richard Sutton(理查德·薩頓,強化學習奠基人、圖靈獎得主)等為代表
③腦認知啟發(fā)的Neural AI范式(Brain Inspired Neural AI),強調(diào)Learn from Neuroscience(從神經(jīng)科學中學習),以楊立昆等為代表。
我們是屬于第三類。
《智能涌現(xiàn)》:現(xiàn)在大多數(shù)具身智能廠商主流的技術(shù)方案是端到端、分層等,這些路線可能存在什么問題?
朱森華:這些技術(shù)方案整體上都繼承了深度學習技術(shù)范式上限的約束,比如存在高數(shù)據(jù)、高功耗、低泛化性、低可解釋性、低在線學習等難題。
這也是為什么這兩年基于深度學習的大模型工程優(yōu)化,確讓局部應用體驗更佳了,但卻仍然難以大規(guī)模推廣應用的原因。
你肯定聽說過一句話,“有多少人工就有多少智能”。今天的大模型也不例外,只是領(lǐng)域眾多玩家把大多數(shù)注意力放在了持續(xù)尋找如何更快捷、便宜地構(gòu)建數(shù)據(jù)集的技術(shù)方案。
《智能涌現(xiàn)》:這些技術(shù)路線未來是否走向收斂,哪一種范式會勝出?
朱森華:我認為當今無論是AI還是具身智能,全人類已經(jīng)進入一片沒有確定答案的技術(shù)黑森林。每種技術(shù)主張的成熟周期不同,技術(shù)突破也再難線性預測。
在黑森林里,需要有眾多路徑分頭探索,所以,對于任何一個技術(shù)團隊而言,只要有清晰的技術(shù)主張和相匹配的人才投入,都值得被支持。
《智能涌現(xiàn)》:你們選擇的腦認知啟發(fā)路徑,還有哪些廠商或者科學家在沿用?
朱森華:如果非要跟業(yè)界做個對標,我認為“具腦磐石”采用的腦啟發(fā)具身智能,和圖靈獎得主、Meta前AI首席科學家楊立昆(Yann Lecun)的世界模型架構(gòu)設計理念是高度一致的。
我們曾深入分析研究過:楊立昆的JEPA-based World Model的底層認知神經(jīng)科學,指導極大地借鑒了“自由能最小原則”(Free Energy Principle,F(xiàn)EP),兩者之間有眾多理論概念相近。
另外,北京通研院朱松純教授 “小數(shù)據(jù)、大任務” 的AI技術(shù)主張從根源上就是認知神經(jīng)科學的理論。
朱教授認為,人類的大腦并不是通過“背誦海量數(shù)據(jù)”而學習,而是通過極少量的觀察和嘗試,就能快速建立對世界規(guī)律的理解。
(《智能涌現(xiàn)》注:FEP自由能由認知神經(jīng)科學領(lǐng)域科學家Karl Friston提出,它指的是,任何活下來的系統(tǒng)都在不斷減少對環(huán)境的預測錯誤,比如走路時,大腦會預測下一步地面在哪里,如果預測錯了下次就會調(diào)整姿勢,這個過程就是最小化自由能。)
機器人大腦,如何向人腦學習?
《智能涌現(xiàn)》:為什么你們要向人類大腦學習,進而對具身智能進行改造?
朱森華:具身智能的根本目標,是希望機器人可以像人一樣。人類大腦就是世界上唯一實現(xiàn)的最強“具身智能大腦”,也是“人工智能”這個概念提出的起源,我們沒有理由不以它為藍本進行技術(shù)迭代。
所以我們主張的是,用清晰的腦啟發(fā)思想去替代盲目的計算。
《智能涌現(xiàn)》:人腦有什么最值得機器人學習的部分,你們是從哪幾個維度去升級?
朱森華:對具身機器人的能力而言,有關(guān)鍵的兩個部分:操作技能和自主移動。
在“操作技能”的這個維度,以“教會機器人用杯子喝水”這一任務為例,大多數(shù)具身智能公司的做法是,用盡可能多種類的杯子去采集足量的數(shù)據(jù),比如采集圓的、扁的、方的、藍的、綠的、大的、小的......
當機器人見過足夠多種類的數(shù)據(jù),下次遇到?jīng)]見過但類似的,機器人仍可能通過關(guān)聯(lián)推理,完成喝水的動作,實現(xiàn)泛化能力。
但如果是人腦,你設想一下,在人類小的時候,家長并不需要這樣無窮無盡的方式來教小孩,甚至把你扔到森林里,你還能把椰子殼當容器去取水喝,展現(xiàn)出更高維度的泛化能力。
所以,人腦智能的一大特性就有著強大的概念抽象能力,能夠?qū)崿F(xiàn)舉一反三的小樣本學習。
《智能涌現(xiàn)》:如何實現(xiàn)“自由移動”呢?
朱森華:在“自主移動”的維度,不管是現(xiàn)在的送餐機器人、掃地機器人,去到一個陌生的環(huán)境都有提前采集環(huán)境地圖的環(huán)節(jié)。
但是人類并不需要這個過程,僅僅憑借眼睛感知的視覺認知,就可以指導人在從來沒有到過的開放空間里自由行動。這是人腦智能的另一大特性,有強大的開放環(huán)境自由探索能力。
《智能涌現(xiàn)》:這兩個部分你們是不是已經(jīng)運用到了機器人領(lǐng)域了?
朱森華:我們已分別在開放環(huán)境的自由移動、腦啟發(fā)小樣本操作,開展了算法原型驗證。
具體而言,在移動方面,我們基于“柵格和位置細胞模擬”的方式,搭建了類人認知地圖(cognitive mapping)機制,讓機器人實現(xiàn)跨室內(nèi)外開放場景的自由探索,部署效率提升了40%。
小樣本學習方面,我們驗證的結(jié)果是,數(shù)據(jù)相較此前降低90%。未來也有望走出具身智能堆算力的“暴力美學”。
《智能涌現(xiàn)》:不堆算力是怎么做到的?
朱森華:大模型里有一個核心詞叫注意力,Attention,樸素地借鑒了人類大腦的認知神經(jīng)機制。但計算機收到的每一張圖片,每一個像素點的權(quán)重都是一樣的,所以就需要極其巨量的GPU算力。
但是人類每秒都在接受海量視覺信息,大腦卻不會崩潰,是因為人腦注意力有重點的,能動態(tài)根據(jù)關(guān)注點,聚焦于局部信息。
比如我剛剛進門的時候,你只會關(guān)注我來沒來,但是其他的信息你都忽略了。
人一天吃三頓飯補能,成人大腦的功耗也就25瓦,就能維持860億神經(jīng)元的運轉(zhuǎn)。大腦通過注意力機制,極大減少了處理信息的代價,最后實現(xiàn)了低功耗。這也是機器人大腦未來需要借鑒的。
《智能涌現(xiàn)》:你們具體是怎么把人類的抽象思維和引進到機器人上的?
朱森華:我們在模型里引入了抽象概念表征Encoder來實現(xiàn),引導和使得模型不再是Learn from Tokens,而是Learn from Concept(從概念中學習)。在具身智能領(lǐng)域里,我們也看到有團隊采用了類似的技術(shù)方式。
(作者注:抽象概念表征Encoder,是一種從具體數(shù)據(jù)中自動提取并編碼出核心抽象特征的神經(jīng)網(wǎng)絡模塊)
智能涌現(xiàn):怎么理解類人認知地圖機制?
朱森華:我們把人腦中由視覺細胞、柵格細胞、位置細胞聯(lián)合構(gòu)成的“自由探索認知神經(jīng)機制”,抽象成一套全新的算法架構(gòu),讓機器人實現(xiàn)不需要提前預置環(huán)境地圖,就可實現(xiàn)類人的自由探索。
《智能涌現(xiàn)》:VLA在一些場景里還是有用的,你們是直接拋棄VLA,直接用全新的技術(shù)范式做具身智能嗎?
朱森華:我們認可VLA是可用的工具,只是局部不可用,所以我們會給他“外掛”做優(yōu)化改造。比如VLA現(xiàn)在像是個五六歲的孩子不夠高,我們會給他加一副增高鞋墊。
舉個例子,你上了大學的時候就會發(fā)現(xiàn),解一道“雞兔同籠”的題,有無數(shù)種方程的解法,比如矩陣計算。但你在小學時,你只會假設法,沒上過大學,就絕對想不到有別的方法來解決。
今天計算機科學的人,大部分人不知道腦和類腦科學是什么,但是我們能從更高維解決具身智能問題。
具體路徑上,在 1-3 年內(nèi),我們還是會基于VLA的工程實踐,但是會用一系列認知神經(jīng)機制,對具身智能的各個環(huán)節(jié)進行系統(tǒng)性的優(yōu)化改造。
隨著我們系統(tǒng)性的腦啟發(fā)算法迭代,預計3-5年后更迭掉深度學習范式。
《智能涌現(xiàn)》:這種范式的差異,會產(chǎn)生方法論上的差異化嗎,比如數(shù)據(jù)上的不同?
朱森華:我們的具身大腦要解決的問題,和其它玩家是沒區(qū)別的,都是想讓機器人能像人一樣游刃有余地應對開放世界環(huán)境下的任務。
我們跟其他家最大的不同,在于“指導理論”根基不同。我們的指導理論來自系統(tǒng)性的認知神經(jīng)科學,而非大模型堆砌Scale的算法工程實驗。
數(shù)據(jù)方面,我們的數(shù)據(jù)需求跟行業(yè)一致,也是VLA真機數(shù)據(jù)。但隨著AI算法范式的升級,所需的數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)標注未來也會動態(tài)變化。
《智能涌現(xiàn)》:你覺得現(xiàn)在具身智能領(lǐng)域,或者深度學習領(lǐng)域在技術(shù)上最大的痛點是什么?
朱森華:這個問題業(yè)界其實都非常清楚,就是缺乏系統(tǒng)性的清晰理論指導。我們回望Hinton引爆的深度學習發(fā)展這十年,大家都笑稱模型訓練是門玄學。
這個領(lǐng)域的工程師經(jīng)常會說一句話,“我得回去煉丹了”。深度學習模型訓練就是煉丹,沒有明確的配方,大家都是試一試,今天你用10B的,明天他用30B的,最后業(yè)界匯總發(fā)現(xiàn)100B開始的模型才可以。
深度學習的發(fā)展過程中,怎么樣堆數(shù)據(jù)、怎么樣搭網(wǎng)絡結(jié)構(gòu)、怎么樣定義優(yōu)化函數(shù),全靠算法工程師的“試錯經(jīng)驗”來推動演化。
《智能涌現(xiàn)》:那腦認知啟發(fā)的范式有理論指導嗎?
朱森華:我們的指導理論來自認知神經(jīng)學。現(xiàn)在全世界的科學家都在試圖理解大腦的神經(jīng)機制。以中國自2021年起、10年投入500億的“中國腦計劃”為例,核心研究目標被概括為“一體兩翼”。
一體,是研究大腦的宏觀、介觀、微觀結(jié)構(gòu)與神經(jīng)機制。左翼,是醫(yī)學臨床應用,用于指導臨床帕金森在內(nèi)的腦疾病治療與大腦保護;
右翼,是類腦轉(zhuǎn)化,用于指導把大腦結(jié)構(gòu)與智能的優(yōu)秀特性轉(zhuǎn)化成服務于人類應用的計算機技術(shù)。
《智能涌現(xiàn)》:用腦認知啟發(fā)來改造機器人,背后的難點在哪里?
朱森華:首先,在人類大腦研究這件事情上,研究還是相對緩慢的,受限于人類的物理學水平。因為我們不能用失活、異常的大腦去研究大腦的功能神經(jīng)機制,所以科學家們發(fā)明了核磁共振(MRI)等工具去研究正常人類的活體大腦。
其次,大腦的智能(NI)和人工智能(AI)之間正在互相促進的。大腦的神經(jīng)機制研究能啟發(fā)算法,算法逐步的進步又能夠加速大腦研究的進展。
但背后最難的是,我的算法該怎么設計、優(yōu)化與迭代?站在腦與類腦研究的視角,領(lǐng)域里腦科學的人才相比于計算機人才很少,而能同時懂計算機科學,又懂腦科學的專家就更是稀缺。
具身智能落地,無法繞開的矛盾
《智能涌現(xiàn)》:你們現(xiàn)在會怎么落地自己的機器人?
朱森華:當前具身智能產(chǎn)業(yè)最大的矛盾是,半吊子的具身智能能力,與人們過高期望之間的Gap。
而機器人產(chǎn)業(yè)落地最困難的點是,如何為當前半吊子的具身智能能力,找到合適的場景和愿意為之付費的客戶。
短期內(nèi),在國內(nèi),具身智能“機器人完全替人”的商業(yè)模式還沒法大規(guī)模走通,客戶算不過賬來。
我們從成立的第一天,就立足出海去解決發(fā)達國家和地區(qū)“事實性勞動力短缺”的核心問題,包括商服、工業(yè)、康養(yǎng)等主要場景。
《智能涌現(xiàn)》:為什么出海的第一站會選擇亞太地區(qū)?
朱森華:①亞太地區(qū)離中國近、有地理優(yōu)勢,有一定的文化相近性;
②亞太發(fā)達地區(qū)的市場規(guī)范、商業(yè)標準能對接歐美地區(qū)。
③亞太地區(qū)的發(fā)達國家不但人力成本更高,更是陷入了事實性勞動力短缺的情況。
比如像日本的7-11,由于全民老齡化導致嚴重的勞動力不足,核心的7×24小時服務模式難以持續(xù),因此已經(jīng)有一定數(shù)量門店縮減為16-20h的運營時間,減少夜班班次。而具身機器人如果能在店里完成夜間班次的巡店、理貨、導購等工作內(nèi)容,就可以讓整個服務可持續(xù)。
目前已經(jīng)有不少海外客戶向我們明確表示,愿意為僅能替代人類50-70%的具身能力買單。
《智能涌現(xiàn)》:這幾個月實際推動落地下來,發(fā)現(xiàn)機器人落地有哪些難點?
朱森華:從實驗室技術(shù)到客戶應用,中間需要應對很多變化,比如環(huán)境變化、人員操作、機器磨損等異常帶來的種種corner case。
對客戶場景的理解、技術(shù)原型的提煉,是坐在實驗室想不明白的。產(chǎn)業(yè)化和商業(yè)化是個系統(tǒng)工程,需要干好臟活累活,而不是不切實際活在技術(shù)愿景里。
《智能涌現(xiàn)》:corner case有沒有一些例子?
朱森華:舉個例子,實驗室的不透明格擋環(huán)境內(nèi)可用的大腦模型,到了有玻璃墻、反光條的工廠環(huán)境,就會變得極不可靠。
《智能涌現(xiàn)》:很多具身智能公司都在“補腦”,本體廠商也在“補本體”,為什么你們堅持不做本體只做腦?
朱森華:我們希望通過聚焦大腦技術(shù),攻克具身大腦“一腦多機”、“一腦多形”的能力上限。
每個團隊都有自己的核心基因,眉毛胡子一把抓,要么有足夠豪華的錢和凝聚力去做好軟硬件人才儲備,否則就會不聚焦、精力耗散。
《智能涌現(xiàn)》:但是現(xiàn)在具身智能行業(yè)里,似乎軟硬的界限在逐漸模糊?
朱森華:我并不認同這個說法。大家有這種觀感,主要原因是現(xiàn)在具身大腦算法還很難做到“一腦多機”、 “一腦多形”,導致大家都是在做“特定本體+特定技能大腦”的強綁定交付,很難解耦和泛化遷移。
這種形態(tài)很明顯不會是最終的技術(shù)交付形態(tài),因為它產(chǎn)品分工不夠明確,也沒有能體現(xiàn)具身大腦的能力。
《智能涌現(xiàn)》:你們直到2025年下半年才開啟創(chuàng)業(yè),會不會太晚了?
朱森華:坦誠地說,從融資拿熱錢的角度來看,確實偏晚了,但是從產(chǎn)業(yè)化落地的角度來看,整個具身智能產(chǎn)業(yè)才剛剛開始。
封面來源|視覺中國
end
end
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.