21世紀(jì)經(jīng)濟(jì)報(bào)道記者 易思琳
具身智能創(chuàng)業(yè)再涌入一家“理想系”公司。
《21汽車·一見Auto》從多位獨(dú)立信源處獨(dú)家獲悉,理想汽車前AI首席科學(xué)家、基座模型負(fù)責(zé)人陳偉,聯(lián)手理想汽車前第二產(chǎn)品線負(fù)責(zé)人張驍,一起創(chuàng)辦了新的具身智能公司——斜躍智能,陳偉擔(dān)任董事長(zhǎng)兼CTO、張驍任CEO。公司成立于2026年2月,首輪融資由元璟資本和理想汽車共同投資,近期會(huì)完成工商變更。
一位投資人告訴《21汽車·一見Auto》,在賽道選擇上,斜躍未來會(huì)聚焦家庭場(chǎng)景,做面向C端用戶的消費(fèi)級(jí)具身智能產(chǎn)品。據(jù)悉,公司成立兩個(gè)月以來,已經(jīng)組建了接近20人的團(tuán)隊(duì),且在北京、杭州、深圳三地設(shè)立辦公地點(diǎn),正在面向社會(huì)招聘核心團(tuán)隊(duì)及相關(guān)技術(shù)人才。
在眾多理想離職員工創(chuàng)業(yè)的公司里,斜躍智能是理想汽車投資的第二家公司。此前,理想只投資了前總裁沈亞楠?jiǎng)?chuàng)業(yè)的公司。
同時(shí),斜躍智能也是元璟資本在一年內(nèi)孵化的第二個(gè)理想系創(chuàng)業(yè)團(tuán)隊(duì)。此前,元璟資本曾投資由前理想自動(dòng)駕駛高管賈鵬、王佳佳及前理想CTO王凱聯(lián)合創(chuàng)立的至簡(jiǎn)動(dòng)力,該企業(yè)半年內(nèi)連續(xù)完成5輪融資,累計(jì)融資金額達(dá)20億人民幣,投后估值超10億美元,迅速成長(zhǎng)為具身智能賽道最年輕的獨(dú)角獸企業(yè)。
“泛化能力”是當(dāng)前具身智能領(lǐng)域要突破的核心難題,想要提升具身智能解決問題的能力,訓(xùn)練基座模型必不可少。在當(dāng)前具身智能的創(chuàng)業(yè)中,幾乎所有公司都極其重視基座模型的搭建和訓(xùn)練。創(chuàng)始團(tuán)隊(duì)是否具備基座模型的架構(gòu)能力而非單純的硬件整合能力,也成為當(dāng)前投資人進(jìn)行投資選擇的重要因素。
一位接近陳偉的知情人士向《21汽車·一見Auto》評(píng)價(jià),基座模型能力是斜躍董事長(zhǎng)、CTO陳偉的專長(zhǎng)。
2021年底,陳偉正式加入理想汽車擔(dān)任首席科學(xué)家,2022年底完成理想智能座艙的全棧自研,并做到了行業(yè)領(lǐng)先,此前理想都是采用供應(yīng)商的方案。2023年,陳偉開始啟動(dòng)理想同學(xué)自研大語(yǔ)言模型MindGPT的研發(fā),并于年底上車,這是汽車行業(yè)首個(gè)在智能座艙落地的多模態(tài)認(rèn)知大模型。
2024年10月,秋季戰(zhàn)略會(huì)上,李想開始推動(dòng)面向具身智能的理想自研大模型體系,爭(zhēng)奪AI時(shí)代的門票,陳偉便是該任務(wù)的承接人。
為了進(jìn)一步優(yōu)化資源配置,2025年2月,陳偉轉(zhuǎn)任基座模型團(tuán)隊(duì)負(fù)責(zé)人,向CTO謝炎匯報(bào)。同期,李想提出明確目標(biāo):年內(nèi)車端必須上線VLA(Vision-Language-Action,視覺語(yǔ)言動(dòng)作大模型)。
上任后,陳偉的首要任務(wù)便是重新定義基于Thor-U和Orin-X芯片上的車端VLA模型。
2024年底,受限于車端芯片算力難以承載大模型參數(shù),理想智能駕駛團(tuán)隊(duì)的VLA預(yù)研一度基于外部的開源模型,而非自研基座模型。2025年春節(jié)過后,李想明確要求,未來理想的VLA一定要用自研基座,于是,基座模型團(tuán)隊(duì)和自動(dòng)駕駛團(tuán)隊(duì)隨即展開聯(lián)合開發(fā),重新定義車端VLA模型。雙方分工明確:基座模型團(tuán)隊(duì)負(fù)責(zé)芯片上的模型結(jié)構(gòu)設(shè)計(jì)、預(yù)訓(xùn)練;智能駕駛團(tuán)隊(duì)圍繞VLA的交付去做后訓(xùn)練。
2025年5月,理想正式發(fā)布重新定義后的車端VLA模型——MindVLA,理想團(tuán)隊(duì)稱該模型參數(shù)大約為4B(40億),由云端訓(xùn)練的基座模型蒸餾而來。這個(gè)車端模型便是陳偉及其團(tuán)隊(duì)的核心研發(fā)成果。
做完現(xiàn)有車端芯片的VLA模型研發(fā)及交付之后,陳偉在2025年上半年還啟動(dòng)了另一件重要的事情:基于自研芯片馬赫100去做模型的設(shè)計(jì)和開發(fā),以充分發(fā)揮芯片的可用算力、提升本地模型的能力。
如何把超大模型塞進(jìn)算力極其有限的車載芯片里,讓芯片資源發(fā)揮到最大的效能,陳偉及其團(tuán)隊(duì)給出的答案是:在設(shè)計(jì)模型之初就把硬件的能力考慮進(jìn)來,實(shí)現(xiàn)軟硬協(xié)同。陳偉及其團(tuán)隊(duì)將這一思考形成了論文,并在即將上車L9 Livis的馬赫100芯片上進(jìn)行了首次實(shí)踐。
(陳偉及其團(tuán)隊(duì)的研究成果,Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs,圖源:Google搜索)
2025年下半年,除了做好理想具身基座模型MindVLA在自動(dòng)駕駛端的布局之外,陳偉還帶領(lǐng)團(tuán)隊(duì)預(yù)研了理想下一代物理AI框架:MindVLA-U1,它是近段時(shí)間理想發(fā)布的MindVLA-o1自動(dòng)駕駛基座模型的雛形。
該基座模型的核心技術(shù)突破有3點(diǎn):
第一,提出了新型的VLA模型架構(gòu):?jiǎn)我籘ransformer聯(lián)合建模感知、推理與控制,自主實(shí)現(xiàn)快慢思考的模式切換。
第二,提出了空間視覺編碼器3D ViT視覺模型。以視覺為核心,借助激光雷達(dá)的幾何提示,引導(dǎo)模型去理解真實(shí)空間結(jié)構(gòu),通過端到端3D表征學(xué)習(xí)讓AI擁有了和人一樣的三維空間直覺。
第三,對(duì)強(qiáng)化學(xué)習(xí)進(jìn)行了閉環(huán),構(gòu)建了低成本、高效率的仿真世界模型MindSim,模型在仿真環(huán)境中能夠更快完成策略迭代。
無論是自研基座模型并將其部署到車端,還是帶領(lǐng)團(tuán)隊(duì)預(yù)研下一代物理AI的核心框架,陳偉在理想汽車近5年的工作經(jīng)歷都能很好地復(fù)用進(jìn)具身智能的創(chuàng)業(yè)里。
“從原來車端的小模型開始做具身的大模型,只有做智能駕駛的經(jīng)驗(yàn)還不夠,還需要有做過大模型經(jīng)驗(yàn)的人。從車圈出來的人,大家都不缺量產(chǎn)能力,缺的是如何把技術(shù)模型拉高的能力。”上述研發(fā)人員稱。
無論是車企內(nèi)部自研機(jī)器人,還是車圈高管投身具身智能創(chuàng)業(yè),大多更傾向于B端工業(yè)場(chǎng)景——環(huán)境可控、任務(wù)單一、ROI可核算。和斜躍一樣同為理想高管出來創(chuàng)業(yè)、同被元璟資本投資的至簡(jiǎn)動(dòng)力,也將產(chǎn)品方向聚焦于工業(yè)場(chǎng)景,做面向B端的通用機(jī)器人。
相比之下,家庭場(chǎng)景被視為具身智能的“圣杯”,代表最開放的環(huán)境和最廣泛的任務(wù),解決了家庭任務(wù),就代表模型可以實(shí)現(xiàn)完全泛化。有觀點(diǎn)認(rèn)為,當(dāng)前的家庭具身智能市場(chǎng)很像10年前的新能源行業(yè),雖然處于創(chuàng)新發(fā)展曲線的起始階段,滲透率很低、產(chǎn)品也不完善,但也需要有公司躬身入局。
從公司成立之初,斜躍就確定了要做面向C端的家庭機(jī)器人。
“做To B的生意雖然場(chǎng)景更容易落地、融錢也更快,但離用戶很遠(yuǎn)。”一位投資人告訴《21汽車·一見Auto》。
敢躬身入局家庭場(chǎng)景,和斜躍的創(chuàng)始團(tuán)隊(duì)背景有關(guān)。
進(jìn)入家庭的機(jī)器人有很多關(guān)鍵難點(diǎn)。擺在面前的首要問題便是如何在零樣本數(shù)據(jù)的情況下提高基座模型的泛化能力。而這恰恰是陳偉所擅長(zhǎng)的。
陳偉除了擅長(zhǎng)做基座模型的研發(fā)、設(shè)計(jì)外,在過往的履歷中,也很擅長(zhǎng)做多模態(tài)人機(jī)交互,加入理想前他曾擔(dān)任搜狗AI交互事業(yè)部首席科學(xué)家、 AI交互技術(shù)部總經(jīng)理。
能不能設(shè)計(jì)、訓(xùn)練一個(gè)泛化能力更強(qiáng)的基座模型,對(duì)于初創(chuàng)的具身智能公司很重要。但在基座模型之外,做好人機(jī)交互是基本功。“基座模型要做的是60-100分的事,而交互是要做0-60分的事。拉高上限很重要,但也需要先及格。”一位具身智能的從業(yè)者稱。
相較于其他布局家庭場(chǎng)景的具身智能項(xiàng)目,斜躍創(chuàng)始團(tuán)隊(duì)均出身理想汽車,更懂中國(guó)家庭的真實(shí)需求與使用場(chǎng)景。
斜躍的另一位創(chuàng)始人——CEO張驍,在過往的履歷中,無論是在寶馬還是在理想,都擅長(zhǎng)把控C端用戶需求,去做產(chǎn)品定義和開發(fā)。作為理想汽車首任整車產(chǎn)品經(jīng)理,張驍是爆款車型理想L9“冰箱彩電大沙發(fā)”產(chǎn)品策略的核心定義者。從理想汽車離職前,張驍擔(dān)任第二產(chǎn)品線總裁。
張驍、陳偉同為內(nèi)蒙人、同為北京郵電大學(xué)的校友,同樣在理想汽車工作多年并收獲不少成績(jī),很多底層基因都很類似;一位是深耕AI領(lǐng)域、對(duì)基座模型的設(shè)計(jì)、研發(fā)都有著深刻認(rèn)知的首席科學(xué)家,一位是具備敏銳的用戶洞察、有著硬件落地的產(chǎn)品化能力和經(jīng)驗(yàn)的負(fù)責(zé)人,二者在能力上又十分互補(bǔ)。
“未來的AI機(jī)器人一定是軟硬一體的,這就需要?jiǎng)?chuàng)始團(tuán)隊(duì)既要懂產(chǎn)品、硬件,做好產(chǎn)品定義、找好場(chǎng)景,同時(shí)也要懂軟件、技術(shù),做好模型的泛化能力。”一位投資人點(diǎn)評(píng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.