新造車觀察
10min read
汽車的「OpenClaw 時(shí)刻」,到了?
靖宇2026/04/28
![]()
摘要
摘要:更聰明的智能助手,和真正的「AI 控車」。
汽車的「OpenClaw 時(shí)刻」,到了?
摘要:更聰明的智能助手,和真正的「AI 控車」。
極客一問(wèn):你覺(jué)得現(xiàn)在車上的「AI 助手」智能化程度如何?
![]()
頭圖來(lái)源:極客公園
作者|靖宇
走完 2026 北京車展的十幾個(gè)展館,我最大的感受是,車企的高管,肯定是用上「小龍蝦」了——今年,如果你的新車沒(méi)搭個(gè)大模型,你都不好意思開(kāi)發(fā)布會(huì)。
火山引擎帶著豆包宣布搭載超 700 萬(wàn)輛車;騰訊發(fā)布出行全場(chǎng)景智能體開(kāi)放平臺(tái);科大訊飛推星火智能座艙;面壁智能展示端側(cè) Agent 框架 EmbodiedClaw,連奔馳新一代 S 級(jí)都在后排塞了一顆端側(cè)多模態(tài)大模型 VLM。
更不用說(shuō)華為的鴻蒙座艙 HarmonySpace 6、寶馬與阿里聯(lián)合定制的 AI 大模型——放眼望去,整個(gè)車展彌漫著一種「不 AI,就出局」的緊迫感。
但如果你真的坐進(jìn)這些車?yán)铮惠v一輛試過(guò)去,會(huì)發(fā)現(xiàn)一個(gè)略顯尷尬的事實(shí)。
絕大多數(shù)所謂的「AI 座艙」,本質(zhì)上還是一個(gè)更智能、會(huì)聊天的語(yǔ)音助手。
它們可以幫你規(guī)劃出去某個(gè)景點(diǎn)的打卡和網(wǎng)紅餐廳路線,搭載了大模型能力,也能和你閑聊非常多話題,并且情緒價(jià)值給足。但是,在真正「控車」環(huán)節(jié),能力依然欠奉——至少在 Q4 之前,真正的 Agent 控車的量產(chǎn)車,可能還送不到消費(fèi)者手里。
這就是 2026 年汽車 AI 最核心的一個(gè)斷層:人人都在講 Agent 上車,但從 Chatbot 到 Agent,中間差的東西,比大多數(shù)人想象的要多得多。
人人都在講 Agent,但 90% 還是 Chatbot
兩年多之前,大模型上車就已經(jīng)是車企共識(shí),在 2026 年已經(jīng)不是什么新聞了——它現(xiàn)在是基礎(chǔ)設(shè)施,而不是時(shí)髦的噱頭。
豆包(火山引擎)、通義(阿里)、星火(科大訊飛)、騰訊混元、面壁 MiniCPM……幾乎所有主流大模型都在搶汽車的入口。你甚至能在車展的展臺(tái)上,看到同一家車企,不同產(chǎn)品接入了不同的模型廠商的產(chǎn)品。
真正的問(wèn)題是:接了大模型之后,體驗(yàn)變了多少?
![]()
訊飛也在做星火智能座艙方案|圖片來(lái)源:極客公園
我在車展期間跟科大訊飛的人聊,他們的星火大模型(星火智能座艙)也在做上車方案。一個(gè)很有代表性的細(xì)節(jié)是,他們告訴我,目前星火上車做車控的思路,是大模型生成指令之后,映射到之前傳統(tǒng)語(yǔ)音助手的控車路線上。換句話說(shuō),AI 的「腦子」是新的,但「手腳」還是舊的。
這不是訊飛一家的做法。目前行業(yè)里絕大多數(shù)「大模型上車」的合作模式,都是車企調(diào)用一個(gè)云端大模型 API,替換掉原來(lái)的語(yǔ)音引擎。對(duì)話更自然了,知識(shí)更豐富了,情緒識(shí)別更好了——但你說(shuō)一句,它答一句,這還是 Chatbot 的邏輯。
真正的 Agent 上車應(yīng)該是什么樣的?
火山引擎在這次車展發(fā)布會(huì)上用了一個(gè)很準(zhǔn)確的表述:從「回合制問(wèn)答」到「感知-推理-執(zhí)行-記憶-學(xué)習(xí)」的一體化閉環(huán)。翻譯成人話就是,它不只是回答你的問(wèn)題,而是能主動(dòng)感知環(huán)境、理解你的意圖、拆解任務(wù)、調(diào)用車上的各種能力把事情辦完,而且還能記住你的習(xí)慣,下次做得更好。
有一個(gè)很簡(jiǎn)單的判斷標(biāo)準(zhǔn),你對(duì)車說(shuō)「我有點(diǎn)悶」。Chatbot 會(huì)問(wèn)你「要不要開(kāi)窗」;而一個(gè)真正的 Agent,應(yīng)該能結(jié)合當(dāng)前溫度、濕度、車速、你的歷史偏好、后排有沒(méi)有人在睡覺(jué),自動(dòng)做出一套組合調(diào)節(jié)——可能是開(kāi)一條縫的車窗加上調(diào)低空調(diào)兩度再打開(kāi)座椅通風(fēng)。
這個(gè)差距看起來(lái)不大,但背后涉及的工程復(fù)雜度,是完全不同量級(jí)的。
從 Chatbot 到 Agent,差的不是模型,是「底座」
為什么,從「能聊天」到真正「能辦事」這么難?
很多人的第一反應(yīng)是模型不夠強(qiáng)。但其實(shí),以目前豆包、通義、星火這些大模型的能力,理解「我有點(diǎn)悶」這句話的含義,并不是什么難事。真正的瓶頸在另一個(gè)地方:大模型再聰明,如果車企不把底層能力開(kāi)放出來(lái),它也只能陪你聊天。
這就像你請(qǐng)了一個(gè)特別聰明的助理,但你不給他公司的系統(tǒng)權(quán)限,不讓他調(diào)動(dòng)任何資源。他再聰明,也只能坐在那跟你對(duì)話。
Agent 上車,最大的挑戰(zhàn)就是這個(gè)。
一輛車的底層有幾千個(gè)硬件接口——空調(diào)、車窗、座椅、氛圍燈、通風(fēng)、導(dǎo)航、行車信號(hào)……這些東西原本是為「按鈕」和「觸屏」設(shè)計(jì)的,不是為 AI 設(shè)計(jì)的。你突然讓一個(gè)大模型來(lái)操作這些東西,它連信號(hào)都拿不到,更別說(shuō)安全地控制了。
而且,車控不是小事。如果你只是簡(jiǎn)單地把接口暴露給 AI,讓它直接調(diào)用,一旦產(chǎn)生安全問(wèn)題,結(jié)果就可能很嚴(yán)重。
所以 Agent 上車的核心難題不是「大模型能不能理解我的話」,而是「理解之后,怎么安全地、精確地、在對(duì)的時(shí)機(jī)幫我把事辦了」。
![]()
火山引擎和榮威合作的新產(chǎn)品序列「家越 07」|圖片來(lái)源:極客公園
在這次車展前后,我深入了解了火山引擎和榮威合作的一套方案,叫 CPP 架構(gòu)。這可能是目前行業(yè)里對(duì)「Agent 上車」想得最深、做得最重的一個(gè)案例。
CPP 是三個(gè)詞的縮寫(xiě):Context、Planner、Pixel。但它不是一個(gè) Agent——它是一個(gè) Agent 的「操作系統(tǒng)」,業(yè)內(nèi)叫 runtime。
先說(shuō) Context。
大多數(shù)車載 AI 的「上下文」就是你跟它聊天的記錄。但 CPP 的 Context 做了一件很激進(jìn)的事——它把上下文泛化了。不只是對(duì)話,而是把車內(nèi)外的所有信息都當(dāng)作 AI 的「感知輸入」:9 到 13 路外部攝像頭、2 到 3 路內(nèi)部攝像頭、車輛的所有傳感器信號(hào)、用戶的長(zhǎng)期記憶,甚至豆包 App 上的個(gè)人偏好數(shù)據(jù)。
這個(gè)「泛化」聽(tīng)起來(lái)簡(jiǎn)單,做起來(lái)極難。因?yàn)檫@些攝像頭和傳感器,原本是為自動(dòng)駕駛、360 度倒車影像、行人檢測(cè)這些功能設(shè)計(jì)的。你突然要讓座艙 AI 調(diào)用它們來(lái)判斷「后排的小朋友是不是睡著了」,就需要在底層重新打通信號(hào)通道。榮威能做到這一步,靠的是七年三代電子電器架構(gòu)的積累——這不是短期能補(bǔ)的功課。
再說(shuō) Planner。
![]()
榮威的 CPP 架構(gòu)|圖片來(lái)源:榮威汽車
這是 CPP 最核心的一層。它不是一個(gè)單一的大模型,而是一個(gè)多模型協(xié)作的「任務(wù)規(guī)劃器」。簡(jiǎn)單的指令(開(kāi)車窗)走一個(gè)輕量快速模型,毫秒級(jí)響應(yīng);復(fù)雜的任務(wù)(幫我規(guī)劃明天的行程)走一個(gè)深度思考模型,允許異步處理;環(huán)境感知(后排有沒(méi)有人)走視覺(jué)模型。
這里有一個(gè)很精巧的設(shè)計(jì)叫 pre-tool 和 post-tool。比如你說(shuō):「北京鳥(niǎo)巢旁邊那個(gè)什么會(huì)議中心附近的星巴克,幫我導(dǎo)過(guò)去。」這個(gè)請(qǐng)求很復(fù)雜,AI 需要先理解「鳥(niǎo)巢旁邊的會(huì)議中心」是水立方還是國(guó)家會(huì)議中心,然后搜索附近的星巴克,再設(shè)定導(dǎo)航。
如果等它全部算完再回答你,可能要好幾秒——在車?yán)铮瑤酌氲某聊蜁?huì)讓人覺(jué)得它死機(jī)了。所以 pre-tool 機(jī)制會(huì)讓 AI 先快速回一句「你說(shuō)的是水立方吧?我現(xiàn)在幫你找附近的星巴克」——這段話說(shuō)出來(lái)的 3 秒鐘里,后臺(tái)另一個(gè)并行任務(wù)已經(jīng)在瘋狂計(jì)算了。算完之后,post-tool 把結(jié)果匯總,接上前面的話繼續(xù)說(shuō)。用戶感受到的是一段連貫的對(duì)話,背后其實(shí)是兩三個(gè)模型在并行工作。
最后是 Pixel——像素級(jí)執(zhí)行。
這才是整套架構(gòu)里最「重」的一層,也是最需要主機(jī)廠自己來(lái)做的一層。榮威的做法是把底層兩三千個(gè)硬件接口,封裝成七八百個(gè)安全的「服務(wù)層」接口。AI 不直接操作底層硬件,而是調(diào)用這個(gè)服務(wù)層。就像你開(kāi)著車去按 P 檔,它按不下去——不是因?yàn)橛腥烁嬖V你「不能按」,而是在架構(gòu)層面就鎖死了。
這就是他們內(nèi)部說(shuō)的「黑區(qū)、灰區(qū)、彩區(qū)」設(shè)計(jì)。彩區(qū),AI 可以盡情發(fā)揮;灰區(qū),有條件地執(zhí)行;黑區(qū),比如行駛中的關(guān)鍵安全操作,無(wú)論 AI 多聰明都碰不到。
榮威和火山引擎+豆包的開(kāi)發(fā)強(qiáng)度超出了行業(yè)預(yù)期。榮威的服務(wù)層封裝已經(jīng)迭代到第三代,光第三代的研發(fā)周期就超過(guò)兩年半。火山引擎的聯(lián)合開(kāi)發(fā)團(tuán)隊(duì)高峰期近 200 人。而且這不是火山單方面做的——CPP 的每一層都需要車企和大模型廠商一起定義,因?yàn)檐囕d場(chǎng)景的需求(延遲敏感、安全要求、多人多角色交互)和手機(jī)、電腦上的 AI 完全不同。
但原生方案的門檻極高。你需要車企愿意把底層架構(gòu)打開(kāi),需要大模型廠商深入理解車載場(chǎng)景,需要雙方投入兩年以上的聯(lián)合開(kāi)發(fā)——其中每一項(xiàng)都難度極大,意愿極低。這也是為什么整個(gè)行業(yè)都在喊 Agent,但真正落地的幾乎沒(méi)有。
MaaS 大戰(zhàn),燒到了汽車上
技術(shù)問(wèn)題之外,Agent 上車,還有另一個(gè)看不見(jiàn)的戰(zhàn)場(chǎng)——云服務(wù)市場(chǎng)的爭(zhēng)奪。
汽車座艙正在成為 MaaS 的新戰(zhàn)場(chǎng)。不夸張地說(shuō),這可能是繼公有云之后,中國(guó)科技巨頭們最激烈的一次 B 端搶灘。
目前至少有四條路線在同時(shí)跑。
火山引擎和豆包走的是「C 端撬 B 端」的路線。豆包 App 日活已經(jīng)突破 3 億,這意味著字節(jié)在自然語(yǔ)言交互、情緒識(shí)別、個(gè)人偏好學(xué)習(xí)上積累了海量的用戶數(shù)據(jù)。火山引擎把這套能力打包,推到汽車端,目前搭載量超 700 萬(wàn)輛,覆蓋 50 多個(gè)品牌、145 個(gè)車型——這個(gè)數(shù)字是行業(yè)第一。
![]()
豆包座艙助手能實(shí)現(xiàn)的能力|圖片來(lái)源:極客公園
更重要的是,火山這次發(fā)布的「豆包座艙助手」,直接與手機(jī)端的豆包 App 打通。這意味著你在手機(jī)上訓(xùn)練出來(lái)的個(gè)人偏好——你喜歡被安慰還是喜歡聽(tīng)干貨、你的說(shuō)話風(fēng)格、你常問(wèn)的問(wèn)題類型——上車就能無(wú)縫繼承。這是其他家做不到的,因?yàn)闆](méi)有人同時(shí)擁有一個(gè) 3 億日活的 C 端 AI 應(yīng)用,和一套 B 端的汽車云服務(wù)。
阿里云走的是傳統(tǒng) B 端強(qiáng)客戶關(guān)系的路線。
寶馬在中國(guó)選了阿里聯(lián)合定制 AI 大模型,這是一個(gè)標(biāo)志性事件。阿里云在汽車行業(yè)經(jīng)營(yíng)多年,客戶基盤(pán)扎實(shí),而且在訓(xùn)練基礎(chǔ)設(shè)施、數(shù)據(jù)中臺(tái)方面有深厚積累。
騰訊則選了一條完全不同的路。在車展前一天的 TIMEDAY 大會(huì)上,騰訊發(fā)布了出行全場(chǎng)景智能體開(kāi)放平臺(tái)。他們的邏輯不是「賣模型」,而是「做底座」——不綁定生態(tài),而是開(kāi)放能力,讓車企在騰訊的平臺(tái)上自己搭。目前騰訊產(chǎn)品的座艙搭載量超 1800 萬(wàn)輛,在頭部車企中滲透率超過(guò) 80%。連特斯拉在中國(guó)市場(chǎng),都選了騰訊來(lái)做微信互聯(lián)和目的地服務(wù)。微信支付、小程序、騰訊地圖——這些生態(tài)資源是騰訊的獨(dú)家護(hù)城河。
華為最特殊,走的是最接近 Tier 1 的路線。鴻蒙座艙加乾崑智駕,深度綁定車企,從芯片到操作系統(tǒng)到應(yīng)用層全部自研。
在這個(gè)格局里,火山引擎的位置很微妙。
極客公園在車展期間參加了火山引擎的媒體群訪。火山引擎高管在被問(wèn)到「是否想做華為那樣的大模型上車 Tier 1」時(shí),明確說(shuō)了「不想」。但你看他們實(shí)際在推的東西——「豆包座艙助手」是完整的產(chǎn)品級(jí)交付,跟豆包 App 互聯(lián)互通,年內(nèi)量產(chǎn)——這已經(jīng)遠(yuǎn)遠(yuǎn)超出了一個(gè)「API 供應(yīng)商」的邊界。
嘴上說(shuō)不做 Tier 1,身體很誠(chéng)實(shí)。
更有意思的是他在群訪中對(duì)整個(gè)行業(yè)的評(píng)價(jià)——一句很輕描淡寫(xiě)的話:「人才密度較低。」翻譯一下,就是火山和字節(jié),覺(jué)得自己在這個(gè)賽道上是「降維打擊」。
這種自信不是沒(méi)有道理的。
字節(jié)系有兩個(gè)別人沒(méi)有的東西:一個(gè)是豆包 App 積累的海量交互數(shù)據(jù)和情緒模型(3 億日活不是白來(lái)的),另一個(gè)是今日頭條和抖音體系沉淀的,內(nèi)容數(shù)據(jù)和信息清洗能力。這些資產(chǎn)用在車載場(chǎng)景里——比如讓 AI 帶你做冥想,它從網(wǎng)上學(xué)來(lái)冥想的流程、話術(shù)、配樂(lè),然后結(jié)合車內(nèi)的氛圍燈和座椅調(diào)節(jié)——這種跨域能力不是傳統(tǒng)汽車供應(yīng)商能復(fù)制的。
但火山也有自己的短板。
![]()
火山引擎在北京車展的展臺(tái)|圖片來(lái)源:極客公園
700 萬(wàn)輛搭載量雖然是「第一」,但其中大部分是標(biāo)準(zhǔn) API 接入,真正做到 CPP 級(jí)別深度合作的標(biāo)桿客戶,還在打造中。數(shù)據(jù)好看,但深度還不夠。這也是為什么火山高管在群訪中反復(fù)強(qiáng)調(diào)「ToC 的用戶體驗(yàn)」和「社會(huì)價(jià)值」,而對(duì)短期商業(yè)閉環(huán)的問(wèn)題打了很多太極。
這場(chǎng) MaaS 大戰(zhàn)的本質(zhì),其實(shí)不是誰(shuí)的模型更強(qiáng)——真正的勝負(fù)手是誰(shuí)能把「服務(wù)閉環(huán)」做得更深。火山的優(yōu)勢(shì)是 C 端生態(tài)和內(nèi)容數(shù)據(jù),阿里的優(yōu)勢(shì)是 B 端客戶關(guān)系和云基礎(chǔ)設(shè)施,騰訊的優(yōu)勢(shì)是社交生態(tài)和支付。
誰(shuí)能贏?現(xiàn)在下結(jié)論還太早。但有一點(diǎn)可以確定:Agent 上車這件事,正在把汽車產(chǎn)業(yè)的競(jìng)爭(zhēng)維度從「硬件制造」拉,向「軟件生態(tài)」。
而在這個(gè)新戰(zhàn)場(chǎng)上,傳統(tǒng)車企的話語(yǔ)權(quán),可能比他們想象的要小。
盡管車展上 Agent 上車的聲量震天響,冷靜看,目前真正的 AI 原生架構(gòu),在行業(yè)里幾乎沒(méi)有量產(chǎn)交付的案例。即便是合作了一年半的榮威和火山,也才走到 CPP 的 runtime 層,真正能控車、能主動(dòng)服務(wù)、能持續(xù)學(xué)習(xí)的智能助手,預(yù)計(jì)最快也要到今年年底才能跟用戶見(jiàn)面。
但這恰恰說(shuō)明了一件事:大家終于不再滿足,只是給車?yán)锶粋€(gè)聊天機(jī)器人了。
從 Chatbot 到 Agent,從「接 API」到「建 runtime」,從「語(yǔ)音助手」到「整車大腦」——這條路確實(shí)很長(zhǎng)。但至少在這一屆北京車展上,我們已經(jīng)看到了行業(yè)轉(zhuǎn)變的信號(hào),而一旦 Agent 上車的能力,給消費(fèi)者帶來(lái)跨時(shí)代的體驗(yàn),汽車行業(yè)無(wú)疑會(huì)再次迎來(lái)猛烈的進(jìn)化。
畢竟,在中國(guó)這個(gè)神器的市場(chǎng)上,即便是大爺大媽,都是會(huì)拿著電腦讓人幫忙裝「小龍蝦」的。
人工智能智能汽車新能源車AI
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.