![]()
時(shí)隔一年之久,地平線副總裁兼首席架構(gòu)師負(fù)責(zé)人蘇箐現(xiàn)身2025地平線技術(shù)生態(tài)大會(huì)。
雖然領(lǐng)著任務(wù)而來(lái),但蘇博士并沒(méi)有把太多的時(shí)間放在捧HSD的“吊炸天”上。
三十分鐘的演講,一貫的心直口快,熟悉的密集信息輸出,給出了不少值得人們冷靜思考的真知灼見(jiàn)。
被VLA和世界模型路線口水戰(zhàn)搞得心煩意亂的部分小伙伴,欣賞著蘇博士的口條,心弦放慢,如清風(fēng)拂面,情不自禁地獻(xiàn)上了“智駕思想者”、“行業(yè)掃地僧”的贊言。
“思想者”、“掃地僧”固然有些過(guò)譽(yù)了,蘇箐聽(tīng)了這樣的話肯定也會(huì)說(shuō)謬贊。
不過(guò),在充斥著技術(shù)黑話與商業(yè)話術(shù)的本土自動(dòng)駕駛行業(yè)里,蘇博士給出的幾個(gè)清晰、篤定的穿透性判斷,確實(shí)值得我們深入思考一番。
立標(biāo)簽、搶首發(fā)向來(lái)是本土自動(dòng)駕駛玩家們做營(yíng)銷宣傳的慣用手段。
在22年9月份特斯拉召開(kāi)最后一屆AI Day之后的近幾年時(shí)間里,為了避免被逐幀學(xué)習(xí),特斯拉幾乎保持了緘默不言。
于是,本土首個(gè)、全球唯二(另一家當(dāng)然是特斯拉)甚至行業(yè)首發(fā)的宣傳語(yǔ)滿天飛,人人第一梯隊(duì),個(gè)個(gè)遙遙領(lǐng)先。
無(wú)圖、兩段式端到端、雙系統(tǒng)、VLA、XLA、世界行為模型各種詞匯紛紛涌現(xiàn),似乎每一年都有里程碑式的新發(fā)現(xiàn)。
![]()
縱然本土自動(dòng)駕駛行業(yè)有很多天降猛男,人才過(guò)剩導(dǎo)致極度內(nèi)卷,每年都會(huì)出現(xiàn)里程碑式的新突破也著實(shí)有些頻繁了。
在兼具極深的技術(shù)底蘊(yùn)、極高的思考密度和如如不動(dòng)的定力的蘇箐看來(lái),分模塊規(guī)則方案向端到端神經(jīng)網(wǎng)絡(luò)方案的轉(zhuǎn)型,才是近幾年來(lái)自動(dòng)駕駛算法領(lǐng)域最重要的一次革命。
也就是說(shuō),VLA、世界模型通通不算里程碑,只有端到端范式才是唯一可以代表行業(yè)根本轉(zhuǎn)向的范式變革。
![]()
當(dāng)然,按照本土智駕圈的話語(yǔ)體系,更準(zhǔn)確的說(shuō)法是「真一段式端到端」。
正如巴菲特不明白為何非要在投資前面加上價(jià)值二字形成“價(jià)值投資”這么一個(gè)詞匯,因?yàn)槊撾x了價(jià)值就不該叫投資一樣,我們也只能認(rèn)為「非真一段式」端到端不是真的端到端了。
![]()
真范式革命只有端到端,這是一個(gè)相當(dāng)有分量而且充滿了真知灼見(jiàn)的論斷。
端到端神經(jīng)網(wǎng)絡(luò)代表著由規(guī)則驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)的范式變革,從根本上改變了構(gòu)建自動(dòng)駕駛系統(tǒng)的核心邏輯。
與端到端相比,近一年多來(lái)被大家反復(fù)提到的VLM、VLA、世界行為模型固然也非常重要,但它們都以單一神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)感知到行動(dòng)的映射,相當(dāng)于在端到端的新范式之下,為了不斷解決復(fù)雜場(chǎng)景問(wèn)題、擴(kuò)大ODD做出的關(guān)鍵技術(shù)突破。
![]()
或者說(shuō),端到端是顛覆傳統(tǒng)模塊化流水線的的范式基石,VLA和世界模型則是端到端范式之上的能力增強(qiáng)組件。
VLA在端到端模型中引入語(yǔ)言智能,賦予系統(tǒng)推理、溝通、解釋的能力,世界模型在端到端神經(jīng)網(wǎng)絡(luò)中引入空間智能,賦予系統(tǒng)感知、推理三維世界并與三維物理世界互動(dòng)的能力。
如果套用軟件的概念,端到端神經(jīng)網(wǎng)絡(luò)是操作系統(tǒng)層面的升級(jí),相當(dāng)于從塞班到安卓/iOS的蛻變,定義了全新的開(kāi)發(fā)模式。
而VLA和世界模型是在這個(gè)新的操作系統(tǒng)上開(kāi)發(fā)的殺手級(jí)應(yīng)用,相當(dāng)于微信和支付寶。
雖然依托于新的操作系統(tǒng),極大發(fā)揮和擴(kuò)展了新操作系統(tǒng)的威力,但它們本身不是操作系統(tǒng)層面的范式變革。
![]()
這么一比較,大家對(duì)VLA和世界模型就沒(méi)有那么上頭了吧!
與第一個(gè)判斷一脈相承,蘇箐的第二個(gè)觀點(diǎn)同樣旗幟鮮明:
——L2輔助駕駛的技術(shù)路徑完全可以通往L4高等級(jí)自動(dòng)駕駛。
這直接挑戰(zhàn)了行業(yè)中一度流行的觀點(diǎn),以小馬智行為代表的一些Robotaxi廠商一直認(rèn)為,人機(jī)共駕的L2和無(wú)人駕駛的L4在技術(shù)本質(zhì)上走的是兩條路,兩者之間存在著技術(shù)的斷層。
![]()
在強(qiáng)調(diào)功能堆砌的分模塊時(shí)代,這個(gè)觀點(diǎn)是成立的。
由于責(zé)任主體的不同,司機(jī)兜底的L2輔助駕駛和系統(tǒng)擔(dān)責(zé)的L4高等級(jí)自動(dòng)駕駛在功能完備線性上存在巨大的差距,以至于L2和L4之間在出發(fā)點(diǎn)、追求目標(biāo)和技術(shù)路徑上都有著很大的不同。
![]()
到了重在追求智能的端到端時(shí)代,這個(gè)觀點(diǎn)就值得商榷了。
端到端范式的出現(xiàn)引入了智能的全新維度,系統(tǒng)的驅(qū)動(dòng)核心從人工規(guī)則轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的智能內(nèi)核,這就意味著L2和L4在追求的智能內(nèi)核上達(dá)到了統(tǒng)一,他們之間的差異更多地體現(xiàn)在基于同一智能內(nèi)核的產(chǎn)品形態(tài)上。
內(nèi)核統(tǒng)一,形態(tài)分化,相當(dāng)于在智能的主干下分出的兩道枝椏。
在統(tǒng)一的端到端范式和追求相同的智能內(nèi)核(語(yǔ)言智能和空間智能)的前提下,L2級(jí)輔助駕駛系統(tǒng)和L4級(jí)自動(dòng)駕駛系統(tǒng)都采用數(shù)據(jù)驅(qū)動(dòng)的端到端神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了方法論的統(tǒng)一。
不過(guò),由于端到端范式出現(xiàn)得比較晚,L2和L4這兩道枝椏還未走到合一的階段,面向量產(chǎn)乘用車的L2級(jí)系統(tǒng)重在追求高度的擬人性、泛化能力,面向無(wú)人出行的L4級(jí)系統(tǒng)重在追求超人的安全性與可靠性,在安全、舒適、效率等各種層面,兩者的區(qū)別還比較大。
![]()
但是,在清晰且統(tǒng)一的方法論下,只要給量產(chǎn)自動(dòng)駕駛玩家足夠的時(shí)間,干足夠多的臟活苦活,差距是可以慢慢追平的,這個(gè)路徑是足夠清晰的。
特斯拉這個(gè)天字號(hào)第一猛男半年前就開(kāi)始拿量產(chǎn)車Model Y(參數(shù)丨圖片)做Robotaxi運(yùn)營(yíng),相當(dāng)于由于大美麗沒(méi)有L3監(jiān)管,特斯拉直接從L2跳到了L4。
小鵬汽車表示要沿著端到端技術(shù)路線繼續(xù)埋頭苦干一年,于26年正式進(jìn)入Robotaxi賽道。
華為和地平線也計(jì)劃經(jīng)過(guò)L3的短暫過(guò)渡后,迅速進(jìn)入L4階段。
![]()
所以,不要再扯L2不能通往L4了,把那該死的傲慢收起來(lái)吧。
曾經(jīng)炮轟特斯拉FSD就是殺人的蘇箐博士一度因?yàn)檎J(rèn)為L(zhǎng)5級(jí)自動(dòng)駕駛永遠(yuǎn)不能實(shí)現(xiàn)而陷入了抑郁狀態(tài),最后還是被特斯拉開(kāi)創(chuàng)的端到端范式治愈了。
以原子彈類比端到端是不是合適,人微言輕的我無(wú)法判斷。
但是,以海量量產(chǎn)車為數(shù)據(jù)源泉,喂養(yǎng)并錘煉出一個(gè)日益強(qiáng)大的自動(dòng)駕駛大腦。
最終在規(guī)模與智能的臨界點(diǎn),實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的涌現(xiàn),端到端的思想多么優(yōu)美,多么簡(jiǎn)單啊!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.