近期,多家企業(yè)相繼推出了各自的高階智駕方案,不斷刷新著公眾對(duì)輔助駕駛能力的認(rèn)知。
無論是華為乾崑智駕的再次進(jìn)化,還是小鵬、理想、Momenta、地平線等發(fā)布的新一代系統(tǒng),都表明了這一領(lǐng)域競(jìng)爭(zhēng)的激烈與技術(shù)路徑的多元化。
![]()
一個(gè)核心的討論焦點(diǎn)在于,不同方案所依賴的底層模型架構(gòu)正在分化為兩種主要思路:一種是以視覺-語(yǔ)言-動(dòng)作為核心的擬人化推理路徑,另一種則專注于構(gòu)建高保真的物理世界模型。這引發(fā)了行業(yè)內(nèi)的廣泛探討:在通往更高級(jí)別自動(dòng)駕駛的道路上,這兩種技術(shù)路線是必須二選一的對(duì)立選項(xiàng),還是有可能殊途同歸?
以VLA為代表的技術(shù)路徑,其目標(biāo)在于讓車輛的決策邏輯盡可能模擬人類駕駛員的思考過程。這套系統(tǒng)的工作流程始于視覺感知,將攝像頭捕捉的圖像信息轉(zhuǎn)化為機(jī)器能夠理解的語(yǔ)義標(biāo)簽,例如識(shí)別出“車輛”、“行人”、“交通標(biāo)志”。隨后,系統(tǒng)會(huì)像人一樣,基于這些語(yǔ)義信息和對(duì)交通規(guī)則的理解,進(jìn)行情景推理和判斷,最終生成控制車輛的指令。
![]()
這種方式的優(yōu)勢(shì)在于其出色的場(chǎng)景泛化能力和處理不確定性的靈活度。在面對(duì)復(fù)雜的城市路況,尤其是那些規(guī)則模糊、充滿突發(fā)狀況的長(zhǎng)尾場(chǎng)景時(shí),比如突然竄出的電動(dòng)自行車、不標(biāo)準(zhǔn)的臨時(shí)施工區(qū)域或是無信號(hào)燈路口的多方博弈,擬人化推理模型能夠憑借其基于規(guī)則的邏輯鏈,做出更接近人類駕駛員的決策,例如主動(dòng)減速觀望、禮貌讓行或重新規(guī)劃路徑。
它的核心價(jià)值在于嘗試?yán)斫鈭?chǎng)景的“含義”而不僅僅是測(cè)量物理數(shù)據(jù),這使得它在應(yīng)對(duì)未知和變化時(shí)顯得更具“智慧”。然而,其挑戰(zhàn)在于,從語(yǔ)義理解到精確控制的轉(zhuǎn)換過程中,可能損失部分物理世界的精度,對(duì)距離、速度、時(shí)間的量化控制有時(shí)不如物理模型那般直接和精確。
另一條技術(shù)路徑,世界模型,則采取了一種更為“工程化”的思維。它致力于利用傳感器(尤其是激光雷達(dá))數(shù)據(jù),在系統(tǒng)中實(shí)時(shí)構(gòu)建并動(dòng)態(tài)更新一個(gè)高精度的、可計(jì)算的周圍環(huán)境數(shù)字孿生。在這個(gè)虛擬的物理仿真環(huán)境中,系統(tǒng)可以預(yù)測(cè)所有交通參與者未來的運(yùn)動(dòng)軌跡,并進(jìn)行大量的“如果-那么”推演,從而規(guī)劃出一條在物理約束下最優(yōu)、最安全、能效最高的行駛軌跡。
![]()
這條路徑的核心優(yōu)勢(shì)在于其卓越的精確性與可控性。在高速公路、結(jié)構(gòu)化良好的城市道路等場(chǎng)景中,基于世界模型的系統(tǒng)能夠?qū)崿F(xiàn)極為平滑、精準(zhǔn)的軌跡跟蹤與控制,在安全性、舒適性和能效方面往往表現(xiàn)出色。它就像是一個(gè)不知疲倦、絕對(duì)遵守物理定律的超級(jí)模擬器。
但其局限性在于,這套高度依賴精確建模和大量計(jì)算的系統(tǒng),在處理訓(xùn)練數(shù)據(jù)中未曾充分覆蓋的、高度依賴“常識(shí)”和“社交禮儀”的極端交互場(chǎng)景時(shí),其決策可能顯得不夠靈活或“情商”不足。同時(shí),它對(duì)算力硬件的高要求,也曾是制約其成本下降和普及的重要因素。
面對(duì)兩種技術(shù)的優(yōu)劣互補(bǔ),行業(yè)早已跳出單一路線之爭(zhēng),轉(zhuǎn)向融合發(fā)展,推出兼顧兩者優(yōu)勢(shì)的雙引擎方案。
這種融合模式以世界模型為基礎(chǔ),負(fù)責(zé)精準(zhǔn)的物理建模、數(shù)據(jù)測(cè)算和軌跡規(guī)劃,筑牢駕駛穩(wěn)定性根基;同時(shí)搭配 VLA 的擬人決策能力,處理復(fù)雜路況溝通、突發(fā)場(chǎng)景應(yīng)對(duì)等柔性需求,實(shí)現(xiàn)精準(zhǔn)操控與靈活應(yīng)變的結(jié)合。在實(shí)際應(yīng)用中,車輛既能精準(zhǔn)完成泊車、勻速行駛等操作,又能聽懂語(yǔ)音指令、避讓行人、靈活繞行,全程無需人工干預(yù),更貼近真實(shí)的高階駕駛需求。
![]()
下一代智駕的發(fā)展方向,從來不是非此即彼的路線之爭(zhēng),而是通過分層協(xié)同,讓一套系統(tǒng)適配全場(chǎng)景。可以預(yù)見,未來一到兩年,雙引擎方案會(huì)成為大多數(shù)頭部車企的選擇。高階智駕不再是高價(jià)車的專屬,普通人也能用上既能算得準(zhǔn)、又能靈活應(yīng)對(duì)突發(fā)狀況的智駕系統(tǒng)。這或許才是技術(shù)普惠的真正意義。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.