![]()
十月下旬,地平線掌門人余凱和深藍汽車CEO鄧承浩在深藍L06上進行了一場智能駕駛系統直播測試。
在直播過程中,智慧的光芒從油光锃亮的頭皮上噴薄而出的余博士表示,視覺與激光雷達方案的爭論沒有必要。
而且,在中國復雜的道路場景下,智能駕駛技術更需要具備的是預判能力,而不僅僅是看見的能力。
這個觀點引發了激光雷達派和視覺派的廣泛熱議,不過,從雙方陣營粉絲的發言來看,大多數人并沒有真正理解余博士的邏輯。
有時候,強烈的愛憎會泯滅基本的邏輯。
很多因為華為采取多傳感器融合技術路線而站隊激光雷達的粉絲朋友們有一個思維上的誤區,他們認為,在自動駕駛感知傳感器系統中,激光雷達是可以取代攝像頭的。
事情的真相當然不是這個樣子。
在自動駕駛系統中,因其不可或缺的語義理解能力,攝像頭是必然存在的。
作為幾何信息的提供者和安全冗余,激光雷達反倒是可以被拿掉的。
因為,在自動駕駛系統的“感知-決策-執行”閉環里,場景理解是最為核心的關鍵,而場景理解需要的三大能力-看得清、看得見和看得懂,主要是通過攝像頭來實現的。
![]()
能不能“看得清”,主要取決于采樣顆粒度和分辨率。
拿主流的128線激光雷達和800萬像素攝像頭做對比,兩者的分辨率差距是1:160,差了整整兩個數量級。
和圖像能夠提供的稠密信息相比,激光雷達提供的數據是相當稀疏的。
饒你像諸葛亮那樣能掐會算,也不可能從稀疏的數據中對車輛周圍的世界進行有效的還原。
![]()
在能不能“看得見”上,不依賴環境光,在強光、弱光、炫光條件下依然表現穩定的激光雷達具備一定的優勢。
不過,隨著圖像捕捉、圖像信號處理和AI技術的進步,視覺方案在這些條件下的表現也在不斷進步。
憑借越來越高的像素和分辨率、可兼顧強光和弱光條件的寬動態范圍、出色的低光性能,現在的圖像捕獲核心部件-圖像傳感器不僅可以滿足在低照度弱光環境下成像的剛性需求,還可以在光線對比強烈的炫光逆光環境下全面地呈現亮部和暗部的細節。
![]()
在能不能“看得懂”上,攝像頭也具備根本的優勢。
因為攝像頭的核心價值就在于提供豐富的二維紋理和語義信息,結合深度學習,它能識別車道線、交通標志、信號燈、顏色等。
至于這個二維傳感器所缺乏的深度信息,它既可以通過雙目視覺直接計算,也可以通過深度神經網絡進行間接的推斷。
相較之下,激光雷達缺乏顏色、紋理等細節,顯然很難(不是不可以)識別交通標志、車道線這些與駕駛任務密切相關的關鍵信息。
![]()
雖然荷爾蒙飽滿的網民們很在乎分出來一個你高我低,但是,求真務實的技術世界從來不是非此即彼的。
激光雷達固然不是用來替代攝像頭的,但它可以成為視覺感知系統的關鍵補充,并提供安全冗余。
![]()
在信息補充上,將激光雷達的幾何信息與攝像頭的語義信息有效地結合。
通過將激光雷達的點云數據與攝像頭的像素數據在時間和空間上進行精確的對齊,為圖像中的每一個像素賦予準確的深度信息,可以創造更全面、更可靠的三維環境感知。
這正是多傳感器融合的核心思想,也是激光雷達存在的主要邏輯。
![]()
其次,在安全冗余上,當攝像頭因為極端的光照、苛刻的工作溫度等原因出現性能下降時,激光雷達可以提供可靠的幾何信息作為備份,確保系統的基本安全。
其實就跟保險一樣,是用來兜底的。
小賭怡情,大賭傷身。最近在資本市場里小賭的我慢慢明白了不懂、似懂非懂、略懂、真懂和懂到位的區別簡直比志玲姐姐和鳳姐的區別還要大。
地平線掌門人余凱說,激光雷達與視覺方案的爭議不重要,智能駕駛技術更需要具備的是預判能力,而不僅僅是看見的能力。
這個充滿洞察力的觀點說明,余凱博士對自動駕駛的理解真的是懂到位了,或者說給懂王開門-懂到家了。
![]()
因為,激光雷達和攝像頭回答的只是“車輛周圍有什么”的問題。
21年問世的基于Transformer的BEV解決了標準障礙物的感知,22年問世的占用網絡OCC解決了異形障礙物的感知。
這些算法基本完成了對車輛、行人、交通標志等動靜態物體的識別和定位,回答了“有什么”的問題。
而要想讓自動駕駛系統像人類老司機那樣安全、絲滑地駕駛,更為關鍵的在于能夠預測“接下來會發生什么”。
![]()
也就是說,L2時代自動駕駛算法的核心目標是實現全面的障礙物識別和目標感知,到了L3和L4的時代,自動駕駛要從靜態、分立的感知走向動態、全維的場景理解。對應到自動駕駛系統的“感知-決策-執行”閉環里。
可以認為,L2時代主攻感知,L3時代開始以神經網絡改造決策。L2時代即將落幕,作為感知算法卡姿蘭大眼睛的激光雷達和攝像頭之爭還有什么意義呢?
![]()
自動駕駛行業正在從考驗眼睛亮不亮的L2感知時代,邁向考驗腦子好不好使的L3認知時代。
在這樣的大背景下,能夠思考和預判的決策和規劃就成了競爭的主戰場。
要知道,真實的交通環境中充滿了形形色色的參與者,引入了各種各樣的不確定性,必須理解場景中各類交通參與者的意圖,并預測其在未來幾秒內的狀態分布,才能給出有效的應對決策。
![]()
對其它車輛和行人進行行為意圖的預測,可以提前平順地做出決策,讓智能駕駛系統可以實現類人的舒適駕駛體驗。
此外,在很多場景中,強大的預判能力也是應對長尾場景、提升系統安全的關鍵。
當你預判了別人的預判,拿捏還不是手拿把攥?
自動駕駛行業的競爭焦點已經從看清世界的感知能力,轉向理解并思考的認知能力。
在這個核心大趨勢下,圍繞激光雷達和攝像頭的爭論真的沒有多少的價值和意義。
別爭了,視覺方案挺好,多傳感器融合方案也不錯,都好還不行嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.