![]()
復旦引望聯手搞出大動作,一款叫WAM-Diff的框架,直接給自動駕駛的核心規劃邏輯來了次大升級。
現在主流的端到端自動駕駛都在往“大一統”方向靠,但老問題一直沒解決,這次WAM-Diff算是精準踩中了痛點。
![]()
現在很多自動駕駛的規劃模型,都用的是自回歸生成模式。
簡單說,就是像寫句子一樣從左到右按順序算動作。這跟咱們人類開車的思路完全對不上。
咱們老司機碰到復雜路況,肯定是先想清楚最終要去哪,比如要進匝道、要避讓行人,再倒著推現在該踩油門還是打方向。
那些自回歸模型可不管這些,只埋頭算下一步動作。
![]()
更麻煩的是,這些模型大多靠模仿人類駕駛數據學習,很容易陷入“平均司機”的陷阱。
意思就是只會中規中矩開車,該激進避讓的時候不敢動,該平穩跟車的時候又反應遲鈍。
之前看不少自動駕駛實測,碰到突發情況就掉鏈子,多半就是這個原因。
WAM-Diff的出現,就是沖著解決這些問題來的。
![]()
本來想是不是單純堆參數就能解決,后來發現根本不行,得從根上改生成邏輯。
WAM-Diff最核心的改變,是把離散掩碼擴散模型用在了自動駕駛規劃上。
首先它搞了個混合離散動作分詞技術,把連續的行車軌跡坐標,精準轉換成了離散的“指令塊”,誤差能控制在很小的范圍里。
這些“指令塊”還能和“左轉”“避讓”這類語義指令放在一起理解,相當于讓模型既能看懂路,又能聽懂指令。
![]()
更有意思的是它的解碼策略。研發團隊試了三種生成順序,最后發現反因果序最管用。
就是先確定遠處的終點,再倒著規劃近處的動作,這完全復刻了人類“以終為始”的駕駛直覺。
如此看來,這種反常規的思路,反而讓行車軌跡更連貫、更安全。
為了應對不同路況,WAM-Diff還加了MoE混合專家架構。
![]()
簡單說就是模型里藏了64個“專項司機”,碰到十字路口、高速路這些不同場景,會自動激活最擅長的那個。
同時搭配的強化學習算法,還能從整個行車軌跡的角度做優化,不光看動作像不像人,更要保證安全、合規、舒服。
這款框架的實力,在NAVSIM權威評測里得到了驗證。
![]()
在兩個版本的測試中,都拿到了頂尖成績,比現在不少主流模型表現都好。
尤其是在加了交通規則和舒適性要求的測試里,優勢更明顯。
這些成績背后的意義不一般。
它證明了非自回歸生成范式在自動駕駛里是可行的,也打破了大家對“模型越復雜越好”的固有認知。
![]()
WAM-Diff沒靠堆參數,而是靠優化生成邏輯和架構設計,就解決了行業痛點。
對行業來說,這可能是通往L4級自動駕駛的關鍵一步。
現在很多自動駕駛方案卡在復雜場景的決策上,WAM-Diff提供了新的思路。
它讓模型不光能“學會開車”,還能“理解為什么這么開”,可解釋性和安全性都提上去了。
![]()
WAM-Diff的出現,算是給端到端自動駕駛的發展指了個新方向。
未來要是能結合車路云一體化這些技術,說不定能更快推動高等級自動駕駛的商業化落地。
毫無疑問,這種從底層邏輯革新的技術,遠比單純的參數升級更有價值。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.