哈嘍,大家好,今天小墨這篇評論,主要來分析復旦團隊如何讓自動駕駛AI學會像老司機一樣"以終為始"規劃路線。
自動駕駛AI最近出現了一個挺顛覆的思路。復旦大學和引望智能聯合搞了個叫WAM-Diff的系統,它跟現在主流的自動駕駛AI完全不一樣。
![]()
現有的AI開車都是"從左到右"一步步算,就像新手司機那樣,看到前面有車就剎車,看到綠燈就起步。但復旦這套系統反過來了,它先想好要去哪兒,然后倒推現在該怎么開。
這個思路聽起來有點反常識,但其實很符合老司機的習慣。你想啊,一個開了十幾年車的師傅,看到前方路口需要左轉進匝道,他會提前幾百米就開始變道,而不是到了路口才手忙腳亂。
![]()
WAM-Diff在權威的NAVSIM測試榜單上拿了91.0分和89.7分的成績,比之前的DiffusionDrive提升了5.2分。
![]()
現在大部分自動駕駛AI用的是自回歸模型,說白了就是按順序一個動作接一個動作地預測。這種方式有個天生的缺陷,它只能利用過去的信息,看不到未來會發生什么。就好比你開車只看后視鏡,不看前方,肯定開不好。
還有個更麻煩的事兒。這些AI是通過模仿人類司機的駕駛數據學出來的,但訓練數據里既有激進的司機,也有保守的司機。AI學完以后,往往變成了一個"平均司機",既不敢大膽超車,也不夠謹慎避讓,遇到復雜路況就容易犯糊涂。
![]()
今年11月,《科技日報》報道過一起自動駕駛測試事故。一輛測試車在高速公路上遇到前車突然減速,系統判斷需要變道,但變道時機選得太晚,差點跟旁邊車道的車發生剮蹭。事后復盤發現,AI在做決策時只考慮了當前1秒內的情況,沒有提前規劃好3到5秒后的行駛軌跡。
![]()
WAM-Diff用了一個叫掩碼擴散模型的技術。簡單說,它不是從起點一步步推到終點,而是先把整條路線的所有可能都列出來,然后通過多輪迭代篩選出最優方案。每一輪迭代都能同時看到過去和未來的信息,這樣規劃出來的路線就更連貫,也更安全。
![]()
團隊測試了三種規劃順序,一種是從近到遠(因果序),一種是從遠到近(反因果序),還有一種是隨機順序。結果發現,反因果序的效果最好,也就是先確定遠處要去哪兒,再倒推近處怎么走。這個發現跟人類駕駛員的思維方式完全吻合。
為了讓AI能應對各種復雜場景,復旦團隊還給它配了64個"專家"。這64個專家其實是64個小模型,每個專家擅長處理不同的路況。
![]()
比如有的專家擅長處理高速并線,有的專家擅長應對擁堵路段,有的專家擅長處理雨天濕滑路面。系統會根據當前情況自動選擇最合適的專家來決策。
這種設計有點像駕校里不同的教練,有人教你過彎,有人教你倒車,有人教你應急處理。WAM-Diff把這些"教練"都裝進了一個系統里,需要哪個就調哪個。
![]()
![]()
光靠模仿人類司機還不夠,因為人類駕駛數據里也有不少危險操作。復旦團隊專門設計了一套叫GSPO的強化學習算法,讓AI在虛擬環境里反復試錯,然后根據安全性、合規性和舒適性三個維度給每條行駛軌跡打分。
打分標準很具體。安全性看有沒有碰撞風險,合規性看有沒有違反交通規則比如壓實線、闖紅燈,舒適性看加減速是否平順,有沒有急剎急轉。系統會生成一組候選路線,然后挑出得分最高的那條,把這個"好學生"的經驗反饋給AI,讓它不斷優化。
![]()
這套機制跟駕校考試有點像。教練不光教你怎么開,還會告訴你哪些動作會被扣分,哪些動作是滿分操作。AI在虛擬環境里相當于練了無數次,把所有可能犯的錯都試過一遍,上路以后自然就更穩了。
![]()
在NAVSIM-v2的測試中,這個版本加入了更嚴格的交通規則檢查和舒適性評估。WAM-Diff依然保持了89.7分的成績,說明它在遵守規則和保證舒適度方面都做得不錯。相比之下,一些只追求速度的系統在這個測試里分數掉得很厲害。
![]()
特斯拉的FSD用的也是端到端學習,但它走的是自回歸路線,本質上還是"從左到右"一步步預測。這種方式在簡單路況下沒問題,但遇到復雜場景,比如高峰期的環島或者施工路段,就容易出現決策延遲。
![]()
WAM-Diff的優勢在于它能提前規劃好整條路線,遇到突發情況時調整空間更大。而且它的64個專家模型可以針對不同場景做專門優化,這點比單一模型更靈活。當然,特斯拉的優勢是海量的實車數據和持續的OTA更新,這方面復旦團隊還在積累階段。
不過技術思路上,WAM-Diff確實提供了一個新方向。它證明了非自回歸的生成方式在自動駕駛領域是可行的,而且在某些指標上已經超過了傳統方法。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.