今年一季度的AI DAY后,我們曾提出——毫末拿出了這么多成績,但在外供上,還沒有第二家主機(jī)廠信息被披露。
彼時,距離毫末推出面向乘用車駕駛領(lǐng)域的“6P開放合作模式”(代碼、模塊、軟件、硬件、云端服務(wù)、全棧解決方案6個產(chǎn)品層面的合作方式)已經(jīng)過去一段時間。
或許是看到了我們的疑惑,在今天舉辦的第八屆AI DAY上,毫末智行董事長張凱向外界公布了毫末6P 開放合作的重要進(jìn)展:目前已與包括長城在內(nèi)的3家主機(jī)廠簽署定點合同,相關(guān)項目正在交付中。
![]()
△毫末智行董事長張凱
這對于有著長城汽車深刻烙印的毫末,意義自是非同一般,張凱也再次強(qiáng)調(diào)“自動駕駛是一個共同進(jìn)退、共享成果的前沿產(chǎn)業(yè)。只有健康的生態(tài)伙伴才能支持毫末高速發(fā)展。”
至此,毫末算是解答了我們在“上節(jié)課”留下的一個疑問。而這,僅僅是整場AI DAY中的冰山一角。
1
“戰(zhàn)爭”狂人
在我看來,毫末是有些“好戰(zhàn)”氣質(zhì)在身上的。
2022年給自己安排了數(shù)據(jù)智能技術(shù)之戰(zhàn)、輔助駕駛城市場景之戰(zhàn)、末端物流智能配送車規(guī)模之戰(zhàn)三大戰(zhàn)役。
進(jìn)入2023年,毫末擴(kuò)大了戰(zhàn)爭范圍,升級了戰(zhàn)爭內(nèi)容:智能駕駛裝機(jī)量王者之戰(zhàn)、MANA大模型的巔峰之戰(zhàn)、城市NOH百城大戰(zhàn)和末端物流自動配送商業(yè)之戰(zhàn)。
三個月過去,四大戰(zhàn)役也迎來了階段性捷報:
首先是“智能駕駛裝機(jī)量王者之戰(zhàn)”,首款搭載HPilot3.0 的新摩卡DHT-PHEV 即將上市,第二款搭載毫末HPilot3.0的車型魏牌藍(lán)山也將在今年發(fā)布。毫末HPilot 整體已搭載近20 款車型。用戶輔助駕駛行駛里程突破4000 萬公里,HPilot2.0 輔助駕駛?cè)站锍淌褂寐蔬_(dá)到了12.6%。海外方面,搭載毫末HPilot 的車輛已運(yùn)往歐盟、以色列等地區(qū)和國家,陸續(xù)交付到用戶手中;同時,毫末HPilot 即將量產(chǎn)墨西哥版本及俄羅斯版本。
![]()
其次是“MANA 大模型巔峰之戰(zhàn)”,毫末的自動駕駛數(shù)據(jù)智能體系MANA 架構(gòu)已迎來全線升級。到2023 年4 月,MANA 學(xué)習(xí)時長近56 萬小時,相當(dāng)于人類司機(jī)6.8 萬年。
第三是“城市NOH 百城大戰(zhàn)”,中國首款可大規(guī)模量產(chǎn)落地、重感知城市NOH,已在北京、保定、上海等城市開啟泛化測試,即將量產(chǎn)上車。到2024 年有序落地100 城。
![]()
最后是“末端物流自動配送商業(yè)之戰(zhàn)”,毫末末端物流自動配送車小魔駝已在商超履約、智慧社區(qū)、校園配送、餐飲零售、機(jī)場巡邏、高校教育、快遞接駁、智慧園區(qū)、大氣環(huán)評等九大場景開啟運(yùn)營。2023 年3 月,小魔駝2.0 獲北京亦莊無人配送車車輛編碼,開啟亦莊運(yùn)營。
![]()
對比上個季度的成績單,雖然增加了“戰(zhàn)爭”內(nèi)容,數(shù)據(jù)也在有條不穩(wěn)地推進(jìn),但對于長期關(guān)注毫末AI Day的人顯然少了一些新鮮感。
好在毫末這次準(zhǔn)備了新的武器——自動駕駛生成式大模型DriveGPT,中文名為“雪湖·海若”。
2
如何練成“DriveGPT雪湖·海若”
這絕對是本場AI Day最受關(guān)注的一Part。
ChatGPT的爆火帶來的AI影響力有愈演愈烈的趨勢,就在上周三,Meta推出了一個AI模型SAM(Segment Anything Model),一個圖像分割基礎(chǔ)模型,能夠根據(jù)文本指令等方式實現(xiàn)圖像分割,并且能夠零樣本遷移到其他任務(wù)。而且萬物皆可識別和一鍵摳圖。

而在汽車圈,相關(guān)企業(yè)幾乎都已官宣布局。
其中兩家最為聲勢浩蕩。
今年第一季度,推出“文心一言”的百度,產(chǎn)品正式發(fā)布前,官宣與超10家的車企簽訂戰(zhàn)略合作協(xié)議;2月17日,毫末宣布即將發(fā)布“DriveGPT雪湖·海若”,在自動駕駛模型算法方面,全面應(yīng)用ChatGPT的模型和技術(shù)邏輯。
今天,毫末智行CEO顧維灝終于帶來了DriveGPT雪湖·海若的具體信息。

本質(zhì)上,GPT是在不斷求解下一個詞(Token)出現(xiàn)的概率,而DriveGPT雪湖·海若底層模型采用了GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,目的是求解駕駛場景Token的出現(xiàn)概率。通過不斷循環(huán)生成自動駕駛場景Token 序列,最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù)。毫末DriveGPT雪湖·海若通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。現(xiàn)階段主要用于解決自動駕駛的認(rèn)知決策問題,后續(xù)持續(xù)會將毫末多個大模型的能力整合到DriveGPT雪湖·海若,最終目標(biāo)是實現(xiàn)端到端自動駕駛。
![]()
這確實是一招有利的先手布局,畢竟,AI大模型更好的規(guī)模化落地確實是在產(chǎn)業(yè)側(cè),而自動駕駛就是其規(guī)模化落地較好的“土壤”之一。應(yīng)用得當(dāng),甚至能成為幫助自動駕駛行業(yè)走出低谷的關(guān)鍵。
當(dāng)然,這需要實際應(yīng)用結(jié)果去給予信心。
據(jù)顧維灝介紹,毫末DriveGPT雪湖·海若使用了基于4000萬公里的駕駛數(shù)據(jù)做預(yù)訓(xùn)練,為了對生成決策結(jié)果進(jìn)行調(diào)優(yōu),又引入大約5萬段駕駛接管Clips數(shù)據(jù),完成模型的訓(xùn)練和推理。
具體過程如下:DriveGPT雪湖·海若會通過人類反饋強(qiáng)化學(xué)習(xí)的方式進(jìn)行迭代,用DriveGPT雪湖·海若最新模型(Active Model)對真實場景Case做生成,產(chǎn)出多種場景序列結(jié)果,再用反饋模型給這些結(jié)果進(jìn)行打分排序,目標(biāo)是把好的結(jié)果排上來,差的結(jié)果排下去,然后與初始模型(Pretrain-Model)的生成概率做比較,放大比分。最后通過強(qiáng)化學(xué)習(xí)的方式將參數(shù)再次更新到最新模型中,一直反復(fù)這個迭代過程。其中,Reward Model(反饋模型)的訓(xùn)練過程是獨(dú)立的,使用帶有偏序關(guān)系的Pair樣本對來訓(xùn)練,這些樣本對來自于接管Case,毫末將與人類駕駛結(jié)果相似的模型結(jié)果作為正樣本,與被接管軌跡相似的作為負(fù)樣本,這樣來構(gòu)建偏序?qū)希倮肔TR(Learning To Rank)的思路去訓(xùn)練Reward Model,進(jìn)而得到一個打分模型。此外,DriveGPT雪湖·海若還可以輸出決策邏輯鏈:即在輸入端提供Prompts(提示語),根據(jù)提示輸出含有決策邏輯鏈(Chain of Thought)的未來序列。CoT的思路來自于毫末CSS自動駕駛場景庫的超過幾十萬個細(xì)顆粒度場景,將Prompt提示語和完整決策過程的樣本交給模型去學(xué)習(xí),學(xué)到推理關(guān)系,從而將完整駕駛策略拆分為自動駕駛場景的動態(tài)識別過程,完成可理解、可解釋的推理邏輯鏈生成。
![]()
發(fā)布會現(xiàn)場,毫末宣布DriveGPT雪湖·海若將首發(fā)于新摩卡DHT-PHEV,新車即將量產(chǎn)上市。相比“文心一言”在車端落地的“暫無音訊”,毫末的DriveGPT雪湖·海若算是有了一個實實在在的落腳點。
現(xiàn)場顧維灝提到,DriveGPT雪湖·海若可以逐步應(yīng)用到智能代駕、捷徑推薦、智能陪練以及脫困場景中。有了DriveGPT雪湖·海若的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。對于普通用戶來說,車輛越來越像老司機(jī),用戶對智能產(chǎn)品的信任感會更強(qiáng)。
是騾子是馬,很快我們就能體驗到。
3
MANA架構(gòu)全線升級
DriveGPT雪湖·海若 的算力支持,來自于毫末的算中心“雪湖·綠洲”(MANA OASIS),這也是毫末面對全新四大戰(zhàn)役的核心關(guān)鍵。
顧維灝介紹,MANA OASIS此次從算力優(yōu)化等層面升級了三大能力。
首先,毫末與火山引擎全新搭建了“全套大模型訓(xùn)練保障框架”,實現(xiàn)了異常任務(wù)分鐘級捕獲和恢復(fù)能力,可以保證千卡任務(wù)連續(xù)訓(xùn)練數(shù)個月沒有任何非正常中斷,有效保證了大模型訓(xùn)練穩(wěn)定性;其次,毫末研發(fā)出以真實數(shù)據(jù)回傳為核心的增量學(xué)習(xí)技術(shù),并將其推廣到了大模型訓(xùn)練,構(gòu)建了一個大模型持續(xù)學(xué)習(xí)系統(tǒng),自主研發(fā)任務(wù)級彈性伸縮調(diào)度器,分鐘級調(diào)度資源,集群計算資源利用率達(dá)到95%;最后,MANA OASIS通過提升數(shù)據(jù)吞吐量來降本增效,滿足Transformer 大模型訓(xùn)練效率,通過引入火山引擎提供的Lego算子庫實現(xiàn)算子融合,端到端吞吐提升84%。
最后,就不得不提毫末AI Day的常駐嘉賓——毫末自動駕駛數(shù)據(jù)智能體系MANA,在經(jīng)過一年多的應(yīng)用迭代后,也迎來了全面的升級。顧維灝表示,MANA 計算基礎(chǔ)服務(wù)針對大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項優(yōu)化,并集成到OASIS中;其次,MANA感知和認(rèn)知相關(guān)大模型能力統(tǒng)一整合到DriveGPT雪湖·海若中;第三,增加了使用NeRF 技術(shù)的數(shù)據(jù)合成服務(wù),降低corner case 數(shù)據(jù)的獲取成本;同時針對多種芯片和多種車型的快速交付難題優(yōu)化了異構(gòu)部署工具和車型適配工具。
![]()
此外,MANA的視覺感知能力持續(xù)提升,一方面可同時學(xué)習(xí)三維空間結(jié)構(gòu)和圖片紋理,并將純視覺測距精度超過了超聲波雷達(dá),BEV 方案也擁有了更強(qiáng)的通用性和適配性;另一方面可實現(xiàn)單趟和多趟純視覺NeRF三維重建,道路場景更逼真。通過NeRF 進(jìn)行場景重建后,可以編輯合成真實環(huán)境難以收集到的Corner Case。在原有的全局視角修改、添加光照/天氣效果的基礎(chǔ)上,新增合成虛擬動態(tài)物體的能力,可以在原有設(shè)定的運(yùn)動軌跡上,合成各種Hard Case,模擬城市復(fù)雜交通環(huán)境,用更低成本測試提升城市NOH能力邊界,更好提升應(yīng)對城市復(fù)雜交通環(huán)境。
相信MANA的能力提升,將是毫末城市NOH在2024年上半年落地城市達(dá)100城的關(guān)鍵。
4
“挖坑”、“填坑”
當(dāng)你連續(xù)關(guān)注了毫末AI Day之后,你會發(fā)現(xiàn)它除了是毫末定期對外展示的平臺,也是對內(nèi)管理的重要抓手。每季度的階段性成績看似是數(shù)據(jù)的更新,其實是企業(yè)滾雪球般發(fā)展的重要推動力。
同時,毫末的AI Day也是一個自我”挖坑”、又不斷去”填坑”的公眾監(jiān)督舞臺,上次的外供情況、這次的DriveGPT雪湖·海若的實操性究竟如何、2024年上半年城市NOH落地將達(dá)到100城等等,毫末需要不斷推進(jìn),去一步步實現(xiàn)這些flag。
這不是件易事。
與此同時,毫末還在給自己加難度。
我們看到,在毫末的ppt有一頁已經(jīng)成了連續(xù)幾次AI Day的固定內(nèi)容,那就是“首個”&“第一”展示。對比三個月前,這張PPT上又多了一枚“勛章”。
![]()
![]()
△上圖:來源于第七屆毫末AI DAY;下圖:來源于第八屆毫末AI DAY
這些是成績、是榮譽(yù)、更是對毫末的鞭策。
從這一次的發(fā)布來看,毫末還有很多去戰(zhàn)斗的力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.