版權(quán)聲明:本文版權(quán)為網(wǎng)易汽車所有,轉(zhuǎn)載請注明出處。
網(wǎng)易汽車1月6日報道 在本屆CES展上,英偉達(dá)CEO 黃仁勛宣布推出行業(yè)首個開源推理型自動駕駛平臺Alpamayo。這是全球首款具備思考、推理和自主駕駛能力的智能汽車AI系統(tǒng)。該系統(tǒng)采用端到端訓(xùn)練模式,從攝像頭輸入到執(zhí)行器輸出實現(xiàn)全流程訓(xùn)練,標(biāo)志著自動駕駛從 "感知時代" 邁向 "推理時代"。黃仁勛強調(diào),該平臺旨在讓汽車具備 “類人推理能力”,標(biāo)志著 “物理AI的ChatGPT時刻已到來”,無人駕駛出租車將是最早受益的應(yīng)用之一。
![]()
Alpamayo平臺是業(yè)界首個專為自動駕駛打造的 “模型 + 仿真 + 數(shù)據(jù)” 全棧開源解決方案,核心包含三大組件:
Alpamayo 1 模型:作為平臺的“大腦核心”,這是一款擁有100億參數(shù)的視覺 - 語言 - 動作(VLA)多模態(tài)推理模型。和傳統(tǒng)自動駕駛模型只懂“看數(shù)據(jù)、做反應(yīng)” 不同,它能像人類一樣把視覺傳感器信息、語音指令、駕駛動作邏輯串聯(lián)起來。目前該模型已經(jīng)在Hugging Face平臺完全開源,不管是車企的研發(fā)團(tuán)隊,還是初創(chuàng)公司,都能直接下載微調(diào),既可將其調(diào)整為更精簡的運行時模型部署于車端,也可將其作為輔助駕駛的基礎(chǔ)架構(gòu),構(gòu)建諸如基于推理的評估器和自動標(biāo)注系統(tǒng)等開發(fā)工具。
物理AI數(shù)據(jù)集:英偉達(dá)提供多元化的大規(guī)模輔助駕駛開放數(shù)據(jù)集。該數(shù)據(jù)集包含超過 1700 小時的駕駛數(shù)據(jù),覆蓋廣泛的地理區(qū)域和環(huán)境條件,涵蓋推動推理架構(gòu)發(fā)展所必需的罕見且復(fù)雜的真實世界極端場景。
AlpaSim仿真框架:基于微服務(wù)架構(gòu)的開源模擬器,支持閉環(huán)測試與高保真場景還原,大幅降低實車測試成本。
![]()
目前,Lucid、捷豹路虎、Uber等移動出行領(lǐng)域領(lǐng)先企業(yè),以及包括伯克利 DeepDrive在內(nèi)的自動駕駛研究社區(qū),將依托 Alpamayo加速推進(jìn)安全的推理型L4級部署進(jìn)程。
![]()
Alpamayo平臺之所以能引發(fā)行業(yè)震動,關(guān)鍵在于它解決了長期困擾自動駕駛落地的四大核心難題,每一個優(yōu)勢都有實打?qū)嵉膽?yīng)用場景支撐:
相較于“看到紅燈就停、看到障礙物就躲,沒見過的場景容易“宕機””的傳統(tǒng)自動駕駛系統(tǒng)狀態(tài),Alpamayo 1模型具備“思維鏈”能力,能把復(fù)雜問題拆解成步驟化決策。比如在路口遇到信號燈失靈的情況,它會先通過攝像頭觀察對向車輛的行駛狀態(tài)、周圍行人的動向,再結(jié)合地圖信息判斷路口優(yōu)先級,最后推演最優(yōu)通行路徑,還能生成可解釋的決策邏輯(比如 “因?qū)ο蜍囕v已減速讓行,且行人已撤離斑馬線,可緩慢通過路口”),徹底解決了行業(yè)長期存在的 “黑箱決策” 問題。
另外這套系統(tǒng)把模型、數(shù)據(jù)集、仿真工具全部開源。目前捷豹路虎、Lucid 已經(jīng)明確表示會接入該平臺,Uber更是計劃用它改造旗下的自動駕駛車隊。加州大學(xué)伯克利分校 DeepDrive 聯(lián)盟的負(fù)責(zé)人評價:“其開放權(quán)限與強大功能將支持我們以前所未有的規(guī)模進(jìn)行訓(xùn)練,并為推動自動駕駛技術(shù)的普及提供了更大的靈活性和資源保障。”
當(dāng)然,這套系統(tǒng)通過成本革命讓高階自動駕駛走進(jìn)中端車,同時,通過安全冗余設(shè)計,打消用戶顧慮。
另據(jù)現(xiàn)場信息,首款搭載該技術(shù)的量產(chǎn)車型將于今年第一季度在美國投入路測。這款汽車整合了12個攝像頭、5個毫米波雷達(dá)及高精地圖,在Alpamayo 1模型驅(qū)動下,可應(yīng)對98%的已知駕駛場景,并對剩余2%的極端情況保持持續(xù)學(xué)習(xí)能力。
