<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

      0
      分享至



      一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

      當今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網(wǎng)絡一齊上陣,似乎什么都「看得見」。但真正的挑戰(zhàn)在于:模型能否像人一樣「想明白」為什么要這么開?

      傳統(tǒng)的端到端(E2E)系統(tǒng)雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

      • 迎面來車違規(guī)左轉(zhuǎn);
      • 行人突然闖入;
      • 臨時施工、交通標志被遮擋。

      這些「極少數(shù)但容易發(fā)生事故」的場景正是當前系統(tǒng)的盲點。

      二、Alpamayo-R1:給模型裝上「推理鏈條」

      NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執(zhí)行指令」,而是能在決策前「推理出因果關系」。



      圖 1:Alpamayo-R1 模型架構(示意)

      AR1 的核心創(chuàng)新有三個方面:

      1. Chain of Causation(因果鏈)數(shù)據(jù)集

      AR1 引入了一套全新的數(shù)據(jù)標注體系:每一段駕駛數(shù)據(jù)不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側(cè)車道空閑。」



      圖 2:因果鏈(CoC)標注示例

      2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

      AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續(xù)、動態(tài)可行的駕駛軌跡。該模塊結(jié)合語言推理輸出與物理約束,實現(xiàn)從推理到控制的無縫銜接。

      3. Multi-Stage Training(多階段訓練策略)

      AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設計的推理視覺語言模型;并采用多階段訓練策略:首先在大規(guī)模駕駛數(shù)據(jù)上做模態(tài)注入,學習從視覺到動作的基本映射;第二階段在 CoC 因果鏈數(shù)據(jù)上做監(jiān)督微調(diào),顯式教會模型「先想清楚再開」;最后通過強化學習(RL)進一步優(yōu)化推理質(zhì)量、推理 - 行動一致性和軌跡安全性。

      這種分階段、分目標的訓練流程,使得模型在開放場景、長尾危險場景中都表現(xiàn)的更加穩(wěn)健。

      三、性能飛躍:更穩(wěn)、更準、更懂你

      在實驗中,AR1 為以下性能帶來了顯著提升:

      • 規(guī)劃精度提升 12%
      • 越界率降低 35%
      • 近碰率降低 25%
      • 推理 - 行動一致性提升 37%
      • ? 實時性能:99 ms 端到端延遲

      更重要的是,這些提升主要體現(xiàn)在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

      四、Vision Encoding:高效多相機時序感知

      AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導航指令或駕駛目標)。所有輸入(包括歷史自車運動)會被統(tǒng)一編碼成多模態(tài) token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預測。

      在這一過程中:

      • 每個相機視角先經(jīng)過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
      • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
      • 所有模態(tài)(圖像、導航文本、自車狀態(tài))被 token 化后統(tǒng)一輸入 Transformer;
      • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預測(trajectories)。

      這種統(tǒng)一編碼方式讓模型具備了多模態(tài)語義理解與運動狀態(tài)感知的「一體化」能力。

      五、數(shù)據(jù)的靈魂:結(jié)構化標注的革命

      AR1 的 CoC 數(shù)據(jù)集采用「人機協(xié)同標注」機制:

      • 人工部分:標注關鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
      • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
      • 質(zhì)量審核:每條樣本通過因果覆蓋、因果正確性、近因優(yōu)先等四項規(guī)則嚴格把關。

      最終形成數(shù)十萬條高質(zhì)量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現(xiàn)象」。



      圖 3:CoC 數(shù)據(jù)標注流程示意圖

      六、Multi-Stage Training:從常識推理到行為控制

      Alpamayo-R1 的訓練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



      圖 4: AR1 訓練流程示意圖

      1. 監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)

      基于 Cosmos-Reason 的預訓練權重進行微調(diào)。該主干模型原本在 370 萬條 VQA 數(shù)據(jù)上后訓練(post-training),其中包括 2.47 萬條專為駕駛設計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標注,幫助模型建立「物理常識」和 「因果直覺」。

      此外還構建了額外的 10 萬條駕駛樣本,標注關鍵目標、交通信號、因果行為解釋等信息,用于領域自適應微調(diào)。

      2. 因果鏈監(jiān)督階段(CoC Supervision)

      引入 CoC 因果鏈數(shù)據(jù)集,顯式監(jiān)督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉(zhuǎn)」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質(zhì)量推理樣本,使模型在策略學習前先獲得強大的語言 - 推理能力。

      3. 強化學習后訓練優(yōu)化(Reinforcement Learning based Post-Training)。

      在最終階段,英偉達通過強化學習對模型進行策略微調(diào),以進一步提升其在推理精準性、推理–行動一致性、軌跡平滑性以及閉環(huán)控制穩(wěn)定性等方面的表現(xiàn)。

      Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據(jù)自身推理合理執(zhí)行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執(zhí)行的運動軌跡。

      七、未來展望:邁向可解釋的 L4 自動駕駛

      AR1 的設計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉(zhuǎn)折點。

      它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

      ? 小結(jié):讓自動駕駛「有理可講」

      Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環(huán)。

      當車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現(xiàn)。

      一句話總結(jié):AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

      詳細內(nèi)容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      應屆畢業(yè)生摩友在海南向張雪當面求職,大方介紹個人能力,當場獲得錄用,網(wǎng)友:這才是真正的“boss直聘”

      應屆畢業(yè)生摩友在海南向張雪當面求職,大方介紹個人能力,當場獲得錄用,網(wǎng)友:這才是真正的“boss直聘”

      觀威海
      2026-04-07 14:11:04
      亂成一鍋粥!釋永信風波扯出多位女星,比王林“床上開光”還惡心

      亂成一鍋粥!釋永信風波扯出多位女星,比王林“床上開光”還惡心

      火之文
      2025-07-29 14:23:48
      諾伊爾:我已經(jīng)40歲了但依然在這里;皇馬的進攻端非常危險

      諾伊爾:我已經(jīng)40歲了但依然在這里;皇馬的進攻端非常危險

      懂球帝
      2026-04-08 05:36:07
      61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

      61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

      蜉蝣說
      2026-02-03 15:04:01
      伊朗官員號召青年手拉手圍住電站:人鏈護核設施

      伊朗官員號召青年手拉手圍住電站:人鏈護核設施

      桂系007
      2026-04-07 14:53:23
      40億美元營救奧格雷迪

      40億美元營救奧格雷迪

      深度報
      2026-04-07 22:24:10
      上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

      上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

      靜若梨花
      2026-03-01 16:25:46
      罕見!浙江漁民捕獲2條“巨無霸”金槍魚,總市值超10萬,船老大:“捕魚30多年,頭一回見!”

      罕見!浙江漁民捕獲2條“巨無霸”金槍魚,總市值超10萬,船老大:“捕魚30多年,頭一回見!”

      極目新聞
      2026-04-07 08:54:24
      騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

      騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

      觀察鑒娛
      2026-04-07 11:11:00
      盒馬、美團、奧樂齊、京東硬折扣,激戰(zhàn)包郵區(qū)

      盒馬、美團、奧樂齊、京東硬折扣,激戰(zhàn)包郵區(qū)

      藍鯨新聞
      2026-04-07 16:56:16
      美軍這回真是出了大新聞,美防長干了一件大事!

      美軍這回真是出了大新聞,美防長干了一件大事!

      達文西看世界
      2026-04-03 14:58:37
      安徽6歲女童遇害,父親辟謠“嫌疑人賠償1萬元”

      安徽6歲女童遇害,父親辟謠“嫌疑人賠償1萬元”

      大象新聞
      2026-04-07 16:01:06
      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      石江月
      2026-04-07 17:09:01
      有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      伊朗稱準備好就結(jié)束戰(zhàn)爭方案等問題作出回應

      伊朗稱準備好就結(jié)束戰(zhàn)爭方案等問題作出回應

      新華社
      2026-04-06 18:21:02
      國米防線換血目標浮現(xiàn):土耳其國腳有兩大優(yōu)勢 與尤文那不勒斯競爭

      國米防線換血目標浮現(xiàn):土耳其國腳有兩大優(yōu)勢 與尤文那不勒斯競爭

      國際足球冷雪
      2026-04-08 06:34:06
      二叔坐牢十年回來,全家沒人理,我給他端了碗餃子,他送我三套房

      二叔坐牢十年回來,全家沒人理,我給他端了碗餃子,他送我三套房

      千秋文化
      2026-02-17 14:52:56
      天天吃!50歲女子確診大腸癌,流淚痛哭:以為對身體好

      天天吃!50歲女子確診大腸癌,流淚痛哭:以為對身體好

      醫(yī)學原創(chuàng)故事會
      2026-04-07 23:56:10
      歐冠戰(zhàn)報:拜仁2:1力克皇馬,阿森納1:0絕殺葡體,客隊全勝占先機

      歐冠戰(zhàn)報:拜仁2:1力克皇馬,阿森納1:0絕殺葡體,客隊全勝占先機

      小彭美識
      2026-04-08 05:09:32
      突然!以色列,發(fā)動大規(guī)模空襲!霍爾木茲海峽,傳來最新消息

      突然!以色列,發(fā)動大規(guī)模空襲!霍爾木茲海峽,傳來最新消息

      數(shù)據(jù)寶
      2026-04-07 21:16:12
      2026-04-08 06:59:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12701文章數(shù) 142616關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      特朗普稱美方正就伊朗戰(zhàn)爭進行“激烈談判”

      頭條要聞

      特朗普稱美方正就伊朗戰(zhàn)爭進行“激烈談判”

      體育要聞

      霸氣!趙心童:斯諾克的未來定屬于中國 20年后50%選手都是中國人

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉(zhuǎn)移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      藝術
      本地
      房產(chǎn)
      教育
      公開課

      藝術要聞

      李苦禪這簡簡幾筆,能讓你歡快一整天

      本地新聞

      跟著歌聲游安徽,聽古村回響

      房產(chǎn)要聞

      重磅!三亞擬出安居房新政!

      教育要聞

      “祖籍成都?”倆初中男孩合照走紅,網(wǎng)友:正常男生不會這樣坐

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版