<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

      0
      分享至



      一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

      當今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網絡一齊上陣,似乎什么都「看得見」。但真正的挑戰在于:模型能否像人一樣「想明白」為什么要這么開?

      傳統的端到端(E2E)系統雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

      • 迎面來車違規左轉;
      • 行人突然闖入;
      • 臨時施工、交通標志被遮擋。

      這些「極少數但容易發生事故」的場景正是當前系統的盲點。

      二、Alpamayo-R1:給模型裝上「推理鏈條」

      NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執行指令」,而是能在決策前「推理出因果關系」。



      圖 1:Alpamayo-R1 模型架構(示意)

      AR1 的核心創新有三個方面:

      1. Chain of Causation(因果鏈)數據集

      AR1 引入了一套全新的數據標注體系:每一段駕駛數據不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側車道空閑。」



      圖 2:因果鏈(CoC)標注示例

      2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

      AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續、動態可行的駕駛軌跡。該模塊結合語言推理輸出與物理約束,實現從推理到控制的無縫銜接。

      3. Multi-Stage Training(多階段訓練策略)

      AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設計的推理視覺語言模型;并采用多階段訓練策略:首先在大規模駕駛數據上做模態注入,學習從視覺到動作的基本映射;第二階段在 CoC 因果鏈數據上做監督微調,顯式教會模型「先想清楚再開」;最后通過強化學習(RL)進一步優化推理質量、推理 - 行動一致性和軌跡安全性。

      這種分階段、分目標的訓練流程,使得模型在開放場景、長尾危險場景中都表現的更加穩健。

      三、性能飛躍:更穩、更準、更懂你

      在實驗中,AR1 為以下性能帶來了顯著提升:

      • 規劃精度提升 12%
      • 越界率降低 35%
      • 近碰率降低 25%
      • 推理 - 行動一致性提升 37%
      • ? 實時性能:99 ms 端到端延遲

      更重要的是,這些提升主要體現在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

      四、Vision Encoding:高效多相機時序感知

      AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導航指令或駕駛目標)。所有輸入(包括歷史自車運動)會被統一編碼成多模態 token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預測。

      在這一過程中:

      • 每個相機視角先經過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
      • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
      • 所有模態(圖像、導航文本、自車狀態)被 token 化后統一輸入 Transformer;
      • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預測(trajectories)。

      這種統一編碼方式讓模型具備了多模態語義理解與運動狀態感知的「一體化」能力。

      五、數據的靈魂:結構化標注的革命

      AR1 的 CoC 數據集采用「人機協同標注」機制:

      • 人工部分:標注關鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
      • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
      • 質量審核:每條樣本通過因果覆蓋、因果正確性、近因優先等四項規則嚴格把關。

      最終形成數十萬條高質量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現象」。



      圖 3:CoC 數據標注流程示意圖

      六、Multi-Stage Training:從常識推理到行為控制

      Alpamayo-R1 的訓練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



      圖 4: AR1 訓練流程示意圖

      1. 監督微調(Supervised Fine-Tuning, SFT)

      基于 Cosmos-Reason 的預訓練權重進行微調。該主干模型原本在 370 萬條 VQA 數據上后訓練(post-training),其中包括 2.47 萬條專為駕駛設計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標注,幫助模型建立「物理常識」和 「因果直覺」。

      此外還構建了額外的 10 萬條駕駛樣本,標注關鍵目標、交通信號、因果行為解釋等信息,用于領域自適應微調。

      2. 因果鏈監督階段(CoC Supervision)

      引入 CoC 因果鏈數據集,顯式監督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質量推理樣本,使模型在策略學習前先獲得強大的語言 - 推理能力。

      3. 強化學習后訓練優化(Reinforcement Learning based Post-Training)。

      在最終階段,英偉達通過強化學習對模型進行策略微調,以進一步提升其在推理精準性、推理–行動一致性、軌跡平滑性以及閉環控制穩定性等方面的表現。

      Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據自身推理合理執行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執行的運動軌跡。

      七、未來展望:邁向可解釋的 L4 自動駕駛

      AR1 的設計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉折點。

      它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

      ? 小結:讓自動駕駛「有理可講」

      Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環。

      當車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現。

      一句話總結:AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

      詳細內容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      我們該不該對曾醫生,進行道德審判?

      我們該不該對曾醫生,進行道德審判?

      吃瓜局
      2025-11-10 21:04:13
      我可以負責任的說,現在日本車的質量,可能還沒有奇瑞車的質量好

      我可以負責任的說,現在日本車的質量,可能還沒有奇瑞車的質量好

      李子櫥
      2025-12-16 19:39:52
      安吉麗娜·朱莉公開乳腺手術疤痕

      安吉麗娜·朱莉公開乳腺手術疤痕

      環球網資訊
      2025-12-16 16:40:05
      iOS 26.3 首更,史詩級功能來了

      iOS 26.3 首更,史詩級功能來了

      電腦報
      2025-12-16 18:06:43
      姚明攜15歲女兒姚沁蕾亮相,1米9的女兒身高出眾,一口流利英語為爸爸擔任現場翻譯

      姚明攜15歲女兒姚沁蕾亮相,1米9的女兒身高出眾,一口流利英語為爸爸擔任現場翻譯

      極目新聞
      2025-12-16 07:52:39
      臺海形勢已經大變,可能打響“第一槍”的人,恐怕令人意想不到

      臺海形勢已經大變,可能打響“第一槍”的人,恐怕令人意想不到

      小噎論事
      2025-12-17 06:46:35
      TVB花旦內地唱《海闊天空》!表情猙獰引熱議!網友:太嚇人了

      TVB花旦內地唱《海闊天空》!表情猙獰引熱議!網友:太嚇人了

      我愛追港劇
      2025-12-17 00:03:48
      噩夢!加州高中槍擊幸存者,逃到布朗大學,再次遭遇校園槍擊!兇手仍在逃...

      噩夢!加州高中槍擊幸存者,逃到布朗大學,再次遭遇校園槍擊!兇手仍在逃...

      超級數學建模
      2025-12-16 23:38:18
      首次披露!山西女縣長被查!

      首次披露!山西女縣長被查!

      晉城關注暢緣
      2025-12-16 11:58:31
      烏克蘭外長宣布:凡購買俄羅斯石油的國家,不得參與烏克蘭重建

      烏克蘭外長宣布:凡購買俄羅斯石油的國家,不得參與烏克蘭重建

      扶蘇聊歷史
      2025-12-16 18:18:39
      日本福岡滅門案:3留學生侵犯美貌主婦后,血洗日本富商一家四口

      日本福岡滅門案:3留學生侵犯美貌主婦后,血洗日本富商一家四口

      復轉這些年
      2025-12-07 21:38:19
      豆包AI手機,恢復銷售!一度一機難求,二手平臺遭爆炒

      豆包AI手機,恢復銷售!一度一機難求,二手平臺遭爆炒

      每日經濟新聞
      2025-12-17 01:05:07
      離婚不到一年就復合?楊子黃圣依的炒作套路太明顯,真讓人反感

      離婚不到一年就復合?楊子黃圣依的炒作套路太明顯,真讓人反感

      洲洲影視娛評
      2025-12-17 01:19:17
      郎朗老婆健身視頻曝光!S身材一覽無遺,卻因幅度太大差點走光

      郎朗老婆健身視頻曝光!S身材一覽無遺,卻因幅度太大差點走光

      小徐講八卦
      2025-12-17 08:37:39
      澳大利亞女演員瑞秋疾病去世!

      澳大利亞女演員瑞秋疾病去世!

      下水道男孩
      2025-12-15 23:40:32
      開吹!馬杜羅宣稱將造“匹敵英偉達”晶片,卻是九十年代蘋果主板

      開吹!馬杜羅宣稱將造“匹敵英偉達”晶片,卻是九十年代蘋果主板

      老馬拉車莫少裝
      2025-12-16 11:50:05
      活久見!真要開倒車了:手機、電腦的內存,明年會變小了

      活久見!真要開倒車了:手機、電腦的內存,明年會變小了

      互聯網.亂侃秀
      2025-12-16 11:56:53
      高速免費跑半年!廣東車主這下賺大了,一趟能省近130塊

      高速免費跑半年!廣東車主這下賺大了,一趟能省近130塊

      寶哥精彩賽事
      2025-12-16 16:04:39
      ESPN:大洛佩茲和倫納德是隊內最堅定支持保羅的球員

      ESPN:大洛佩茲和倫納德是隊內最堅定支持保羅的球員

      北青網-北京青年報
      2025-12-17 07:40:04
      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      科普100克克
      2025-12-07 18:20:34
      2025-12-17 09:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11934文章數 142511關注度
      往期回顧 全部

      科技要聞

      無人駕駛邁關鍵一步 特斯拉股價觸歷史新高

      頭條要聞

      歐盟松口氣:中國發稀土通用許可證了 有效期更長

      頭條要聞

      歐盟松口氣:中國發稀土通用許可證了 有效期更長

      體育要聞

      楊瀚森18+10首次兩雙 關鍵攻防統治G聯賽

      娛樂要聞

      《雙軌》遭網友舉報,稱劇情三觀不正

      財經要聞

      "祥源系"爆雷 有投資者數百萬元無法提現

      汽車要聞

      打造全域安全2.0,吉利的新“長征”

      態度原創

      親子
      手機
      本地
      時尚
      公開課

      親子要聞

      你以為孩子食物過敏,其實大多數都不是

      手機要聞

      初代銷量太差!蘋果計劃iPhone Air 2升級雙攝:增配還降價

      本地新聞

      云游安徽|尋跡六安,三處舊址回望烽火歲月

      那些被稱贊 “老得慢” 的阿姨們,這樣穿,比同齡人顯年輕

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美性猛交ⅹxxx乱大交妖精 | 日本边吃奶边摸边做在线视频| 欧美午夜福利| 欧美日本韩国亚洲| 国产菊眼屁股无码免费| 天堂久久蜜桃一区二区三区| 91免费看视频| 亚洲日韩一区二区| 夜夜cao| 超碰aⅴ人人做人人爽欧美 | 亚洲国产成人精品无码区在线观看 | 无码国产精品一区二区色情男同 | 香蕉视频一区| 精品熟女999| 国产熟妇久久777777| 久久精品国产亚洲7777| 国产成人片无码视频在线观看| 精品无人乱码一区二区三区的优势 | 精品人妻系列无码人妻免费视频| 女被男啪到哭的视频网站| 欧美日韩亚洲国产| 毛片自拍| 中文字幕av无码不卡| 国产成人啪精品视频免费软件| 亚洲综合伊人久久大杳蕉| 无码纯肉视频在线观看| 天堂a?中文在线| 欧洲无码一区二区三区在线观看| 中文字幕熟妇无码专区| 国产互换人妻XXXXXX6| www.婷婷| 99亚洲精品| 少妇爆乳无码专区| 欧美整片sss| 亚洲免费视频一区二区三区| 瑞昌市| 九月婷婷人人澡人人添人人爽| 欧美BB| 刺激一区仑乱| 免费观看性行为视频的网站| 横峰县|