英偉達(NVDA,股價:188.120美元;總市值:4.57萬億美元)在無人駕駛領域邁出關鍵一步,宣布開源其首個推理VLA(視覺-語言-動作)模型Alpamayo 1,這一舉措旨在加速安全的自動駕駛技術開發。該模型通過類人思維方式處理復雜駕駛場景,為解決自動駕駛長尾問題提供新路徑。
當地時間1月5日,美東時間1月5日周一,英偉達CEO黃仁勛在拉斯維加斯舉行的CES展會上發布了Alpamayo平臺,使汽車能夠在真實世界中進行"推理"。黃仁勛表示,首款搭載英偉達技術的汽車將于第一季度在美國上路。
![]()
圖片來源:視頻截圖
英偉達免費開放Alpamayo模型,允許潛在用戶自行對模型進行重新訓練。該模型旨在打造能在意外情況下"思考"解決方案的車輛,例如交通信號燈故障等場景。車載計算機將分析來自攝像頭和其他傳感器的輸入,將其分解為步驟并提出解決方案。
英偉達此次發布的Alpamayo家族整合了三大基礎支柱:開源模型、仿真框架和數據集,構建了一個完整的開放生態系統供任何汽車開發者或研究團隊使用。
Alpamayo 1是業界首個為自動駕駛研究社區設計的思維鏈推理VLA模型,現已在Hugging Face平臺發布。該模型采用100億參數架構,使用視頻輸入生成軌跡及推理軌跡,展示每個決策背后的邏輯。開發者可以將Alpamayo 1改編為更小的運行時模型用于車輛開發,或將其作為自動駕駛開發工具的基礎,例如基于推理的評估器和自動標注系統。
黃仁勛表示:“物理AI的ChatGPT時刻已到來——機器開始理解、推理并在真實世界中行動。無人出租車是首批受益者。Alpamayo為自動駕駛汽車帶來推理能力,使其能夠思考罕見場景,在復雜環境中安全駕駛,并解釋其駕駛決策——這是安全、可擴展自動駕駛的基礎。”
英偉達強調,Alpamayo模型并非直接在車內運行,而是作為大規模教師模型,供開發者微調并提取到其完整自動駕駛技術棧的骨干中。未來該家族的模型將具有更大的參數規模、更詳細的推理能力、更多的輸入輸出靈活性以及商業使用選項。
推理VLA是一種統一的AI模型,將視覺感知、語言理解和動作生成與逐步推理集成在一起。
這類模型整合了明確的AI推理功能,在傳統視覺-語言-動作模型的基礎上構建。AI推理是AI逐步解決復雜問題并生成類似于人類思維過程推理痕跡的能力。這些系統對一系列互聯網規模的任務進行預訓練,包括語言生成和視覺連接,以發展通用知識和感知基礎。
與將視覺輸入直接映射到動作的標準VLA模型不同,推理VLA模型將復雜的任務分解成可管理的子問題,并以可解釋的形式闡明其推理過程。這使模型能夠更準確地解決問題或執行任務,還能對模型正在進行的操作提供一定程度的反思。
構建推理VLA模型需要三種基本AI功能:視覺感知、語言理解以及動作和決策制定。視覺感知處理來自攝像頭、毫米波雷達或激光雷達等感知傳感器的實時數據;語言理解通過自然語言處理解釋命令、上下文提示和對話輸入;動作和決策制定則使用融合的感官和語言信息來計劃、選擇和安全地執行任務,同時生成可解釋的推理痕跡。
在自動駕駛場景中,推理VLA可以對交通狀況進行逐步推理。例如,接近一個十字路口時,系統可能會進行如此推理:“我看到一個停止標志,左邊有車輛駛來,還有行人正在過馬路。我應該減速,完全停下來,等待行人通過人行橫道,安全時再繼續前進。”
除Alpamayo 1模型外,英偉達還發布了配套的仿真工具和數據集,構建完整的開發生態系統。
此外,英偉達CEO黃仁勛表示,AI的復雜性推高需求。新款Vera Rubin設計已經全面量產。宣布面向Vera Rubin電腦的六款新芯片。新款VeraCPU擁有88 Arm定制核。公司現在是最大的網絡公司。
英偉達計劃2027年測試一款無人駕駛出租車服務。
黃仁勛表示,英偉達公司備受期待的新款Rubin數據中心產品將于今年發布,客戶很快就能試用該技術,這將有助于加速人工智能的發展。相比前代Blackwell架構,Rubin加速器在AI訓練性能上提升3.5倍,運行(推理)性能提升5倍,并配備擁有88個核心的新款中央處理器(CPU)。英偉達表示,基于Rubin的系統運行成本將低于Blackwell版本,因為它們可以用更少的組件實現相同的效果。微軟公司和其他大型云服務商將成為首批部署這一新硬件的客戶。
英偉達宣布,作為全棧NVIDIA BlueField平臺的一部分,NVIDIA BlueField?-4數據處理器將為推理上下文記憶存儲平臺提供動力。賦能推理上下文記憶存儲平臺(Inference Context Memory Storage Platform)。這是一種專為千億級參數規模(Gigascale)推理設計的新型AI原生存儲基礎設施,旨在加速并擴展代理式AI(Agentic AI)。
每日經濟新聞綜合公開信息
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.