Nemotron 3是英偉達(Nvidia)最新推出的開放推理模型,旨在支持跨長上下文和多個智能體運行的自主智能體系統。該版本包括三種型號:Nano、Super和Ultra,以及新的開放數據集和強化學習工具,以幫助開發人員構建用于生產的專用人工智能系統。Nvidia詳細介紹了這三種型號的尺寸和使用情況:
Nemotron 3 Nano是一個300億參數的小型模型,一次可激活多達30億個參數,用于有針對性的高效任務。
Nemotron 3 Super是一個高精度推理模型,具有大約1000億個參數,每個詞元(Token)可激活參數高達100億,適用于多智能體應用程序。
Nemotron 3 Ultra是一個大型推理引擎,擁有約5000億個參數,每個詞元的活動量高達500億,適用于復雜的人工智能應用。
![]()
Nvidia最初開發了Nemotron作為構建和定制AI系統的開放基礎模型,同時為開發人員和企業提供了透明的模型、數據和訓練技術,他們可以檢查和調整。該項目旨在支持推理能力和特定領域的專業化,使組織能夠根據自己的數據、工作流程和監管約束調整模型。Nvidia發布了Nemotron模型權重以及數據集、數值精度方法和用于訓練和推理的軟件。
Nemotron 3模型是圍繞混合專家架構構建的,每個詞元只激活總參數的一小部分,使模型能夠提供比早期版本更高的吞吐量和更低的推理成本。Nemotron 3 Nano是一個300億參數的模型,一次大約有30億個活動參數。Nvidia表示,其詞元吞吐量是Nemotron 2 Nano的四倍,并支持多達一百萬個詞元的上下文窗口。預計在2026年上半年,更大的Super和Ultra模型將相同的架構擴展到涉及更多智能體和更長推理鏈的更高精度用例。
除了這些模型,Nvidia還發布了3萬億個新的用于訓練前、訓練后和強化學習數據詞元,以及開源庫NeMo Gym和NeMo RL。這些工具提供了Nvidia內部用于構建Nemotron 3的訓練環境和評估框架,旨在提高對模型訓練和評估方式的可見性和控制。
![]()
在新聞發布會上,英偉達企業生成人工智能軟件副總裁Kari Briski被問及英偉達是否希望成為前沿模型構建者并與專有模型競爭。
“我們不必與專有模型競爭,”她說,并指出Nvidia為開放的開發者生態系統構建了Nemotron,“真正突破了我們系統在訓練和推理方面的極限,我們正在為所有合作伙伴構建最好的系統。我不會說這是在競爭。它將交給生態系統信任和開發。”
如果開發人員已經在使用專有模型來構建智能體,他們如何使用Nemotron。Briski表示,Nvidia不希望Nemotron取代已經使用的專有模型。相反,她描述了一種新興模式,即開發人員正在使用隨時間演變的多個模型構建智能體系統。團隊可能從一個單一的模型開始,但隨著他們收集領域數據并完善他們的應用程序,他們越來越多地為特定任務微調開放模型,并將這項工作跨專業智能體進行路由。在這種情況下,像Nemotron這樣的開放模型用于優化應用程序中效率和控制最重要的部分,而專有模型則繼續用于其優勢所在的部分。
Nvidia表示,Nemotron的早期采用者包括CrowdStrike、ServiceNow和Perplexity等公司,這些公司正在將這些模型集成到他們的人工智能平臺中。在人工智能搜索引擎Perplexity的案例中,該公司使用了一個智能體路由系統,該系統動態地將每個查詢定向到最適合該任務的模型。Nvidia表示,Perplexity使用Nemotron的開放模型和相關技術,以及其他開放和專有模型,使該平臺能夠優化查詢的準確性、效率和成本。
![]()
Nvidia押注智能體AI系統將依賴于多個模型協同工作,而不是單個基礎模型。隨著推理工作負載變得更加復雜,推理成本上升,該公司正在將其開放模型、開放數據集和高效架構定位為尋求平衡成本和控制的生產系統的基本構建塊。
與Ai時代前沿合作,將大門向更多普通用戶敞開!免費課程限時領,還有好禮相送!無論你是對新技術充滿好奇心的愛好者,還是希望提升自己技能的職場人士,這里都有適合你的課程和資源。文章留言或私信小編拉您入群!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.