當(dāng)其他巨頭忙著把大門關(guān)上的時(shí)候,英偉達(dá)卻在忙著把更多人請(qǐng)進(jìn)自己的院子——當(dāng)然,前提是他們得用英偉達(dá)的磚頭蓋房子。
本周一,英偉達(dá)宣布收購(gòu)開源調(diào)度軟件公司 SchedMD,并同時(shí)發(fā)布了名為 Nemotron 3 的開源大語言模型系列。這家全球最大的 GPU 制造商宣稱,這是迄今為止“最高效的開源模型家族”。
本次發(fā)布的 Nemotron 3 模型家族包含三個(gè)規(guī)格:Nano(300 億參數(shù))、Super(1,000 億參數(shù))和 Ultra(5,000 億參數(shù))。采用混合專家模型(Mixture of Experts,簡(jiǎn)稱 MoE)架構(gòu)。
按英偉達(dá)的說法,Nano 的吞吐量是前代 Nemotron 2 的四倍,推理時(shí)的 token 生成量最多可減少 60%。此外,Nano 的上下文窗口擴(kuò)展到了 100 萬 token,是前代的七倍。不過,需要注意的是,目前只有 Nano 立即可用,Super 和 Ultra 要到 2026 年上半年才會(huì)正式發(fā)布。
此次發(fā)布的開放程度較高。英偉達(dá)公開了模型權(quán)重、將近 10 萬億 token 的合成預(yù)訓(xùn)練語料以及詳細(xì)的訓(xùn)練配方,采用 NVIDIA Open Model License 許可協(xié)議,模型可商用、允許創(chuàng)建并分發(fā)衍生模型,英偉達(dá)不主張對(duì)模型輸出的所有權(quán)。開發(fā)者可以在 GitHub 和 Hugging Face 上獲取這些資源,并使用 NeMo Gym、NeMo RL 等配套工具庫(kù)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練和安全評(píng)估。
收購(gòu) SchedMD 則是對(duì)英偉達(dá)軟件布局的補(bǔ)強(qiáng)。SchedMD 是 Slurm 的主要開發(fā)者,后者是一套廣泛應(yīng)用于高性能計(jì)算(High-Performance Computing,HPC)和 AI 訓(xùn)練集群的開源工作負(fù)載調(diào)度系統(tǒng),全球 TOP500 超級(jí)計(jì)算機(jī)中超過一半在使用它。
英偉達(dá)與 SchedMD 的合作已經(jīng)持續(xù)了十多年,此次收購(gòu)后,公司承諾將繼續(xù)以開源、廠商中立的方式運(yùn)營(yíng) Slurm。這筆交易的具體金額未披露,但 SchedMD 的 CEO Danny Auble 在聲明中表示,此次收購(gòu)“是對(duì) Slurm 在最嚴(yán)苛的 HPC 和 AI 環(huán)境中扮演關(guān)鍵角色的終極認(rèn)可”。
![]()
圖丨Danny Auble(來源:SchedMD)
就在英偉達(dá)持續(xù)擴(kuò)大開源力度的同時(shí),其他美國(guó) AI 巨頭在開源領(lǐng)域卻集體后撤。
就在上周,彭博社和多家媒體報(bào)道稱,Meta 正在開發(fā)一款代號(hào)為“Avocado”的新模型,預(yù)計(jì)將于 2026 年春季發(fā)布,而這款模型很可能不再開源。這對(duì)一家曾大張旗鼓宣揚(yáng)“開源是 AI 正道”的公司來說,無異于一次立場(chǎng)倒戈。扎克伯格去年還在公開信中信誓旦旦地寫道,“開源 AI 是前進(jìn)的道路”,并高調(diào)批評(píng) OpenAI 變得越來越封閉。
但今年 Llama 4 的旗艦版本 Behemoth 在基準(zhǔn)測(cè)試中表現(xiàn)不佳后,Meta 的超級(jí)智能實(shí)驗(yàn)室(Meta Superintelligence Labs)內(nèi)部開始討論轉(zhuǎn)向閉源路線,其新任的首席 AI 官 Alexandr Wang 也是閉源模型的倡導(dǎo)者。
OpenAI 的開源節(jié)奏同樣緩慢。今年 8 月,該公司發(fā)布了 GPT-oss 系列開源模型,包括 117 億參數(shù)的 gpt-oss-120b 和 21 億參數(shù)的 gpt-oss-20b,采用 Apache 2.0 許可。但這距離其上一次開源發(fā)布(GPT-2)已過去五年。而在如今 OpenAI 面臨來自谷歌的巨大競(jìng)爭(zhēng)壓力下,顯然并不太可能在開源方面投入過多。
與此同時(shí),大洋彼岸的中國(guó)開源力量正以驚人的速度崛起。根據(jù) OpenRouter 和風(fēng)險(xiǎn)投資機(jī)構(gòu) a16z 聯(lián)合發(fā)布的一份報(bào)告,中國(guó)開源大語言模型的全球使用份額已從 2024 年底的 1.2%飆升至近 30%。DeepSeek-V3、阿里巴巴旗下的 Qwen 系列以及 Moonshot AI 的 Kimi K2 成為這波增長(zhǎng)的主要推動(dòng)力。
![]()
(來源:OpenRouter)
更讓美國(guó)同行不安的是,中國(guó)公司在開源這條路上走得極為堅(jiān)定。阿里云不斷迭代 Qwen 系列,DeepSeek 頻繁更新模型版本,形成了一套密集的發(fā)布節(jié)奏。反觀美國(guó)巨頭,除了英偉達(dá),幾乎都在向閉源收縮。
黃仁勛對(duì)此并不諱言。他在今年 10 月于華盛頓舉辦的 GTC 大會(huì)上稱,中國(guó)在開源領(lǐng)域“遙遙領(lǐng)先”,如果美國(guó)公司全面撤退,可能會(huì)對(duì)中國(guó)軟件“滲透世界”的那一天“毫無準(zhǔn)備”。
那么,作為一家硬件公司,英偉達(dá)為何要在這種趨勢(shì)下逆勢(shì)加碼開源?答案仍然要回到它最核心的生意:賣芯片。
英偉達(dá)的核心護(hù)城河不僅是 GPU 硬件,更是圍繞 GPU 構(gòu)建的軟件生態(tài),尤其是 CUDA。CUDA 是一套專為英偉達(dá)硬件設(shè)計(jì)的并行計(jì)算平臺(tái)和編程接口,自 2006 年推出以來,已成為 AI、機(jī)器學(xué)習(xí)和高性能計(jì)算領(lǐng)域事實(shí)上的行業(yè)標(biāo)準(zhǔn)。全球超過 400 萬注冊(cè)開發(fā)者在 CUDA 上編寫代碼,TensorFlow、PyTorch 等主流深度學(xué)習(xí)框架都對(duì)其有深度依賴。
英偉達(dá)很早就意識(shí)到,開源軟件是鞏固這套生態(tài)鎖定的絕佳手段。雖然 CUDA 本身是閉源的(這也一直受到競(jìng)爭(zhēng)對(duì)手的詬病),但英偉達(dá)多年來持續(xù)向開源社區(qū)投入資源:參與 Linux 內(nèi)核、PyTorch、TensorFlow、Kubernetes 等項(xiàng)目的開發(fā),發(fā)布 CV-CUDA、TensorRT 等開源組件,并在 2022 年將 Linux GPU 內(nèi)核模塊以 GPL 和 MIT 雙許可的形式開源。這些舉措的核心邏輯非常清晰,讓開發(fā)者在開源世界里自由探索,但最終,他們構(gòu)建的工具和應(yīng)用仍然需要(或最適合)跑在英偉達(dá)的硬件上。
Nemotron 3 的推出是這套戰(zhàn)略的延伸。英偉達(dá)生成式 AI 軟件業(yè)務(wù)副總裁 Kari Briski 在發(fā)布會(huì)前的媒體吹風(fēng)會(huì)上說得相當(dāng)直白:“當(dāng)我們是最好的開發(fā)平臺(tái)時(shí),人們自然會(huì)選擇我們,選擇我們的平臺(tái),選擇我們的 GPU,不僅為了今天的項(xiàng)目,也為了明天的產(chǎn)品。”
開發(fā)者用 Nemotron 搭建 AI 應(yīng)用、訓(xùn)練智能體,這些工作流最終都會(huì)沉淀在英偉達(dá)的硬件生態(tài)里。當(dāng)他們習(xí)慣了 NeMo、Triton 這些工具,當(dāng)他們的代碼深度綁定在 CUDA 上,切換到 AMD 或其他平臺(tái)的成本就會(huì)變得越來越高。
從這個(gè)角度看,英偉達(dá)做開源模型,并不是要跟 OpenAI 或 Anthropic 搶 LLM 的生意,這些公司的模型主要通過 API 付費(fèi)使用,而英偉達(dá)的商業(yè)模式是賣芯片。它真正對(duì)標(biāo)的,是那些可能讓開發(fā)者“脫離英偉達(dá)軌道”的替代方案:無論是中國(guó)的開源模型生態(tài),還是 AMD 的 ROCm、英特爾的 oneAPI,抑或是那些試圖在非英偉達(dá)硬件上訓(xùn)練和部署 AI 的努力。
此外,英偉達(dá)此舉還精準(zhǔn)瞄準(zhǔn)了一個(gè)特殊的客戶群體——那些對(duì)數(shù)據(jù)安全和模型透明度有極高要求的企業(yè)與機(jī)構(gòu)。
Kari Briski 表示:“我們的很多企業(yè)客戶無法部署某些模型,也無法在源代碼不透明的模型上構(gòu)建業(yè)務(wù)。”她強(qiáng)調(diào),英偉達(dá)希望提供一個(gè)可靠且持續(xù)更新的開源模型路線圖,因?yàn)椤叭绻话l(fā)布過一個(gè)模型且沒有后續(xù)計(jì)劃,開發(fā)者是不敢真正依賴的”。
這番話的潛臺(tái)詞就在于:英偉達(dá)瞄準(zhǔn)的是那些對(duì)模型透明度和可審計(jì)性有剛性需求的客戶群體,如醫(yī)療、金融、國(guó)防等受監(jiān)管行業(yè),以及全球各國(guó)尋求“主權(quán) AI”能力的政府機(jī)構(gòu)。
Nemotron 支持英偉達(dá)更廣泛的主權(quán) AI 戰(zhàn)略,從韓國(guó)到印度再到中東,越來越多的國(guó)家希望在本土部署可以審計(jì)、符合本地法規(guī)和價(jià)值觀的 AI 系統(tǒng)。閉源模型無法滿足這些需求,而來自中國(guó)公司的開源模型又可能引發(fā)這些國(guó)家的地緣政治顧慮,這恰好給英偉達(dá)留下了巨大的市場(chǎng)空間。
這種填補(bǔ)真空的策略,所代表的正是英偉達(dá)在產(chǎn)業(yè)鏈縱向整合上的野心。與試圖靠模型 API 盈利的軟件巨頭不同,黃仁勛并不在意把模型本身賣個(gè)好價(jià)錢,他在意的是這些模型究竟跑在哪里。
通過 Nemotron 3,英偉達(dá)實(shí)際上是在用開源代碼構(gòu)建一種比 CUDA 更上層的黏性:當(dāng)全球的開發(fā)者、銀行乃至政府機(jī)構(gòu)都習(xí)慣了基于這套方案構(gòu)建業(yè)務(wù)時(shí),他們也就把自己鎖死在了英偉達(dá)的硬件戰(zhàn)車上。也就是說,開源對(duì)英偉達(dá)來說,只是手段而非目的。
參考資料:
1.https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models
2.https://www.wired.com/story/nvidia-becomes-major-model-maker-nemotron-3/
3.https://gizmodo.com/nvidia-wants-to-be-your-open-source-model-provider-2000699568
運(yùn)營(yíng)/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.