網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

美國(guó)AI巨頭紛紛閉源，英偉達(dá)為何反其道而行？

2025-12-16 18:08:18　來源: DeepTech深科技

北京舉報(bào)

分享至

當(dāng)其他巨頭忙著把大門關(guān)上的時(shí)候，英偉達(dá)卻在忙著把更多人請(qǐng)進(jìn)自己的院子——當(dāng)然，前提是他們得用英偉達(dá)的磚頭蓋房子。

本周一，英偉達(dá)宣布收購(gòu)開源調(diào)度軟件公司 SchedMD，并同時(shí)發(fā)布了名為 Nemotron 3 的開源大語言模型系列。這家全球最大的 GPU 制造商宣稱，這是迄今為止“最高效的開源模型家族”。

本次發(fā)布的 Nemotron 3 模型家族包含三個(gè)規(guī)格：Nano（300 億參數(shù)）、Super（1,000 億參數(shù)）和 Ultra（5,000 億參數(shù)）。采用混合專家模型（Mixture of Experts，簡(jiǎn)稱 MoE）架構(gòu)。

按英偉達(dá)的說法，Nano 的吞吐量是前代 Nemotron 2 的四倍，推理時(shí)的 token 生成量最多可減少 60％。此外，Nano 的上下文窗口擴(kuò)展到了 100 萬 token，是前代的七倍。不過，需要注意的是，目前只有 Nano 立即可用，Super 和 Ultra 要到 2026 年上半年才會(huì)正式發(fā)布。

此次發(fā)布的開放程度較高。英偉達(dá)公開了模型權(quán)重、將近 10 萬億 token 的合成預(yù)訓(xùn)練語料以及詳細(xì)的訓(xùn)練配方，采用 NVIDIA Open Model License 許可協(xié)議，模型可商用、允許創(chuàng)建并分發(fā)衍生模型，英偉達(dá)不主張對(duì)模型輸出的所有權(quán)。開發(fā)者可以在 GitHub 和 Hugging Face 上獲取這些資源，并使用 NeMo Gym、NeMo RL 等配套工具庫(kù)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練和安全評(píng)估。

收購(gòu) SchedMD 則是對(duì)英偉達(dá)軟件布局的補(bǔ)強(qiáng)。SchedMD 是 Slurm 的主要開發(fā)者，后者是一套廣泛應(yīng)用于高性能計(jì)算（High-Performance Computing，HPC）和 AI 訓(xùn)練集群的開源工作負(fù)載調(diào)度系統(tǒng)，全球 TOP500 超級(jí)計(jì)算機(jī)中超過一半在使用它。

英偉達(dá)與 SchedMD 的合作已經(jīng)持續(xù)了十多年，此次收購(gòu)后，公司承諾將繼續(xù)以開源、廠商中立的方式運(yùn)營(yíng) Slurm。這筆交易的具體金額未披露，但 SchedMD 的 CEO Danny Auble 在聲明中表示，此次收購(gòu)“是對(duì) Slurm 在最嚴(yán)苛的 HPC 和 AI 環(huán)境中扮演關(guān)鍵角色的終極認(rèn)可”。

圖丨Danny Auble（來源：SchedMD）

就在英偉達(dá)持續(xù)擴(kuò)大開源力度的同時(shí)，其他美國(guó) AI 巨頭在開源領(lǐng)域卻集體后撤。

就在上周，彭博社和多家媒體報(bào)道稱，Meta 正在開發(fā)一款代號(hào)為“Avocado”的新模型，預(yù)計(jì)將于 2026 年春季發(fā)布，而這款模型很可能不再開源。這對(duì)一家曾大張旗鼓宣揚(yáng)“開源是 AI 正道”的公司來說，無異于一次立場(chǎng)倒戈。扎克伯格去年還在公開信中信誓旦旦地寫道，“開源 AI 是前進(jìn)的道路”，并高調(diào)批評(píng) OpenAI 變得越來越封閉。

但今年 Llama 4 的旗艦版本 Behemoth 在基準(zhǔn)測(cè)試中表現(xiàn)不佳后，Meta 的超級(jí)智能實(shí)驗(yàn)室（Meta Superintelligence Labs）內(nèi)部開始討論轉(zhuǎn)向閉源路線，其新任的首席 AI 官 Alexandr Wang 也是閉源模型的倡導(dǎo)者。

OpenAI 的開源節(jié)奏同樣緩慢。今年 8 月，該公司發(fā)布了 GPT-oss 系列開源模型，包括 117 億參數(shù)的 gpt-oss-120b 和 21 億參數(shù)的 gpt-oss-20b，采用 Apache 2.0 許可。但這距離其上一次開源發(fā)布（GPT-2）已過去五年。而在如今 OpenAI 面臨來自谷歌的巨大競(jìng)爭(zhēng)壓力下，顯然并不太可能在開源方面投入過多。

與此同時(shí)，大洋彼岸的中國(guó)開源力量正以驚人的速度崛起。根據(jù) OpenRouter 和風(fēng)險(xiǎn)投資機(jī)構(gòu) a16z 聯(lián)合發(fā)布的一份報(bào)告，中國(guó)開源大語言模型的全球使用份額已從 2024 年底的 1.2％飆升至近 30％。DeepSeek-V3、阿里巴巴旗下的 Qwen 系列以及 Moonshot AI 的 Kimi K2 成為這波增長(zhǎng)的主要推動(dòng)力。

(來源：OpenRouter)

更讓美國(guó)同行不安的是，中國(guó)公司在開源這條路上走得極為堅(jiān)定。阿里云不斷迭代 Qwen 系列，DeepSeek 頻繁更新模型版本，形成了一套密集的發(fā)布節(jié)奏。反觀美國(guó)巨頭，除了英偉達(dá)，幾乎都在向閉源收縮。

黃仁勛對(duì)此并不諱言。他在今年 10 月于華盛頓舉辦的 GTC 大會(huì)上稱，中國(guó)在開源領(lǐng)域“遙遙領(lǐng)先”，如果美國(guó)公司全面撤退，可能會(huì)對(duì)中國(guó)軟件“滲透世界”的那一天“毫無準(zhǔn)備”。

那么，作為一家硬件公司，英偉達(dá)為何要在這種趨勢(shì)下逆勢(shì)加碼開源？答案仍然要回到它最核心的生意：賣芯片。

英偉達(dá)的核心護(hù)城河不僅是 GPU 硬件，更是圍繞 GPU 構(gòu)建的軟件生態(tài)，尤其是 CUDA。CUDA 是一套專為英偉達(dá)硬件設(shè)計(jì)的并行計(jì)算平臺(tái)和編程接口，自 2006 年推出以來，已成為 AI、機(jī)器學(xué)習(xí)和高性能計(jì)算領(lǐng)域事實(shí)上的行業(yè)標(biāo)準(zhǔn)。全球超過 400 萬注冊(cè)開發(fā)者在 CUDA 上編寫代碼，TensorFlow、PyTorch 等主流深度學(xué)習(xí)框架都對(duì)其有深度依賴。

英偉達(dá)很早就意識(shí)到，開源軟件是鞏固這套生態(tài)鎖定的絕佳手段。雖然 CUDA 本身是閉源的（這也一直受到競(jìng)爭(zhēng)對(duì)手的詬病），但英偉達(dá)多年來持續(xù)向開源社區(qū)投入資源：參與 Linux 內(nèi)核、PyTorch、TensorFlow、Kubernetes 等項(xiàng)目的開發(fā)，發(fā)布 CV-CUDA、TensorRT 等開源組件，并在 2022 年將 Linux GPU 內(nèi)核模塊以 GPL 和 MIT 雙許可的形式開源。這些舉措的核心邏輯非常清晰，讓開發(fā)者在開源世界里自由探索，但最終，他們構(gòu)建的工具和應(yīng)用仍然需要（或最適合）跑在英偉達(dá)的硬件上。

Nemotron 3 的推出是這套戰(zhàn)略的延伸。英偉達(dá)生成式 AI 軟件業(yè)務(wù)副總裁 Kari Briski 在發(fā)布會(huì)前的媒體吹風(fēng)會(huì)上說得相當(dāng)直白：“當(dāng)我們是最好的開發(fā)平臺(tái)時(shí)，人們自然會(huì)選擇我們，選擇我們的平臺(tái)，選擇我們的 GPU，不僅為了今天的項(xiàng)目，也為了明天的產(chǎn)品。”

開發(fā)者用 Nemotron 搭建 AI 應(yīng)用、訓(xùn)練智能體，這些工作流最終都會(huì)沉淀在英偉達(dá)的硬件生態(tài)里。當(dāng)他們習(xí)慣了 NeMo、Triton 這些工具，當(dāng)他們的代碼深度綁定在 CUDA 上，切換到 AMD 或其他平臺(tái)的成本就會(huì)變得越來越高。

從這個(gè)角度看，英偉達(dá)做開源模型，并不是要跟 OpenAI 或 Anthropic 搶 LLM 的生意，這些公司的模型主要通過 API 付費(fèi)使用，而英偉達(dá)的商業(yè)模式是賣芯片。它真正對(duì)標(biāo)的，是那些可能讓開發(fā)者“脫離英偉達(dá)軌道”的替代方案：無論是中國(guó)的開源模型生態(tài)，還是 AMD 的 ROCm、英特爾的 oneAPI，抑或是那些試圖在非英偉達(dá)硬件上訓(xùn)練和部署 AI 的努力。

此外，英偉達(dá)此舉還精準(zhǔn)瞄準(zhǔn)了一個(gè)特殊的客戶群體——那些對(duì)數(shù)據(jù)安全和模型透明度有極高要求的企業(yè)與機(jī)構(gòu)。

Kari Briski 表示：“我們的很多企業(yè)客戶無法部署某些模型，也無法在源代碼不透明的模型上構(gòu)建業(yè)務(wù)。”她強(qiáng)調(diào)，英偉達(dá)希望提供一個(gè)可靠且持續(xù)更新的開源模型路線圖，因?yàn)椤叭绻话l(fā)布過一個(gè)模型且沒有后續(xù)計(jì)劃，開發(fā)者是不敢真正依賴的”。

這番話的潛臺(tái)詞就在于：英偉達(dá)瞄準(zhǔn)的是那些對(duì)模型透明度和可審計(jì)性有剛性需求的客戶群體，如醫(yī)療、金融、國(guó)防等受監(jiān)管行業(yè)，以及全球各國(guó)尋求“主權(quán) AI”能力的政府機(jī)構(gòu)。

Nemotron 支持英偉達(dá)更廣泛的主權(quán) AI 戰(zhàn)略，從韓國(guó)到印度再到中東，越來越多的國(guó)家希望在本土部署可以審計(jì)、符合本地法規(guī)和價(jià)值觀的 AI 系統(tǒng)。閉源模型無法滿足這些需求，而來自中國(guó)公司的開源模型又可能引發(fā)這些國(guó)家的地緣政治顧慮，這恰好給英偉達(dá)留下了巨大的市場(chǎng)空間。

這種填補(bǔ)真空的策略，所代表的正是英偉達(dá)在產(chǎn)業(yè)鏈縱向整合上的野心。與試圖靠模型 API 盈利的軟件巨頭不同，黃仁勛并不在意把模型本身賣個(gè)好價(jià)錢，他在意的是這些模型究竟跑在哪里。

通過 Nemotron 3，英偉達(dá)實(shí)際上是在用開源代碼構(gòu)建一種比 CUDA 更上層的黏性：當(dāng)全球的開發(fā)者、銀行乃至政府機(jī)構(gòu)都習(xí)慣了基于這套方案構(gòu)建業(yè)務(wù)時(shí)，他們也就把自己鎖死在了英偉達(dá)的硬件戰(zhàn)車上。也就是說，開源對(duì)英偉達(dá)來說，只是手段而非目的。

參考資料：

1.https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models

2.https://www.wired.com/story/nvidia-becomes-major-model-maker-nemotron-3/

3.https://gizmodo.com/nvidia-wants-to-be-your-open-source-model-provider-2000699568

運(yùn)營(yíng)/排版：何晨龍

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.