國內(nèi)大模型全面被“萬億參數(shù)”卷進(jìn)去了？

2025-09-29 12:06:33　來源: 科技不許冷

北京舉報

分享至

9 月 24 日的云棲大會，阿里宣布通義千問 Qwen3-Max 達(dá)到“超萬億參數(shù)”規(guī)模，訓(xùn)練數(shù)據(jù)量高達(dá) 36T tokens。周靖人稱它是“通義家族最強(qiáng)”。這是國產(chǎn)大模型第一次，正式站在“萬億級”的門檻上。

這次發(fā)布會之所以格外受關(guān)注，是因為“萬億”這個詞本身的象征意義。在 AI 發(fā)展史上，每一次參數(shù)數(shù)量的跨越，都會被視作行業(yè)新紀(jì)元的標(biāo)志：從 GPT-2 的 15 億參數(shù)，到 GPT-3 的 1750 億參數(shù)，再到 GPT-4 被推測接近萬億。

如今，國內(nèi)廠商第一次在舞臺上宣布“我們也有萬億”，這不僅是一次產(chǎn)品升級，更是一次“地位宣言”。

成績同樣引人注目：在數(shù)學(xué)推理測試 AIME25 中，Qwen3-Max 取得 86.4% 的準(zhǔn)確率，位列全球前三。在編程基準(zhǔn) SWE-Bench Verified 上得分 69.6%，僅次于 GPT-4.1（71.2%），位居全球第二。在 Chatbot Arena 綜合榜單中進(jìn)入前五，最高位列第四。這是國產(chǎn)大模型首次在多項國際權(quán)威基準(zhǔn)上全面進(jìn)入世界前列。

更值得注意的是，阿里并非只推出一個“巨無霸”，而是將其切分為多個方向：Thinking 版專注復(fù)雜推理，適合科研、數(shù)學(xué)、金融分析等場景。Instruct 版擅長指令遵循，更像 ChatGPT 的日常應(yīng)用版。

Omni 版則支持實時語音交互與多模態(tài)，讓用戶能夠和 AI 進(jìn)行自然對話，甚至在視頻場景里實現(xiàn)即時反饋。對普通用戶而言，這已經(jīng)不僅是一個聊天機(jī)器人，而是一個能寫代碼、能看文檔、還能聽得懂、看得見的全能助手。

但“萬億”背后，也潛藏著巨大的不確定性：這是國產(chǎn)大模型真正的騰飛起點，還是一場技術(shù)軍備競賽的陷阱？

為什么國內(nèi)廠商沒有退路

在國際市場，OpenAI 的 GPT-4.1、Anthropic 的 Claude 已經(jīng)開始追求“更輕、更靈活”。GPT-4.1 的重點是多智能體協(xié)作與 API 工具調(diào)用，Claude 則強(qiáng)調(diào)長文本和安全性。換句話說，他們意識到“越大越好”的階段正在過去。

而國內(nèi)，卻幾乎所有巨頭都被推向了萬億參數(shù)這條單行道。

資本市場的推力最直接。2024 年，國內(nèi)超過 50 家大模型公司融資總額突破 300 億元。投資人最敏感的指標(biāo)不是你能否落地，而是你是否能在技術(shù)指標(biāo)上追平國際巨頭。參數(shù)數(shù)值，成了最能“安撫市場”的語言。于是，“萬億”成了過關(guān)口令，誰沒到萬億，誰就可能被貼上“二線”的標(biāo)簽。

企業(yè)客戶也加了一把火。在采購邏輯里，模型越大，意味著越靠譜。很多需求被天然等同于“只有萬億才行”：跨語種客服、動輒 20 萬字的合同審查、跨行業(yè)知識整合等等。哪怕實際差距只是 92% 與 93% 的準(zhǔn)確率，在客戶眼里也足以放大成決定性的差別。于是廠商們不得不迎合這種認(rèn)知，把“萬億”當(dāng)成展示實力的籌碼。

更深層的原因也在于產(chǎn)業(yè)環(huán)境。高端 GPU 的獲取仍受限制，國內(nèi)廠商在算法優(yōu)化上難以直接與國際巨頭硬碰硬。于是，唯有通過“以量補(bǔ)質(zhì)”來走捷徑：擴(kuò)大參數(shù)規(guī)模，用工程手段換性能表現(xiàn)。就像 LCD 時代，中國廠商把背光做到極致，才在畫質(zhì)上追上 OLED，如今在大模型賽道，廠商們也只能靠堆算力來追趕。

而這并不是選擇，而是被裹挾后的必然。不卷上去，就意味著退出牌桌。

冷冰冰的算力賬單

據(jù)行業(yè)測算（斯坦福 AI Index 2024 數(shù)據(jù)，結(jié)合多家券商研報），訓(xùn)練一次萬億參數(shù)模型，能耗可達(dá) 2000–5000 萬度電，僅電費成本就超過上千萬元。如果算上 GPU 采購、數(shù)據(jù)清洗、分布式工程調(diào)度等全流程，完整成本可能超過數(shù)十億元。

推理階段同樣昂貴。恒信證券的一份測算指出，萬億模型的單次調(diào)用開銷，是百億模型的 2–4 倍。這意味著企業(yè)在部署時要么承擔(dān)更高的算力租賃費用，要么就要接受調(diào)用速度和穩(wěn)定性的下降。

然而，性能提升卻往往只是個位數(shù)。比如在客服場景下，一個模型準(zhǔn)確率 92%，另一個 93%，后者的訓(xùn)練成本卻可能翻倍。對于企業(yè)來說，多花的不是 1%，而是實實在在的數(shù)億預(yù)算。

這就是所謂的“邊際效益遞減”。隨著參數(shù)規(guī)模越來越大，性能提升越來越有限，而能耗、賬單卻是成倍增加。對于巨頭來說，這可能是可以承受的“戰(zhàn)略性虧損”，但對于普通企業(yè)來說，這種成本根本不具備推廣價值。

阿里的真正野心，不止是參數(shù)

既然如此，阿里為什么還要第一個喊出“萬億”呢？

答案很清楚：阿里瞅準(zhǔn)的并不是單純的參數(shù)競賽，而是一盤云生態(tài)的棋。

阿里的真正目標(biāo)，是讓 Qwen3-Max 成為下一代阿里云的“操作系統(tǒng)”。在百煉平臺，它已經(jīng)開放 API，按 Token 計費。Qwen3-Coder 在 OpenRouter 的調(diào)用量一度暴漲 1474%，躍居全球第二。同期推出的 Qwen3-VL、通義萬相 2.5、通義百聆，覆蓋了視頻生成、語音交互、視覺編程等核心場景。

這一套動作，意味著阿里要的不只是展示“萬億”，而是要通過 API、工具鏈，把企業(yè)和開發(fā)者的工作流牢牢綁定在阿里云的生態(tài)里。未來，當(dāng)企業(yè)習(xí)慣用 Qwen 提供的代碼生成、長文檔處理、語音交互服務(wù)時，遷移成本會越來越高，最終只能留在阿里云。

換句話說，“萬億”是招牌，真正的生意在后面。阿里賣的不是模型，而是云上的智能操作系統(tǒng)。

萬億之后，中國要回答更大的問題

Qwen3-Max 抬高了門檻，國內(nèi)廠商被迫跟進(jìn)。但世界的方向，未必是越大越好。OpenAI 在推小模型和多智能體，Anthropic 在強(qiáng)化安全與效率，而 Meta 則通過開源 Llama 系列構(gòu)建全球開發(fā)者生態(tài)。相比之下，國內(nèi)的“閉源+堆參數(shù)”路線，是否會在長期競爭中失去靈活性？

這也是為什么“智能密度”概念變得重要。所謂“智能密度”，就是單位算力、單位成本下所能提供的有效智能輸出。未來的競爭，不在于誰的參數(shù)最多，而在于誰能用同樣的資源，交付更聰明、更實用的結(jié)果。

換個角度看，萬億參數(shù)確實是護(hù)城河，但可能也是最后的倔強(qiáng)。它能否真正轉(zhuǎn)化為產(chǎn)業(yè)價值，要看三點：企業(yè)是否愿意為高昂算力買單，開發(fā)者是否愿意留在生態(tài)，用戶是否能切實感受到“省錢省力”。

如果答案是肯定的，萬億參數(shù)將成為中國大模型產(chǎn)業(yè)的里程碑。如果不是，它可能會重演“曲面電視”的故事：技術(shù)領(lǐng)先，卻與用戶無關(guān)。

最后

當(dāng)全球 AI 進(jìn)入“智能密度”時代，中國能否從“參數(shù)軍備競賽”轉(zhuǎn)向“場景智能革命”，將決定我們是引領(lǐng)者，還是陪跑者。

萬億參數(shù)或許能刷榜，但只有讓用戶省下一分算力開銷，才是真正偉大的AI。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.