![]()
9 月 24 日的云棲大會,阿里宣布通義千問 Qwen3-Max 達(dá)到“超萬億參數(shù)”規(guī)模,訓(xùn)練數(shù)據(jù)量高達(dá) 36T tokens。周靖人稱它是“通義家族最強(qiáng)”。這是國產(chǎn)大模型第一次,正式站在“萬億級”的門檻上。
這次發(fā)布會之所以格外受關(guān)注,是因為“萬億”這個詞本身的象征意義。在 AI 發(fā)展史上,每一次參數(shù)數(shù)量的跨越,都會被視作行業(yè)新紀(jì)元的標(biāo)志:從 GPT-2 的 15 億參數(shù),到 GPT-3 的 1750 億參數(shù),再到 GPT-4 被推測接近萬億。
如今,國內(nèi)廠商第一次在舞臺上宣布“我們也有萬億”,這不僅是一次產(chǎn)品升級,更是一次“地位宣言”。
成績同樣引人注目:在數(shù)學(xué)推理測試 AIME25 中,Qwen3-Max 取得 86.4% 的準(zhǔn)確率,位列全球前三。在編程基準(zhǔn) SWE-Bench Verified 上得分 69.6%,僅次于 GPT-4.1(71.2%),位居全球第二。在 Chatbot Arena 綜合榜單中進(jìn)入前五,最高位列第四。這是國產(chǎn)大模型首次在多項國際權(quán)威基準(zhǔn)上全面進(jìn)入世界前列。
更值得注意的是,阿里并非只推出一個“巨無霸”,而是將其切分為多個方向:Thinking 版專注復(fù)雜推理,適合科研、數(shù)學(xué)、金融分析等場景。Instruct 版擅長指令遵循,更像 ChatGPT 的日常應(yīng)用版。
Omni 版則支持實時語音交互與多模態(tài),讓用戶能夠和 AI 進(jìn)行自然對話,甚至在視頻場景里實現(xiàn)即時反饋。對普通用戶而言,這已經(jīng)不僅是一個聊天機(jī)器人,而是一個能寫代碼、能看文檔、還能聽得懂、看得見的全能助手。
但“萬億”背后,也潛藏著巨大的不確定性:這是國產(chǎn)大模型真正的騰飛起點,還是一場技術(shù)軍備競賽的陷阱?
為什么國內(nèi)廠商沒有退路
在國際市場,OpenAI 的 GPT-4.1、Anthropic 的 Claude 已經(jīng)開始追求“更輕、更靈活”。GPT-4.1 的重點是多智能體協(xié)作與 API 工具調(diào)用,Claude 則強(qiáng)調(diào)長文本和安全性。換句話說,他們意識到“越大越好”的階段正在過去。
而國內(nèi),卻幾乎所有巨頭都被推向了萬億參數(shù)這條單行道。
資本市場的推力最直接。2024 年,國內(nèi)超過 50 家大模型公司融資總額突破 300 億元。投資人最敏感的指標(biāo)不是你能否落地,而是你是否能在技術(shù)指標(biāo)上追平國際巨頭。參數(shù)數(shù)值,成了最能“安撫市場”的語言。于是,“萬億”成了過關(guān)口令,誰沒到萬億,誰就可能被貼上“二線”的標(biāo)簽。
企業(yè)客戶也加了一把火。在采購邏輯里,模型越大,意味著越靠譜。很多需求被天然等同于“只有萬億才行”:跨語種客服、動輒 20 萬字的合同審查、跨行業(yè)知識整合等等。哪怕實際差距只是 92% 與 93% 的準(zhǔn)確率,在客戶眼里也足以放大成決定性的差別。于是廠商們不得不迎合這種認(rèn)知,把“萬億”當(dāng)成展示實力的籌碼。
更深層的原因也在于產(chǎn)業(yè)環(huán)境。高端 GPU 的獲取仍受限制,國內(nèi)廠商在算法優(yōu)化上難以直接與國際巨頭硬碰硬。于是,唯有通過“以量補(bǔ)質(zhì)”來走捷徑:擴(kuò)大參數(shù)規(guī)模,用工程手段換性能表現(xiàn)。就像 LCD 時代,中國廠商把背光做到極致,才在畫質(zhì)上追上 OLED,如今在大模型賽道,廠商們也只能靠堆算力來追趕。
而這并不是選擇,而是被裹挾后的必然。不卷上去,就意味著退出牌桌。
冷冰冰的算力賬單
據(jù)行業(yè)測算(斯坦福 AI Index 2024 數(shù)據(jù),結(jié)合多家券商研報),訓(xùn)練一次萬億參數(shù)模型,能耗可達(dá) 2000–5000 萬度電,僅電費成本就超過上千萬元。如果算上 GPU 采購、數(shù)據(jù)清洗、分布式工程調(diào)度等全流程,完整成本可能超過數(shù)十億元。
![]()
推理階段同樣昂貴。恒信證券的一份測算指出,萬億模型的單次調(diào)用開銷,是百億模型的 2–4 倍。這意味著企業(yè)在部署時要么承擔(dān)更高的算力租賃費用,要么就要接受調(diào)用速度和穩(wěn)定性的下降。
然而,性能提升卻往往只是個位數(shù)。比如在客服場景下,一個模型準(zhǔn)確率 92%,另一個 93%,后者的訓(xùn)練成本卻可能翻倍。對于企業(yè)來說,多花的不是 1%,而是實實在在的數(shù)億預(yù)算。
這就是所謂的“邊際效益遞減”。隨著參數(shù)規(guī)模越來越大,性能提升越來越有限,而能耗、賬單卻是成倍增加。對于巨頭來說,這可能是可以承受的“戰(zhàn)略性虧損”,但對于普通企業(yè)來說,這種成本根本不具備推廣價值。
阿里的真正野心,不止是參數(shù)
既然如此,阿里為什么還要第一個喊出“萬億”呢?
答案很清楚:阿里瞅準(zhǔn)的并不是單純的參數(shù)競賽,而是一盤云生態(tài)的棋。
阿里的真正目標(biāo),是讓 Qwen3-Max 成為下一代阿里云的“操作系統(tǒng)”。在百煉平臺,它已經(jīng)開放 API,按 Token 計費。Qwen3-Coder 在 OpenRouter 的調(diào)用量一度暴漲 1474%,躍居全球第二。同期推出的 Qwen3-VL、通義萬相 2.5、通義百聆,覆蓋了視頻生成、語音交互、視覺編程等核心場景。
![]()
這一套動作,意味著阿里要的不只是展示“萬億”,而是要通過 API、工具鏈,把企業(yè)和開發(fā)者的工作流牢牢綁定在阿里云的生態(tài)里。未來,當(dāng)企業(yè)習(xí)慣用 Qwen 提供的代碼生成、長文檔處理、語音交互服務(wù)時,遷移成本會越來越高,最終只能留在阿里云。
換句話說,“萬億”是招牌,真正的生意在后面。阿里賣的不是模型,而是云上的智能操作系統(tǒng)。
萬億之后,中國要回答更大的問題
Qwen3-Max 抬高了門檻,國內(nèi)廠商被迫跟進(jìn)。但世界的方向,未必是越大越好。OpenAI 在推小模型和多智能體,Anthropic 在強(qiáng)化安全與效率,而 Meta 則通過開源 Llama 系列構(gòu)建全球開發(fā)者生態(tài)。相比之下,國內(nèi)的“閉源+堆參數(shù)”路線,是否會在長期競爭中失去靈活性?
這也是為什么“智能密度”概念變得重要。所謂“智能密度”,就是單位算力、單位成本下所能提供的有效智能輸出。未來的競爭,不在于誰的參數(shù)最多,而在于誰能用同樣的資源,交付更聰明、更實用的結(jié)果。
換個角度看,萬億參數(shù)確實是護(hù)城河,但可能也是最后的倔強(qiáng)。它能否真正轉(zhuǎn)化為產(chǎn)業(yè)價值,要看三點:企業(yè)是否愿意為高昂算力買單,開發(fā)者是否愿意留在生態(tài),用戶是否能切實感受到“省錢省力”。
如果答案是肯定的,萬億參數(shù)將成為中國大模型產(chǎn)業(yè)的里程碑。如果不是,它可能會重演“曲面電視”的故事:技術(shù)領(lǐng)先,卻與用戶無關(guān)。
最后
當(dāng)全球 AI 進(jìn)入“智能密度”時代,中國能否從“參數(shù)軍備競賽”轉(zhuǎn)向“場景智能革命”,將決定我們是引領(lǐng)者,還是陪跑者。
萬億參數(shù)或許能刷榜,但只有讓用戶省下一分算力開銷,才是真正偉大的AI。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.