網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

2025云棲大會(huì)，阿里亮出王牌，萬(wàn)億參數(shù)和全模態(tài)大模型齊發(fā)，我直接好家伙！

2025-09-24 20:18:29　來(lái)源: 蒼何

湖北舉報(bào)

分享至

這是蒼何的第 436 篇原創(chuàng)！

大家好，我是蒼何。

還是做博主好，有機(jī)會(huì)能來(lái)阿里云棲大會(huì)。

要知道，以前我只能一邊搬磚一邊云參展。

更別提，還能受邀參與直播探展了。

逛完展，給我最大的感受是震撼，今年能明顯感覺(jué)到越來(lái)越多的 Agent 和 AI 應(yīng)用出來(lái)了。

這個(gè)機(jī)器人做的拉花咖啡很有意思，自拍后通過(guò)阿里云函數(shù)計(jì)算，調(diào)用Qwen-Image 生成卡通形象，然后給機(jī)器人做拉花咖啡。

這么多的應(yīng)用底層都離不開(kāi)大模型的加持，這次逛展發(fā)現(xiàn)，阿里又發(fā)布了不少新東西。

千問(wèn) 3 家族又迎來(lái)了不少新成員，先給大家介紹下：

1、Qwen3 Max：擁有超萬(wàn)億參數(shù)，是目前為止通義千問(wèn)家族中最大、最強(qiáng)的模型，在多項(xiàng)主流權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出全球領(lǐng)先的性能；

2、Qwen3-Omni：這是首個(gè)原生端到端全模態(tài)開(kāi)源大模型，將文本、圖像、音頻和視頻統(tǒng)一在一個(gè)模型中，無(wú)需權(quán)衡模態(tài)，能夠無(wú)縫處理文本、圖像、音頻和視頻等多種輸入形式。

3、Qwen3-Next：該模型擁有 800 億參數(shù)僅激活 30 億，性能就可媲美千問(wèn) 3 旗艦版 235B 模型，實(shí)現(xiàn)了模型計(jì)算效率的重大突破。

4、Qwen3-VL：這是 Qwen 系列迄今為止最強(qiáng)大的視覺(jué)理解模型，它能操作電腦和手機(jī)界面，識(shí)別 GUI 元素、理解按鈕功能、調(diào)用工具、執(zhí)行任務(wù)，目前已開(kāi)源。

5、Qwen3-Coder-Plus：這是代碼模型 Qwen 3-Coder 的一次升級(jí)，增強(qiáng)了終端任務(wù)功能，并提高了 Terminal Bench 的性能，推理速度更快，token 消耗更少，同時(shí)代碼安全性上也有增強(qiáng)。

除了千問(wèn)，阿里還發(fā)布了通義萬(wàn)相 Wan2.5-preview系列模型，涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。

麻了，這次云棲大會(huì)，阿里連著發(fā)模型，把人看傻了。

不過(guò)，作為一名合格的野生 AI 博主，我還是想親自嘗試這些新的模型。

下面開(kāi)始吧，文章有些長(zhǎng)，建議先點(diǎn)贊收藏。

Qwen 3 Max

Qwen 3 Max 是目前最強(qiáng)的通義大模型，擁有超萬(wàn)億的參數(shù)。其中 Qwen 3 Max 包括 instruct 和 Thinking 兩款。

其中 Instruct 模型的智力和能力水平接近 Claude 4 Opus 以及 GPT-5。

Thinking 模型具備很強(qiáng)的深度推理能力，在國(guó)際主流評(píng)測(cè)指標(biāo)上全球領(lǐng)先。

現(xiàn)在 chat.qwen.ai 上就可以直接使用了。

先來(lái)個(gè)六邊形重力小球?qū)嶒?yàn)，看看出來(lái)的效果：

我們和以前的 Qwen 2.5 Max 做下對(duì)比。

Qwen 2.5 Max 就有些抽象了，壓根都出不來(lái)。

一個(gè)模型的實(shí)用性最終還是要落地到 coding 和 Agent 能力，下面我們?cè)偈且粋€(gè) breakout游戲的 case。

Claude 4 效果如下：

可以看到 Claude 4 生成的游戲中間缺失元素了直接。Qwen 3 Max 可玩性上更有優(yōu)勢(shì)。

這個(gè)是我用 Qwen 3 Max 做的復(fù)古打印機(jī)，效果也很贊。

然后看下 Qwen 3 Max 的文風(fēng)，我覺(jué)得相對(duì)上個(gè)版本，還是有了很大的增強(qiáng)，特別是在風(fēng)格仿寫(xiě)上。

Wan 2.5-preview

今天在現(xiàn)場(chǎng)，最為炸裂的當(dāng)屬萬(wàn)相的 Wan 2.5-preview，終于也能像 VEO 3 一樣生成帶聲音的視頻了。

后排的小姐姐，激動(dòng)的連說(shuō)了好幾句臥槽。

目前可以在夸克造點(diǎn)和萬(wàn)相平臺(tái)上體驗(yàn)：

1、夸克造點(diǎn) https://zaodian.quark.cn/r/ai-studio-pc/main/gen-video?click=ai_video 2、萬(wàn)相平臺(tái) https://tongyi.aliyun.com/wan/generate/video/text-to-video?model=wan2.5

其中，要想視頻能生成聲音，需要手動(dòng)開(kāi)啟一下這個(gè)音效設(shè)置：

看了下，感覺(jué)整體效果相當(dāng) nice，甚至在細(xì)節(jié)和畫(huà)質(zhì)上比 veo3 還要更好些。

以上視頻分別來(lái)自X老哥：@Dork_sense、@higgsfield_ai、@PhotogenicWeekE

Qwen 3-VL

Qwen 3-VL 是 Qwen 系列迄今為止最強(qiáng)大的視覺(jué)語(yǔ)言模型！

旗艦型號(hào) Qwen3-VL-235B-A22B 現(xiàn)已開(kāi)源，并提供 Instruct 和 Thinking 兩個(gè)版本：
? Instruct 在關(guān)鍵視覺(jué)基準(zhǔn)測(cè)試中的表現(xiàn)優(yōu)于 Gemini 2.5 Pro
? Thinking 在多模態(tài)推理任務(wù)上實(shí)現(xiàn)了最佳 (SOTA) 性能

能力方面，我直接放官方的一張圖，大家可以感受下。

測(cè)了這么多 VLM 模型，下面用幾個(gè)經(jīng)典的例子來(lái)拷打一下它的能力吧。

1、文字倒放：

prompt：卡片上都說(shuō)了啥。

Qwen 3-VL 很快能正確識(shí)別，這里需要做的第一步是要將文字旋轉(zhuǎn)擺正后再 OCR 識(shí)別。

2、數(shù)車(chē)子

prompt：幫我數(shù)下一共有多少臺(tái)玩具車(chē)？

回答正確！

3、網(wǎng)頁(yè)復(fù)刻

prompt：幫我復(fù)刻一下這個(gè)網(wǎng)站

這個(gè) case 失敗了：

Qwen 3-Omni

這是首個(gè)原生端到端全模態(tài)大模型，能將文本、圖像、音頻和視頻統(tǒng)一在一個(gè)模型中，無(wú)需權(quán)衡模態(tài)！

也就是一個(gè)模型就支持文本和多模態(tài)能力，可以說(shuō)是一個(gè)超級(jí)大腦了，也更貼近真人。

目前已經(jīng)開(kāi)源了 Qwen3-Omni-30B-A3B-Instruct、Qwen3-Omni-30B-A3B-Thinking 和 Qwen3-Omni-30B-A3B-Captioner。

同時(shí)在22/36 音頻和 AV 基準(zhǔn)測(cè)試中 SOTA

目前也可以使用 Qwen Chat 上的語(yǔ)音聊天和視頻聊天功能來(lái)體驗(yàn) Qwen3-Omni 模型。

Qwen 3-Next

從名字上來(lái)看，這是下一代模型的全新標(biāo)準(zhǔn)。

Qwen 3-Next 主要實(shí)現(xiàn)了模型計(jì)算效率的重大突破，總參數(shù)80B僅激活 3B，性能就可足以媲美千問(wèn)3旗艦版235B模型。

而且 Qwen 3-Next 的訓(xùn)練成本更低，長(zhǎng)文本推理吞吐量更高了。

Qwen 3-Coder-Plus

Qwen 3-Coder 剛出來(lái)的時(shí)候，蒼何也第一時(shí)間做了評(píng)測(cè)，具體可看：

這次云棲大會(huì)上發(fā)布的主要是對(duì) Qwen 3-Coder 的升級(jí)。

主要在推理速度和同時(shí)執(zhí)行任務(wù)的效率上更高，代碼安全性也更好。

這里的具體實(shí)測(cè)，就需要花費(fèi)更長(zhǎng)時(shí)間了，不過(guò)可以持續(xù)關(guān)注蒼何，到時(shí)給大家?guī)?lái)使用上的體驗(yàn)。

好了，今天的內(nèi)容就到這里了。

講真的，逛完一天，我人是麻的。

技術(shù)的迭代速度，已經(jīng)不是按年來(lái)算了，而是按天，甚至是按小時(shí)。我們以為的未來(lái)，可能在 AI 眼里，只是個(gè)開(kāi)場(chǎng)白。

但焦慮歸焦慮，興奮也是真的。

這個(gè)時(shí)代，最怕的就是站在原地，一成不變。

我們無(wú)法預(yù)測(cè)未來(lái)，但可以創(chuàng)造未來(lái)。

與其被浪潮拍在沙灘上，不如學(xué)著怎么去沖浪。

與各位共勉。

好了，今天就聊到這，如果對(duì)你有幫助，希望可以點(diǎn)贊、在看、分享。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.