這是蒼何的第 436 篇原創(chuàng)!
大家好,我是蒼何。
還是做博主好,有機(jī)會(huì)能來(lái)阿里云棲大會(huì)。
要知道,以前我只能一邊搬磚一邊云參展。
更別提,還能受邀參與直播探展了。
![]()
逛完展,給我最大的感受是震撼,今年能明顯感覺(jué)到越來(lái)越多的 Agent 和 AI 應(yīng)用出來(lái)了。
![]()
這個(gè)機(jī)器人做的拉花咖啡很有意思,自拍后通過(guò)阿里云函數(shù)計(jì)算,調(diào)用Qwen-Image 生成卡通形象,然后給機(jī)器人做拉花咖啡。
這么多的應(yīng)用底層都離不開(kāi)大模型的加持,這次逛展發(fā)現(xiàn),阿里又發(fā)布了不少新東西。
![]()
千問(wèn) 3 家族又迎來(lái)了不少新成員,先給大家介紹下:
1、Qwen3 Max:擁有超萬(wàn)億參數(shù),是目前為止通義千問(wèn)家族中最大、最強(qiáng)的模型,在多項(xiàng)主流權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出全球領(lǐng)先的性能;
![]()
2、Qwen3-Omni:這是首個(gè)原生端到端全模態(tài)開(kāi)源大模型,將文本、圖像、音頻和視頻統(tǒng)一在一個(gè)模型中,無(wú)需權(quán)衡模態(tài),能夠無(wú)縫處理文本、圖像、音頻和視頻等多種輸入形式。
![]()
3、Qwen3-Next:該模型擁有 800 億參數(shù)僅激活 30 億,性能就可媲美千問(wèn) 3 旗艦版 235B 模型,實(shí)現(xiàn)了模型計(jì)算效率的重大突破。
![]()
4、Qwen3-VL:這是 Qwen 系列迄今為止最強(qiáng)大的視覺(jué)理解模型,它能操作電腦和手機(jī)界面,識(shí)別 GUI 元素、理解按鈕功能、調(diào)用工具、執(zhí)行任務(wù),目前已開(kāi)源。
![]()
5、Qwen3-Coder-Plus:這是代碼模型 Qwen 3-Coder 的一次升級(jí),增強(qiáng)了終端任務(wù)功能,并提高了 Terminal Bench 的性能,推理速度更快,token 消耗更少,同時(shí)代碼安全性上也有增強(qiáng)。
![]()
除了千問(wèn),阿里還發(fā)布了通義萬(wàn)相 Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。
麻了,這次云棲大會(huì),阿里連著發(fā)模型,把人看傻了。
不過(guò),作為一名合格的野生 AI 博主,我還是想親自嘗試這些新的模型。
下面開(kāi)始吧,文章有些長(zhǎng),建議先點(diǎn)贊收藏。
Qwen 3 Max
![]()
Qwen 3 Max 是目前最強(qiáng)的通義大模型,擁有超萬(wàn)億的參數(shù)。其中 Qwen 3 Max 包括 instruct 和 Thinking 兩款。
其中 Instruct 模型的智力和能力水平接近 Claude 4 Opus 以及 GPT-5。
Thinking 模型具備很強(qiáng)的深度推理能力,在國(guó)際主流評(píng)測(cè)指標(biāo)上全球領(lǐng)先。
![]()
現(xiàn)在 chat.qwen.ai 上就可以直接使用了。
![]()
先來(lái)個(gè)六邊形重力小球?qū)嶒?yàn),看看出來(lái)的效果:

我們和以前的 Qwen 2.5 Max 做下對(duì)比。
![]()
Qwen 2.5 Max 就有些抽象了,壓根都出不來(lái)。
一個(gè)模型的實(shí)用性最終還是要落地到 coding 和 Agent 能力,下面我們?cè)偈且粋€(gè) breakout游戲的 case。

Claude 4 效果如下:

可以看到 Claude 4 生成的游戲中間缺失元素了直接。Qwen 3 Max 可玩性上更有優(yōu)勢(shì)。
這個(gè)是我用 Qwen 3 Max 做的復(fù)古打印機(jī),效果也很贊。

然后看下 Qwen 3 Max 的文風(fēng),我覺(jué)得相對(duì)上個(gè)版本,還是有了很大的增強(qiáng),特別是在風(fēng)格仿寫(xiě)上。
![]()
Wan 2.5-preview
![]()
今天在現(xiàn)場(chǎng),最為炸裂的當(dāng)屬萬(wàn)相的 Wan 2.5-preview,終于也能像 VEO 3 一樣生成帶聲音的視頻了。
后排的小姐姐,激動(dòng)的連說(shuō)了好幾句臥槽。
目前可以在夸克造點(diǎn)和萬(wàn)相平臺(tái)上體驗(yàn):
1、夸克造點(diǎn) https://zaodian.quark.cn/r/ai-studio-pc/main/gen-video?click=ai_video 2、萬(wàn)相平臺(tái) https://tongyi.aliyun.com/wan/generate/video/text-to-video?model=wan2.5 ![]()
其中,要想視頻能生成聲音,需要手動(dòng)開(kāi)啟一下這個(gè)音效設(shè)置:
![]()
看了下,感覺(jué)整體效果相當(dāng) nice,甚至在細(xì)節(jié)和畫(huà)質(zhì)上比 veo3 還要更好些。
以上視頻分別來(lái)自X老哥:@Dork_sense、@higgsfield_ai、@PhotogenicWeekE
Qwen 3-VL
![]()
Qwen 3-VL 是 Qwen 系列迄今為止最強(qiáng)大的視覺(jué)語(yǔ)言模型!
旗艦型號(hào) Qwen3-VL-235B-A22B 現(xiàn)已開(kāi)源,并提供 Instruct 和 Thinking 兩個(gè)版本:
? Instruct 在關(guān)鍵視覺(jué)基準(zhǔn)測(cè)試中的表現(xiàn)優(yōu)于 Gemini 2.5 Pro
? Thinking 在多模態(tài)推理任務(wù)上實(shí)現(xiàn)了最佳 (SOTA) 性能
![]()
能力方面,我直接放官方的一張圖,大家可以感受下。
![]()
測(cè)了這么多 VLM 模型,下面用幾個(gè)經(jīng)典的例子來(lái)拷打一下它的能力吧。
1、文字倒放:
prompt:卡片上都說(shuō)了啥。
![]()
Qwen 3-VL 很快能正確識(shí)別,這里需要做的第一步是要將文字旋轉(zhuǎn)擺正后再 OCR 識(shí)別。
![]()
2、數(shù)車(chē)子
prompt:幫我數(shù)下一共有多少臺(tái)玩具車(chē)?
![]()
回答正確!
![]()
3、網(wǎng)頁(yè)復(fù)刻
prompt:幫我復(fù)刻一下這個(gè)網(wǎng)站
![]()
這個(gè) case 失敗了:
![]()
Qwen 3-Omni
![]()
這是首個(gè)原生端到端全模態(tài)大模型,能將文本、圖像、音頻和視頻統(tǒng)一在一個(gè)模型中,無(wú)需權(quán)衡模態(tài)!
也就是一個(gè)模型就支持文本和多模態(tài)能力,可以說(shuō)是一個(gè)超級(jí)大腦了,也更貼近真人。
![]()
目前已經(jīng)開(kāi)源了 Qwen3-Omni-30B-A3B-Instruct、Qwen3-Omni-30B-A3B-Thinking 和 Qwen3-Omni-30B-A3B-Captioner。
同時(shí)在22/36 音頻和 AV 基準(zhǔn)測(cè)試中 SOTA
![]()
目前也可以使用 Qwen Chat 上的語(yǔ)音聊天和視頻聊天功能來(lái)體驗(yàn) Qwen3-Omni 模型。

Qwen 3-Next
![]()
從名字上來(lái)看,這是下一代模型的全新標(biāo)準(zhǔn)。
Qwen 3-Next 主要實(shí)現(xiàn)了模型計(jì)算效率的重大突破,總參數(shù)80B僅激活 3B,性能就可足以媲美千問(wèn)3旗艦版235B模型。
而且 Qwen 3-Next 的訓(xùn)練成本更低,長(zhǎng)文本推理吞吐量更高了。
Qwen 3-Coder-Plus
![]()
Qwen 3-Coder 剛出來(lái)的時(shí)候,蒼何也第一時(shí)間做了評(píng)測(cè),具體可看:
這次云棲大會(huì)上發(fā)布的主要是對(duì) Qwen 3-Coder 的升級(jí)。
主要在推理速度和同時(shí)執(zhí)行任務(wù)的效率上更高,代碼安全性也更好。
這里的具體實(shí)測(cè),就需要花費(fèi)更長(zhǎng)時(shí)間了,不過(guò)可以持續(xù)關(guān)注蒼何,到時(shí)給大家?guī)?lái)使用上的體驗(yàn)。
好了,今天的內(nèi)容就到這里了。
講真的,逛完一天,我人是麻的。
技術(shù)的迭代速度,已經(jīng)不是按年來(lái)算了,而是按天,甚至是按小時(shí)。我們以為的未來(lái),可能在 AI 眼里,只是個(gè)開(kāi)場(chǎng)白。
但焦慮歸焦慮,興奮也是真的。
這個(gè)時(shí)代,最怕的就是站在原地,一成不變。
我們無(wú)法預(yù)測(cè)未來(lái),但可以創(chuàng)造未來(lái)。
與其被浪潮拍在沙灘上,不如學(xué)著怎么去沖浪。
與各位共勉。
好了,今天就聊到這,如果對(duì)你有幫助,希望可以 點(diǎn)贊、在看、分享。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.