網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

ATH變陣兩周，阿里AI體系化開啟“日更”節(jié)奏

2026-04-03 19:23:09　來(lái)源: 光子星球

北京舉報(bào)

分享至

撰文| 吳坤諺

編輯| 吳先之

半個(gè)月前，阿里巴巴成立Alibaba Token Hub（ATH）事業(yè)群，外界的關(guān)注還停留在組織調(diào)整、人員變動(dòng)、戰(zhàn)略磨合這類問題上。沒人會(huì)想到，這個(gè)新生的事業(yè)群已在本周以“日更”的方式三連發(fā)新模型。

3月30日，阿里發(fā)布千問新一代全模態(tài)大模型Qwen3.5-Omni，新模型在音視頻理解、識(shí)別、交互等215項(xiàng)任務(wù)中取得SOTA表現(xiàn)。兩天之后，又發(fā)布了圖像生成與編輯統(tǒng)一模型Wan2.7-Image，此次更新重點(diǎn)解決生圖“AI味”與“色彩盲盒”問題。

4月2日，阿里千問發(fā)布了新一代大語(yǔ)言模型Qwen3.6-Plus，相較上一代模型，千問3.6全面提升了編程Coding能力、智能體Agent能力，以及工具調(diào)用能力。

新模型有量也有質(zhì)。

4月3日，全球知名大模型盲測(cè)榜單LMArena旗下聚焦AI編程能力的Code Arena公布新一期排名，Qwen3.6-Plus在全球榜單中排名第二，超越OpenAI、Google、xAI等國(guó)際巨頭，成為該榜單上排名最高的中國(guó)大模型。

一周時(shí)間，阿里連續(xù)在全模態(tài)、生圖、Agent編程三個(gè)當(dāng)下最熱的能力區(qū)間密集發(fā)力，折射出阿里AI組織的真實(shí)狀態(tài)。外界擔(dān)心的失速?zèng)]有出現(xiàn)，相反，ATH完成阿里AI業(yè)務(wù)的快速整合后，把過(guò)去幾年積累起的模型能力、人才梯隊(duì)和產(chǎn)品線協(xié)同起來(lái)，以更密集的節(jié)奏完成迭代。

“日更”背后的體系厚度

過(guò)去三年，AI領(lǐng)域盛極一時(shí)的明星產(chǎn)品層出不窮，太多案例表明，隨著行業(yè)步入深水區(qū)，如果沒有體系厚度，哪怕再好的產(chǎn)品也難以持續(xù)領(lǐng)跑。

最近的案例當(dāng)屬Sora。OpenAI已確認(rèn)，Sora的Web和App體驗(yàn)將于2026年4月26日停止，相關(guān)API也將在9月24日停用。

這款文生視頻模型兩位核心創(chuàng)始人Tim Brooks與Bill Peebles于今年初相繼離職，導(dǎo)致團(tuán)隊(duì)士氣低迷，研發(fā)節(jié)奏中斷。此外，算力消耗高企、產(chǎn)品熱度回落與公司戰(zhàn)略重心轉(zhuǎn)移向下一代模型，同樣是Sora難以為繼的因素。

曾被寄予厚望的明星模型步入終結(jié)，背后折射出的卻是研發(fā)體系韌性的不足。過(guò)度依賴單點(diǎn)突破、個(gè)別團(tuán)隊(duì)、甚至關(guān)鍵人物，一旦節(jié)奏中斷、方向調(diào)整，將會(huì)打斷持續(xù)迭代的節(jié)奏。

真正有厚度、有耐力的AI研發(fā)體系從來(lái)不是只靠一個(gè)爆款模型撐場(chǎng)面，而是能在不同技術(shù)方向上多點(diǎn)布局、并持續(xù)深入，在長(zhǎng)周期里保持穩(wěn)定。ATH此番“三連發(fā)”，折射出阿里AI已經(jīng)走到了不靠偶然運(yùn)氣與單點(diǎn)沖刺，而是底層研發(fā)體系成熟后的自然結(jié)果。

具體來(lái)看，本輪密集發(fā)布的模型中，阿里在三條最關(guān)鍵的技術(shù)賽道完成卡位。

Qwen3.5-Omni能夠?qū)σ粢曨l內(nèi)容生成詳細(xì)、可控的結(jié)構(gòu)化描述，可識(shí)別語(yǔ)言數(shù)量多達(dá)113種。基于原生的多模態(tài)理解能力，這款新模型具備了音視頻驅(qū)動(dòng)的Vibe Coding能力，用戶對(duì)著視頻提出需求，模型便能理解其中的信息，進(jìn)一步自主生成應(yīng)用、網(wǎng)頁(yè)、游戲等復(fù)雜產(chǎn)品代碼。

圖像生成與編輯統(tǒng)一模型Wan2.7-Image抬高了AI生圖的標(biāo)準(zhǔn)。該模型不再停留于生圖環(huán)節(jié)，還具備圖像指令編輯和交互式編輯等全鏈路能力，自此告別千篇一律的“AI”臉。

Wan2.7-Image強(qiáng)化了虛擬形象捏臉功能，支持從骨相、眼眸到五官細(xì)微處的全方位定制，實(shí)現(xiàn)“千人千面”。針對(duì)生圖領(lǐng)域的“色彩盲盒”問題，Wan2.7-Image提供“調(diào)色盤”功能，用戶通過(guò)Hex Code，可以一鍵提取或輸入?yún)⒖紙D的各種顏色占比，自定義配色方案。

新一代大語(yǔ)言模型Qwen3.6-Plus（千問3.6）除了整體能力提升之外，最核心的突破是讓代理式編程（Agentic Coding）變得可能。官方披露，千問3.6在多項(xiàng)權(quán)威編程與智能體評(píng)測(cè)中，都拿出了頗具競(jìng)爭(zhēng)力的成績(jī)。模型還支持百萬(wàn)Tokens的上下文窗口，并針對(duì)OpenClaw、Qwen Code、Cline等Agent框架進(jìn)行了優(yōu)化。

它能自主拆解任務(wù)、執(zhí)行終端操作、完成長(zhǎng)程代碼工程，真正實(shí)現(xiàn)可落地的代理式開發(fā)。結(jié)合百萬(wàn)上下文與多模態(tài)理解，千問3.6可直接依據(jù)設(shè)計(jì)稿、界面截圖生成并修改代碼，讓“氛圍編程”從概念走向?qū)嵱谩?/p>

這一突破不僅提升開發(fā)效率，更把AI變成可直接調(diào)用的新型生產(chǎn)資料，大幅降低編程門檻，即便普通人也能用自然語(yǔ)言完成復(fù)雜開發(fā)任務(wù)，為企業(yè)智能化與AI原生應(yīng)用落地筑牢底層能力。

三款模型各有主攻、互不偏科，分別落在全模態(tài)、文生圖、編程Agent三條關(guān)鍵技術(shù)線上，且均達(dá)到領(lǐng)先的性能水平。這說(shuō)明阿里AI的根基沒有因?yàn)槿藛T流動(dòng)與組織調(diào)整而動(dòng)搖，通義實(shí)驗(yàn)室并非單點(diǎn)強(qiáng)勢(shì)，而是呈現(xiàn)多點(diǎn)布局、全面開花的情況。

模型迭代的效率與穩(wěn)定性，來(lái)自長(zhǎng)期沉淀的機(jī)制、平臺(tái)、數(shù)據(jù)與流程。它可以穩(wěn)定產(chǎn)出、持續(xù)迭代，甚至在組織整合后更快發(fā)力。三連發(fā)表明ATH整合之后，阿里AI以一個(gè)真正具備長(zhǎng)期主義能力的純血AI玩家的身份，站穩(wěn)在全球競(jìng)爭(zhēng)的主航道中。

跨越“實(shí)驗(yàn)室鴻溝”

模型迭代的三連發(fā)后，阿里內(nèi)部的反應(yīng)速度同樣值得關(guān)注。

在三款新模型發(fā)布的窗口期，悟空、千問App等阿里AI應(yīng)用和平臺(tái)幾乎壓著哨聲完成了接入。這種節(jié)奏上的合拍，業(yè)內(nèi)鮮見。

過(guò)去兩年多，研發(fā)側(cè)熱衷于卷榜單、刷參數(shù)、精進(jìn)SOTA，產(chǎn)品側(cè)則在消費(fèi)市場(chǎng)或企業(yè)市場(chǎng)各自尋找應(yīng)用切口。模型和產(chǎn)品像兩條并行線，彼此都在向前跑，卻很難真正咬合到一起。

無(wú)需枚舉，自2023年大模型全面爆發(fā)以來(lái)，市場(chǎng)上從來(lái)不缺“發(fā)布即王炸”的明星模型。很多“前輩”模型在發(fā)布后豪取了一段時(shí)間的聲量，過(guò)不了多久便淡出公眾視野。原因便在于這些頂尖的技術(shù)成果沒能快速接入產(chǎn)品中，轉(zhuǎn)化為用戶可感知的體驗(yàn)。

產(chǎn)品化的窗口期內(nèi)，模型與產(chǎn)品實(shí)際上是“兩張皮”。這種現(xiàn)象是行業(yè)中長(zhǎng)期存在共性困境，導(dǎo)致創(chuàng)新成果在轉(zhuǎn)化過(guò)程中遭受高額損耗。

ATH成立后的核心價(jià)值正在于此，它讓阿里的AI產(chǎn)品線開始從發(fā)散走向收斂，模型能力可以在迭代后的第一時(shí)間快速進(jìn)入業(yè)務(wù)場(chǎng)景中。

我們了解到，Qwen3.6-Plus發(fā)布后，將很快接入悟空、千問App等阿里AI應(yīng)用和平臺(tái)；Wan2.7-Image除了在阿里云百煉、萬(wàn)相官網(wǎng)開放體驗(yàn)，也已明確將接入千問App；Qwen3.5-Omni則同步提供Plus、Flash、Light三種API形態(tài)，直接面向開發(fā)者和企業(yè)開放調(diào)用。

模型團(tuán)隊(duì)把能力往前推了一步，產(chǎn)品線同步跟進(jìn)，把這些能力迅速翻譯成用戶可以接觸到的體驗(yàn)與功能。對(duì)阿里來(lái)說(shuō)，這種節(jié)奏感本身就是一種信號(hào)：模型、產(chǎn)品與平臺(tái)之間的鏈路正在縮短。

以悟空平臺(tái)為例，接入Qwen3.6-Plus后，其背后的龍蝦軍團(tuán)便具備了匹配Claude 4.5的智能體編程能力。這意味著智能體能夠自主拆解業(yè)務(wù)需求，在終端環(huán)境中完成代碼編寫與修復(fù)。

從模型發(fā)布到應(yīng)用落地的無(wú)縫銜接，證明了ATH并非簡(jiǎn)單的組織整合。它建立了一套從AI實(shí)驗(yàn)室到業(yè)務(wù)前臺(tái)的價(jià)值傳導(dǎo)機(jī)制：底層能力的每一次突破，都會(huì)借由這套機(jī)制，更快變成產(chǎn)品、平臺(tái)和開發(fā)接口的共同底層。

AI時(shí)代下，組織效率成為將AI從昂貴的實(shí)驗(yàn)性技術(shù)，快速轉(zhuǎn)化為高效率、高確定性的通用生產(chǎn)力的關(guān)鍵要素。關(guān)乎企業(yè)能否在快速迭代的基模競(jìng)爭(zhēng)中，最大限度把握迭代的價(jià)值窗口。

近乎“零時(shí)差”接入平臺(tái)不同產(chǎn)品線的模型，便是ATH組織效率的一個(gè)切面。“模型即產(chǎn)品”，這個(gè)業(yè)內(nèi)反復(fù)被提起的口號(hào)，在阿里變成了更具體的現(xiàn)實(shí)。

全棧協(xié)同的生態(tài)復(fù)利

通過(guò)觀察阿里這一輪從模型到業(yè)務(wù)的迭代，我們可以看到，ATH成立后，阿里AI的戰(zhàn)略版圖愈發(fā)清晰。

在模型即產(chǎn)品的邏輯之上，阿里更深層的意圖在于構(gòu)建一種全棧協(xié)同的生態(tài)復(fù)利。如果將模型視作一個(gè)獨(dú)立的單體，其天花板終究有限。而真正的AI勢(shì)能，在于將模型能力降維、打碎，并重新注入到所有的業(yè)務(wù)場(chǎng)景中，使其成為像水電煤一樣的基礎(chǔ)設(shè)施。

放眼全球，將Gemini穿透Workspace各項(xiàng)原子化能力與平臺(tái)搜索業(yè)務(wù)的谷歌，便是生態(tài)復(fù)利的典型樣本。

回看阿里，三連發(fā)的全新模型同樣貫穿阿里業(yè)已鋪開的業(yè)務(wù)線。尤其是作為阿里當(dāng)前面向用戶側(cè)攻城略地的核心入口的千問，底層模型每往前推一步，千問及悟空等AI應(yīng)用及平臺(tái)層的能力就會(huì)隨之往前推一步。

以全模態(tài)大模型Qwen3.5-Omni為例，它在音視頻理解與實(shí)時(shí)交互等215項(xiàng)任務(wù)中取得了性能最佳的表現(xiàn)，在核心指標(biāo)上已經(jīng)可以與谷歌的Gemini 3.1 Pro一較高下。

底層能力的迭代同步擴(kuò)張了千問App的半徑。繼年初的餐食外賣、商超便利后，千問能辦的事越來(lái)越多，涉及更復(fù)雜的線下供給與交互場(chǎng)景。

如日前千問上線的打車功能，便需要完全理解用戶通過(guò)自然語(yǔ)言表達(dá)的用車需求，并在一次服務(wù)中調(diào)用、理解基于LBS的路線地圖、車型推薦、系統(tǒng)預(yù)估的價(jià)格與到達(dá)時(shí)間等完整的高德服務(wù)。

千問承接的是用戶側(cè)需求，悟空承接的是企業(yè)與組織側(cè)需求，Qoder更貼近開發(fā)者和編程場(chǎng)景。面向三類不同用戶，背后都是同一套不斷進(jìn)化的底層能力。

在這種統(tǒng)一底座對(duì)不同場(chǎng)景的穿透力之上，阿里還進(jìn)一步把優(yōu)勢(shì)推進(jìn)到了成本側(cè)。

據(jù)了解，Qwen3.5-Omni在保持較強(qiáng)全模態(tài)能力的同時(shí)，API輸入價(jià)格每百萬(wàn)Tokens不到0.8元，約為Gemini 3.1 Pro的十分之一。

在算力普遍漲價(jià)，AI云服務(wù)緊俏的當(dāng)下，Qwen3.5-Omni難能可貴的性價(jià)比直接將技術(shù)紅利轉(zhuǎn)化為市場(chǎng)競(jìng)爭(zhēng)力，將阿里的競(jìng)爭(zhēng)優(yōu)勢(shì)從“資源層”推向了“模型智能層”。

當(dāng)模型迭代顯著優(yōu)化了產(chǎn)品體驗(yàn)，體驗(yàn)的躍升會(huì)刺激更大規(guī)模的調(diào)用需求，而調(diào)用規(guī)模的持續(xù)放大，則反過(guò)來(lái)攤薄了研發(fā)與算力成本，并進(jìn)一步放大阿里云作為AI基礎(chǔ)設(shè)施的底座價(jià)值。

而對(duì)于擁有完整AI技術(shù)棧的阿里而言，三連發(fā)模型只是一個(gè)開始。把這些原本可能彼此并行、彼此分散的環(huán)節(jié)重新組織起來(lái)，讓它們相互牽引，才是ATH的價(jià)值所在。

在“以智能帶動(dòng)算力”的飛輪帶動(dòng)下，阿里正在全球AI產(chǎn)業(yè)化的坐標(biāo)系中，劃出一條屬于自己的確定性曲線。

微信號(hào)｜TMTweb

公眾號(hào)｜光子星球

別忘了掃碼關(guān)注我們！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.