撰文| 吳坤諺
編輯| 吳先之
半個(gè)月前,阿里巴巴成立Alibaba Token Hub(ATH)事業(yè)群,外界的關(guān)注還停留在組織調(diào)整、人員變動(dòng)、戰(zhàn)略磨合這類問題上。沒人會(huì)想到,這個(gè)新生的事業(yè)群已在本周以“日更”的方式三連發(fā)新模型。
3月30日,阿里發(fā)布千問新一代全模態(tài)大模型Qwen3.5-Omni,新模型在音視頻理解、識(shí)別、交互等215項(xiàng)任務(wù)中取得SOTA表現(xiàn)。兩天之后,又發(fā)布了圖像生成與編輯統(tǒng)一模型Wan2.7-Image,此次更新重點(diǎn)解決生圖“AI味”與“色彩盲盒”問題。
4月2日,阿里千問發(fā)布了新一代大語(yǔ)言模型Qwen3.6-Plus,相較上一代模型,千問3.6全面提升了編程Coding能力、智能體Agent能力,以及工具調(diào)用能力。
![]()
新模型有量也有質(zhì)。
4月3日,全球知名大模型盲測(cè)榜單LMArena旗下聚焦AI編程能力的Code Arena公布新一期排名,Qwen3.6-Plus在全球榜單中排名第二,超越OpenAI、Google、xAI等國(guó)際巨頭,成為該榜單上排名最高的中國(guó)大模型。
一周時(shí)間,阿里連續(xù)在全模態(tài)、生圖、Agent編程三個(gè)當(dāng)下最熱的能力區(qū)間密集發(fā)力,折射出阿里AI組織的真實(shí)狀態(tài)。外界擔(dān)心的失速?zèng)]有出現(xiàn),相反,ATH完成阿里AI業(yè)務(wù)的快速整合后,把過(guò)去幾年積累起的模型能力、人才梯隊(duì)和產(chǎn)品線協(xié)同起來(lái),以更密集的節(jié)奏完成迭代。
“日更”背后的體系厚度
過(guò)去三年,AI領(lǐng)域盛極一時(shí)的明星產(chǎn)品層出不窮,太多案例表明,隨著行業(yè)步入深水區(qū),如果沒有體系厚度,哪怕再好的產(chǎn)品也難以持續(xù)領(lǐng)跑。
最近的案例當(dāng)屬Sora。OpenAI已確認(rèn),Sora的Web和App體驗(yàn)將于2026年4月26日停止,相關(guān)API也將在9月24日停用。
這款文生視頻模型兩位核心創(chuàng)始人Tim Brooks與Bill Peebles于今年初相繼離職,導(dǎo)致團(tuán)隊(duì)士氣低迷,研發(fā)節(jié)奏中斷。此外,算力消耗高企、產(chǎn)品熱度回落與公司戰(zhàn)略重心轉(zhuǎn)移向下一代模型,同樣是Sora難以為繼的因素。
曾被寄予厚望的明星模型步入終結(jié),背后折射出的卻是研發(fā)體系韌性的不足。過(guò)度依賴單點(diǎn)突破、個(gè)別團(tuán)隊(duì)、甚至關(guān)鍵人物,一旦節(jié)奏中斷、方向調(diào)整,將會(huì)打斷持續(xù)迭代的節(jié)奏。
真正有厚度、有耐力的AI研發(fā)體系從來(lái)不是只靠一個(gè)爆款模型撐場(chǎng)面,而是能在不同技術(shù)方向上多點(diǎn)布局、并持續(xù)深入,在長(zhǎng)周期里保持穩(wěn)定。ATH此番“三連發(fā)”,折射出阿里AI已經(jīng)走到了不靠偶然運(yùn)氣與單點(diǎn)沖刺,而是底層研發(fā)體系成熟后的自然結(jié)果。
具體來(lái)看,本輪密集發(fā)布的模型中,阿里在三條最關(guān)鍵的技術(shù)賽道完成卡位。
Qwen3.5-Omni能夠?qū)σ粢曨l內(nèi)容生成詳細(xì)、可控的結(jié)構(gòu)化描述,可識(shí)別語(yǔ)言數(shù)量多達(dá)113種。基于原生的多模態(tài)理解能力,這款新模型具備了音視頻驅(qū)動(dòng)的Vibe Coding能力,用戶對(duì)著視頻提出需求,模型便能理解其中的信息,進(jìn)一步自主生成應(yīng)用、網(wǎng)頁(yè)、游戲等復(fù)雜產(chǎn)品代碼。
圖像生成與編輯統(tǒng)一模型Wan2.7-Image抬高了AI生圖的標(biāo)準(zhǔn)。該模型不再停留于生圖環(huán)節(jié),還具備圖像指令編輯和交互式編輯等全鏈路能力,自此告別千篇一律的“AI”臉。
![]()
Wan2.7-Image強(qiáng)化了虛擬形象捏臉功能,支持從骨相、眼眸到五官細(xì)微處的全方位定制,實(shí)現(xiàn)“千人千面”。針對(duì)生圖領(lǐng)域的“色彩盲盒”問題,Wan2.7-Image提供“調(diào)色盤”功能,用戶通過(guò)Hex Code,可以一鍵提取或輸入?yún)⒖紙D的各種顏色占比,自定義配色方案。
新一代大語(yǔ)言模型Qwen3.6-Plus(千問3.6)除了整體能力提升之外,最核心的突破是讓代理式編程(Agentic Coding)變得可能。官方披露,千問3.6在多項(xiàng)權(quán)威編程與智能體評(píng)測(cè)中,都拿出了頗具競(jìng)爭(zhēng)力的成績(jī)。模型還支持百萬(wàn)Tokens的上下文窗口,并針對(duì)OpenClaw、Qwen Code、Cline等Agent框架進(jìn)行了優(yōu)化。
它能自主拆解任務(wù)、執(zhí)行終端操作、完成長(zhǎng)程代碼工程,真正實(shí)現(xiàn)可落地的代理式開發(fā)。結(jié)合百萬(wàn)上下文與多模態(tài)理解,千問3.6可直接依據(jù)設(shè)計(jì)稿、界面截圖生成并修改代碼,讓“氛圍編程”從概念走向?qū)嵱谩?/p>
這一突破不僅提升開發(fā)效率,更把AI變成可直接調(diào)用的新型生產(chǎn)資料,大幅降低編程門檻,即便普通人也能用自然語(yǔ)言完成復(fù)雜開發(fā)任務(wù),為企業(yè)智能化與AI原生應(yīng)用落地筑牢底層能力。
三款模型各有主攻、互不偏科,分別落在全模態(tài)、文生圖、編程Agent三條關(guān)鍵技術(shù)線上,且均達(dá)到領(lǐng)先的性能水平。這說(shuō)明阿里AI的根基沒有因?yàn)槿藛T流動(dòng)與組織調(diào)整而動(dòng)搖,通義實(shí)驗(yàn)室并非單點(diǎn)強(qiáng)勢(shì),而是呈現(xiàn)多點(diǎn)布局、全面開花的情況。
模型迭代的效率與穩(wěn)定性,來(lái)自長(zhǎng)期沉淀的機(jī)制、平臺(tái)、數(shù)據(jù)與流程。它可以穩(wěn)定產(chǎn)出、持續(xù)迭代,甚至在組織整合后更快發(fā)力。三連發(fā)表明ATH整合之后,阿里AI以一個(gè)真正具備長(zhǎng)期主義能力的純血AI玩家的身份,站穩(wěn)在全球競(jìng)爭(zhēng)的主航道中。
跨越“實(shí)驗(yàn)室鴻溝”
模型迭代的三連發(fā)后,阿里內(nèi)部的反應(yīng)速度同樣值得關(guān)注。
在三款新模型發(fā)布的窗口期,悟空、千問App等阿里AI應(yīng)用和平臺(tái)幾乎壓著哨聲完成了接入。這種節(jié)奏上的合拍,業(yè)內(nèi)鮮見。
過(guò)去兩年多,研發(fā)側(cè)熱衷于卷榜單、刷參數(shù)、精進(jìn)SOTA,產(chǎn)品側(cè)則在消費(fèi)市場(chǎng)或企業(yè)市場(chǎng)各自尋找應(yīng)用切口。模型和產(chǎn)品像兩條并行線,彼此都在向前跑,卻很難真正咬合到一起。
無(wú)需枚舉,自2023年大模型全面爆發(fā)以來(lái),市場(chǎng)上從來(lái)不缺“發(fā)布即王炸”的明星模型。很多“前輩”模型在發(fā)布后豪取了一段時(shí)間的聲量,過(guò)不了多久便淡出公眾視野。原因便在于這些頂尖的技術(shù)成果沒能快速接入產(chǎn)品中,轉(zhuǎn)化為用戶可感知的體驗(yàn)。
產(chǎn)品化的窗口期內(nèi),模型與產(chǎn)品實(shí)際上是“兩張皮”。這種現(xiàn)象是行業(yè)中長(zhǎng)期存在共性困境,導(dǎo)致創(chuàng)新成果在轉(zhuǎn)化過(guò)程中遭受高額損耗。
ATH成立后的核心價(jià)值正在于此,它讓阿里的AI產(chǎn)品線開始從發(fā)散走向收斂,模型能力可以在迭代后的第一時(shí)間快速進(jìn)入業(yè)務(wù)場(chǎng)景中。
我們了解到,Qwen3.6-Plus發(fā)布后,將很快接入悟空、千問App等阿里AI應(yīng)用和平臺(tái);Wan2.7-Image除了在阿里云百煉、萬(wàn)相官網(wǎng)開放體驗(yàn),也已明確將接入千問App;Qwen3.5-Omni則同步提供Plus、Flash、Light三種API形態(tài),直接面向開發(fā)者和企業(yè)開放調(diào)用。
模型團(tuán)隊(duì)把能力往前推了一步,產(chǎn)品線同步跟進(jìn),把這些能力迅速翻譯成用戶可以接觸到的體驗(yàn)與功能。對(duì)阿里來(lái)說(shuō),這種節(jié)奏感本身就是一種信號(hào):模型、產(chǎn)品與平臺(tái)之間的鏈路正在縮短。
以悟空平臺(tái)為例,接入Qwen3.6-Plus后,其背后的龍蝦軍團(tuán)便具備了匹配Claude 4.5的智能體編程能力。這意味著智能體能夠自主拆解業(yè)務(wù)需求,在終端環(huán)境中完成代碼編寫與修復(fù)。
![]()
從模型發(fā)布到應(yīng)用落地的無(wú)縫銜接,證明了ATH并非簡(jiǎn)單的組織整合。它建立了一套從AI實(shí)驗(yàn)室到業(yè)務(wù)前臺(tái)的價(jià)值傳導(dǎo)機(jī)制:底層能力的每一次突破,都會(huì)借由這套機(jī)制,更快變成產(chǎn)品、平臺(tái)和開發(fā)接口的共同底層。
AI時(shí)代下,組織效率成為將AI從昂貴的實(shí)驗(yàn)性技術(shù),快速轉(zhuǎn)化為高效率、高確定性的通用生產(chǎn)力的關(guān)鍵要素。關(guān)乎企業(yè)能否在快速迭代的基模競(jìng)爭(zhēng)中,最大限度把握迭代的價(jià)值窗口。
近乎“零時(shí)差”接入平臺(tái)不同產(chǎn)品線的模型,便是ATH組織效率的一個(gè)切面。“模型即產(chǎn)品”,這個(gè)業(yè)內(nèi)反復(fù)被提起的口號(hào),在阿里變成了更具體的現(xiàn)實(shí)。
全棧協(xié)同的生態(tài)復(fù)利
通過(guò)觀察阿里這一輪從模型到業(yè)務(wù)的迭代,我們可以看到,ATH成立后,阿里AI的戰(zhàn)略版圖愈發(fā)清晰。
在模型即產(chǎn)品的邏輯之上,阿里更深層的意圖在于構(gòu)建一種全棧協(xié)同的生態(tài)復(fù)利。如果將模型視作一個(gè)獨(dú)立的單體,其天花板終究有限。而真正的AI勢(shì)能,在于將模型能力降維、打碎,并重新注入到所有的業(yè)務(wù)場(chǎng)景中,使其成為像水電煤一樣的基礎(chǔ)設(shè)施。
放眼全球,將Gemini穿透Workspace各項(xiàng)原子化能力與平臺(tái)搜索業(yè)務(wù)的谷歌,便是生態(tài)復(fù)利的典型樣本。
回看阿里,三連發(fā)的全新模型同樣貫穿阿里業(yè)已鋪開的業(yè)務(wù)線。尤其是作為阿里當(dāng)前面向用戶側(cè)攻城略地的核心入口的千問,底層模型每往前推一步,千問及悟空等AI應(yīng)用及平臺(tái)層的能力就會(huì)隨之往前推一步。
以全模態(tài)大模型Qwen3.5-Omni為例,它在音視頻理解與實(shí)時(shí)交互等215項(xiàng)任務(wù)中取得了性能最佳的表現(xiàn),在核心指標(biāo)上已經(jīng)可以與谷歌的Gemini 3.1 Pro一較高下。
![]()
底層能力的迭代同步擴(kuò)張了千問App的半徑。繼年初的餐食外賣、商超便利后,千問能辦的事越來(lái)越多,涉及更復(fù)雜的線下供給與交互場(chǎng)景。
如日前千問上線的打車功能,便需要完全理解用戶通過(guò)自然語(yǔ)言表達(dá)的用車需求,并在一次服務(wù)中調(diào)用、理解基于LBS的路線地圖、車型推薦、系統(tǒng)預(yù)估的價(jià)格與到達(dá)時(shí)間等完整的高德服務(wù)。
千問承接的是用戶側(cè)需求,悟空承接的是企業(yè)與組織側(cè)需求,Qoder更貼近開發(fā)者和編程場(chǎng)景。面向三類不同用戶,背后都是同一套不斷進(jìn)化的底層能力。
在這種統(tǒng)一底座對(duì)不同場(chǎng)景的穿透力之上,阿里還進(jìn)一步把優(yōu)勢(shì)推進(jìn)到了成本側(cè)。
據(jù)了解,Qwen3.5-Omni在保持較強(qiáng)全模態(tài)能力的同時(shí),API輸入價(jià)格每百萬(wàn)Tokens不到0.8元,約為Gemini 3.1 Pro的十分之一。
在算力普遍漲價(jià),AI云服務(wù)緊俏的當(dāng)下,Qwen3.5-Omni難能可貴的性價(jià)比直接將技術(shù)紅利轉(zhuǎn)化為市場(chǎng)競(jìng)爭(zhēng)力,將阿里的競(jìng)爭(zhēng)優(yōu)勢(shì)從“資源層”推向了“模型智能層”。
當(dāng)模型迭代顯著優(yōu)化了產(chǎn)品體驗(yàn),體驗(yàn)的躍升會(huì)刺激更大規(guī)模的調(diào)用需求,而調(diào)用規(guī)模的持續(xù)放大,則反過(guò)來(lái)攤薄了研發(fā)與算力成本,并進(jìn)一步放大阿里云作為AI基礎(chǔ)設(shè)施的底座價(jià)值。
而對(duì)于擁有完整AI技術(shù)棧的阿里而言,三連發(fā)模型只是一個(gè)開始。把這些原本可能彼此并行、彼此分散的環(huán)節(jié)重新組織起來(lái),讓它們相互牽引,才是ATH的價(jià)值所在。
在“以智能帶動(dòng)算力”的飛輪帶動(dòng)下,阿里正在全球AI產(chǎn)業(yè)化的坐標(biāo)系中,劃出一條屬于自己的確定性曲線。
微信號(hào)|TMTweb
公眾號(hào)|光子星球
別忘了掃碼關(guān)注我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.