![]()
文:王智遠 | ID:Z201440
今天阿里發了Qwen3.6-Plus。
千問3.6系列的第一款模型,編程能力接近Claude系列,100萬Token上下文窗口。
往前倒兩天,4月1日,Wan2.7-Image,圖像生成和編輯統一模型;3月30日,Qwen3.5-Omni,全模態大模型,215項全球最佳性能。
四天,三個模型。全模態感知、圖像生成、Agent編程,完全不同的方向,這是ATH事業群成立兩周以來的第一次集中亮相。
不知道你有沒有想過:三個方向完全不同的模型,為什么偏偏選在同一個窗口期發?
01
先說結論,我認為,這三個模型單獨看,每一個都是各自賽道上的常規迭代;拼在一起看就不一樣了。
Omni管感知,Wan2.7管生成,Qwen3.6-Plus管執行。加在一起,剛好覆蓋了一個完整Agent工作流的三個階段。
不信,我們拆開來看。
先說Omni,全模態,能聽能看;支持113種語言和方言,在音視頻理解這類任務上拿了215項全球最佳,超過了谷歌的Gemini-3.1 Pro。
這個模型有一個細節值得多說兩句。它長出了一種能力:
打開攝像頭,對著一張手畫的草圖說你想要什么,哪怕描述的是一個帶復雜產品邏輯的界面,它也能直接給你生成一個可以跑的原型。動動嘴就能編程。
關鍵在于,這個能力不是團隊刻意訓練出來的。
它是模型在多模態能力持續擴展的過程中,自己長出來的,感知能力積累到某個臨界點之后,它開始能做一些設計者自己都沒預料到的事情。
再看Wan2.7-Image,做圖像生成的。
AI生圖這個領域有兩個老問題。一個叫「標準臉」,生出來的人長得都一樣,審美疲勞。一個叫「色彩盲盒」,你沒法精確控制畫面的配色。
Wan2.7針對這兩個痛點做了專門優化,捏臉可以從骨相、眼眸到五官全方位定制;配色上做了一個調色盤功能,用戶可以用色值精確控制顏色的數量和占比。
在人類偏好盲測中,Wan2.7的文生圖能力超過了GPT-Image1.5和國內主流模型;它還有一個跟今天這個話題直接相關的特性:支持被龍蝦調用,讓Agent畫畫。
也就是說,Agent的能力邊界又往外推了一步,之前能寫代碼、能查資料、能總結文檔,現在還能做設計了。
然后是今天發的Qwen3.6-Plus。
阿里給它的定位「國內最強編程模型」。數據上看,確實站得住。好幾個主流的編程和Agent能力評測里,3.6-Plus可以匹敵Claude Opus 4.5,顯著超過了參數量兩倍甚至三倍于它的GLM-5和Kimi-K2.5。
這些評測的名字你不用記,記住它們測什么的就行:
一個測能不能修真實項目的Bug,一個測能不能操作終端,還有幾個測在龍蝦里能不能完成一個完整任務。所以,三者指向同一件事:模型的價值正在從「生成文本」遷移到「完成任務」。
3.6-Plus還做了一件很有針對性的事。
它在訓練過程中,集中對市面上主流的Agent框架做了優化適配,包括OpenClaw、Claude Code等等;100萬Token的上下文窗口,意味著它可以一次性裝下一個中等規模項目的完整代碼庫。
你看,一個團隊做出一個好模型不稀奇,三個放在一起,這說明背后有統一的節奏。
02
這個節奏從哪來?兩周前阿里成立了ATH事業群,這件事大家都知道了,我不重復。
我想聊它的名字:Alibaba Token Hub。嗯,不叫AI實驗室,不叫大模型中心,叫,Hub。
Token是什么?我們跟AI對話、讓它寫代碼、讓它畫圖,消耗的都是Token。它是AI世界的燃料。Hub是樞紐,是集散中心。
我們可以把ATH理解成一個Token煉油廠和加油站網絡。
通義實驗室是上游油田,負責把原油煉出來;MaaS平臺是管道,負責把油輸送出去;千問APP、悟空、AI創新這些應用,是下游的加油站,直接面向開車的人。
吳泳銘給這個事業群定的使命也是這個邏輯:創造Token、輸送Token、應用Token。你看,你又聽說過。
不過,這個命名有意思的地方在于,它暗含了一個判斷:AI這門生意的核心資產是Token的流轉效率。
什么是流轉效率?
現在有兩家自來水公司,水的質量差不多,都是達標的。
一家只有水廠,水造出來了,但管網不行,送到用戶家里要繞三道彎,水壓不穩,有時候擰開龍頭半天沒水;另一家從水廠到管網到龍頭全是自己的,擰開就來,水壓穩定,24小時不斷。
你說用戶會選誰?顯然,用戶會選后者。
對應到AI里,模型就是水廠,平臺是管網,應用就是用戶家里的水龍頭。水質(模型能力)固然重要,達到一定水準后,用戶感受到的差距是水壓,打開龍頭的那一瞬間,水能不能立刻出來。
Token流轉效率,講的就是這件事:從模型生成Token,到用戶在應用中實際使用,鏈路有多短、響應有多快、損耗有多小。
這個判斷不只阿里一家在做。
有消息說OpenAI內部已經把核心考核從日活用戶切到了每日Token消耗量;兩家公司,一個在舊金山,一個在杭州,得出了同一個結論。
所以,ATH名字透露了阿里對AI商業化的底層思考。Agent時代,衡量一家AI公司值不值錢的指標,正在從多少人在用,變成消耗多少Token,誰的Token管線跑得最順,誰就離錢最近。
03
上面說了,三個團隊同時交卷,背后肯定有統一的節奏。ATH搭了一條Token管線,從生產到運輸到消費,聽起來很完整。
問題是,這個管道通不通?
畢竟市面上每家模型公司都在說「模型應用協同」,這個詞我聽了一年多了,已經沒什么信息量了。關鍵在于,大家說的「協同」,根本不是同一件事。
我試著把它拆成三層來看。
第一層:接入層。
模型更新了,應用端改個版本號、發篇公告,模型團隊和應用團隊各干各的,發布完才臨時對接。就像兩支球隊,比賽打完了才第一次見面握手。絕大多數公司,停留在這一層。
第二層,同步層。
模型還沒正式發布,應用端就已經在聯合調試了。兩個團隊從立項開始,就清楚對方在做什么。模型訓練方向會考慮應用需求,應用產品設計也會提前適配模型能力邊界。
等模型一上線,應用直接同步交付。ATH這一輪,做到的就是這一層。我為什么這么判斷?
因為有幾個細節對得上。
Qwen3.6-Plus專門對OpenClaw、Qwen Code、Claude Code這些主流Agent框架做了優化適配。
你想,如果模型和應用各干各的,模型不可能在訓練階段就去適配特定框架。它這么做,說明模型還沒成型,就已經知道將來給誰用、怎么用。
同理,Omni能通過API直接被龍蝦、Claude Code調用,處理長音視頻和文檔;Wan2.7支持Skill調用,Agent可以直接用它生成圖像。三個模型都是出廠就自帶適配接口。
再看應用端:悟空、千問APP、QoderWork,全都在Qwen3.6發布的同一時間點官宣接入,是一起沖線的。
這種節奏,必須在立項、定方向的早期,就把模型和應用放在一起統籌。ATH把五個業務整合進同一個事業群、統一負責人,本質上就是從組織上保證這件事能落地。
第三層:飛輪層。
應用跑起來后,真實用戶數據回流,指導下一代模型訓練;模型更好用,帶來更多用戶與調用量;更多調用又產生更多數據,形成正向循環。
這一層,說實話,我目前沒有完整證據證明已經完全跑起來,但有幾個前置信號很關鍵:
沙利文今年2月的報告顯示,2025年下半年中國企業級大模型日均調用量,千問占比沖到32.1%,比上半年17.7%幾乎翻倍,增幅第一。
調用量暴漲,意味著真實場景的反饋數據在快速積累,飛輪的燃料正在備齊。
而且,你看千問現在的客戶構成。
一汽紅旗把千問智能體接進了智能座艙,汽車行業。達能亞太跟阿里云合作,基于千問搭供應鏈和營銷的Agent,消費品行業
西門子用千問做工業機器人,工程師口述就能搭建生產線,制造業;海外更不用說,亞馬遜、英偉達、Meta都在基于千問做產品,斯坦福李飛飛團隊也在用千問做前沿研究。
場景越多元,數據越豐富,飛輪一旦轉起來,慣性就會非常大。我的觀點是:判斷一條Token管線有沒有真正跑通,就看兩點:
一,模型發布后,應用跟上的速度夠不夠快;二,外部開發者是不是真的在用模型做自己的產品。
從這兩個標準看,ATH第一輪已經及格。而大部分模型公司,還卡在第一層。
04
及格只是起點,現在還有一個更關鍵的問題擺在所有人面前:這輪大模型競爭,最后到底比的是什么?
現在牌桌上玩家一點不少,智譜、字節、騰訊、百度,全都往Agent方向沖。當所有人都在做同一件事時,必須想明白:真正的壁壘到底在哪?
模型能力算壁壘嗎?不算。
現在跑分領先的窗口期越來越短,很快就被追上;龍蝦生態適配算壁壘嗎?OpenClaw本身就是開源的,誰都能做適配。你能優化,別人也能。
那真正的勝負手在哪?
我認為,最容易被忽視、卻最可能決定終局的,是這條Token管線在企業側的縱深。
我們先算一筆很簡單的賬。
一個普通C端用戶,用龍蝦玩一下午,寫寫代碼、總結幾篇文檔,也就消耗幾十萬Token。玩完覺得新鮮,關掉就沒了,可能一周都不打開,下次再用,說不定就換別家模型了。
企業不一樣。
把AI Agent嵌進客服系統,一天處理幾千工單;嵌進供應鏈,每天自動跑數據分析;嵌進產品設計,設計師天天用它出方案。這種Token消耗是日復一日、穩定持續的,跟水電費一樣。
更關鍵的是:企業一旦把AI嵌入核心業務,基本不會輕易換。
換一個聊天工具的成本是零,換一套跑在業務里的AI系統,要重新對接數據、重新訓流程、重新讓員工適應。切換成本非常高。
哪個生意更值錢,一目了然。
C端Token消費像賣礦泉水,一瓶一瓶的,今天買你明天買他;B端Token消費像鋪自來水管,一旦接通了,水費按月交,誰也不會吃飽了沒事去換一套管道。
這就是悟空事業部存在的意義。
它是ATH成立時,第一次公開亮相的全新部門,定位非常清晰:B端AI原生工作平臺,把模型能力深度扎進企業工作流。而且有消息透露,阿里還計劃逐步把淘寶、支付寶、阿里云的B端商業服務全部整合進來。
阿里做這件事,有一個別人幾乎沒法復制的先天優勢。
釘釘沉淀了多少企業?阿里云覆蓋了多少行業?淘寶商家生態有多大體量?這些客戶,不是ATH要從零去找的,因為他們本來就在阿里生態里。
ATH要做的,只是把Token管線接到這些客戶已有的工作流里;對純模型公司來說,獲客是最難的一關;但對阿里來說,客戶就坐在隔壁桌。
當越來越多企業的核心工作流,跑在千問的Token之上,以后比拼的,就是基礎設施綁定。
順便說一句,ATH這個名字還有另一層意思:All Time High,表面看,是個討巧的雙關,但里面野心是真的,阿里想做的,絕不止一個普通大模型。
Qwen3.6-Plus是千問3.6系列的第一款,后面還有Max版本;Token管線剛跑完第一輪,第二輪其實已經在路上了。
能不能交得更快,我們走著看。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.