10月22日,Airbnb CEO布萊恩·切斯基在采訪中說(shuō)了句讓硅谷側(cè)目的話:
我們大量依賴阿里巴巴的Qwen模型,它非常好,很快速且便宜...
![]()
11月3日,nof1.ai策劃的首屆AI投資大賽結(jié)果出爐:Qwen3 Max排名第一,收益率22.3%,和DeepSeek構(gòu)成了僅有的兩個(gè)盈利模型之一。GPT5、Claude 4.5、Gemini 2.5 Pro全部虧損。
![]()
這是第一個(gè)專門衡量AI投資能力的測(cè)試,可以理解為是幣圈版圖靈測(cè)試。
規(guī)則很簡(jiǎn)單:每個(gè)模型拿1萬(wàn)美元,自己在加密貨幣市場(chǎng)交易,全程無(wú)人干預(yù)。結(jié)果,只有Qwen3 Max賺錢了。
再往前,8月,有網(wǎng)友在X上發(fā)了用通義萬(wàn)相Wan2.2生成的圖片,馬斯克點(diǎn)評(píng):
It will be impossible to tell what’s real online
![]()
7月,HuggingFace CEO連轉(zhuǎn)12條推盛贊Qwen3-Coder,推特創(chuàng)始人Jack Dorsey直接說(shuō):
goose + qwen3-coder = wow
![]()
5月,英偉達(dá)CEO黃仁勛,在財(cái)報(bào)電話會(huì)上說(shuō):
阿里巴巴的通義千問(wèn)模型是開(kāi)源AI模型中最好的。它們?cè)诿绹?guó)、歐洲及其他地區(qū)獲得了巨大關(guān)注。
在橫掃完一圈硅谷后,Qwen,現(xiàn)在終于殺回國(guó)內(nèi)了。
11月14日,阿里正式推出C端產(chǎn)品——千問(wèn)APP。這一次,中國(guó)終于有了自己的ChatGPT。
![]()
為什么硅谷認(rèn)可?
從文章開(kāi)頭我舉的一些例子,你可能就發(fā)現(xiàn)了,雖然都在夸Qwen,但他們好像夸的并不是一個(gè)Qwen!其中有投資能力霸榜的Qwen3-Max,有馬斯克夸的圖像模型wan2.2,也有Jack Dorsey盛贊的Qwen3-coder。
Qwen實(shí)在是太能搞東西,我覺(jué)得他們并不是在做模型,而是真在構(gòu)建一個(gè)生態(tài)。
而這種多線開(kāi)花,在分枝上有突破的特點(diǎn),再加上他們的開(kāi)源精神,是很容易受到開(kāi)發(fā)者,受到硅谷企業(yè)盛贊的。
在9月28日Hugging Face公布的模型趨勢(shì)榜上,Qwen系列7款模型擠進(jìn)全球前10,幾乎屠榜。
![]()
而從模型具體的Benchmark表現(xiàn)來(lái)說(shuō),Qwen很多模型都可圈可點(diǎn)的:
1)Qwen3-Max:Chatbot Arena全球第三,超過(guò)GPT-5
2)Qwen3-Coder:編程能力并列全球第一,超越GPT-4.1
3)Qwen3-VL:視覺(jué)理解全球第二,開(kāi)源第一
這種又強(qiáng)又廣的特點(diǎn),在開(kāi)源生態(tài)上可能還會(huì)體現(xiàn)得更明顯:
1)Qwen衍生模型17萬(wàn)+,超越Meta的Llama,全球第一
2)下載量超6億次
3)HuggingFace 2024年下載量占比超30%
當(dāng)然,我也得說(shuō)一句,模型太多這件事對(duì)C端用戶可能就沒(méi)那么友好了,普通用戶不像開(kāi)發(fā)者那樣熟悉種種模型之間的優(yōu)劣勢(shì),也沒(méi)有更多的能力去判斷在不同的場(chǎng)景下分別該使用Qwen哪個(gè)模型。
所以,Qwen很長(zhǎng)時(shí)間的情況都是,在硅谷和開(kāi)發(fā)者口中口碑盛好,但...普通用戶確實(shí)沒(méi)那么了解。
我想現(xiàn)在阿里推出千問(wèn)app大概就是想解決這個(gè)問(wèn)題,即想把出色的模型能力和豐富的模型生態(tài)也開(kāi)放給普通用戶使用,但也別有那么多的名字提高用戶的決策成本了。
為什么說(shuō)千問(wèn)=中國(guó)的ChatGPT?
今天,我看到金沙江創(chuàng)投朱嘯虎(對(duì),就是那個(gè)投過(guò)滴滴、餓了么、小紅書(shū)的朱嘯虎)在朋友圈和小紅書(shū)發(fā)文,標(biāo)簽千問(wèn)app的發(fā)布意味著「硬剛ChatGPT的國(guó)產(chǎn)AI出現(xiàn)了」。
![]()
他給了三個(gè)理由,原文如下:
在硅谷屠榜的Qwen殺回國(guó)內(nèi)了,模型直接決定了阿里千問(wèn)APP的起點(diǎn)。
更聰明的國(guó)產(chǎn)AI出現(xiàn)了。 我看了一下它的思考鏈路,邏輯清楚,專業(yè)問(wèn)題也表現(xiàn)挺好,不鬧著玩兒,全是干貨,這是中國(guó)市場(chǎng)真正需要的AI產(chǎn)品。
從算力基建、數(shù)據(jù)積累,到各種應(yīng)用在AI領(lǐng)域的整合打通。 估計(jì)阿里這是準(zhǔn)備用千問(wèn)重構(gòu)一個(gè)超級(jí)AI的入口。
作為一個(gè)頗受爭(zhēng)議的投資人,朱嘯虎在AI上的觀點(diǎn)常常能激起很多討論。比如,他去年就說(shuō)過(guò)"中國(guó)大模型公司沒(méi)戲,我一家都沒(méi)投",后面DeepSeek的橫空出世讓他改過(guò)一次態(tài)度,而現(xiàn)在,又公開(kāi)背書(shū)千問(wèn),說(shuō)明是真看好。
我總結(jié)了一下,覺(jué)得他是從技術(shù)、產(chǎn)品、生態(tài)這三個(gè)視角去得出他的觀點(diǎn)的,這個(gè)思路值得參考,我也試著從這三個(gè)維度出發(fā),去談?wù)勎业挠^點(diǎn)。
技術(shù)、產(chǎn)品、生態(tài)三維度拆解
不過(guò),先岔個(gè)題,在兩個(gè)半月前,我發(fā)了個(gè)即刻動(dòng)態(tài),里面提到現(xiàn)在二級(jí)市場(chǎng)上最靠譜的AI股可能是阿里,他們從產(chǎn)品到模型都還不錯(cuò)。
從那一天至今,阿里股價(jià)漲了近30%,看來(lái)市場(chǎng)也是逐漸意識(shí)到這一點(diǎn)了(當(dāng)然,這是我自己的小判斷,不構(gòu)成投資意見(jiàn),請(qǐng)謹(jǐn)慎參考)。
技術(shù)方面,我覺(jué)得在開(kāi)頭提的夠多,就不贅述了,我們可以在額外看幾個(gè)關(guān)鍵數(shù)據(jù):
1)SWE-Bench Verified(代碼解決真實(shí)問(wèn)題測(cè)試):69.6分,全球第一梯隊(duì)
)Tau2-Bench(Agent工具調(diào)用能力測(cè)試):74.8分,超過(guò)Claude Opus 4和DeepSeek-V3.1
3)AIME 25和HMMT(數(shù)學(xué)推理測(cè)試):雙滿分,國(guó)內(nèi)首次
也就是說(shuō),ChatGPT能做的,Qwen都能做。ChatGPT做不到的(比如某些專業(yè)推理場(chǎng)景),Qwen也能做。
更別提,Qwen是開(kāi)源的,參數(shù)權(quán)重全公開(kāi),你可以改、可以定制。
再說(shuō)說(shuō)產(chǎn)品方面,千問(wèn)APP對(duì)標(biāo)ChatGPT的產(chǎn)品哲學(xué):極簡(jiǎn)界面,強(qiáng)大能力。
幾個(gè)亮點(diǎn):
會(huì)思考:思維鏈高級(jí),多步推理,會(huì)根據(jù)你實(shí)際任務(wù)的需要選擇是否思考、是否聯(lián)網(wǎng),不是簡(jiǎn)單問(wèn)答
懂中文:原生中文理解,不會(huì)突然給你蹦英文
全模態(tài):文本、視覺(jué)理解、圖像生成、語(yǔ)音,一個(gè)APP搞定
免費(fèi):ChatGPT Plus $20/月,千問(wèn)完全免費(fèi)
最后,很重要的,千問(wèn)背后是阿里的整個(gè)AI生態(tài)。
1)開(kāi)源生態(tài):17萬(wàn)衍生模型,全球開(kāi)發(fā)者共同進(jìn)化
2)商業(yè)場(chǎng)景:能打通淘寶、釘釘、高德等阿里系產(chǎn)品
3)基礎(chǔ)設(shè)施:380億AI投資,云計(jì)算、算力、數(shù)據(jù)全覆蓋
4)本土化:不用翻墻,數(shù)據(jù)在國(guó)內(nèi),符合監(jiān)管
在AI模型越來(lái)越和實(shí)際場(chǎng)景融合的今天,有生態(tài)加持的產(chǎn)品顯然是更容易在體驗(yàn)上做出差異化做出特色來(lái)的。而考慮中國(guó)的市場(chǎng)環(huán)境,ChatGPT顯然是不適配的。阿里有"云+模型+產(chǎn)品+商業(yè)場(chǎng)景"全鏈路。這就是朱嘯虎說(shuō)的"生態(tài)閉環(huán)護(hù)城河"。
四個(gè)場(chǎng)景對(duì)比:千問(wèn) vs ChatGPT vs DeepSeek
我拿幾個(gè)實(shí)際工作、生活中常見(jiàn)的場(chǎng)景來(lái)對(duì)比三個(gè)產(chǎn)品在一些基礎(chǔ)任務(wù)上的表現(xiàn),分別是:實(shí)時(shí)信息問(wèn)答、圖片理解/搜索、文本生成、文本總結(jié)。
測(cè)試1:實(shí)時(shí)信息問(wèn)答
我問(wèn)的是「楊立昆為何選擇現(xiàn)在離職創(chuàng)業(yè)?」,這不是個(gè)多困難的問(wèn)題,但是需要模型意識(shí)到需要調(diào)用實(shí)時(shí)聯(lián)網(wǎng)搜索能力,減少幻覺(jué),再搜到足夠多的信息,匯總出結(jié)論來(lái)。
![]()
在這個(gè)問(wèn)題下,三個(gè)產(chǎn)品的第一步倒是都沒(méi)問(wèn)題,都有選擇聯(lián)網(wǎng)搜索獲取信息,連DeepSeek都沒(méi)翻車。不過(guò)從最終成文來(lái)說(shuō),我個(gè)人不太喜歡GPT 5.1那種莫名其妙,太套近乎的說(shuō)話風(fēng)格,這幾天的5.1也是沒(méi)少因此被罵的,有時(shí)候我們希望AI就用AI的態(tài)度回答就好了。
DeepSeek和千問(wèn)的結(jié)論基本一致,不過(guò)千問(wèn)整體回答的結(jié)構(gòu)化程度是最好的,從「戰(zhàn)略理念分歧」到「組織權(quán)力重構(gòu)」,再到「行業(yè)趨勢(shì)與個(gè)人使命」「離職時(shí)機(jī)」,一級(jí)和二級(jí)標(biāo)題的內(nèi)容層次結(jié)構(gòu)都相當(dāng)清晰。
所以這部分我自己的偏好是:千問(wèn)app > DeepSeek > ChatGPT
測(cè)試2:圖文理解/搜索
在這個(gè)問(wèn)題場(chǎng)景里,我是看到了一張很感興趣的照片,想讓AI告訴我這是哪,有什么旅行建議。
![]()
顯然,DeepSeek在這題上翻車了,它都沒(méi)法回答,因?yàn)镈eepSeek雖然也有做視覺(jué)模型,但是他們app內(nèi)現(xiàn)在還完全缺乏圖像理解能力,圖片上傳功能依然只是OCR文字識(shí)別的功能
這題里千問(wèn)和ChatGPT都是完整且準(zhǔn)確回答了我的問(wèn)題,但是解答思路不太一樣,千問(wèn)是搜索相關(guān)圖片,幫我找到了更多圖片資料,我可以自己進(jìn)一步探索相關(guān)內(nèi)容;ChatGPT則是把圖片理解得很細(xì),甚至告訴我是在哪拍的,拍攝中的主景是什么。算是各有優(yōu)勢(shì),如果圖片的理解和搜索能結(jié)合起來(lái)我會(huì)更喜歡。
所以在這題上我的偏好是 ChatGPT = 千問(wèn) > DeepSeek
測(cè)試3:文本生成
讓AI幫我們寫(xiě)資料算是最常見(jiàn)的使用場(chǎng)景之一了,在這個(gè)場(chǎng)景下,我讓他們「幫我寫(xiě)一個(gè)關(guān)于如何用AI輔助寫(xiě)作周報(bào)的小紅書(shū)文章,300字」。
![]()
最基礎(chǔ)的,小紅書(shū)的圖文文章需要有標(biāo)題、有正文,以及用一些emoji,內(nèi)容更簡(jiǎn)短,更貼近日常更實(shí)用生活化的語(yǔ)言。
在這里我覺(jué)得ChatGPT似乎不那么理解小紅書(shū),從標(biāo)題到正文的表述都太AI了。千問(wèn)app會(huì)先闡述痛點(diǎn)引出要寫(xiě)的內(nèi)容,然后再去表述解決方案;而DeepSeek則是安利工具的角度寫(xiě)的,內(nèi)容結(jié)構(gòu)倒是也很簡(jiǎn)潔,但是有個(gè)問(wèn)題是,里面媒體具體的工具,但是提到選擇「專業(yè)模式」這類詞,明顯有幻覺(jué),真實(shí)度一般。
在這個(gè)場(chǎng)景下,我的偏好是:千問(wèn)app > DeepSeek > ChatGPT
測(cè)試4:文本總結(jié)
在這個(gè)場(chǎng)景里,我都是把上萬(wàn)字的最近段永平接受雪球CEO采訪的視頻播客的字幕發(fā)給了AI,然后讓他們幫我總結(jié)其中段永平對(duì)AI的觀點(diǎn)。
![]()
讓我比較意外的是,這三個(gè)產(chǎn)品都能無(wú)壓力吞下幾萬(wàn)字的輸入,而且確實(shí)都總結(jié)到了關(guān)鍵點(diǎn)。不過(guò),對(duì)于一個(gè)總結(jié)來(lái)說(shuō),我希望內(nèi)容是既有深度,又有原文引用,去說(shuō)明為何有這樣的結(jié)論的,細(xì)節(jié)是什么。
從這個(gè)視角來(lái)說(shuō),DeepSeek總結(jié)的結(jié)果太簡(jiǎn)單了,只有結(jié)論沒(méi)有引用。千問(wèn)做的好了不少,直接引用了不少段永平在視頻播客中的原文表述,比如「至少要慘和一下,不要miss掉」「買股票就是買公司」「阿貓阿狗都跟著漲」,從這些細(xì)節(jié)可以去生動(dòng)理解段永平的結(jié)論。
而ChatGPT則是在這個(gè)問(wèn)題上做了更深度思考,把不同片段中內(nèi)容的觀點(diǎn)綜合了起來(lái),所以結(jié)論在引用原文的前提下有了更深度的探討。
在這個(gè)場(chǎng)景下,我的偏好是:ChatGPT > 千問(wèn)app > DeepSeek
所以,上面四項(xiàng)測(cè)試?yán)铮?wèn)app有兩次第一,一次并列第一,一次第二,稱之為中國(guó)的ChatGPT并不過(guò)分。
這不是終點(diǎn),是起點(diǎn)
所以,千問(wèn)的出現(xiàn),意味著什么?
1. 中國(guó)AI從追趕到并跑
技術(shù)上,Qwen3-Max全球第三,和GPT、Claude在同一梯隊(duì)。生態(tài)上,17萬(wàn)衍生模型,甚至超過(guò)了Meta的Llama。
過(guò)去,我們跟著美國(guó)跑,模型晚一年,能力差一截。現(xiàn)在,我們和美國(guó)同步,甚至某些方面領(lǐng)先。
2. AI平權(quán)時(shí)代到來(lái)
ChatGPT Plus $20/月,不便宜。千問(wèn)完全免費(fèi),功能全開(kāi),國(guó)內(nèi)直接訪問(wèn)。
人人可用,門檻夠低。
3. 應(yīng)用落地加速
阿里的商業(yè)場(chǎng)景豐富:淘寶、天貓、釘釘、高德、夸克。大膽設(shè)想千問(wèn)有機(jī)會(huì)可以打通這些產(chǎn)品,真正成為"AI助理"。
想象一下:你在釘釘開(kāi)會(huì),千問(wèn)自動(dòng)生成會(huì)議紀(jì)要。你在淘寶購(gòu)物,千問(wèn)幫你分析哪個(gè)商品性價(jià)比最高。你在高德導(dǎo)航,千問(wèn)提醒你路上有什么好吃的。
這些場(chǎng)景,ChatGPT做不到。因?yàn)樗皇且粋€(gè)產(chǎn)品,千問(wèn)背后是一個(gè)生態(tài)。
中國(guó)的ChatGPT,不是夢(mèng)想,而是現(xiàn)實(shí)。這不是終點(diǎn),是起點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.