網易首頁 > 網易號 > 正文申請入駐

橫掃硅谷的千問，殺回國內了

2025-11-17 11:51:47　來源: AI進化論花生

北京舉報

分享至

10月22日，Airbnb CEO布萊恩·切斯基在采訪中說了句讓硅谷側目的話：

我們大量依賴阿里巴巴的Qwen模型，它非常好，很快速且便宜...

11月3日，nof1.ai策劃的首屆AI投資大賽結果出爐：Qwen3 Max排名第一，收益率22.3%，和DeepSeek構成了僅有的兩個盈利模型之一。GPT5、Claude 4.5、Gemini 2.5 Pro全部虧損。

這是第一個專門衡量AI投資能力的測試，可以理解為是幣圈版圖靈測試。

規則很簡單：每個模型拿1萬美元，自己在加密貨幣市場交易，全程無人干預。結果，只有Qwen3 Max賺錢了。

再往前，8月，有網友在X上發了用通義萬相Wan2.2生成的圖片，馬斯克點評：

It will be impossible to tell what’s real online

7月，HuggingFace CEO連轉12條推盛贊Qwen3-Coder，推特創始人Jack Dorsey直接說：

goose + qwen3-coder = wow

5月，英偉達CEO黃仁勛，在財報電話會上說：

阿里巴巴的通義千問模型是開源AI模型中最好的。它們在美國、歐洲及其他地區獲得了巨大關注。

在橫掃完一圈硅谷后，Qwen，現在終于殺回國內了。

11月14日，阿里正式推出C端產品——千問APP。這一次，中國終于有了自己的ChatGPT。

為什么硅谷認可？

從文章開頭我舉的一些例子，你可能就發現了，雖然都在夸Qwen，但他們好像夸的并不是一個Qwen！其中有投資能力霸榜的Qwen3-Max，有馬斯克夸的圖像模型wan2.2，也有Jack Dorsey盛贊的Qwen3-coder。

Qwen實在是太能搞東西，我覺得他們并不是在做模型，而是真在構建一個生態。

而這種多線開花，在分枝上有突破的特點，再加上他們的開源精神，是很容易受到開發者，受到硅谷企業盛贊的。

在9月28日Hugging Face公布的模型趨勢榜上，Qwen系列7款模型擠進全球前10，幾乎屠榜。

而從模型具體的Benchmark表現來說，Qwen很多模型都可圈可點的：

1）Qwen3-Max：Chatbot Arena全球第三，超過GPT-5

2）Qwen3-Coder：編程能力并列全球第一，超越GPT-4.1

3）Qwen3-VL：視覺理解全球第二，開源第一

這種又強又廣的特點，在開源生態上可能還會體現得更明顯：

1）Qwen衍生模型17萬+，超越Meta的Llama，全球第一

2）下載量超6億次

3）HuggingFace 2024年下載量占比超30%

當然，我也得說一句，模型太多這件事對C端用戶可能就沒那么友好了，普通用戶不像開發者那樣熟悉種種模型之間的優劣勢，也沒有更多的能力去判斷在不同的場景下分別該使用Qwen哪個模型。

所以，Qwen很長時間的情況都是，在硅谷和開發者口中口碑盛好，但...普通用戶確實沒那么了解。

我想現在阿里推出千問app大概就是想解決這個問題，即想把出色的模型能力和豐富的模型生態也開放給普通用戶使用，但也別有那么多的名字提高用戶的決策成本了。

為什么說千問=中國的ChatGPT？

今天，我看到金沙江創投朱嘯虎（對，就是那個投過滴滴、餓了么、小紅書的朱嘯虎）在朋友圈和小紅書發文，標簽千問app的發布意味著「硬剛ChatGPT的國產AI出現了」。

他給了三個理由，原文如下：

在硅谷屠榜的Qwen殺回國內了，模型直接決定了阿里千問APP的起點。
更聰明的國產AI出現了。我看了一下它的思考鏈路，邏輯清楚，專業問題也表現挺好，不鬧著玩兒，全是干貨，這是中國市場真正需要的AI產品。
從算力基建、數據積累，到各種應用在AI領域的整合打通。估計阿里這是準備用千問重構一個超級AI的入口。

作為一個頗受爭議的投資人，朱嘯虎在AI上的觀點常常能激起很多討論。比如，他去年就說過"中國大模型公司沒戲，我一家都沒投"，后面DeepSeek的橫空出世讓他改過一次態度，而現在，又公開背書千問，說明是真看好。

我總結了一下，覺得他是從技術、產品、生態這三個視角去得出他的觀點的，這個思路值得參考，我也試著從這三個維度出發，去談談我的觀點。

技術、產品、生態三維度拆解

不過，先岔個題，在兩個半月前，我發了個即刻動態，里面提到現在二級市場上最靠譜的AI股可能是阿里，他們從產品到模型都還不錯。

從那一天至今，阿里股價漲了近30%，看來市場也是逐漸意識到這一點了（當然，這是我自己的小判斷，不構成投資意見，請謹慎參考）。

技術方面，我覺得在開頭提的夠多，就不贅述了，我們可以在額外看幾個關鍵數據：

1）SWE-Bench Verified（代碼解決真實問題測試）：69.6分，全球第一梯隊

）Tau2-Bench（Agent工具調用能力測試）：74.8分，超過Claude Opus 4和DeepSeek-V3.1

3）AIME 25和HMMT（數學推理測試）：雙滿分，國內首次

也就是說，ChatGPT能做的，Qwen都能做。ChatGPT做不到的（比如某些專業推理場景），Qwen也能做。

更別提，Qwen是開源的，參數權重全公開，你可以改、可以定制。

再說說產品方面，千問APP對標ChatGPT的產品哲學：極簡界面，強大能力。

幾個亮點：

會思考：思維鏈高級，多步推理，會根據你實際任務的需要選擇是否思考、是否聯網，不是簡單問答
懂中文：原生中文理解，不會突然給你蹦英文
全模態：文本、視覺理解、圖像生成、語音，一個APP搞定
免費：ChatGPT Plus $20/月，千問完全免費

最后，很重要的，千問背后是阿里的整個AI生態。

1）開源生態：17萬衍生模型，全球開發者共同進化

2）商業場景：能打通淘寶、釘釘、高德等阿里系產品

3）基礎設施：380億AI投資，云計算、算力、數據全覆蓋

4）本土化：不用翻墻，數據在國內，符合監管

在AI模型越來越和實際場景融合的今天，有生態加持的產品顯然是更容易在體驗上做出差異化做出特色來的。而考慮中國的市場環境，ChatGPT顯然是不適配的。阿里有"云+模型+產品+商業場景"全鏈路。這就是朱嘯虎說的"生態閉環護城河"。

四個場景對比：千問 vs ChatGPT vs DeepSeek

我拿幾個實際工作、生活中常見的場景來對比三個產品在一些基礎任務上的表現，分別是：實時信息問答、圖片理解/搜索、文本生成、文本總結。

測試1：實時信息問答

我問的是「楊立昆為何選擇現在離職創業？」，這不是個多困難的問題，但是需要模型意識到需要調用實時聯網搜索能力，減少幻覺，再搜到足夠多的信息，匯總出結論來。

在這個問題下，三個產品的第一步倒是都沒問題，都有選擇聯網搜索獲取信息，連DeepSeek都沒翻車。不過從最終成文來說，我個人不太喜歡GPT 5.1那種莫名其妙，太套近乎的說話風格，這幾天的5.1也是沒少因此被罵的，有時候我們希望AI就用AI的態度回答就好了。

DeepSeek和千問的結論基本一致，不過千問整體回答的結構化程度是最好的，從「戰略理念分歧」到「組織權力重構」，再到「行業趨勢與個人使命」「離職時機」，一級和二級標題的內容層次結構都相當清晰。

所以這部分我自己的偏好是：千問app > DeepSeek > ChatGPT

測試2：圖文理解/搜索

在這個問題場景里，我是看到了一張很感興趣的照片，想讓AI告訴我這是哪，有什么旅行建議。

顯然，DeepSeek在這題上翻車了，它都沒法回答，因為DeepSeek雖然也有做視覺模型，但是他們app內現在還完全缺乏圖像理解能力，圖片上傳功能依然只是OCR文字識別的功能

這題里千問和ChatGPT都是完整且準確回答了我的問題，但是解答思路不太一樣，千問是搜索相關圖片，幫我找到了更多圖片資料，我可以自己進一步探索相關內容；ChatGPT則是把圖片理解得很細，甚至告訴我是在哪拍的，拍攝中的主景是什么。算是各有優勢，如果圖片的理解和搜索能結合起來我會更喜歡。

所以在這題上我的偏好是 ChatGPT = 千問 > DeepSeek

測試3：文本生成

讓AI幫我們寫資料算是最常見的使用場景之一了，在這個場景下，我讓他們「幫我寫一個關于如何用AI輔助寫作周報的小紅書文章，300字」。

最基礎的，小紅書的圖文文章需要有標題、有正文，以及用一些emoji，內容更簡短，更貼近日常更實用生活化的語言。

在這里我覺得ChatGPT似乎不那么理解小紅書，從標題到正文的表述都太AI了。千問app會先闡述痛點引出要寫的內容，然后再去表述解決方案；而DeepSeek則是安利工具的角度寫的，內容結構倒是也很簡潔，但是有個問題是，里面媒體具體的工具，但是提到選擇「專業模式」這類詞，明顯有幻覺，真實度一般。

在這個場景下，我的偏好是：千問app > DeepSeek > ChatGPT

測試4：文本總結

在這個場景里，我都是把上萬字的最近段永平接受雪球CEO采訪的視頻播客的字幕發給了AI，然后讓他們幫我總結其中段永平對AI的觀點。

讓我比較意外的是，這三個產品都能無壓力吞下幾萬字的輸入，而且確實都總結到了關鍵點。不過，對于一個總結來說，我希望內容是既有深度，又有原文引用，去說明為何有這樣的結論的，細節是什么。

從這個視角來說，DeepSeek總結的結果太簡單了，只有結論沒有引用。千問做的好了不少，直接引用了不少段永平在視頻播客中的原文表述，比如「至少要慘和一下，不要miss掉」「買股票就是買公司」「阿貓阿狗都跟著漲」，從這些細節可以去生動理解段永平的結論。

而ChatGPT則是在這個問題上做了更深度思考，把不同片段中內容的觀點綜合了起來，所以結論在引用原文的前提下有了更深度的探討。

在這個場景下，我的偏好是：ChatGPT > 千問app > DeepSeek

所以，上面四項測試里，千問app有兩次第一，一次并列第一，一次第二，稱之為中國的ChatGPT并不過分。

這不是終點，是起點

所以，千問的出現，意味著什么？

1. 中國AI從追趕到并跑

技術上，Qwen3-Max全球第三，和GPT、Claude在同一梯隊。生態上，17萬衍生模型，甚至超過了Meta的Llama。

過去，我們跟著美國跑，模型晚一年，能力差一截。現在，我們和美國同步，甚至某些方面領先。

2. AI平權時代到來

ChatGPT Plus $20/月，不便宜。千問完全免費，功能全開，國內直接訪問。

人人可用，門檻夠低。

3. 應用落地加速

阿里的商業場景豐富：淘寶、天貓、釘釘、高德、夸克。大膽設想千問有機會可以打通這些產品，真正成為"AI助理"。

想象一下：你在釘釘開會，千問自動生成會議紀要。你在淘寶購物，千問幫你分析哪個商品性價比最高。你在高德導航，千問提醒你路上有什么好吃的。

這些場景，ChatGPT做不到。因為它只是一個產品，千問背后是一個生態。

中國的ChatGPT，不是夢想，而是現實。這不是終點，是起點。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

AI進化論花生

AI博主，AppStore付費榜第一的小貓補光燈app開發者

142文章數 64關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

數碼

本地

時尚

公開課

手機 / 數碼

房產 / 家居

橫掃硅谷的千問，殺回國內了

智譜上市1月漲5倍，市值超越京東、快手

在貝加爾湖遇難的3名中國游客身份已確認：系一家人

在貝加爾湖遇難的3名中國游客身份已確認：系一家人

冬奧第一"海王"？一人和13國選手都有關系

鏢人反超驚蟄無聲拿下單日票房第二！

一覺醒來，世界大變，特朗普改新打法了

態度原創

史洪生油畫作品

NVIDIA新卡皇RTX 5090 Ti再曝光：功耗直飆超700W！性能提升10%

春花齊放2026：《駿馬奔騰迎新歲》

2026紐約秋冬時裝周，在春天開啟美的新故事！