![]()
文:王智遠 | ID:Z201440
月中,手里攢了 46 張發票要處理。
說出來挺諷刺的,這輪實打實的「壓力測試」里,大部分模型都直接「翻車」。要么,數錯張數,要么算錯總額,唯獨千問再幾輪撮合下,找出了幾張重復的,給出了結果。
這里沒有任何吹捧意思,你要不信,隨手找四五十張碎票丟進去試試,就知道了。
所以,看著結果,我就在思考,這像一個悖論:我們能讓 AI 寫論文、解奧數,卻搞不定 46 張發票的清點,AGI 卷了兩年,居然還卡在「職場入門級任務」的門檻上?
01
用反常識思維看下,不難找到答案。
過去兩年,大家沉迷于調教 Prompt,試圖讓 AI 寫出一首像樣的現代詩,或者編一段不出錯的代碼。
但這背后藏著一個極大的諷刺:我們跟 AI 聊得越久,反而覺得越累。這種現狀可以用一個詞來形容:「無效溝通」。
大模型只停留在對話框里,充其量是個只會「畫餅」和「接梗」的虛擬實習生;為了讓它整理個報表,你得先寫 500 字指令,最后還得花半小時人工核對。
這算生產力革命嗎?開什么玩笑。真實職場里,交付結果,比沒完沒了的推理重要得多。
那為什么AI以前接不動呢?模型不夠大?
其實,真實場景里全是「臟數據」;你想想,你手里的文檔是不是總有好幾個版本待校正?表格是不是經常「缺個胳膊少個腿」?這種雜亂,靠「聊」是沒用的。
那靠什么?
一個叫「全模態理解」,另一個叫「自主調度 Agent」。
怎么理解它們的關系呢?舉個例子:現在,你隨手拍個表格,不管單元格怎么缺漏,千問能「一眼」分清噪音,準確讀取核心信息;這就是全模態的「視力」。
而自主調度 Agent 則是「資深項目經理」;會自動規劃工作流,到底是先幫用戶核對文檔的最新版本,還是先補全表格的邏輯漏洞?
阿里集團副總裁吳嘉在發布會現場說了一句話,我特別認可:Coding、全模態、超長上下文,共同構成了這個「清掃黑洞」的底座。
沒錯。
以前 AI 是 Copilot(副駕駛),它聽你指揮,但得盯著它別撞墻,臟活累活還是你在干;現在的千問任務助理 1.0 做能自主行動、交付結果的「辦事員」。
正如那 46 張發票證明的,一個能識別「冗余」并主動糾錯的 AI,才真正具備了從對話框走出來,坐上「主駕駛」的資格。
說到底,做產品是一種思維的改變。AI 的調情期徹底結束了,接下來,拼誰能把充滿「臟數據」的職場地板,拖得更干凈。
02
就算把工作上的臟活累活都收拾干凈,它頂多算個靠譜的工作搭子那 AI 有沒有可能更進一步,變成你的生活搭子?
比如幫你點杯咖啡?或者幫你找個最優解打車?
當然能。
你看看中美兩家巨頭的玩法就知道了,雖然都喊著「能做到」,但「怎么做」的門道,完全不是一回事。因為中美幾家 AI 巨頭,都在琢磨:怎么讓支付前的冗余動作變輕松。
2026 年初,谷歌推出了UCP(通用商業協議),拉上沃爾瑪、Shopify 搞「一鍵結賬」。
聽著挺美,你細琢磨琢磨:谷歌走的是「翻譯官」路線,它想靠一套協議,把外部巨頭的貨架全連起來。
這本質上是一種「弱連接」。
Gemini 還在忙著跟沃爾瑪「對口令」,核對協議版本對不對時,這種「外交路線」放在復雜的中國商業環境里,可能連杯奶茶都點不順溜。
為啥會這樣?我想到一個詞,叫 「商業主權」。咱們得先想明白,谷歌 UCP 協議的核心定位,是「水電煤」。
它想定義 AI 代理和商業系統對話的「母語」,把購物入口拆得七零八落,試圖在每個搜索框、每段視頻下面,都塞一個收銀臺,畢竟,Google做流量生意。
但這就繞不開一個悖論:谷歌拿到了流量分發權,卻拿不到交易的「終審權」。
下一單外賣,庫存對不上、地址選錯、或者配送費有爭議,Gemini 作為一個「外人」,很難在協議層把細碎的麻煩解決掉。
說白了,它在做連接,而非接管;那什么才叫真正的「接管」?舉個最接地氣的例子。
千問、千問:幫我點杯霸王茶姬,三分糖,多冰。好,等我說完這句話,它直接在對話框里,把所有動作全搞定了;最后調用淘寶閃購的底層接口,我只需要點一下確認,就完事了。
這才叫接管,AI 成了你的「內部代理」。
它根本不用去求什么外部協議,因為它本身長在阿里的生態叢林里。明白這些,你就懂了:谷歌的 UCP 協議,是搞「外交」;外交講究跨界合作,哪怕聊得再熱乎,中間始終隔著一層防御和協議。
而千問走「內政」路線,先把淘寶、飛豬、支付寶這些「兄弟單位」的底層邏輯,全焊死在一塊兒,搞定內部,外部只是時間問題。
阿里集團副總裁吳嘉在現場,說了一個很關鍵的點:
APP 時代的邏輯,可能真的要變了。怎么變?吳嘉給新邏輯下了定義:APP 正在從「目的地」,退化成「零件庫」。
千問接管了你的需求,會直接鉆進淘寶、高德的后臺,把需要的服務拎出來,就像從工具箱里拿零件一樣;你根本不用管中間過程,等著收咖啡、機票、叫車就行。
所以,智遠認為,阿里這波操作,把 AI 購物,從「信息檢索」的階段,直接推向了「結果交付」的新階段。
03
既然要交付「結果」,你敢不敢百分之百信任這個結果?
信任到底是什么?文明社會里,信任就是一套「契約與背書」。你去銀行存錢,靠金融監管體系給你兜底。不然,滿大街都是搶錢的,你敢把錢存進去嗎?
職場里,它叫 「確定性」。老板把任務交給你,信任你能交出靠譜、不出錯的東西。
要是我交的財務報表數字錯了,不管平時多聰明,這份信任都會打折扣。老板大概率會皺著眉說:小王,你怎么這么馬虎?
AI 圈現在就卡在這道坎上。
硅谷火得不行的 Chat GPT 5.2,邏輯推理強到能解奧數題,那叫一個「神性」;但商業世界不認神,只認會算。
你琢磨琢磨:
要是把 46 張發票扔給一個只會「推理」的模型,它可能因為某張發票背景模糊,就給我算錯兩百塊;對大模型來說,這只是 1% 的概率誤差;但對我來說,是報銷被財務打回,甚至可能引來審計風險。
所以,AI 交付結果賽道上,聰明能加分,靠譜才是入場券。
我一直在想,為什么千問敢在后臺配一個「數字審計員」?它憑什么覺得自己能搞定這種職場級別的信任?
秘訣就在于:它除了卷聰明,還卷「流程」;我打聽了一下,千問的 AI 助理背后,搭了一套「交叉檢點機制」(Cross-Check)。相當于直接帶了一個「審計班組」進場干活。
這話怎么理解?我還是拿處理 46 張發票的過程舉例:
它在后臺會同時啟動好幾個獨立的 Agent:一個專門負責視覺提取信息,一個盯著邏輯對賬,還有一個專找漏洞挑毛病。
當這幾方的數據完全「鎖死」、能互相印證時,它才敢把最終結果交給我。這就是,為什么只有它能揪出那張被重復下載的發票, 因為它在「審」賬。
當然,AI 也會犯錯。
不過千,問產品團隊早想到了這一點:遇到模糊不清的情況,它會直接告訴你「這幾個地方我有疑慮,建議你最后確認一下」。
這叫 「職業操守」。把「終審權」交還給人,同時附上最詳盡的證據鏈。這種「信任閉環」,難道不算大模型真正能闖進財務、法務、商務這些嚴肅場景的底牌嗎?
但在我看來,一個 AI 要是只做到「準」和「穩」,那它終究只是一臺冷冰冰的精密儀器。
當我們把目光從那些嚴謹的報表、繁瑣的審計流程上移開,落回最瑣碎的日常里,你會發現一個更有意思的命題:
一個會辦事的 AI,想要把事情「辦好看」,到底需不需要帶點「人味」?
我們為啥要費勁教 AI 訂奶茶、打車,甚至幫我們「代打電話」?難道就為了省下點開 APP 的那幾秒鐘?當然不是。這背后藏著的,是 AI 對人類「真實意圖」的深層理解。
是一道非黑即白的數學題啊?全是細碎的偏好和微妙的情緒。
只會機械執行指令的,那叫機器;但能記住你喝奶茶永遠「三分糖、多冰」,能摸清你打車愛坐后排的習慣,甚至能聽懂「伯牙絕弦」里那點社交默契的 AI,才算得上真正的「代理人」。
這種對「人味」的捕捉,本質上是技術在跨越冰冷的數字鴻溝,努力向人的體溫靠攏。
04
發布會現場有個例子,我看完特別觸動:這是關于 「平權的溫度」 的故事。
很多偏遠山區的學校,一個老師往往要帶好幾個年級;他們不光要教語文數學,還得應付孩子們那些天馬行空、連成年人都答不上來的提問。
以前資源有限,老師們只能無奈回一句「等你們長大了就懂了」,或者給個模棱兩可的答案;但我看到一位鄉村教師,把千問的辦事能力用活了,直接把它變成了自己的「超級助教」
當孩子歪著腦袋問「星星為什么會眨眼」,或者「伯牙和鐘子期到底在彈什么曲子」時,這個 AI 展現出的,是一種特別細膩的「人味」。
它會用孩子們聽得懂的話,帶著點講故事的語氣去互動、去啟發。
那一刻我突然明白,計算的終點,是「人」的起點。
在大城市里,千問幫我們算發票、訂機票,叫「優化生產力」,是幫我們從瑣事里抽身;可對山區的孩子來說,這個會辦事的 AI,就是他們通往廣闊世界的唯一「數字階梯」
它抹平的不只是資源的鴻溝,更是讓平凡的好奇心,能得到一份體面的反饋。
這種「體面」,是讓山里的孩子,也能享受到全球最頂尖的知識交付;是讓每一個稚嫩的「為什么」,都不再石沉大海。
也正因為這樣,我才讀懂了阿里云那句經典的 slogan:
Creating value beyond computing(計算,是為了那些「無法計算」的價值)。
什么是無法計算的價值?
AI 幫我處理完那 46 張發票后,我能心安理得躺在床上追劇,奪回的那一點點自由;我出差路上手忙腳亂時,AI 默默搞定所有復雜行程,遞給我的那份掌控感;
更是山里的孩子,在 AI 的溫柔引導下,第一次對星辰大海,生出的那份真切、具體的向往。
這些省下的時間、彌合的鴻溝、被妥帖照顧的情緒,才是技術在這個冰冷的時代里,寫給人類最深情的告白。
大模型卷了三年,終于從模仿上帝的「神性」,落回了服務人間的「人性」。
這場全球范圍的 AI 競賽,賽道早就變了。我們需要一個能蹲下身子、弄臟雙手,幫我們搞定瑣事、算清賬目,還能懂你口味的靠譜伙伴。
從今天起,衡量一個模型好不好,就一個標準:它能不能把那些「沒靈魂」的臟活,辦得既漂亮,又有溫度。
千問開年的這步內卷,實實在在,踩在了地上。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.