![]()
剛剛過去的 2025 年,可以說是 Agent 爆發(fā)的一年。
特別是各種能自主「執(zhí)行任務(wù)」的 Agent,甚至能夠模仿人類操作手機(jī),只是驚艷之余,Agent 實(shí)際能完成的事情仍然有限。
背后的原因,除了模型能力尚待提升,更難以逾越的是現(xiàn)實(shí)中那一道道封閉的 App 壁壘:由于不同生態(tài)間相對獨(dú)立、數(shù)據(jù)互不相通,AI 即使聽得懂指令,也無法實(shí)際拉取服務(wù),甚至還會被 App 提供方封禁。
面對這種「有心無力」的行業(yè)困境,阿里破局的嘗試很巧妙——從自己的生態(tài)做起。
今天千問 App 大更新,一口氣上線400多項(xiàng)新功能,集成了阿里系豐富的服務(wù)生態(tài),走出了一條不一樣的 Agent 路線。
![]()
憑借這個(gè)覆蓋衣食住行的阿里生態(tài),千問成為了世界上第一個(gè)能調(diào)用多種生活服務(wù),真正把下單鍵搬到對話框的 AI 助手。
重走《長安的荔枝》路,千問把小紅書不存在的攻略給我做了出來
千問辦事的一個(gè)核心功能是「任務(wù)助理」,能夠處理更復(fù)雜的信息,也能真正執(zhí)行一些任務(wù)。
比如說,定制一條獨(dú)一無二的旅游線路。
普通的旅游攻略,上小紅書找找就有,但我這人就偏不想走尋常路。我是個(gè)狂熱影迷,之前看了《長安的荔枝》后,就特別想走一走李善德那條從廣州到西安「荔枝道」。
![]()
▲ 圖源:知乎@地圖書
這次我就給千問「辦事」上點(diǎn)難度,看能不能滿足我這個(gè)小眾的旅行需求。
這條路線的規(guī)劃難度極高,首先古「荔枝道」至少有四條,全長超 1600 公里,不僅要篩選出最具觀賞性的路段,還要在短短 7 天內(nèi)搞定沿途復(fù)雜的交通和住宿。
![]()
這種需求擱在以前,即便你是資深驢友,也得在幾個(gè) App 之間反復(fù)橫跳,耗費(fèi)幾天才能理清頭緒。
但千問只用了不到 5 分鐘,就把整個(gè)路線和行程安排交付到我手上:從廣州出發(fā),經(jīng)江西,直抵陜西,這剛好就是小說中主角最終選擇的路線。
![]()
千問選擇的景點(diǎn)還頗具品味,兼具人文和自然風(fēng)光:江西選擇了梅關(guān)古道和井岡山這樣的著名風(fēng)景區(qū)、陜西則聚焦在華清宮、永慶坊這些唐代古址,緊扣「長安的荔枝」主題。
![]()
但這還不是千問最「殺手級」的體驗(yàn)。
路線安排只是基礎(chǔ),它規(guī)劃行程的同時(shí),還能直接把「手」伸進(jìn)了飛豬和高德的后臺,將景點(diǎn)、交通、酒店的預(yù)訂信息一并附上,坐哪趟火車,訂哪家酒店,全部仔仔細(xì)細(xì)安排明白。
![]()
它甩給你的不再是冷冰冰的文字建議,而是真正的飛豬和高德地圖服務(wù),點(diǎn)開就能看到詳情,全部等著用戶下單。
這也是千問這個(gè)新形態(tài)給我印象最深的地方——直接聯(lián)動阿里的各種服務(wù),不僅是超級「大腦」,還長出「手腳」,幫用戶把事情辦了。
以往,想要自己定制一條旅游線路,用戶不可避免往返平臺做攻略和預(yù)訂,消耗不少時(shí)間精力,現(xiàn)在一句話,千問就能幫你把事情安排妥當(dāng),用戶唯一要做的事情,就是最后的付款。
![]()
除了飛豬和高德,千問辦事還集成了淘寶、閃購和支付寶。
「點(diǎn)外賣」已經(jīng)成了 Agent 能力的練兵場,對于千問來說自然不再話下。我直接給它上強(qiáng)度:
幫我買 100 杯咖啡,要 30 杯冰美式,30 杯生椰拿鐵,20 杯拿鐵、20 杯橙 C 美式,全部要冰的。
即便是人類,點(diǎn) 100 杯不同種類的咖啡,也免不了一番繁瑣操作,而且因?yàn)辄c(diǎn)單數(shù)量限制,還得在不同店鋪間來回下單。
和旅游攻略一樣,千問的「任務(wù)助理」只需 3 分鐘,就能把所有需要的商品「加購物車」,只待用戶下單付款。
![]()
比起單純點(diǎn)外賣,讓 AI 幫我們比價(jià)、選購的網(wǎng)購能力,更符合用戶期待,也成為 AI Agent 的必爭之地。
![]()
▲ ChatGPT 與 Etsy 的集成
像買電視這樣選擇繁多、需要在各個(gè)平臺反復(fù)比對,且需求因人而異的購物場景,非常適合交給千問來處理。
![]()
只要明確大致的預(yù)期,千問就能直接附上兩三張具體的淘寶商品卡片,佐以詳盡的推薦理由,消費(fèi)決策的難度一下子變得很低。
它可不是從浩如煙海的電視型號中隨機(jī)抽出幾個(gè)敷衍了事,而是根據(jù)電視的核心參數(shù),以及不同的場景需要進(jìn)行甄選。我還專門用一樣的需求反復(fù)測試,千問每次的推薦產(chǎn)品和理由都基本一致。
作為一位長期關(guān)注電子產(chǎn)品的科技編輯,我認(rèn)為千問給出的選購建議相當(dāng)靠譜。
提到阿里系平臺,自然繞不開支付寶。
作為一個(gè)整合了豐富生活與民生服務(wù)的平臺,支付寶的加入讓千問能夠處理 50 多項(xiàng)政務(wù)事務(wù),實(shí)現(xiàn)真正的「一站式辦事」能力。
可以這么說,千問或許是世界上唯一一個(gè)能直接將公積金提取入口帶到你面前的 AI 機(jī)器人。
要讓這些能力真正落地,千問 AI 的智能理解與阿里生態(tài)的豐富服務(wù)缺一不可:前者提供「大腦」,后者提供「手腳」。
過去三年,盡管各家 AI 在「大腦」能力上不斷升級,但實(shí)際落地場景依然有限。要實(shí)現(xiàn)真正突破,AI 必須長出「手腳」,能夠親自動手辦事。
憑借 20 多年的互聯(lián)網(wǎng)生態(tài)積累,以及自研強(qiáng)大模型的加持,阿里無疑最適合邁出這關(guān)鍵的一步。
AI 的「辦事」時(shí)代來了
體驗(yàn)完千問的這次更新,我發(fā)現(xiàn) AI 真的開始接管現(xiàn)實(shí)世界的「辦事權(quán)」了。
在千問推出「辦事」功能之前,行業(yè)對 AI Agent 辦事能力的探索主要走了兩條路線:一是「模擬用戶」,二是「開放接口」。但這兩種模式都有很多限制,無法讓 AI 絲滑給用戶提供服務(wù)。
在這兩種模式都陷入僵局時(shí),阿里千問走出了第三條路:直接把服務(wù),做進(jìn) Agent 里。
我在使用過程中,能清晰感知到這種「原生」帶來的質(zhì)感差異。
它生成的不是干巴巴的跳轉(zhuǎn)鏈接,而是功能完備的服務(wù)卡片。這種體驗(yàn),就像在飛豬里看酒店、在淘寶里看購物車一樣自然流暢。
![]()
并且,大部分生成的結(jié)果,都是用戶可以直接用支付寶下單,點(diǎn)一杯奶茶最快只需要 30 秒。
更重要的是,這在很大程度上規(guī)避了隱私雷區(qū)。因?yàn)閺念^到尾,數(shù)據(jù)都只在阿里這一套賬號體系內(nèi)流轉(zhuǎn),沒有流出第一方,這種安全感是第三方插件無法給予的。
我認(rèn)為,千問辦事目前展現(xiàn)的能力,還只是冰山一角,隨著服務(wù)集成進(jìn)一步深入,還會釋放出更多潛力。
如果把視角拉大到全球科技版圖,你會發(fā)現(xiàn)千問的這次搶跑,實(shí)則踩準(zhǔn)了一個(gè)全球科技公司都在角逐的關(guān)鍵節(jié)點(diǎn):AI 電商(Agent Commerce)。
就在四天前,大洋彼岸的 Google 剛剛宣布與沃爾瑪?shù)攘闶凵踢_(dá)成 AI 購物合作,試圖通過 UCP 協(xié)議組建一個(gè)「開放聯(lián)盟」。而現(xiàn)在,阿里已經(jīng)憑借千問后來居上,成為了全球首個(gè)實(shí)現(xiàn)多品類、全鏈路 AI 購物的科技公司。
這并非偶然,背后是兩種不同技術(shù)路線的必然結(jié)果。
與 Google 試圖連接外部松散盟友的模式不同,千問展現(xiàn)的是一種極致的「垂直整合」能力:底層是千問大模型作為大腦,上層則直接打通了淘寶的商品庫、支付寶的支付體系以及高德餓了么的履約網(wǎng)絡(luò)。
正是這種「模型+生態(tài)」的深度協(xié)同,讓阿里率先解決了 AI Agent 落地中最棘手的兩個(gè)難題——「決策信任」與「支付斷點(diǎn)」。
當(dāng)其他 AI 還在通過跳轉(zhuǎn)外部鏈接來規(guī)避責(zé)任時(shí),千問已經(jīng)在一個(gè) App 內(nèi)閉環(huán)完成了從搜索、決策到支付、履約的全過程。
這一賽道的擁擠程度,足以證明其價(jià)值。OpenAI 不久前推出了「即時(shí)結(jié)賬」,Perplexity 宣布聯(lián)手 PayPal,微軟也在對話中嵌入購物推薦。麥肯錫更是預(yù)測,在智能體商業(yè)的推動下,2030 年全球零售市場的潛在增量將達(dá)到 3 萬億至 5 萬億美元。
在這場萬億級的競爭中,阿里利用自身獨(dú)有的生態(tài)壁壘,搶先完成了「搜索-決策-支付-履約」的完整拼圖,在將 AI 轉(zhuǎn)化為實(shí)際消費(fèi)力的道路上,拿到了第一張入場券。
更令人興奮的,是這種「全鏈路打通」背后的可能性。
![]()
從鼠標(biāo)點(diǎn)擊(Click)到手指觸控(Touch),再到如今以千問為代表的 AI ,我們正站在第三次人機(jī)交互改革新的十字路口。
LUI(語言用戶界面)正在取代 GUI(圖形用戶界面),語言已然在成為新的操作系統(tǒng),從這個(gè)角度看來,千問不再是一個(gè)單純的 APP,更有可能成為某種系統(tǒng)級的存在。
還記得,喬布斯在 2007 年發(fā)布第一代 iPhone 時(shí),他演示了用 Google Map 定位星巴克并撥打電話訂咖啡——那是一個(gè)時(shí)代的開端。
而今天,我們只需要對千問說一句話,就能在半小時(shí)后真實(shí)收到 500 杯包含復(fù)雜需求的奶茶。這就是 AI 真正長出「手腳」、打破 App 孤島的開端。
試想一下,當(dāng) AI 真正擁有了跨應(yīng)用的數(shù)據(jù)視野,它能做的事情將遠(yuǎn)超「買東西」的范疇:
它或許能根據(jù)你在淘票票的觀影歷史,結(jié)合豆瓣評分,從上萬部新片中精準(zhǔn)篩選出你最可能喜歡的電影;
它或許能根據(jù)你在淘寶購買的教輔資料,自動規(guī)劃學(xué)習(xí)路徑,甚至聯(lián)動夸克整理出錯(cuò)題集。
![]()
這并非憑空畫餅,而是基于「生態(tài)數(shù)據(jù)打通」這一技術(shù)邏輯的合理推演。此前,不管是比爾 · 蓋茨還是馬斯克,都曾預(yù)言 AI 將終結(jié) App 時(shí)代。
當(dāng) AI 不再被一個(gè)個(gè) App 的圍墻阻隔,當(dāng)數(shù)據(jù)開始在生態(tài)內(nèi)自由流動,我們得到的將不再是一個(gè)冰冷的工具,而是一個(gè)真正懂你、能幫你在這個(gè)信息過載的世界里高效「辦事」的數(shù)字分身。
這,或許才是 AI「辦事時(shí)代」真正的終局。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.