![]()
“3499元的豆包手機(jī)能做的事,現(xiàn)在你的安卓機(jī)也能免費(fèi)玩了。”
就在我們剛剛評(píng)測(cè)完豆包手機(jī)的系統(tǒng)級(jí)AI Agent不久,一個(gè)重磅消息就炸開(kāi)了科技圈——智譜AI直接把Open-AutoGLM開(kāi)源了。這意味著什么?那種"AI幫你操作手機(jī)"的黑科技,不再是旗艦機(jī)的專(zhuān)屬特權(quán),任何一臺(tái)普通安卓手機(jī)都有可能化身AI超級(jí)助手。
聽(tīng)起來(lái)很炸裂對(duì)吧?但先別急著興奮,這背后的故事遠(yuǎn)比你想象的復(fù)雜。
評(píng)測(cè)機(jī)構(gòu):至頂AI實(shí)驗(yàn)室
測(cè)評(píng)時(shí)間:2025年12月16日
評(píng)測(cè)產(chǎn)品:智譜AI Open-AutoGLM
主要參數(shù):基于9B參數(shù)規(guī)模的大語(yǔ)言模型;集成OCR技術(shù),實(shí)現(xiàn)屏幕內(nèi)容的精準(zhǔn)識(shí)別;通過(guò)ADB調(diào)試橋接,模擬觸摸、滑動(dòng)等人機(jī)交互;無(wú)需APP適配,理論上可操作任何安卓應(yīng)用
評(píng)測(cè)主題:智譜AI Open-AutoGLM部署評(píng)測(cè)
Open-AutoGLM:給安卓機(jī)裝上的"超級(jí)外掛"
Open-AutoGLM本質(zhì)上是一個(gè)面向智能手機(jī)的系統(tǒng)級(jí)AI Agent解決方案。與豆包手機(jī)內(nèi)置的Agent不同,它采用了完全開(kāi)源的策略,讓普通開(kāi)發(fā)者也能在自己的設(shè)備上部署類(lèi)似的能力。
從技術(shù)架構(gòu)來(lái)看,Open-AutoGLM的核心配置包括:
基礎(chǔ)模型:基于9B參數(shù)規(guī)模的大語(yǔ)言模型
視覺(jué)識(shí)別:集成OCR技術(shù),實(shí)現(xiàn)屏幕內(nèi)容的精準(zhǔn)識(shí)別
操作模擬:通過(guò)ADB調(diào)試橋接,模擬觸摸、滑動(dòng)等人機(jī)交互
跨應(yīng)用調(diào)度:無(wú)需APP適配,理論上可操作任何安卓應(yīng)用
簡(jiǎn)單來(lái)說(shuō),它能像真人一樣看懂屏幕、理解指令,然后自己去點(diǎn)擊、滑動(dòng),完成你交代的任務(wù)。從下單外賣(mài)到查詢信息,從設(shè)置鬧鐘到回復(fù)消息,只要你說(shuō)得出,它就能做得到。
評(píng)測(cè):理想很豐滿,現(xiàn)實(shí)有骨感 部署門(mén)檻:不是普通用戶能玩的
在實(shí)際體驗(yàn)中,我們發(fā)現(xiàn)Open-AutoGLM的使用門(mén)檻相當(dāng)高。整個(gè)部署流程需要:
開(kāi)啟手機(jī)開(kāi)發(fā)者模式
配置ADB調(diào)試環(huán)境
本地部署9B大模型
調(diào)試各類(lèi)權(quán)限和參數(shù)
這一套流程下來(lái),基本上把普通用戶拒之門(mén)外。你需要有一定的技術(shù)背景,熟悉命令行操作,還得有臺(tái)性能不錯(cuò)的設(shè)備來(lái)跑模型。智譜這次的開(kāi)源,與其說(shuō)是面向大眾的產(chǎn)品,不如說(shuō)是向技術(shù)社區(qū)秀了一把肌肉。
功能表現(xiàn):能做到,但有限制
在成功部署后,Open-AutoGLM在基礎(chǔ)任務(wù)上的表現(xiàn)確實(shí)令人眼前一亮。它能夠:
準(zhǔn)確識(shí)別屏幕UI元素
理解自然語(yǔ)言的復(fù)雜指令
跨應(yīng)用完成連貫操作
自主判斷并修正操作錯(cuò)誤
然而,真正的問(wèn)題出現(xiàn)在與主流APP的交互上。
致命死結(jié):APP廠商的圍剿
這才是整個(gè)評(píng)測(cè)中最核心的發(fā)現(xiàn)——Open-AutoGLM和豆包手機(jī)面臨著同一個(gè)無(wú)解的困境:AI Agent與APP廠商之間不可調(diào)和的矛盾。
當(dāng)AI Agent嘗試操作微信、支付寶、淘寶等超級(jí)APP時(shí),系統(tǒng)幾乎必然會(huì)觸發(fā)"環(huán)境異常"或"登錄異常"警告。這不是技術(shù)問(wèn)題,而是商業(yè)邏輯的沖突:
數(shù)據(jù)安全顧慮:APP廠商擔(dān)心用戶數(shù)據(jù)被第三方AI獲取
體驗(yàn)控制權(quán):廠商希望掌控用戶在自家APP內(nèi)的完整體驗(yàn)
商業(yè)模式威脅:AI Agent可能繞過(guò)廣告、推薦等核心變現(xiàn)環(huán)節(jié)
結(jié)果就是,這些占據(jù)用戶80%使用時(shí)長(zhǎng)的超級(jí)APP,恰恰是AI Agent最難施展的地方。
結(jié)論:技術(shù)突破不等于生態(tài)成功
Open-AutoGLM的開(kāi)源無(wú)疑具有里程碑意義。它證明了:
AI Agent不再是硬件專(zhuān)屬,技術(shù)本身已經(jīng)足夠成熟。
但它同時(shí)也暴露了一個(gè)殘酷的現(xiàn)實(shí):
AI手機(jī)的進(jìn)化,光靠技術(shù)突破遠(yuǎn)遠(yuǎn)不夠。
系統(tǒng)級(jí)AI Agent的未來(lái),不取決于模型有多強(qiáng)、識(shí)別有多準(zhǔn)、操作有多流暢,而取決于超級(jí)Agent和超級(jí)APP之間能否找到一個(gè)和平共處的商業(yè)模式。在這個(gè)問(wèn)題解決之前,無(wú)論是官方的豆包手機(jī),還是開(kāi)源的Open-AutoGLM,都只能在技術(shù)圈子里自嗨,難以真正走進(jìn)千家萬(wàn)戶。
或許,真正的破局點(diǎn)在于建立一套標(biāo)準(zhǔn)化的AI Agent接入?yún)f(xié)議,讓APP廠商、手機(jī)廠商、AI服務(wù)商三方都能從中獲益。只有這樣,我們才能真正迎來(lái)那個(gè)"AI替你操作一切"的未來(lái)。
而在那之前,Open-AutoGLM更像是一個(gè)技術(shù)演示——它告訴我們未來(lái)可以是什么樣,但也提醒我們,距離那個(gè)未來(lái),我們還有很長(zhǎng)的路要走。
你覺(jué)得AI手機(jī)的未來(lái)該怎么走?超級(jí)Agent和超級(jí)APP之間的矛盾該如何化解?歡迎在評(píng)論區(qū)分享你的看法。
至頂AI實(shí)驗(yàn)室
,贊68
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.