![]()
![]()
文|鄭亦久
十二月的第一天,字節(jié)跳動(dòng)旗下的豆包突然推出的手機(jī)助手測(cè)試版,瞬間成為焦點(diǎn)。
它并不是單純豆包AI的升級(jí)版,而是一套試圖改變手機(jī)使用方式的系統(tǒng)級(jí)AI。它讓模型能夠像“人”一樣刷手機(jī),從而以一種更高維度的方式接管用戶的意圖。
![]()
豆包手機(jī)助手演示視頻
這種技術(shù)方向本身無(wú)疑是明確的,在移動(dòng)端逐漸進(jìn)入AI原生時(shí)代的當(dāng)下,系統(tǒng)層面的會(huì)從傳統(tǒng)的點(diǎn)按界面,逐漸轉(zhuǎn)向自然語(yǔ)言理解與高度自動(dòng)化執(zhí)行。
然而,當(dāng)這套看似未來(lái)感十足的路線真正落地時(shí),一個(gè)不難發(fā)現(xiàn)的結(jié)構(gòu)性障礙也隨之暴露出來(lái)——國(guó)產(chǎn)手機(jī)系統(tǒng)和軟件生態(tài)深度權(quán)限遠(yuǎn)比想象中更難觸達(dá),而豆包的愿景又高度依賴這種軟硬件的權(quán)限自由。
從這個(gè)角度來(lái)看,豆包最終可能被國(guó)內(nèi)復(fù)雜的生態(tài)結(jié)構(gòu)“推著”走向自研硬件,而不是停留在做一個(gè)助手應(yīng)用的層面。
![]()
怕玩手機(jī)累著,讓豆包來(lái)幫你“刷”
豆包手機(jī)助手在測(cè)試版中所呈現(xiàn)出的能力,明顯比市面絕大多數(shù)所謂的AI對(duì)話助手更為激進(jìn)。
它基本是一套嘗試通過(guò)底層能力完成跨應(yīng)用動(dòng)作的系統(tǒng)級(jí)協(xié)作方案。
通過(guò)理解用戶的意圖,并將這些意圖自動(dòng)拆解成一連串操作指令,再由系統(tǒng)級(jí)AI直接執(zhí)行。
如果從更宏觀的技術(shù)脈絡(luò)來(lái)看,豆包想做的,其實(shí)正是桌面端早已反復(fù)驗(yàn)證過(guò)的“代理(Agent)”模式——像是目前給出的演示,幫你電商比價(jià)、外賣下單、聊微信等等。

豆包手機(jī)助手演示視頻
當(dāng)然在PC環(huán)境中,這種代理能夠借助相對(duì)開(kāi)放的系統(tǒng)、窗口結(jié)構(gòu)與權(quán)限體系,順利完成自動(dòng)化任務(wù),從出道即巔峰的Manus,到之后ChatGPT的代理,其實(shí)目前大廠都已經(jīng)給出了穩(wěn)定方案。
但手機(jī)作為一個(gè)封閉得多的生態(tài),情況就完全不同了。
不論蘋果還是安卓作為移動(dòng)系統(tǒng)限制更強(qiáng)、應(yīng)用之間的邊界更硬、可供調(diào)用的系統(tǒng)能力也更少。
桌面端代理能夠輕松實(shí)現(xiàn)的操作,一旦移植到手機(jī)上,立刻變成一系列需要深度系統(tǒng)權(quán)限才能完成的動(dòng)作。
因此,豆包試圖在手機(jī)端復(fù)刻“全局代理”的企圖,難度實(shí)際上遠(yuǎn)高于PC端的同類產(chǎn)品。它不僅要理解用戶的意圖,更要突破手機(jī)系統(tǒng)對(duì)跨應(yīng)用操作的天然封鎖。
像是讀取微信聊天界面這種功能,一旦被騰訊盯上,視為某種程度的隱私風(fēng)險(xiǎn),那正式版是否還能使用,尚未可知。誠(chéng)如新浪科技直接報(bào)道了“傳‘豆包助手’手機(jī)微信登陸出現(xiàn)異常,涉及功能無(wú)法正常使用”便是印證。

豆包手機(jī)助手演示視頻
畢竟從目前的測(cè)試效果來(lái)看,其試圖扮演的不再是一個(gè)“語(yǔ)音助手”,而是橫跨系統(tǒng)的AI“操作系統(tǒng)”。
這確實(shí)代表了未來(lái)手機(jī)交互的方向。然而,也正是這種對(duì)底層權(quán)限的高度依賴,讓豆包在現(xiàn)實(shí)中撞上了沉重的生態(tài)壁壘。
目前國(guó)內(nèi)的頭部手機(jī)廠商幾乎都在打造某種程度上的“AI原生系統(tǒng)”。小米、華為、OPPO、vivo甚至蘋果無(wú)一例外,都通過(guò)系統(tǒng)級(jí)集成來(lái)強(qiáng)化自己的生態(tài)閉環(huán)。
在這樣的背景下,他們不可能讓一個(gè)來(lái)自外部的第三方助手直接介入底層,也不可能讓渡關(guān)鍵的權(quán)限。
和中興努比亞工程機(jī)的合作,本質(zhì)上也揭示了同樣的問(wèn)題:能夠與豆包深度合作的廠商,往往是生態(tài)規(guī)模有限的品牌,而真正具備影響力的頭部廠商,出于商業(yè)邏輯的天然對(duì)立,不可能放開(kāi)權(quán)限。
![]()
圖源:中興商城
因此,豆包現(xiàn)在處在一個(gè)尷尬的位置。一方面,它描繪的愿景合理且前沿;另一方面,它能否觸達(dá)這個(gè)愿景,卻并不取決于自身的技術(shù),而取決于系統(tǒng)權(quán)限是否能被開(kāi)放。
![]()
當(dāng)被卡住脖子,“豆包手機(jī)”成唯一出路
當(dāng)豆包選擇做這樣一款高度依賴系統(tǒng)級(jí)權(quán)限的助手時(shí),它實(shí)際上已經(jīng)接受了一個(gè)隱含前提:如果未來(lái)要讓這套能力成為真正的“標(biāo)準(zhǔn)體驗(yàn)”,它必須能直達(dá)軟硬件生態(tài)的核心。
而能操作的方式只有兩種:說(shuō)服一家頭部廠商開(kāi)放系統(tǒng)權(quán)限,或者自己做能完全掌控的硬件。
第一條路幾乎沒(méi)有現(xiàn)實(shí)可能。所有頭部廠商都在打造自己所謂的AI OS,它們不會(huì)允許一個(gè)外部助手成為系統(tǒng)級(jí)入口。
![]()
AIOS架構(gòu)
這意味著豆包不可能依靠現(xiàn)有廠商提供的底層權(quán)限來(lái)構(gòu)建自己的核心能力。事實(shí)上大概任何AI廠商都很難指望依靠第三方的硬件來(lái)實(shí)現(xiàn)自己的全部需求與野心。
Meta依托的是眼鏡,而阿里最近也推出了夸克AI眼鏡,其實(shí)多少也是在考慮尋求一個(gè)獨(dú)立的硬件入口。
這種趨勢(shì)在全球范圍內(nèi)正在發(fā)生。無(wú)論是OpenAI的輕量設(shè)備路線,還是Google對(duì)Pixel系列的深度整合,本質(zhì)都指向同一個(gè)方向:下一代AI智能硬件的核心不再是UI,而是AI邏輯。
![]()
Pixel 10的AI個(gè)人總結(jié)功能
在這個(gè)前提下,豆包要么成為別人系統(tǒng)的一部分,要么必須擁有自己的設(shè)備,并控制從硬件到OS的全鏈路。
對(duì)于豆包而言,問(wèn)題大概不是要不要造硬件,而是不造硬件就無(wú)法實(shí)現(xiàn)愿景。事實(shí)上傳言字節(jié)開(kāi)發(fā)智能眼鏡的消息由來(lái)已久,而收購(gòu)多時(shí)的錘子硬件團(tuán)隊(duì)顯然并不會(huì)完全閑著。
可以說(shuō)在現(xiàn)有的產(chǎn)業(yè)格局下,這種“操作層”只有依附在它自己能掌控的硬件上,才有機(jī)會(huì)被完整實(shí)現(xiàn)。
豆包在發(fā)布手機(jī)助手時(shí)專門強(qiáng)調(diào)“不造手機(jī)”,但從技術(shù)方向、生態(tài)沖突到權(quán)限結(jié)構(gòu),未來(lái)打臉自己幾乎是必然會(huì)發(fā)生的事。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.