近期,Manus的火爆再次將AI Agent(智能體)推向了科技圈的聚光燈下。作為通用型Agent的代表,Manus展現(xiàn)了驚人的思考力。與此同時,國內(nèi)Agent領(lǐng)域的領(lǐng)軍企業(yè)——實在智能,近期也發(fā)布了一段耐人尋味的實測視頻,引發(fā)了業(yè)內(nèi)對于Agent落地路徑的深度討論。
很多業(yè)內(nèi)人士都在好奇:以Manus為代表的“云端原生派”,與以實在Agent為代表的“桌面實戰(zhàn)派”,在面對真實的中國職場業(yè)務(wù)時,究竟有何不同?
帶著這個問題,我們深入分析了實在智能官方發(fā)布的這則“跨應(yīng)用工作流”實測案例,試圖從技術(shù)邏輯層面,解析兩種Agent形態(tài)的本質(zhì)差異。
實測背景:還原真實的職場需求
實測設(shè)定了一個典型的跨平臺、長鏈條辦公場景,旨在考察Agent在復(fù)雜環(huán)境下的執(zhí)行能力。
任務(wù)指令:
“幫我分別調(diào)研一下淘寶和京東上 iPhone 17 PM 的行情,數(shù)據(jù)合并一下,清洗掉異常數(shù)據(jù),做一個數(shù)據(jù)分析,把數(shù)據(jù)分析的結(jié)果寫一個分析報告,再把這份報告寫成ppt,把分析報告釘釘發(fā)給阿寶。”
這一指令涵蓋了信息采集、數(shù)據(jù)處理、文檔生成、即時通訊四個關(guān)鍵環(huán)節(jié)。
01 理解與規(guī)劃:殊途同歸的“頂層設(shè)計”
視頻顯示,任務(wù)啟動后,兩款A(yù)gent都展現(xiàn)了基于頂尖大模型的強大意圖理解能力。
●實在Agent規(guī)劃路徑:采集淘寶/京東信息 → 清洗數(shù)據(jù) → 生成PPT → 釘釘發(fā)送給阿寶。
●Manus規(guī)劃路徑:采集淘寶/京東信息 → 清洗數(shù)據(jù) → 生成PPT → 釘釘發(fā)送給阿寶。
![]()
在規(guī)劃階段,兩者的邏輯高度一致。這說明當(dāng)前主流Agent在“大腦”層面,對于自然語言的理解和任務(wù)拆解已經(jīng)非常成熟,雙方在理論層面達成了共識。
然而,隨著任務(wù)進入執(zhí)行層,不同的運行環(huán)境決定了兩者截然不同的作業(yè)方式。
02 數(shù)據(jù)獲取:云端搜索 vs 屏幕視覺
任務(wù)的第一步是獲取電商平臺的特定商品行情。這里暴露了“云端沙盒”與“本地環(huán)境”的第一個分水嶺。
Manus的策略:側(cè)重信息檢索
由于Manus運行在云端瀏覽器環(huán)境中,它沒有用戶的本地Cookie,也無法直接操作用戶的本地瀏覽器登錄賬號。
面對電商平臺的登錄墻和反爬機制,Manus采取了更為通用的策略:它調(diào)用搜索引擎(如Google/Bing),檢索了大量關(guān)于iPhone 17 PM的新聞報道和預(yù)測文章。
![]()
●結(jié)果特征:獲取的數(shù)據(jù)更多基于全網(wǎng)資訊和媒體預(yù)測,適合做宏觀趨勢調(diào)研。
實在Agent的策略:側(cè)重業(yè)務(wù)實操
實在Agent運行在用戶的本地電腦上,擁有系統(tǒng)級權(quán)限。依托TARS大模型和ISSUT(智能屏幕語義理解)技術(shù),它能像人類員工一樣“看”懂屏幕。
視頻中,當(dāng)遇到登錄界面時,它能暫停等待用戶安全驗證(或自動處理),隨后直接進入淘寶和京東的商品詳情頁,讀取實時的價格與銷量數(shù)據(jù)。
![]()
![]()
●結(jié)果特征:獲取的是電商平臺后臺的實時交易數(shù)據(jù),所見即所得,適合做精準(zhǔn)業(yè)務(wù)分析。
03 分析與制作:旗鼓相當(dāng)?shù)摹皵?shù)字邏輯”
在數(shù)據(jù)清洗、代碼生成及PPT制作環(huán)節(jié),兩款A(yù)gent的表現(xiàn)都十分出色。
這也印證了一個行業(yè)共識:在純數(shù)字化、邏輯化的封閉任務(wù)中,AI的能力已經(jīng)趨于完善。
無論是Manus還是實在Agent,都能快速生成代碼、繪制精美圖表,并輸出可下載的PPT文件。
這一環(huán)節(jié)的差異主要源于上一環(huán)節(jié)的數(shù)據(jù)輸入——前者基于檢索數(shù)據(jù),后者基于實時數(shù)據(jù),但就處理能力而言,雙方打成平手。
![]()
![]()
04 交付環(huán)節(jié):下載轉(zhuǎn)發(fā) vs 自動發(fā)送
任務(wù)的最后一步是“通過釘釘發(fā)送給阿寶”。這一環(huán)節(jié)最能體現(xiàn)兩款產(chǎn)品在“邊界感”上的不同設(shè)計。
Manus的邊界:止步于瀏覽器
當(dāng)任務(wù)進行到最后,Manus嘗試在云端網(wǎng)頁版釘釘進行操作,但受限于云端環(huán)境與本地客戶端的隔離,它最終給出的反饋是:“我已經(jīng)為您準(zhǔn)備好了所有文件,您可以直接下載并手動發(fā)送。”
![]()
這并非能力不足,而是產(chǎn)品定位使然。
Manus作為通用型Agent,其安全邊界被嚴(yán)格限制在云端沙盒內(nèi),無法“穿透”屏幕去觸碰用戶的本地客戶端。
實在Agent的閉環(huán):打通最后一公里
而在實在Agent的演示中,我們看到了RPA(機器人流程自動化)基因的延續(xù)。
它控制鼠標(biāo)自動打開了桌面的釘釘客戶端,搜索聯(lián)系人,上傳剛才生成的PPT,并點擊發(fā)送。
![]()
這一過程無需人工介入,實現(xiàn)了從“接到指令”到“任務(wù)交付”的全流程自動化。
05 深度復(fù)盤:兩種技術(shù)路線的互補與選擇
通過這次實測對比,我們并非要分出高下,而是能清晰地看到兩種技術(shù)路線所對應(yīng)的不同應(yīng)用場景。
我們將兩者的核心差異梳理如下:
![]()
此次實測向行業(yè)展示了AI Agent發(fā)展的硬幣兩面:
一面是Manus代表的“云端大腦”,它知識淵博,適合作為人類的創(chuàng)意顧問和全網(wǎng)搜索助手;
另一面是實在Agent代表的“桌面數(shù)字員工”,它手腳麻利,更適合深入企業(yè)的具體業(yè)務(wù)流,承擔(dān)繁瑣、重復(fù)且需要跨軟件操作的工作。
對于中國企業(yè)而言,選擇哪一種Agent,取決于你希望它解決什么問題:是需要一個能寫詩作畫、整理資訊的“智囊”,還是需要一個能登錄系統(tǒng)、發(fā)報表、跑流程的“實干家”?
實在Agent用行動證明,在后者的賽道上,它已經(jīng)跑通了“所想即所見,所見即所得”的最后一公里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.