![]()
文:董指導(dǎo)
本期要點(diǎn)
大眾對(duì)AI充滿期待,但有一個(gè)趨勢(shì)是許多人并沒有意識(shí)到的:未來(lái)的電腦/手機(jī)等終端,主要使用者將不再是人類,而是Agent智能體。
開發(fā)者對(duì)AI充滿期待,但有一個(gè)狀況是許多人之前沒有想到的:開發(fā)一款Agent,并不容易。因?yàn)楫?dāng)下的開發(fā)設(shè)施、運(yùn)行環(huán)境都是為人類使用的App而設(shè)計(jì)的,并非面向Agent。
當(dāng)必然的趨勢(shì),和必然的障礙相碰撞,就得到了一個(gè)關(guān)鍵話題:所有的應(yīng)用,都值得為Agent重做一遍;而針對(duì)Agent開發(fā)的基礎(chǔ)設(shè)施(Agent Infra),則是前置條件和增長(zhǎng)藍(lán)海。
在2025 WAIC大會(huì)期間,我聆聽了一場(chǎng)阿里云無(wú)影的主題分享,而其宣布正式商用的產(chǎn)品AgentBay,正好呼應(yīng)了上述的關(guān)鍵話題。也解答了我的疑惑:為什么Agent開發(fā)這么難?又該如何實(shí)現(xiàn)?
Agent的“交流電時(shí)刻”
新技術(shù)在誕生之初,往往會(huì)顯現(xiàn)不出其威力,被低估、甚至?xí)@得落后而被嘲諷。因?yàn)榧夹g(shù)要發(fā)揮效果,必須有與之相配的基礎(chǔ)設(shè)施。
正如19世紀(jì)八十年代的交流電。
當(dāng)時(shí)電力的使用還不算普及,主流采用的也是愛迪生推廣的直流電。但直流電的傳輸距離很短,超過(guò)1公里就會(huì)大幅損耗,要么就得密集建立發(fā)電站,這也就導(dǎo)致電力成本大幅提升,無(wú)法普及。
特斯拉發(fā)現(xiàn)的交流電,因電壓高、傳輸損耗小,正好解決了長(zhǎng)距離輸送的難題。但是,交流電卻遲遲無(wú)法被主流采用:因?yàn)椴]有與之兼容的基礎(chǔ)設(shè)施。
直到1884年,西屋電氣公司負(fù)責(zé)人看中了交流電的潛力,開始打造其專屬的基礎(chǔ)設(shè)施:建立了全球首個(gè)高壓交流輸電網(wǎng)絡(luò),展示了40公里的傳輸能力;并批量生產(chǎn)變壓器,讓高壓電可以降低電壓,更安全地接入家庭和工廠。
![]()
與此同時(shí),隨著交流電的效力顯現(xiàn),也越來(lái)越多的企業(yè)愿意在應(yīng)用場(chǎng)景方面與之適配:交流電驅(qū)動(dòng)的電動(dòng)機(jī)、工業(yè)設(shè)備逐漸增加,基于交流電的家用電器也不斷涌現(xiàn)。
最終,交流電的長(zhǎng)距離傳輸,不僅擊敗了直流電成為全球電力系統(tǒng)的標(biāo)準(zhǔn),更是加速了電力的普及,讓電力從奢侈品轉(zhuǎn)變?yōu)榈诙喂I(yè)革命的核心驅(qū)動(dòng)力。
如今,Agent也迎來(lái)了“交流電時(shí)刻”。
雖然Manus引起了不少爭(zhēng)議,但也無(wú)可辯駁地展示了Agent的魅力:多線程、自主、高效。而一個(gè)重要原因是,Agent和人類使用電腦的方式完全不同。
人類和電腦的交互依賴于視覺、觸覺和圖形界面,需要通過(guò)鼠標(biāo)點(diǎn)選、鍵盤輸入、觸屏等方式來(lái)操作;但Agent可以則依賴程序接口或底層指令,可以直接通過(guò)代碼來(lái)調(diào)用各種功能,或通過(guò)腳本來(lái)執(zhí)行任務(wù)。人類只能同時(shí)執(zhí)行幾個(gè)任務(wù),而Agent則可以并行多個(gè)任務(wù)。
總結(jié)而言,Agent的交互是機(jī)器對(duì)機(jī)器,代碼對(duì)代碼,無(wú)需理解人類設(shè)計(jì)的界面邏輯。這種變化,就像在《黑客帝國(guó)》中,Neo突然領(lǐng)悟到所在的世界,其實(shí)就是0、1代碼,瞬間就開啟了超能力。
Manus的爆火,也展示了人們對(duì)Agent的熱情。然而,截至目前,大眾也詫異:為什么好用的Agent還沒普及。而原因正是因?yàn)椋?/p>
和Agent相配套的基礎(chǔ)設(shè)施并不完善。開發(fā)者沒有高效的工具、環(huán)境來(lái)開發(fā),也缺少Agent運(yùn)行的環(huán)境,包括接口、任務(wù)拆解等等。
所以,Agent就像當(dāng)年的交流電一樣,雖然有著巨大的優(yōu)勢(shì),但仍需等待專屬的基礎(chǔ)設(shè)施發(fā)展起來(lái)。
Agent大規(guī)模應(yīng)用,比“舉辦奧運(yùn)會(huì)”還復(fù)雜
就像交流電的高壓,必須能降低才可以安全使用一樣,Agent也必須有一套專屬的基礎(chǔ)設(shè)施,來(lái)確保Agent真正成為生產(chǎn)力。畢竟,當(dāng)前的Agent就像花果山的美猴王一樣,雖有本事、也能惹事。
Agent執(zhí)行任務(wù),不是一步到位,而是步步拆解。然而,現(xiàn)有技術(shù)并不能確保每一步都是100%完美執(zhí)行,因而就存在著“錯(cuò)誤積累”的難題。假設(shè)每一個(gè)自主操作準(zhǔn)確率為99%,那么10個(gè)步驟之后,準(zhǔn)確率就僅為90%。結(jié)果缺乏可信度,自然也就無(wú)法真正使用。
穩(wěn)定性也是Agent要確保的能力。同樣一個(gè)任務(wù),即使重復(fù)多次,都應(yīng)該能準(zhǔn)確記住用戶要求,執(zhí)行結(jié)果也應(yīng)該都符合用戶需求,而不能一次對(duì)、一次錯(cuò)。或者即使在不同電腦上執(zhí)行任務(wù),也要能符合需求。
隨之而來(lái)的使用痛點(diǎn)就是安全性。Agent在自主執(zhí)行任務(wù)時(shí),也許會(huì)調(diào)用本地終端上的程序、修改刪減本地文件等,但整個(gè)執(zhí)行過(guò)程就像個(gè)“黑匣子”,可能用戶壓根就不知道。這在金融、醫(yī)療等對(duì)數(shù)據(jù)安全、隱私保護(hù)要求極高的領(lǐng)域而言,完全不可接受。即使普通用戶,也會(huì)格外在意。
縱然Agent完美無(wú)瑕,安全又高效,但依然會(huì)面臨新的挑戰(zhàn):完全通用的Agent幾乎是不可能實(shí)現(xiàn)的,未來(lái)一定是多個(gè)Agent協(xié)同作業(yè)。而且每個(gè)Agent的任務(wù)也不相同,有的要買票、有的要畫畫、有的要寫報(bào)告德、有的要點(diǎn)餐等等,不同任務(wù)需要不同的資源配置,可擴(kuò)展性、彈性,就非常關(guān)鍵。
這就像帶兵打仗一樣,有多個(gè)兵種,分別使用刀槍輥棒斧鉞鉤叉,而且兵種還會(huì)不斷增加,每位士兵都要能立刻拿到武器、沖上戰(zhàn)場(chǎng);而當(dāng)任務(wù)完成或戰(zhàn)損后,又要盡快結(jié)算軍餉、避免吃空餉的情況,這就非常考驗(yàn)后勤保障了。
但普通的電腦,資源有限,難以支撐高算力、高并發(fā)需求。
所以,正如美猴王的成長(zhǎng),既要學(xué)習(xí)72般變化、駕馭筋斗云等本領(lǐng),也要有金箍棒當(dāng)工具、以及緊箍來(lái)作約束;現(xiàn)階段要確保Agent能揚(yáng)長(zhǎng)避短、發(fā)揮威力:
既要做好工具協(xié)調(diào)與集成,也要能用產(chǎn)品服務(wù)來(lái)增強(qiáng)Agent的任務(wù)規(guī)劃、長(zhǎng)期記憶、上下文持續(xù)性等能力,以及用技術(shù)約束來(lái)實(shí)現(xiàn)安全、穩(wěn)定性等要求,以及提供充足、彈性的算力。
每一項(xiàng)產(chǎn)品、服務(wù),又都包含多個(gè)技術(shù)、指標(biāo)。比如記憶,要能跨會(huì)話存儲(chǔ)、多工具交流等;工具要滿足豐富度、數(shù)據(jù)一致性、無(wú)縫切換;上下文要求任務(wù)進(jìn)度可恢復(fù)、多輪對(duì)話連貫、實(shí)時(shí)環(huán)境感知等等。
![]()
也難怪在WAIC的論壇分享上,阿里云無(wú)影的同事表示:Agent大規(guī)模應(yīng)用所面臨的挑戰(zhàn),其復(fù)雜度遠(yuǎn)超“舉辦一場(chǎng)奧運(yùn)會(huì)”。那么,如何會(huì)成為促進(jìn)交流電發(fā)展的西屋,打造一套降低Agent開發(fā)復(fù)雜度的基礎(chǔ)設(shè)施?
Agent基礎(chǔ)設(shè)施,帶來(lái)“拎包入住”的便利
科技界對(duì)Agent如何發(fā)展的認(rèn)知,是逐漸發(fā)展的。
最初,所有的目光都聚焦在Agent應(yīng)用上,無(wú)數(shù)創(chuàng)業(yè)者在各個(gè)場(chǎng)景、領(lǐng)域,尋找Agent的應(yīng)用機(jī)會(huì)。
過(guò)了一段時(shí)間后,大家發(fā)現(xiàn),基于大模型的Agent雖然能力不錯(cuò),但是許多現(xiàn)有的應(yīng)用,并不是針對(duì)Agent的,需要讓Agent可以更好地使用各類工具。于是,Anthropic發(fā)布了MCP協(xié)議(模型上下文協(xié)議),實(shí)現(xiàn)大模型與外部工具、數(shù)據(jù)源實(shí)現(xiàn)標(biāo)準(zhǔn)化通信;谷歌發(fā)布了Agent2Agent協(xié)議,實(shí)現(xiàn)不同Agent之間的通信、協(xié)作。
又過(guò)了一段時(shí)間后,大家發(fā)現(xiàn),要讓Agent更好用,需要把更底層的能力進(jìn)行完善。
比如記憶,要有長(zhǎng)期記憶、語(yǔ)義記憶、場(chǎng)景記憶等等;多工具使用之間,數(shù)據(jù)要保持一致性;最好能跨平臺(tái),比如手機(jī)、電腦等;安全性和一致性的要求,又決定了沙箱這種虛擬隔離環(huán)境,是必然之選;以及應(yīng)對(duì)高算力、高并發(fā)狀況等等。
這些思考,最終促成了基礎(chǔ)設(shè)施的需求,而且刻畫了其概貌:為Agent智能體設(shè)計(jì)的云基礎(chǔ)設(shè)施(AgentInfra)---將Agent接到的任務(wù)直接轉(zhuǎn)入高性能的云端環(huán)境,用沙箱構(gòu)建適合智能體工作的環(huán)境,在云端提供海量MCP工具,并提供彈性的云算力。
美國(guó)創(chuàng)業(yè)公司E2B,因其沙盒技術(shù)迅速獲得一批AI開發(fā)者客戶;而國(guó)內(nèi)阿里云無(wú)影事業(yè)部,則低調(diào)發(fā)布了無(wú)影AgentBay,解決了當(dāng)下的開發(fā)痛點(diǎn):
![]()
目前Agent的工作無(wú)非就是系統(tǒng)層面用電腦、用手機(jī),以及應(yīng)用層面用瀏覽器、以及寫代碼;而無(wú)影AgentBay的云上沙箱,覆蓋了上述多個(gè)主流環(huán)境,讓Agent輕松“打工”。
而且安全沙箱環(huán)境,就是一道“防火墻”,數(shù)據(jù)加密傳輸和權(quán)限嚴(yán)格隔離功能,既讓開發(fā)者放心開發(fā)、發(fā)布Agent,也讓用戶放心使用。即使Agent犯了錯(cuò),也不會(huì)對(duì)本地環(huán)境造成侵入。
交互,一定是最在意的能力。AgentBay也提供視覺理解、自然語(yǔ)言控制、任務(wù)解析等多項(xiàng)AI技術(shù);也支持多種交互方式,比如:
原子化工具API(拆分最小功能單元,讓開發(fā)者像使用樂(lè)高積木一樣自由搭配技術(shù))、AI Agent API(支持智能體自主完成任務(wù)拆解、規(guī)劃)和ASP遠(yuǎn)程串流協(xié)議(實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)傳輸)等,從而精準(zhǔn)匹配不同場(chǎng)景的需求。
最后,由于用戶未來(lái)會(huì)使用多個(gè)Agent來(lái)執(zhí)行多個(gè)任務(wù),因此,必然會(huì)有任務(wù)中斷、切換。傳統(tǒng)模式下,Agent的運(yùn)行狀態(tài)會(huì)隨著中斷而丟失,重啟時(shí)又要從零加載,浪費(fèi)資源、時(shí)間。另外,Agent在手機(jī)、電腦之間切換時(shí),也會(huì)出現(xiàn)信息丟失的情況。
因此,無(wú)影AgentBay升級(jí)了跨平臺(tái)的數(shù)據(jù)漫游系統(tǒng),支持狀態(tài)和內(nèi)存級(jí)別的持久化,實(shí)現(xiàn)資源按需加載、實(shí)時(shí)切換,而不用“重啟”。
這些標(biāo)準(zhǔn)化的產(chǎn)品、服務(wù),僅需三行代碼即可接入,讓開發(fā)者們“拎包入住”,徹底告別繁瑣的安裝和配置。
尾聲:吹響節(jié)奏、拉開大幕
雖然阿里云無(wú)影啟動(dòng)Agent基礎(chǔ)設(shè)施研發(fā)的時(shí)間并不久,但多年積累的云電腦技術(shù),順其自然地誕生了無(wú)影AgentBay。
顯然,Agent開發(fā)的門檻,不會(huì)一次性就全部拆光;這套基礎(chǔ)設(shè)施仍在發(fā)展、完善中。
但正如1890年代的尼亞加拉瀑布水電站,率先采用交流電把電力輸送到了水牛城,吹響了交流電普及的前奏。無(wú)影AgentBay的正式商用,也將拉開Agent普及的大幕。
---全文完,歡迎交流
理工/金融 復(fù)合背景
暢銷書《英偉達(dá)之道》譯者
百億私募/頭部自媒體 雙重經(jīng)歷
看清科技、商業(yè)本質(zhì),講出精彩故事
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.