鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
毋庸置疑!2025年title屬于「Agent元年」。
要說Agent這把火,一直從年初燒到了年末——
先是Manus,再到最近的豆包手機……Agent已然成為全行業(yè)的關(guān)注焦點。
而回顧這一年,也是Agent從技術(shù)萌芽,走向工程化落地的關(guān)鍵一年。
![]()
于是乎,量子位趁熱打鐵攢了場局,邀請來兩位行業(yè)大拿——Dify開源生態(tài)負責(zé)人鄭立和騰訊云云原生產(chǎn)品副總經(jīng)理于廣游做客,聊一聊他們眼里Agent落地過程中的挑戰(zhàn)、機遇和未來:
- 從年初硅谷的宏大敘事,Agent正走向充滿煙火氣的務(wù)實。
- 行業(yè)之所以認可Agent,在于它真的在做事。
- Agent真正落地,需要確定性的工程方法才能駕馭一個不確定性的復(fù)雜系統(tǒng)。
- Agent Infra解決企業(yè)的偶然復(fù)雜度問題,而非本質(zhì)復(fù)雜度。
- 對于中小公司或個人開發(fā)者,最大的門檻是缺乏勇氣。
兩位嘉賓還給出了一個高度一致的判斷:
- 在智能體落地過程中,Agent Infra是關(guān)鍵一環(huán)。
下面一起跟隨量子位的視角,看看他們具體都說了些什么,知識密度之高,不要輕易眨眼。
![]()
回顧Agent元年,技術(shù)走向工程落地
量子位:那我們今天先從Agent這個概念聊起吧。今年也要結(jié)束了,那站在年末,二位對這一年Agent的整體發(fā)展有什么印象和總結(jié)?
于廣游:我今年對Agent的最主要看法還是,今年Agent已經(jīng)從技術(shù)萌芽期,走到了真正工程性落地的階段。我個人看到有三種比較標志性的實踐:
- 面向企業(yè)內(nèi)部的Agent:首先是像咱們Dify這類產(chǎn)品,通過確定性去駕馭不確定性,從而實實在在地幫助企業(yè)內(nèi)部提效。
- 面向大眾的Agent:那再比如說Manus和豆包,它倆通過新的交互形態(tài)點燃用戶對Agent的想象力。
- 新范式Agent:而像Claude Code這樣的產(chǎn)品,能夠通過Agent RL和工具調(diào)用,拓寬Agent自身能力范圍。
至于我個人印象比較深刻的應(yīng)用,其實還是AI代碼工具。我覺得一方面它不再只解決代碼問題,它也正在成為Agent連接現(xiàn)實世界的通用接口。
第二個點是AI代碼工具,切實改變了原先的軟件工程范式,然后在我們內(nèi)部,我們也做了大量的從AI Coding到AISE(AI Software Engineer)的調(diào)整,包括研發(fā)模式、組織管理、角色職責(zé)等。
鄭立:其實這一年Agent發(fā)展吧,我能感受到就是大傳統(tǒng)和小傳統(tǒng)之間的鮮明張力。
大傳統(tǒng)其實就比如說來自硅谷那些的宏大敘事,他們會許諾用全自動智能體取代白領(lǐng),邏輯完美但實際落地的時候會有些水土不服。
那從小傳統(tǒng)來看,會充滿一些煙火氣,比如我看到義烏商家使用AI自動回復(fù)客戶,還有比如獨立開發(fā)者會用工作流進行代碼評審。
總結(jié)起來,這是蠻有趣味的一年,然后也是在走向務(wù)實。
年初的時候,一個簡單的Demo就能吸引資本市場,可以類比“立法階段”,那年末其實我們就會類似進入到“司法階段”,開始處理具體的、瑣碎的執(zhí)行層面問題。
這不是線性的進步,更多像是根莖狀的蔓延。
那我們也看到秩序的逐步建立,并非來自基座模型的升級,更多時候來自于那些“膠水”——如產(chǎn)品工程、提示詞工程、RAG、Pipeline和工具使用等技術(shù)手段,雖然它們不夠優(yōu)雅,但確實能夠有效地去維持我們數(shù)字社會的運轉(zhuǎn)。
量子位:確實就像兩位所說,可能年初的時候大家還是會被Demo驚艷,年末就到了更工程化的階段。其實以我們科技媒體的視角來看,這個進程非常快。智能體為什么會這么快成為行業(yè)共識呢?
于廣游:我覺得首先還是它能夠真正做到解決問題。過去生產(chǎn)力的發(fā)展,本質(zhì)上都是在延伸人類的手和腳,但實際我們工作中,確實也存在大量無法通過精確語言或編程描述的內(nèi)容,需要Agent來解決。
然后其次就是,我們在落地過程中對工程方法的探索。今年有一系列工程方法快速成型,包括Agent Infra、Agent Runtime、不同的Agent架構(gòu)范式、內(nèi)容工程,這些技術(shù)幫助Agent實現(xiàn)了真正落地。
鄭立:其實我感覺也差不多,不過在我看來,共識其實是資本在尋求新的組織方式。因為在我看來,互聯(lián)網(wǎng)時代的紅利已經(jīng)被吃干抹凈了,App的邊際效用也在遞減。
但是Agent承諾的是交互成本的一種坍塌,其實能看到權(quán)力從指令式計算到異度式計算的轉(zhuǎn)移。
量子位:其實剛才兩位也談到了,今年有一些關(guān)鍵詞都是在變化的,比如可能以前講AI Infra,現(xiàn)在說Agent Infra。Agent落地與AI落地之間存在哪些區(qū)別?以及是否存在工作流的變化和對Infra需求的差異。
鄭立:其實我覺得這個范式轉(zhuǎn)移還是很明顯的,我們從傳統(tǒng)的那種if/else的邏輯判斷轉(zhuǎn)向到Agent的概率性目標規(guī)劃。
放在過去,機器必須執(zhí)行下一行代碼,現(xiàn)在我們開發(fā)者更像是老師這種角色,通過Prompt、RAG和原則給予模型自由處理的空間。
![]()
區(qū)別還是在于新增了很多不確定性,比如傳統(tǒng)軟件工程中,Bug就是對規(guī)則的違反,而放到Agent工程里,失敗其實是對我們意圖的誤解或概率上的漂移。我們沒辦法再像修Bug一樣修復(fù)它,而是需要像教育孩子一樣去約束或者說服Agent。
這不僅僅是工作流的變化,還有交付物的變化,比如說以前是確定的功能,那現(xiàn)在我們交付的就是一種概率性的能力,你沒有辦法明確定義它是否正確。
于廣游:對,我感覺不確定性非常關(guān)鍵。我們團隊內(nèi)部觀察到的是,Agent是不確定性的復(fù)雜系統(tǒng)。
那首先,Agent的效果通常是由七八個不同因素構(gòu)成(模型本身、架構(gòu)范式、Prompt、Content、工具選擇和參數(shù)等)。這些子部件彼此之間又相互影響,我們很難明確它們的關(guān)系,所以Agent是一個復(fù)雜系統(tǒng)。
其次,對于同一個問題,你在不同時刻輸入,Agent的輸出,它也是不一樣的,咱們稱之為不確定性。那與之相反的,就是傳統(tǒng)的微服務(wù)系統(tǒng)。
所以我認為工程師的工作方式必須進行這兩點思維轉(zhuǎn)變:
1、從工程思維轉(zhuǎn)向科學(xué)實驗思維:我們不能再僅僅依賴預(yù)先規(guī)劃,而是要去建立一個評測體系,把里面環(huán)環(huán)相扣的復(fù)雜系統(tǒng)分解為單獨的子系統(tǒng),然后通過控制變量的方式,在科學(xué)實驗中一步步駕馭Agent。
2、從Day One思維轉(zhuǎn)向Day Two思維:我覺得我們對AI開發(fā)的思維也需要轉(zhuǎn)變,過去Day One就代表代碼已經(jīng)上線給用戶提供服務(wù),下一步怎么優(yōu)化看用戶的需要;現(xiàn)在Day One只能夠代表Agent能運行,效果的持續(xù)優(yōu)化,也就是Day Two才是真正的開始。
所以我覺得Agent落地,不僅僅是靠幾個巧妙的范式,我們需要循序漸進通過確定性的工程方法,才能駕馭一個不確定性的復(fù)雜系統(tǒng),而這將帶來Infra的重塑。
智能體落地,Agent Infra是關(guān)鍵一環(huán)
量子位:于老師剛剛也提到了整個工具的重塑。那從Infra角度來說,能詳細講一下騰訊云為加速Agent落地提供了哪些支持嗎?
于廣游:我剛剛說Agent的本質(zhì)是不確定性的復(fù)雜系統(tǒng),那它在上線過程中,我們首先要解決的最大問題其實是自主運行帶來的破壞性風(fēng)險。
所以我們團隊選擇從后往前解決。先解決Agent安全問題,我們在Agent Infra上,推出了Agent安全沙箱,給Agent提供了一個獨立的執(zhí)行環(huán)境。
然后我們再駕馭Agent的不確定性和復(fù)雜性,為此我們會提供一系列的可觀測性工具以及評估工具。
再進一步,我們就要進行效果的提升,對Agent的記憶和學(xué)習(xí)能力進行優(yōu)化,比如元寶就已經(jīng)進入了這一階段。在積累相關(guān)經(jīng)驗后,我們也會提供相應(yīng)的服務(wù)。
量子位:那包括您剛剛提到的Agent Runtime、安全沙箱這類Infra產(chǎn)品,和我們這些Agent平臺之間有什么關(guān)系呢?以及騰訊Infra當(dāng)前在關(guān)注什么?
于廣游:首先我們要厘清一個概念——Agent Infra到底是什么,我們可以先把企業(yè)問題劃分為本質(zhì)復(fù)雜度和偶然復(fù)雜度兩種,前者是必須要解決的問題,后者會隨著工具和方法選擇存在一定的偶然性。
所以我覺得,Infra層其實就是解決企業(yè)在問題處理過程中,遇到的偶然復(fù)雜問題,但是這個問題是沒有定下來的,對于不同的場景,要面臨的偶然復(fù)雜度完全不同,具體要解決什么問題也要視情況而定。
不過無論解決什么問題,這里都有一個共性問題,這也是我們團隊現(xiàn)在做的,就是去構(gòu)建偶然復(fù)雜度問題的最大公共子集,包括:安全、執(zhí)行環(huán)境、工具、記憶和觀測。
![]()
而這些問題或多或少都有解決方案,其中我們認為最突出的一個問題就是Agent的自主運行。
所以我們團隊做的安全沙箱,并不是簡單的隔離環(huán)境,而是一個多層次、全鏈路的Agent運行安全體系。
量子位:那鄭老師這邊,您在提供Agent Runtime這類底層組件時,Dify是更傾向于自研還是說使用第三方產(chǎn)品,以及您對Agent Infra開閉源有什么看法嗎?
鄭立:我們本身的話,核心模塊還是選擇自研,我們覺得如果這些使用第三方組件,勢必會導(dǎo)致核心組件不可控、給用戶的服務(wù)質(zhì)量無法保證,而其它的我們也會選擇一些合適的開閉源方案。
然后開源這件事我們是這樣認為的,AI時代基礎(chǔ)模型可以是黑箱,但Infra必須是白箱,因為開發(fā)者需要看到底層代碼,想了解Agent行為邏輯。而且我們觀察到,對于初創(chuàng)公司和創(chuàng)新者,他們會選擇開源,因為這里有一種低成本和靈活性。
相反,那些大企業(yè)則更加傾向于選擇開源的商業(yè)版本或閉源版本,因為閉源實則是給大企業(yè)提供了責(zé)任轉(zhuǎn)移與兜底服務(wù)。
量子位:于老師,根據(jù)您這邊接觸用戶的經(jīng)驗來看,他們在選擇Agent Infra產(chǎn)品時,一般會比較關(guān)注哪些要素?
于廣游:我覺得,首先對核心的業(yè)務(wù)邏輯層,我看到用戶還是在意它是不是開源的,因為這樣他們就可以圍繞自己的業(yè)務(wù)進行任意修改,也會更透明更可控。
那具體到Infra層上,用戶更在意體驗是否極致、能否降低開發(fā)成本。在用戶使用時,用戶就更在意Agent的穩(wěn)定性和效率,那么在這種情況下,我覺得閉源是有非常好的優(yōu)勢的。
量子位:聽二位這樣講下來,我感覺在Agent這個領(lǐng)域里,開閉源正在形成分層互補,那么在這樣的結(jié)構(gòu)下,像那種小白開發(fā)者或者個人開發(fā)者能夠通過Agent Infra把Agent開發(fā)和落地簡化到一個什么程度?
鄭立:其實這樣我們會逼近于AI開發(fā)的一個Excel時刻。
![]()
這種簡化其實是非常激進的,它會把基礎(chǔ)設(shè)施的認知負荷降到最低,然后你就可以把全部精力集中在Prompt和數(shù)據(jù)治理上。
于廣游:我補充一下,我們騰訊云的Infra產(chǎn)品就更偏向于專業(yè)開發(fā)者,他們會有非常多的復(fù)雜度問題需要治理,所以我們主要還是面向Agent原生企業(yè)和AI原生企業(yè),去幫助他們加速Agent落地過程。
量子位:想請兩位老師來幫我們總結(jié)一下,你觀察到的Agent Infra技術(shù)進展或趨勢。
于廣游:我還是前面提到的AI Coding,我對這個事情印象非常深刻。
首先過去一年里,我能看到代碼不僅是大模型抽象能力的來源,也正在成為Agent駕馭不確定性、連接世界的工具。
就拿AI Coding來說,它帶來的是開發(fā)模式的顛覆改變,能夠做到讓我們團隊里的每一個開發(fā)者,在分鐘級就能拉起一個獨立的全套開發(fā)環(huán)境,所以我覺得代碼肯定是會產(chǎn)生全面影響的。
我認為任何一個工程師或者Agent從業(yè)者,都絕不能小覷Coding的影響,它非常之重要。
鄭立:就我們個人而言,過去一年我們都在做自己的事情,主要的技術(shù)進展也都集中在補齊我們的短板。我們也看到了一個比較清晰的趨勢,就是技術(shù)正在從開發(fā)者向非開發(fā)者移動。
量子位:如果現(xiàn)在讓你們拿三個詞限定的話,您能再講講Agent Infra為什么說是智能體落地應(yīng)用的關(guān)鍵環(huán)節(jié)嗎?
鄭立:我先說吧,我認為主要是以下三點:
- 秩序:首先它會讓混亂的模型變得可控;
- 連接:其次我們需要打通Agent孤島,讓AI真正融入到業(yè)務(wù)中去;
- 自動:接下來就是將簡單繁瑣的任務(wù)去變得自動化。
于廣游:我想到的是這三點:
- 安全高效:第一個是我們?nèi)ヂ涞谹gent的關(guān)鍵,就是讓它能夠安全高效地跑起來;
- 智能進化:第二步就是我們?nèi)?yōu)化Agent本身的這個能力,無論是通過知識庫、記憶還是Agent RL進化它;
- 人機協(xié)同:那么要實現(xiàn)Agent的進化,就需要人類作為老師去教Agent。
Agent Infra的下一步
量子位:最后還是來展望一下,剛剛都在聊過去一年,那對于未來的一到兩年,甚至三到五年時間里,各位覺得Agent Infra接下來的重點會是哪些方向?
于廣游:對我而言,我們最關(guān)注的是Agent Infra如何服務(wù)好Agent,能夠確保其安全可靠運行。
我其實覺得Agent Infra和AI Infra是交叉的關(guān)系,當(dāng)我們把Agent運行好后,就會發(fā)現(xiàn)它的一些不足,然后我們再將產(chǎn)生的數(shù)據(jù)進行利用,就能對Agent本身和Agent模型進行持續(xù)優(yōu)化。
![]()
當(dāng)前的Infra體系,它更多的是服務(wù)于基礎(chǔ)大模型本身的能力和智力的進化,而不是業(yè)務(wù)可用,所以我認為Agent Infra的下一步,一定是從服務(wù)好Agent的運行構(gòu)建到服務(wù)好Agent的智能進化。
鄭立:我這邊會更加關(guān)注Agent Infra的可調(diào)試性,也就是看清楚是哪一步Agent理解錯誤,需要去做推理鏈的可視化調(diào)試。
然后就是記憶管理,不僅僅是聲音的那種向量搜索,還有就是關(guān)注語義化的情景記憶和可計算的時間觀吧。我理解中,Agent的記憶不能是簡單的常量存儲,而應(yīng)該是一種變量,Agent的目標在執(zhí)行過程中可能會被重寫、降級,所以我們需要對目標進行一些置信度處理。
量子位:好,那感謝兩位老師的分享,最后我們來回答幾個觀眾問題吧。第一個問題,從你們的角度看,中小公司和個人開發(fā)者他們來做Agent應(yīng)用最大的門檻是什么?是技術(shù)還是成本?
于廣游:我感覺這兩個都不是,應(yīng)該是商業(yè)模式。
既然是中小公司,那肯定是要賺錢的,但是現(xiàn)在AI Agent還沒有到改變整個社會商業(yè)模式的程度,這個時候產(chǎn)生的新消費和新的生產(chǎn)力變革還只發(fā)生在小領(lǐng)域。
所以如果希望把它應(yīng)用到你的公司產(chǎn)品中去,我覺得更多的是,創(chuàng)業(yè)者需要回到實際問題中解決,同時也可以嘗試著把自己的商業(yè)模式和形態(tài)進行一個巨大的轉(zhuǎn)變。
鄭立:我也覺得技術(shù)不是問題,你比方說現(xiàn)在大模型智力本身已經(jīng)過剩了。真正最大的困難,我還是覺得在于企業(yè)數(shù)據(jù)的壁壘和缺乏開始的勇氣。
![]()
量子位:最后一個觀眾問題交給于老師,您覺得如果未來Agent成為主流,會對現(xiàn)在的移動開發(fā)生態(tài)造成什么影響?它們會被徹底顛覆嗎?
于廣游:OK,我覺得這個可以要從應(yīng)用交互形態(tài)和開發(fā)方式兩個角度去討論。
首先第一個對于形態(tài),我覺得移動端(iOS/Android)形態(tài)沒有人能給出確切答案。
在Agent的這個形態(tài)之外,我們就會立馬面臨兩個問題:
- APP集成Agent能力:第一個問題是公司會希望你在APP中集成一些Agent能力,這時開發(fā)者就需要將思維從工程轉(zhuǎn)向科學(xué)實驗,我覺得這個轉(zhuǎn)型是非常巨大的。
- 利用AI Coding工具開發(fā)APP:第二是你所在的公司可能會讓你使用AI Coding去開發(fā),那么開發(fā)者就不能只用它來生成代碼,更要用它來改變你們的協(xié)同模式和工具體系。
我相信,只有與AI工具為伍、改造研發(fā)流程,并用科學(xué)實驗思維駕馭不確定性的人,才能抓住未來Agent形態(tài)轉(zhuǎn)移的機遇。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.