網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

智能體落地元年，Agent Infra是關(guān)鍵一環(huán)｜對話騰訊云&Dify

2025-12-23 13:36:29　來源: 量子位

北京舉報

分享至

鷺羽發(fā)自凹非寺
量子位 | 公眾號 QbitAI

毋庸置疑！2025年title屬于「Agent元年」。

要說Agent這把火，一直從年初燒到了年末——

先是Manus，再到最近的豆包手機……Agent已然成為全行業(yè)的關(guān)注焦點。

而回顧這一年，也是Agent從技術(shù)萌芽，走向工程化落地的關(guān)鍵一年。

于是乎，量子位趁熱打鐵攢了場局，邀請來兩位行業(yè)大拿——Dify開源生態(tài)負責(zé)人鄭立和騰訊云云原生產(chǎn)品副總經(jīng)理于廣游做客，聊一聊他們眼里Agent落地過程中的挑戰(zhàn)、機遇和未來：

從年初硅谷的宏大敘事，Agent正走向充滿煙火氣的務(wù)實。
行業(yè)之所以認可Agent，在于它真的在做事。
Agent真正落地，需要確定性的工程方法才能駕馭一個不確定性的復(fù)雜系統(tǒng)。
Agent Infra解決企業(yè)的偶然復(fù)雜度問題，而非本質(zhì)復(fù)雜度。
對于中小公司或個人開發(fā)者，最大的門檻是缺乏勇氣。

兩位嘉賓還給出了一個高度一致的判斷：

在智能體落地過程中，Agent Infra是關(guān)鍵一環(huán)。

下面一起跟隨量子位的視角，看看他們具體都說了些什么，知識密度之高，不要輕易眨眼。

回顧Agent元年，技術(shù)走向工程落地

量子位：那我們今天先從Agent這個概念聊起吧。今年也要結(jié)束了，那站在年末，二位對這一年Agent的整體發(fā)展有什么印象和總結(jié)？

于廣游：我今年對Agent的最主要看法還是，今年Agent已經(jīng)從技術(shù)萌芽期，走到了真正工程性落地的階段。我個人看到有三種比較標志性的實踐：

面向企業(yè)內(nèi)部的Agent：首先是像咱們Dify這類產(chǎn)品，通過確定性去駕馭不確定性，從而實實在在地幫助企業(yè)內(nèi)部提效。
面向大眾的Agent：那再比如說Manus和豆包，它倆通過新的交互形態(tài)點燃用戶對Agent的想象力。
新范式Agent：而像Claude Code這樣的產(chǎn)品，能夠通過Agent RL和工具調(diào)用，拓寬Agent自身能力范圍。

至于我個人印象比較深刻的應(yīng)用，其實還是AI代碼工具。我覺得一方面它不再只解決代碼問題，它也正在成為Agent連接現(xiàn)實世界的通用接口。

第二個點是AI代碼工具，切實改變了原先的軟件工程范式，然后在我們內(nèi)部，我們也做了大量的從AI Coding到AISE（AI Software Engineer）的調(diào)整，包括研發(fā)模式、組織管理、角色職責(zé)等。

鄭立：其實這一年Agent發(fā)展吧，我能感受到就是大傳統(tǒng)和小傳統(tǒng)之間的鮮明張力。

大傳統(tǒng)其實就比如說來自硅谷那些的宏大敘事，他們會許諾用全自動智能體取代白領(lǐng)，邏輯完美但實際落地的時候會有些水土不服。

那從小傳統(tǒng)來看，會充滿一些煙火氣，比如我看到義烏商家使用AI自動回復(fù)客戶，還有比如獨立開發(fā)者會用工作流進行代碼評審。

總結(jié)起來，這是蠻有趣味的一年，然后也是在走向務(wù)實。

年初的時候，一個簡單的Demo就能吸引資本市場，可以類比“立法階段”，那年末其實我們就會類似進入到“司法階段”，開始處理具體的、瑣碎的執(zhí)行層面問題。

這不是線性的進步，更多像是根莖狀的蔓延。

那我們也看到秩序的逐步建立，并非來自基座模型的升級，更多時候來自于那些“膠水”——如產(chǎn)品工程、提示詞工程、RAG、Pipeline和工具使用等技術(shù)手段，雖然它們不夠優(yōu)雅，但確實能夠有效地去維持我們數(shù)字社會的運轉(zhuǎn)。

量子位：確實就像兩位所說，可能年初的時候大家還是會被Demo驚艷，年末就到了更工程化的階段。其實以我們科技媒體的視角來看，這個進程非常快。智能體為什么會這么快成為行業(yè)共識呢？

于廣游：我覺得首先還是它能夠真正做到解決問題。過去生產(chǎn)力的發(fā)展，本質(zhì)上都是在延伸人類的手和腳，但實際我們工作中，確實也存在大量無法通過精確語言或編程描述的內(nèi)容，需要Agent來解決。

然后其次就是，我們在落地過程中對工程方法的探索。今年有一系列工程方法快速成型，包括Agent Infra、Agent Runtime、不同的Agent架構(gòu)范式、內(nèi)容工程，這些技術(shù)幫助Agent實現(xiàn)了真正落地。

鄭立：其實我感覺也差不多，不過在我看來，共識其實是資本在尋求新的組織方式。因為在我看來，互聯(lián)網(wǎng)時代的紅利已經(jīng)被吃干抹凈了，App的邊際效用也在遞減。

但是Agent承諾的是交互成本的一種坍塌，其實能看到權(quán)力從指令式計算到異度式計算的轉(zhuǎn)移。

量子位：其實剛才兩位也談到了，今年有一些關(guān)鍵詞都是在變化的，比如可能以前講AI Infra，現(xiàn)在說Agent Infra。Agent落地與AI落地之間存在哪些區(qū)別？以及是否存在工作流的變化和對Infra需求的差異。

鄭立：其實我覺得這個范式轉(zhuǎn)移還是很明顯的，我們從傳統(tǒng)的那種if/else的邏輯判斷轉(zhuǎn)向到Agent的概率性目標規(guī)劃。

放在過去，機器必須執(zhí)行下一行代碼，現(xiàn)在我們開發(fā)者更像是老師這種角色，通過Prompt、RAG和原則給予模型自由處理的空間。

區(qū)別還是在于新增了很多不確定性，比如傳統(tǒng)軟件工程中，Bug就是對規(guī)則的違反，而放到Agent工程里，失敗其實是對我們意圖的誤解或概率上的漂移。我們沒辦法再像修Bug一樣修復(fù)它，而是需要像教育孩子一樣去約束或者說服Agent。

這不僅僅是工作流的變化，還有交付物的變化，比如說以前是確定的功能，那現(xiàn)在我們交付的就是一種概率性的能力，你沒有辦法明確定義它是否正確。

于廣游：對，我感覺不確定性非常關(guān)鍵。我們團隊內(nèi)部觀察到的是，Agent是不確定性的復(fù)雜系統(tǒng)。

那首先，Agent的效果通常是由七八個不同因素構(gòu)成（模型本身、架構(gòu)范式、Prompt、Content、工具選擇和參數(shù)等）。這些子部件彼此之間又相互影響，我們很難明確它們的關(guān)系，所以Agent是一個復(fù)雜系統(tǒng)。

其次，對于同一個問題，你在不同時刻輸入，Agent的輸出，它也是不一樣的，咱們稱之為不確定性。那與之相反的，就是傳統(tǒng)的微服務(wù)系統(tǒng)。

所以我認為工程師的工作方式必須進行這兩點思維轉(zhuǎn)變：

1、從工程思維轉(zhuǎn)向科學(xué)實驗思維：我們不能再僅僅依賴預(yù)先規(guī)劃，而是要去建立一個評測體系，把里面環(huán)環(huán)相扣的復(fù)雜系統(tǒng)分解為單獨的子系統(tǒng)，然后通過控制變量的方式，在科學(xué)實驗中一步步駕馭Agent。

2、從Day One思維轉(zhuǎn)向Day Two思維：我覺得我們對AI開發(fā)的思維也需要轉(zhuǎn)變，過去Day One就代表代碼已經(jīng)上線給用戶提供服務(wù)，下一步怎么優(yōu)化看用戶的需要；現(xiàn)在Day One只能夠代表Agent能運行，效果的持續(xù)優(yōu)化，也就是Day Two才是真正的開始。

所以我覺得Agent落地，不僅僅是靠幾個巧妙的范式，我們需要循序漸進通過確定性的工程方法，才能駕馭一個不確定性的復(fù)雜系統(tǒng)，而這將帶來Infra的重塑。

智能體落地，Agent Infra是關(guān)鍵一環(huán)

量子位：于老師剛剛也提到了整個工具的重塑。那從Infra角度來說，能詳細講一下騰訊云為加速Agent落地提供了哪些支持嗎？

于廣游：我剛剛說Agent的本質(zhì)是不確定性的復(fù)雜系統(tǒng)，那它在上線過程中，我們首先要解決的最大問題其實是自主運行帶來的破壞性風(fēng)險。

所以我們團隊選擇從后往前解決。先解決Agent安全問題，我們在Agent Infra上，推出了Agent安全沙箱，給Agent提供了一個獨立的執(zhí)行環(huán)境。

然后我們再駕馭Agent的不確定性和復(fù)雜性，為此我們會提供一系列的可觀測性工具以及評估工具。

再進一步，我們就要進行效果的提升，對Agent的記憶和學(xué)習(xí)能力進行優(yōu)化，比如元寶就已經(jīng)進入了這一階段。在積累相關(guān)經(jīng)驗后，我們也會提供相應(yīng)的服務(wù)。

量子位：那包括您剛剛提到的Agent Runtime、安全沙箱這類Infra產(chǎn)品，和我們這些Agent平臺之間有什么關(guān)系呢？以及騰訊Infra當(dāng)前在關(guān)注什么？

于廣游：首先我們要厘清一個概念——Agent Infra到底是什么，我們可以先把企業(yè)問題劃分為本質(zhì)復(fù)雜度和偶然復(fù)雜度兩種，前者是必須要解決的問題，后者會隨著工具和方法選擇存在一定的偶然性。

所以我覺得，Infra層其實就是解決企業(yè)在問題處理過程中，遇到的偶然復(fù)雜問題，但是這個問題是沒有定下來的，對于不同的場景，要面臨的偶然復(fù)雜度完全不同，具體要解決什么問題也要視情況而定。

不過無論解決什么問題，這里都有一個共性問題，這也是我們團隊現(xiàn)在做的，就是去構(gòu)建偶然復(fù)雜度問題的最大公共子集，包括：安全、執(zhí)行環(huán)境、工具、記憶和觀測。

而這些問題或多或少都有解決方案，其中我們認為最突出的一個問題就是Agent的自主運行。

所以我們團隊做的安全沙箱，并不是簡單的隔離環(huán)境，而是一個多層次、全鏈路的Agent運行安全體系。

量子位：那鄭老師這邊，您在提供Agent Runtime這類底層組件時，Dify是更傾向于自研還是說使用第三方產(chǎn)品，以及您對Agent Infra開閉源有什么看法嗎？

鄭立：我們本身的話，核心模塊還是選擇自研，我們覺得如果這些使用第三方組件，勢必會導(dǎo)致核心組件不可控、給用戶的服務(wù)質(zhì)量無法保證，而其它的我們也會選擇一些合適的開閉源方案。

然后開源這件事我們是這樣認為的，AI時代基礎(chǔ)模型可以是黑箱，但Infra必須是白箱，因為開發(fā)者需要看到底層代碼，想了解Agent行為邏輯。而且我們觀察到，對于初創(chuàng)公司和創(chuàng)新者，他們會選擇開源，因為這里有一種低成本和靈活性。

相反，那些大企業(yè)則更加傾向于選擇開源的商業(yè)版本或閉源版本，因為閉源實則是給大企業(yè)提供了責(zé)任轉(zhuǎn)移與兜底服務(wù)。

量子位：于老師，根據(jù)您這邊接觸用戶的經(jīng)驗來看，他們在選擇Agent Infra產(chǎn)品時，一般會比較關(guān)注哪些要素？

于廣游：我覺得，首先對核心的業(yè)務(wù)邏輯層，我看到用戶還是在意它是不是開源的，因為這樣他們就可以圍繞自己的業(yè)務(wù)進行任意修改，也會更透明更可控。

那具體到Infra層上，用戶更在意體驗是否極致、能否降低開發(fā)成本。在用戶使用時，用戶就更在意Agent的穩(wěn)定性和效率，那么在這種情況下，我覺得閉源是有非常好的優(yōu)勢的。

量子位：聽二位這樣講下來，我感覺在Agent這個領(lǐng)域里，開閉源正在形成分層互補，那么在這樣的結(jié)構(gòu)下，像那種小白開發(fā)者或者個人開發(fā)者能夠通過Agent Infra把Agent開發(fā)和落地簡化到一個什么程度？

鄭立：其實這樣我們會逼近于AI開發(fā)的一個Excel時刻。

這種簡化其實是非常激進的，它會把基礎(chǔ)設(shè)施的認知負荷降到最低，然后你就可以把全部精力集中在Prompt和數(shù)據(jù)治理上。

于廣游：我補充一下，我們騰訊云的Infra產(chǎn)品就更偏向于專業(yè)開發(fā)者，他們會有非常多的復(fù)雜度問題需要治理，所以我們主要還是面向Agent原生企業(yè)和AI原生企業(yè)，去幫助他們加速Agent落地過程。

量子位：想請兩位老師來幫我們總結(jié)一下，你觀察到的Agent Infra技術(shù)進展或趨勢。

于廣游：我還是前面提到的AI Coding，我對這個事情印象非常深刻。

首先過去一年里，我能看到代碼不僅是大模型抽象能力的來源，也正在成為Agent駕馭不確定性、連接世界的工具。

就拿AI Coding來說，它帶來的是開發(fā)模式的顛覆改變，能夠做到讓我們團隊里的每一個開發(fā)者，在分鐘級就能拉起一個獨立的全套開發(fā)環(huán)境，所以我覺得代碼肯定是會產(chǎn)生全面影響的。

我認為任何一個工程師或者Agent從業(yè)者，都絕不能小覷Coding的影響，它非常之重要。

鄭立：就我們個人而言，過去一年我們都在做自己的事情，主要的技術(shù)進展也都集中在補齊我們的短板。我們也看到了一個比較清晰的趨勢，就是技術(shù)正在從開發(fā)者向非開發(fā)者移動。

量子位：如果現(xiàn)在讓你們拿三個詞限定的話，您能再講講Agent Infra為什么說是智能體落地應(yīng)用的關(guān)鍵環(huán)節(jié)嗎？

鄭立：我先說吧，我認為主要是以下三點：

秩序：首先它會讓混亂的模型變得可控；
連接：其次我們需要打通Agent孤島，讓AI真正融入到業(yè)務(wù)中去；
自動：接下來就是將簡單繁瑣的任務(wù)去變得自動化。

于廣游：我想到的是這三點：

安全高效：第一個是我們?nèi)ヂ涞谹gent的關(guān)鍵，就是讓它能夠安全高效地跑起來；
智能進化：第二步就是我們?nèi)?yōu)化Agent本身的這個能力，無論是通過知識庫、記憶還是Agent RL進化它；
人機協(xié)同：那么要實現(xiàn)Agent的進化，就需要人類作為老師去教Agent。

Agent Infra的下一步

量子位：最后還是來展望一下，剛剛都在聊過去一年，那對于未來的一到兩年，甚至三到五年時間里，各位覺得Agent Infra接下來的重點會是哪些方向？

于廣游：對我而言，我們最關(guān)注的是Agent Infra如何服務(wù)好Agent，能夠確保其安全可靠運行。

我其實覺得Agent Infra和AI Infra是交叉的關(guān)系，當(dāng)我們把Agent運行好后，就會發(fā)現(xiàn)它的一些不足，然后我們再將產(chǎn)生的數(shù)據(jù)進行利用，就能對Agent本身和Agent模型進行持續(xù)優(yōu)化。

當(dāng)前的Infra體系，它更多的是服務(wù)于基礎(chǔ)大模型本身的能力和智力的進化，而不是業(yè)務(wù)可用，所以我認為Agent Infra的下一步，一定是從服務(wù)好Agent的運行構(gòu)建到服務(wù)好Agent的智能進化。

鄭立：我這邊會更加關(guān)注Agent Infra的可調(diào)試性，也就是看清楚是哪一步Agent理解錯誤，需要去做推理鏈的可視化調(diào)試。

然后就是記憶管理，不僅僅是聲音的那種向量搜索，還有就是關(guān)注語義化的情景記憶和可計算的時間觀吧。我理解中，Agent的記憶不能是簡單的常量存儲，而應(yīng)該是一種變量，Agent的目標在執(zhí)行過程中可能會被重寫、降級，所以我們需要對目標進行一些置信度處理。

量子位：好，那感謝兩位老師的分享，最后我們來回答幾個觀眾問題吧。第一個問題，從你們的角度看，中小公司和個人開發(fā)者他們來做Agent應(yīng)用最大的門檻是什么？是技術(shù)還是成本？

于廣游：我感覺這兩個都不是，應(yīng)該是商業(yè)模式。

既然是中小公司，那肯定是要賺錢的，但是現(xiàn)在AI Agent還沒有到改變整個社會商業(yè)模式的程度，這個時候產(chǎn)生的新消費和新的生產(chǎn)力變革還只發(fā)生在小領(lǐng)域。

所以如果希望把它應(yīng)用到你的公司產(chǎn)品中去，我覺得更多的是，創(chuàng)業(yè)者需要回到實際問題中解決，同時也可以嘗試著把自己的商業(yè)模式和形態(tài)進行一個巨大的轉(zhuǎn)變。

鄭立：我也覺得技術(shù)不是問題，你比方說現(xiàn)在大模型智力本身已經(jīng)過剩了。真正最大的困難，我還是覺得在于企業(yè)數(shù)據(jù)的壁壘和缺乏開始的勇氣。

量子位：最后一個觀眾問題交給于老師，您覺得如果未來Agent成為主流，會對現(xiàn)在的移動開發(fā)生態(tài)造成什么影響？它們會被徹底顛覆嗎？

于廣游：OK，我覺得這個可以要從應(yīng)用交互形態(tài)和開發(fā)方式兩個角度去討論。

首先第一個對于形態(tài)，我覺得移動端（iOS/Android）形態(tài)沒有人能給出確切答案。

在Agent的這個形態(tài)之外，我們就會立馬面臨兩個問題：

APP集成Agent能力：第一個問題是公司會希望你在APP中集成一些Agent能力，這時開發(fā)者就需要將思維從工程轉(zhuǎn)向科學(xué)實驗，我覺得這個轉(zhuǎn)型是非常巨大的。
利用AI Coding工具開發(fā)APP：第二是你所在的公司可能會讓你使用AI Coding去開發(fā)，那么開發(fā)者就不能只用它來生成代碼，更要用它來改變你們的協(xié)同模式和工具體系。

我相信，只有與AI工具為伍、改造研發(fā)流程，并用科學(xué)實驗思維駕馭不確定性的人，才能抓住未來Agent形態(tài)轉(zhuǎn)移的機遇。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.