編輯部 整理自 凹非寺量子位 | 公眾號(hào) QbitAI
- Agent的真正價(jià)值不在于演示效果多驚艷,而在于能否真正跑在生產(chǎn)環(huán)境里。 數(shù)據(jù)顯示,超過(guò)93%的企業(yè)Agent項(xiàng)目卡在了從POC(概念驗(yàn)證)到生產(chǎn)的最后一公里。
在量子位MEET2026智能未來(lái)大會(huì)上,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建系統(tǒng)闡述了企業(yè)級(jí)Agent從開發(fā)到生產(chǎn)的完整路徑。
這個(gè)數(shù)字背后,是無(wú)數(shù)企業(yè)在Agent落地過(guò)程中踩過(guò)的坑:開發(fā)門檻高、工程化能力缺失、模型定制困難、安全邊界模糊。
![]()
在剛剛結(jié)束的AWS re:Invent 2025大會(huì)上,亞馬遜云科技將聚光燈對(duì)準(zhǔn)了Agent。不是因?yàn)槠渌夹g(shù)不重要,而是整個(gè)行業(yè)都意識(shí)到:Agent正在成為AI生產(chǎn)力釋放的關(guān)鍵樞紐。
陳曉建的分享,正是圍繞“如何讓Agent真正跑起來(lái)”這一核心命題展開。
MEET2026智能未來(lái)大會(huì)是由量子位主辦的行業(yè)峰會(huì),近30位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾近1500人,線上直播觀眾350萬(wàn)+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。
核心觀點(diǎn)梳理
- 一個(gè)成功的Agent需要三個(gè)模塊:模型(大腦)、代碼(邏輯)、工具(連接物理世界的手腳)。三者的有效連接是最大的工程挑戰(zhàn)。
- 十幾行代碼實(shí)現(xiàn)過(guò)去數(shù)千行才能完成的功能,這就是模型驅(qū)動(dòng)開發(fā)帶來(lái)的效率躍遷。
- 93%的Agent項(xiàng)目卡在POC到生產(chǎn)的跨越上,核心原因是數(shù)據(jù)質(zhì)量落差和工程化能力缺失。
- 模型定制的最佳時(shí)機(jī)是在基礎(chǔ)模型訓(xùn)練階段,就像人類學(xué)習(xí)語(yǔ)言,年幼時(shí)效果遠(yuǎn)好于成年后。
- 對(duì)Agent既不能嚴(yán)防死守,也不能過(guò)度放任,正確做法是通過(guò)策略框架劃定行為邊界。
以下為陳曉建演講全文:
Agent成功的三要素:模型、代碼與工具
Agent正在從各個(gè)維度釋放AI的生產(chǎn)力潛能,它可以替代許多人類以往的工作,甚至能夠完成人類此前無(wú)法企及的任務(wù)。然而從創(chuàng)意到落地,中間需要跨越的鴻溝遠(yuǎn)比想象中更寬。
我們認(rèn)為,一個(gè)成功的Agent需要三個(gè)至關(guān)重要的模塊。
第一是底層模型。
模型是Agent的大腦,負(fù)責(zé)產(chǎn)生智慧、提供決策,承擔(dān)推理、規(guī)劃與執(zhí)行的核心職能。
第二是代碼。
任何Agent都需要服務(wù)于特定場(chǎng)景,提供該場(chǎng)景所需的功能邏輯。這些邏輯需要像構(gòu)建傳統(tǒng)軟件一樣,通過(guò)代碼來(lái)實(shí)現(xiàn)。這一點(diǎn)與大多數(shù)已有軟件并無(wú)本質(zhì)區(qū)別。
第三是工具。
如果把模型比作大腦,那么工具就是連接大腦與物理世界的手和腳。在整個(gè)架構(gòu)中,工具層包括連接不同信息源的各類協(xié)議,以及執(zhí)行各種行為的代碼——比如知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、代碼庫(kù),或者瀏覽器等外部能力。
當(dāng)然,我們看到很多客戶在嘗試用自己的方式構(gòu)建Agent。但如何有效連接這三個(gè)模塊,帶來(lái)了巨大的復(fù)雜性與挑戰(zhàn)。如何高效調(diào)用模型能力?如何組織代碼邏輯?如何打通與物理世界的連接?不同工具之間的編排,更是給開發(fā)者帶來(lái)了前所未有的新課題。
十幾行代碼完成過(guò)去數(shù)千行的工作
基于這些挑戰(zhàn),我們從2024年開始規(guī)劃:如何構(gòu)建一套工具,降低開發(fā)者構(gòu)建Agent的門檻?如何讓工具編排更加自動(dòng)化?如何讓大模型調(diào)用更加便捷?
今年,我們正式推出了Strands Agents
Strands Agents采用模型驅(qū)動(dòng)的方法論,讓大語(yǔ)言模型能夠自主處理各種場(chǎng)景,從而大幅簡(jiǎn)化開發(fā)Agent所需的代碼量。我們經(jīng)常收到客戶反饋:過(guò)去需要數(shù)千行代碼才能開發(fā)的場(chǎng)景,現(xiàn)在只需要短短十幾行就能實(shí)現(xiàn)
在推出Strands Agents時(shí),我們就將其定位為一個(gè)開源項(xiàng)目。用戶不僅可以直接使用,還可以獲取完整源碼。更重要的是,Strands Agents采用開放架構(gòu),不僅適配亞馬遜云科技自身的產(chǎn)品,也兼容業(yè)界各種流行的開源或商用框架。
在上周的re:Invent大會(huì)上,我們同步發(fā)布了兩項(xiàng)重要更新。
一是支持TypeScript語(yǔ)言。TypeScript是業(yè)界廣泛使用的編程語(yǔ)言,通過(guò)支持這一語(yǔ)言,可以幫助更多開發(fā)者構(gòu)建更適用的Agent方案。
二是支持邊緣設(shè)備部署。邊緣設(shè)備正日益成為人類生活與工作不可分割的一部分,Strands Agents可以為汽車、游戲、機(jī)器人等各類終端提供Agent能力,讓Agent不僅能在云端運(yùn)行,也能在前端智能設(shè)備上運(yùn)行。
93%的項(xiàng)目卡在POC到生產(chǎn)的跨越上
除了開發(fā)工具,我們還看到大量客戶在Agent的部署與上線階段遭遇困難。
有一組來(lái)自第三方調(diào)研的數(shù)據(jù)值得關(guān)注:93%的客戶在從POC階段邁向生產(chǎn)階段時(shí)遇到了重大障礙。換言之,可能只有不到10%的客戶能夠真正將Agent從POC推進(jìn)到最終生產(chǎn)環(huán)境。
原因是什么?
POC與生產(chǎn)環(huán)境之間存在本質(zhì)差異。在POC階段,我們可能只需要關(guān)注代碼效果如何。但到了生產(chǎn)階段,很多客戶發(fā)現(xiàn),原先在POC階段表現(xiàn)優(yōu)異的效果突然變得不盡如人意。
一個(gè)重要原因是數(shù)據(jù)。在POC階段,數(shù)據(jù)可以經(jīng)過(guò)精心挑選,保證高質(zhì)量。但在真實(shí)生產(chǎn)環(huán)境中,數(shù)據(jù)是無(wú)法被人為篩選和優(yōu)化的。數(shù)據(jù)質(zhì)量的落差,往往是POC與生產(chǎn)效果差異的核心原因。
另一個(gè)主要原因是工程化挑戰(zhàn)。一旦業(yè)務(wù)從POC走向生產(chǎn),就必須直面一系列生產(chǎn)環(huán)境特有的問(wèn)題:安全、擴(kuò)容、成本、高可用……這些問(wèn)題在POC階段完全不需要考慮,但上了生產(chǎn)就必須正視。
正是基于這些考量,我們意識(shí)到:不僅要提供降低編程門檻的開發(fā)工具,還需要提供工程化能力,幫助客戶跨越從POC到生產(chǎn)的鴻溝。
這就是我們?cè)?025年7月推出Amazon Bedrock AgentCore的原因。
AgentCore是一個(gè)完整的工具箱,提供多種能力幫助客戶實(shí)現(xiàn)底層基礎(chǔ)架構(gòu)的編排。當(dāng)您的Agent部署上云時(shí),無(wú)需關(guān)心底層的計(jì)算資源、網(wǎng)絡(luò)資源、安全配置、可觀測(cè)性如何實(shí)現(xiàn)——AgentCore會(huì)幫您完成這些底層資源的動(dòng)態(tài)管理。這將極大地幫助客戶解決從POC到生產(chǎn)過(guò)程中遇到的工程化難題。
模型定制:在“年幼時(shí)”學(xué)習(xí)效果最好
當(dāng)Agent進(jìn)入生產(chǎn)環(huán)境后,還會(huì)面臨一系列效率問(wèn)題:延遲、可擴(kuò)展性、敏捷性……這些都是實(shí)際生產(chǎn)中必須關(guān)注的特性。如果延遲從幾百毫秒飆升到秒級(jí)以上,用戶體驗(yàn)會(huì)受到極大影響;如果可擴(kuò)展性不足,業(yè)務(wù)高峰期同樣會(huì)出現(xiàn)瓶頸。
這里要談?wù)勀P投ㄖ频奶魬?zhàn)。
在很多場(chǎng)景下,通用大模型在標(biāo)準(zhǔn)場(chǎng)合表現(xiàn)出色,但在特定垂直場(chǎng)景中可能無(wú)法滿足需求。因此,許多客戶嘗試基于自有數(shù)據(jù)對(duì)開源模型進(jìn)行定制。但模型定制本身也面臨諸多挑戰(zhàn)——需要專業(yè)技能,需要高質(zhì)量數(shù)據(jù),才能獲得理想效果。
在這方面,我們的Amazon SageMaker AI產(chǎn)品提供了豐富的模型定制支持。在本次re:Invent大會(huì)上,我們發(fā)布了四種不同的模型定制能力,包括強(qiáng)化微調(diào)、模型定制化訓(xùn)練、無(wú)檢查點(diǎn)訓(xùn)練,以及Amazon Nova Forge
這里特別想介紹Nova Forge。Nova Forge允許用戶在基礎(chǔ)模型訓(xùn)練階段就注入自己的數(shù)據(jù)。
打個(gè)比方:一個(gè)人學(xué)習(xí)語(yǔ)言,什么時(shí)候效果最好?在年幼時(shí)期,大腦還在發(fā)育階段,學(xué)習(xí)能力最強(qiáng),幾乎不知不覺就能掌握一門語(yǔ)言。但如果到了大學(xué)階段再去學(xué)一門新語(yǔ)言,可能需要付出極大努力,效果卻不如幼年時(shí)期。
大語(yǔ)言模型的定制邏輯與此類似。如果能在模型開發(fā)階段就進(jìn)行定制,效果遠(yuǎn)優(yōu)于模型完成后再做調(diào)整
劃定邊界:讓Agent既自主又可控
當(dāng)我們把Agent交付給用戶使用時(shí),如果缺乏適當(dāng)?shù)募s束,可能會(huì)產(chǎn)生意想不到的后果。這是我們必須規(guī)避的風(fēng)險(xiǎn)。
目前業(yè)界常見兩種極端做法:一種是對(duì)Agent嚴(yán)防死守,另一種是過(guò)度依賴人工干預(yù)。顯然,這兩種方式都不是理想選擇。
針對(duì)這一問(wèn)題,我們?cè)诒敬蝦e:Invent大會(huì)上為AgentCore發(fā)布了一項(xiàng)新特性——Policy(策略)。
通過(guò)Policy,可以為Agent定義一個(gè)行為框架。在這個(gè)框架內(nèi),Agent可以自主完成任務(wù);但Policy能夠明確界定Agent不可逾越的邊界。比如,合規(guī)性限制、安全紅線等都可以通過(guò)Policy來(lái)配置。我們已經(jīng)有客戶在實(shí)際使用這一工具,通過(guò)Policy實(shí)現(xiàn)安全可靠的Agent運(yùn)行。
再談?wù)勛詣?dòng)化。
過(guò)去,人類實(shí)現(xiàn)工作流自動(dòng)化主要依賴RPA(機(jī)器人流程自動(dòng)化,Robotic Process Automation)技術(shù)。但大模型的出現(xiàn)帶來(lái)了新的可能性:大模型能夠處理更復(fù)雜、更靈活的任務(wù),但如何讓它與現(xiàn)有工作流深度結(jié)合?
為此,我們開發(fā)了Amazon Nova Act
Nova Act深度集成了大模型能力與AgentCore的工程化能力,打造了全新的工作流自動(dòng)化方案。與傳統(tǒng)RPA工具不同,Nova Act因?yàn)槿诤狭舜竽P偷闹悄埽w成功率可以達(dá)到80%以上。通過(guò)Nova Act,大模型可以直接與執(zhí)行器、瀏覽器進(jìn)行交互,實(shí)現(xiàn)端到端的工作流自動(dòng)化。
最后介紹兩個(gè)案例。
Blue Origin(藍(lán)色起源)是美國(guó)一家商業(yè)航天公司,專注于火箭與太空探索。他們已經(jīng)通過(guò)Bedrock和Strands Agents等服務(wù)構(gòu)建了超過(guò)2700個(gè)內(nèi)部Agent,實(shí)現(xiàn)了75%的交付效率提升,設(shè)計(jì)質(zhì)量相比原始方案提高了40%。
Sony(索尼)是全球領(lǐng)先的電子與娛樂(lè)公司。Sony通過(guò)構(gòu)建Agent能力打造了內(nèi)部的“Data Ocean”數(shù)據(jù)平臺(tái)。他們基于Bedrock構(gòu)建企業(yè)級(jí)大模型,每天服務(wù)超過(guò)57000名內(nèi)部用戶,處理多達(dá)15萬(wàn)次推理請(qǐng)求。同時(shí),Sony還使用微調(diào)能力對(duì)Amazon Nova 2.0 Lite進(jìn)行了定制,將合規(guī)審核效率提升了整整100倍。
re:Invent 2025發(fā)布了大量新產(chǎn)品,由于時(shí)間有限,今天只能介紹其中一部分。通過(guò)這些產(chǎn)品,我們希望能夠幫助更多企業(yè)獲得更強(qiáng)的工程化能力,在Agent應(yīng)用中取得更高的效率。
也希望大家在構(gòu)建和應(yīng)用Agent時(shí),可以嘗試今天提到的這些能力。
讓我們一起構(gòu)建未來(lái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.