<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      別再迷信Prompt了,這才是Agent的真正戰(zhàn)場(chǎng)

      0
      分享至

      曾經(jīng)被奉為AI魔法咒語的Prompt Engineering,如今在大模型Agent開發(fā)中的權(quán)重已大幅下降。本文探討了Prompt權(quán)重下降的原因,以及現(xiàn)代Agent開發(fā)的核心挑戰(zhàn)和替代方案,幫助從業(yè)者適應(yīng)這一范式轉(zhuǎn)移。

      ———— / BEGIN / ————

      我們?cè)孕臥rompt Engineering是AI的魔法咒語,但隨著大模型智商飆升和應(yīng)用深入,Agent競(jìng)爭(zhēng)的主戰(zhàn)場(chǎng)早已轉(zhuǎn)移。

      大模型Agent的核心還是Prompt嗎?

      如果這個(gè)問題在2023年上半年提出,我會(huì)毫不猶豫地告訴你:是的,Prompt就是咒語,就是魔法,誰掌握了Prompt誰就是大法師。那時(shí)我們還在為如何讓GPT-3.5不”胡說八道”而絞盡腦汁地嘗試”Let’s think step by step”。

      但在即將進(jìn)入2026年的今天,如果仍認(rèn)為Agent的核心競(jìng)爭(zhēng)力是Prompt,那在AI落地的一線戰(zhàn)場(chǎng)上,可能尚未經(jīng)歷真正的實(shí)戰(zhàn)洗禮。

      觀點(diǎn)先行:Prompt權(quán)重的斷崖式下跌:

      在2025年的當(dāng)下,Prompt在Agent開發(fā)中的權(quán)重,已從原來的90%降至最多30%。 Agent現(xiàn)在的核心是工作流編排、記憶管理、工具生態(tài)接口標(biāo)準(zhǔn)化,以及最關(guān)鍵的——自動(dòng)化評(píng)估體系。Prompt現(xiàn)在更多充當(dāng)前端交互層,是API調(diào)用的一個(gè)參數(shù)而已。

      為什么Prompt不再占據(jù)主導(dǎo)地位?

      前兩年大家迷信Prompt Engineering,是因?yàn)槟P捅旧淼倪壿嬐评砟芰Σ蛔?,需要通過精巧的話術(shù)引導(dǎo)甚至”哄著”模型工作。然而,當(dāng)今的DeepSeek V3、Claude 4.5 Sonnet等先進(jìn)模型,其意圖理解能力已大幅提升。即使給出粗糙的Prompt,模型也能大概率領(lǐng)會(huì)意圖。

      真實(shí)案例對(duì)比:以往需數(shù)百字Prompt加少樣本示例才能讓Agent將混亂的會(huì)議紀(jì)要整理成JSON格式?,F(xiàn)在,只需簡(jiǎn)單指令”轉(zhuǎn)成標(biāo)準(zhǔn)JSON,字段自行判斷”,結(jié)果基本可用。

      當(dāng)模型智商提升,Prompt這一”拐杖”的作用自然減弱。但這反而提高了Agent開發(fā)的門檻,因?yàn)楝F(xiàn)在要解決的是復(fù)雜任務(wù)。

      以我們的供應(yīng)鏈Agent為例,其任務(wù)包括:檢測(cè)庫存安全水位、分析歷史銷量、預(yù)測(cè)需求、對(duì)比供應(yīng)商、生成補(bǔ)貨單并發(fā)送審批。這種多步驟流程無法依靠單一Prompt實(shí)現(xiàn),必須依賴流程工程。

      技術(shù)轉(zhuǎn)向:Agent開發(fā)的核心已從Prompt設(shè)計(jì)轉(zhuǎn)向Flow Engineering。如LangChain團(tuán)隊(duì)的LangGraph和吳恩達(dá)推崇的Agentic Patterns所示,現(xiàn)代Agent是由大模型驅(qū)動(dòng)的狀態(tài)機(jī),需要明確定義步驟、成功/失敗路徑和數(shù)據(jù)傳遞邏輯。

      在我們的代碼庫中,邏輯控制代碼的規(guī)模遠(yuǎn)超Prompt字符數(shù)。我們通過代碼約束模型行為,而非依靠自然語言祈禱模型表現(xiàn)良好。

      當(dāng)前Agent開發(fā)的核心挑戰(zhàn)

      隨著Prompt權(quán)重的下降,真正的挑戰(zhàn)浮出水面,主要體現(xiàn)在以下三個(gè)方面,這些問題在傳統(tǒng)Prompt優(yōu)化中找不到答案:

      1. 規(guī)劃與執(zhí)行的脫節(jié)

      大模型擅長制定計(jì)劃,但長鏈條執(zhí)行中容易”迷路”。例如,供應(yīng)鏈Agent中,模型規(guī)劃”先查A數(shù)據(jù)庫,再查B系統(tǒng)”,但當(dāng)A數(shù)據(jù)庫返回含特殊字符的數(shù)據(jù),模型生成查詢B系統(tǒng)的SQL時(shí)會(huì)失敗,并陷入死循環(huán)。

      解決方案:需要大量Guardrails代碼校驗(yàn)?zāi)P洼敵龅膮?shù)合法性,這是傳統(tǒng)Prompt工程無法解決的魯棒性問題。

      2. 上下文污染與記憶管理難題

      盡管當(dāng)今模型的上下文窗口可達(dá)128K甚至1M,但存在”中間迷失”現(xiàn)象:上下文越長,模型性能越受影響。在Agent運(yùn)行過程中,歷史消息快速積累,如何動(dòng)態(tài)管理上下文成為關(guān)鍵挑戰(zhàn)。

      我們的實(shí)踐:引入”總結(jié)Agent”在關(guān)鍵節(jié)點(diǎn)對(duì)對(duì)話記錄進(jìn)行摘要,保留關(guān)鍵變量,替換原始對(duì)話。這要求精準(zhǔn)判斷哪些記憶長期有用(存向量數(shù)據(jù)庫),哪些短期相關(guān)(放上下文),哪些可丟棄。

      3. 評(píng)估的黑盒問題

      這是大模型落地團(tuán)隊(duì)最頭疼的問題。傳統(tǒng)軟件有單元測(cè)試(輸入A,輸出必為B),但Agent的輸出具有不確定性:輸入A,可能輸出B1或B2,語義相同卻形式各異。

      更棘手的是隱性錯(cuò)誤:如供應(yīng)鏈Agent決策”補(bǔ)貨500件”,而算法計(jì)算為520件,結(jié)果看似可接受,但若依據(jù)錯(cuò)誤邏輯(如混淆月度數(shù)據(jù)),這種隱患難以檢測(cè)。

      行業(yè)現(xiàn)狀:尚無完美解決方案,我們采用LLM-as-a-Judge方法,以更強(qiáng)模型評(píng)估小模型或Agent的執(zhí)行過程。

      從Prompt Engineering到DSPy:范式轉(zhuǎn)移

      既然Prompt不再是核心,那么什么是更好的替代方案?如果你仍在手動(dòng)調(diào)整Prompt,如將”You are a helpful assistant”改為”You are an expert data scientist”,那么是時(shí)候了解DSPy框架了。

      DSPy由斯坦福大學(xué)開發(fā),其核心理念極為超前:Prompt不應(yīng)由人工編寫,而應(yīng)由模型自我優(yōu)化。在這一框架下,你只需定義任務(wù)邏輯(Signature)并準(zhǔn)備高質(zhì)量數(shù)據(jù)集,DSPy便會(huì)自動(dòng)優(yōu)化Prompt,嘗試各種少樣本組合,調(diào)整指令,直至在測(cè)試集上達(dá)到最優(yōu)效果。

      這類似于從匯編語言(手寫Prompt)升級(jí)到C++(使用DSPy),編譯器負(fù)責(zé)生成匯編代碼。我們團(tuán)隊(duì)已用DSPy Module替代許多手寫Prompt模塊,效率顯著提升。

      實(shí)戰(zhàn)案例:保險(xiǎn)理賠核查Agent的演進(jìn)

      讓我們通過一個(gè)保險(xiǎn)理賠核查Agent案例,具體理解這種思維轉(zhuǎn)變:

      初始階段(Prompt思維):編寫長達(dá)3000token的System Prompt,詳細(xì)規(guī)定車險(xiǎn)理賠規(guī)則。結(jié)果上線后,面對(duì)模糊照片,Agent幻覺出責(zé)任認(rèn)定書并錯(cuò)誤拒賠。原因是過長Prompt導(dǎo)致指令沖突,模型在信息不足時(shí)強(qiáng)行腦補(bǔ)。

      進(jìn)階階段(Agentic Flow思維):將大Prompt拆解為三個(gè)獨(dú)立Agent:材料初審Agent(檢查清晰度)、規(guī)則提取Agent(RAG檢索條款)、最終裁決Agent(綜合判斷)。Agent間通過代碼邏輯連接,如if 材料初審Agent.result == “不清晰”: return “請(qǐng)重傳”。

      此案例中,各Agent的Prompt極為簡(jiǎn)單,核心競(jìng)爭(zhēng)力在于問題拆解架構(gòu)和Workflow設(shè)計(jì)能力。

      給從業(yè)者的務(wù)實(shí)建議

      基于實(shí)戰(zhàn)經(jīng)驗(yàn),為同行提供以下建議:


      • 放棄“通才”模型幻想,轉(zhuǎn)向“專才”協(xié)同趨勢(shì)是Multi-Agent System,如微軟AutoGen和LangGraph所示。需要掌握的是如何讓多個(gè)AI協(xié)作甚至辯論,而非單一Prompt技巧。

      • 掌握結(jié)構(gòu)化輸出Agent內(nèi)部數(shù)據(jù)流轉(zhuǎn)必須是JSON或Pydantic對(duì)象。OpenAI的Structured Outputs和開源模型的Function Calling是接入傳統(tǒng)IT系統(tǒng)的橋梁。

      • 重視SOP(標(biāo)準(zhǔn)作業(yè)程序)的數(shù)據(jù)轉(zhuǎn)化Agent所需的數(shù)據(jù)并非傳統(tǒng)訓(xùn)練集,而是企業(yè)SOP。例如,開發(fā)高效HR Agent依賴員工手冊(cè)和歷年案例。將這些SOP轉(zhuǎn)化為Agent可理解的工具或知識(shí)庫,才是核心競(jìng)爭(zhēng)力。

      • 回歸代碼工程本質(zhì)Agent開發(fā)不能違背軟件工程原則:版本控制、單元測(cè)試、日志監(jiān)控、灰度發(fā)布等缺一不可。代碼錯(cuò)誤會(huì)報(bào)錯(cuò),Agent錯(cuò)誤則會(huì)一本正經(jīng)地胡說八道,危害更大。


      結(jié)論:2026年高階玩家的門票

      大模型Agent的核心早已不是Prompt。當(dāng)下的Prompt如同代碼中的變量命名:良好的變量名增強(qiáng)可讀性,但僅靠變量名無法構(gòu)建淘寶或微信這樣的系統(tǒng)。

      真正的護(hù)城河在于系統(tǒng)架構(gòu)設(shè)計(jì)、數(shù)據(jù)流轉(zhuǎn)邏輯、異常處理以及垂直領(lǐng)域的行業(yè)知識(shí),這些要素封裝于Workflow和工具中。因此,不必過度糾結(jié)Prompt的雕琢,而應(yīng)積極學(xué)習(xí)LangGraph、DSPy,提升RAG準(zhǔn)確率,將業(yè)務(wù)SOP代碼化。這才是應(yīng)對(duì)未來挑戰(zhàn)的關(guān)鍵。

      Prompt是對(duì)話的起點(diǎn),而智能的工作流與堅(jiān)實(shí)的工程化能力,才是Agent價(jià)值持續(xù)增長的基石。

      本文來自公眾號(hào):栗子 作者:栗子

      想要第一時(shí)間了解行業(yè)動(dòng)態(tài)、面試技巧、商業(yè)知識(shí)等等等?加入產(chǎn)品經(jīng)理進(jìn)化營,跟優(yōu)秀的產(chǎn)品人一起交流成長!


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報(bào)
      2025-12-14 22:36:54
      臺(tái)灣媒體:中國是世上唯一、遭遇殖民就死戰(zhàn)不退的國家!全球少有

      臺(tái)灣媒體:中國是世上唯一、遭遇殖民就死戰(zhàn)不退的國家!全球少有

      來科點(diǎn)譜
      2026-02-20 07:16:10
      郎平也沒想到,當(dāng)年留給前夫在美國長大的女兒,如今成了她的驕傲

      郎平也沒想到,當(dāng)年留給前夫在美國長大的女兒,如今成了她的驕傲

      冷紫葉
      2026-01-29 19:10:32
      “所以,輸了嗎?”美媒披露“特朗普得知關(guān)稅政策被判違法的那一刻”

      “所以,輸了嗎?”美媒披露“特朗普得知關(guān)稅政策被判違法的那一刻”

      環(huán)球網(wǎng)資訊
      2026-02-21 13:32:39
      農(nóng)村倫理故事:死于兒媳手里的公公

      農(nóng)村倫理故事:死于兒媳手里的公公

      長安一孤客
      2025-12-26 17:21:00
      不可錯(cuò)過!2月21日下午16:00比賽!中央5套CCTV5、CCTV5+直播表

      不可錯(cuò)過!2月21日下午16:00比賽!中央5套CCTV5、CCTV5+直播表

      皮皮觀天下
      2026-02-21 15:16:31
      三年前,55歲湖南老漢發(fā)現(xiàn)工友老婆,竟是失蹤14年的妻子

      三年前,55歲湖南老漢發(fā)現(xiàn)工友老婆,竟是失蹤14年的妻子

      法老不說教
      2026-02-19 16:59:24
      北京發(fā)布沙塵藍(lán)色預(yù)警信號(hào)

      北京發(fā)布沙塵藍(lán)色預(yù)警信號(hào)

      新華社
      2026-02-21 09:28:49
      張家界“愛國賊事件”:傻X式愛國,是個(gè)巨大禍害

      張家界“愛國賊事件”:傻X式愛國,是個(gè)巨大禍害

      麥大人
      2025-10-13 15:29:56
      河南小伙在非洲16年,當(dāng)?shù)匾环蚨嗥拗疲腥酥挥猛妫藪赍X養(yǎng)家

      河南小伙在非洲16年,當(dāng)?shù)匾环蚨嗥拗?,男人只用玩,女人掙錢養(yǎng)家

      大魚簡(jiǎn)科
      2026-02-07 16:50:52
      女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

      女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

      漢史趣聞
      2025-11-08 09:27:32
      俄媒稱K寶若參賽米蘭冬奧肯定輕松奪冠 無四周跳女子花滑倒退10年

      俄媒稱K寶若參賽米蘭冬奧肯定輕松奪冠 無四周跳女子花滑倒退10年

      勁爆體壇
      2026-02-21 06:54:19
      10到15天!特朗普對(duì)伊朗最新通牒,中東火藥桶是否要炸?

      10到15天!特朗普對(duì)伊朗最新通牒,中東火藥桶是否要炸?

      上觀新聞
      2026-02-20 17:23:14
      馬云曾3次請(qǐng)她“出山”,入職阿里后身家百億,年過40仍孑然一身

      馬云曾3次請(qǐng)她“出山”,入職阿里后身家百億,年過40仍孑然一身

      歷史甄有趣
      2026-01-02 06:35:07
      別再花冤枉錢!iPhone自帶多款高效應(yīng)用,全部免費(fèi)更實(shí)用

      別再花冤枉錢!iPhone自帶多款高效應(yīng)用,全部免費(fèi)更實(shí)用

      小柱解說游戲
      2026-02-20 09:16:19
      太囂張!那藝娜被湖北官方列為劣跡藝人,團(tuán)隊(duì)硬剛:是地區(qū)黑公關(guān)

      太囂張!那藝娜被湖北官方列為劣跡藝人,團(tuán)隊(duì)硬剛:是地區(qū)黑公關(guān)

      離離言幾許
      2026-02-21 14:46:36
      對(duì)越反擊戰(zhàn),世界上只有兩個(gè)國家支持中國,是敵是友一目了然!

      對(duì)越反擊戰(zhàn),世界上只有兩個(gè)國家支持中國,是敵是友一目了然!

      嘆為觀止易
      2026-02-17 13:08:02
      1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      哄動(dòng)一時(shí)啊
      2026-02-17 22:21:25
      新加坡大滿貫正賽首日賽程:22日上午6場(chǎng)下午2場(chǎng)

      新加坡大滿貫正賽首日賽程:22日上午6場(chǎng)下午2場(chǎng)

      小僫搞笑解說
      2026-02-21 10:25:16
      原來花小錢就能過得舒服很多,網(wǎng)友:不要心疼電費(fèi),該省省該花花

      原來花小錢就能過得舒服很多,網(wǎng)友:不要心疼電費(fèi),該省省該花花

      另子維愛讀史
      2026-01-23 20:02:10
      2026-02-21 17:23:00
      人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
      人人都是產(chǎn)品經(jīng)理社區(qū)
      想要成為大牛先從學(xué)做產(chǎn)品開始
      64445文章數(shù) 311530關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認(rèn):系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認(rèn):系一家人

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關(guān)系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財(cái)經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔(dān)當(dāng)”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      房產(chǎn)
      家居
      數(shù)碼
      健康
      公開課

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      家居要聞

      本真棲居 愛暖伴流年

      數(shù)碼要聞

      NVIDIA新卡皇RTX 5090 Ti再曝光:功耗直飆超700W!性能提升10%

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版