網易首頁 > 網易號 > 正文申請入駐

Google把回調藏了6個月，開發者發現后成本直降40%

2026-04-07 00:40:49　來源: 像素與芯片

北京舉報

分享至

去年Q3，某金融科技團隊把AI Agent部署到生產環境后，月度賬單從8000美元飆到34000美元。產品經理盯著儀表盤看了十分鐘，只問了一句話：「我們到底在為什么付費？」

問題出在大多數人忽略的環節——回調鉤子（callback hooks）。Google ADK（Agent Development Kit，智能體開發套件）去年開源時帶了這個功能，但文檔里只占了三頁。直到團隊把LLM調用從主邏輯里剝離出來，才發現70%的token消耗根本沒必要經過模型。

回調鉤子不是優化選項，是架構設計的必選項。

六組鉤子，對應Agent的六個呼吸節點

ADK的回調機制覆蓋三個執行階段的前后：Agent執行、模型調用、工具調用。每個節點都能插入自定義邏輯，像給流水線裝傳感器。

作者在實際項目中部署了8個串聯Agent（sequentialEvaluationAgent），包括項目評估、反模式檢測、決策、推薦、審計、上傳、合并、郵件通知。其中5個LLM Agent需要Gemini推理，3個執行類Agent對接外部API。

關鍵設計決策：把確定性操作從LLM Agent遷移到回調鉤子。審計日志寫入、云存儲上傳、郵件觸發——這些動作原本嵌在Agent內部，現在改在鉤子階段執行。

改造前后的差異可以用一個類比理解：以前是每個工人都自帶倉庫鑰匙，取材料要親自跑一趟；現在是流水線旁設傳送帶，工人專注加工，物流系統并行運轉。

本地調試的陷阱：為什么性能問題總被延遲發現

作者的開發流程很有代表性。ADK Web本地測試階段，優先級排序是：正確性 > 性能 > token消耗。Agent能跑通就行，延遲多兩秒無所謂。

QA環境暴露真相。產品經理和測試團隊第一次完整跑通流程后，反饋就兩條：慢，貴。這時候回頭排查，發現多個瓶頸——重復的大模型調用、同步阻塞的外部API、沒有緩存的中間結果。

回調鉤子的價值在這個階段顯現。before_agent鉤子可以預處理輸入，過濾無效請求；after_model鉤子能截獲響應，把確定性格式化邏輯從模型輸出中剝離；before_tool和after_tool鉤子則讓外部調用變成可觀測、可重試的獨立單元。

具體收益：項目評估Agent的token消耗下降37%，端到端延遲從4.2秒降到1.8秒。反模式檢測Agent通過緩存相似查詢，重復請求成本歸零。

企業級部署的一個細節：依賴鎖定

作者在package.json里用了--save-exact。這個細節容易被忽略，但在生產環境意味著版本一致性。ADK本身迭代快，@google/adk和@google/adk-devtools的版本漂移可能導致本地通過的測試在線上失敗。

依賴清單包括：ADK核心庫、開發工具、Nodemailer（本地郵件測試）、Marked（Markdown轉HTML）、Zod（Schema驗證）。測試階段用MailHog捕獲郵件，避免誤發。

環境配置也有地域限制。Gemini在香港不可用，作者選擇Vertex AI作為認證入口。GOOGLE_GENAI_USE_VERTEXAI=T這個開關，決定了整套架構的可用性。

回調鉤子的真正成本優勢不在省token，而在把「要不要調用模型」變成可編程決策。

作者最后提了一個未完成的實驗：在after_agent鉤子中加入動態模型選擇邏輯——簡單查詢走Flash-Lite，復雜推理切到Pro。如果路由準確率能穩定在90%以上，整體成本還有30%的下探空間。

這套機制現在跑在作者的QA環境。生產部署前，團隊還在爭論一個點：回調鉤子里的業務邏輯越來越重，要不要拆成獨立的微服務？還是說，Agent和鉤子的邊界本來就該模糊？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0
Claude Code一周份額，一天燒完一半？有人逆向工程發現了7個bug

機器之心Pro 2026-04-07 17:34:08
0 跟貼 0

鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0

PMDformer：一個簡單減法實現長時序預測注意力機制糾偏

機器之心Pro 2026-04-07 13:31:21
0 跟貼 0
2010美股閃崩預演! Claude黑進底層，谷歌預警: AI將血洗人類萬億財富

新智元 2026-04-06 19:58:03
37 跟貼 37

谷歌創始人布林：當年發完Transformer論文，我們太不當回事了

機器之心Pro 2025-12-15 10:18:00
49 跟貼 49

谷歌用一堆不賺錢的AI小玩意，給科技圈上了一課

機器之心Pro 2026-01-26 14:47:02
43 跟貼 43
「OpenClaw之父點贊」終結百蝦大戰？一場升級版的AI原生革命上演

新智元 2026-04-07 12:10:28
0 跟貼 0

美股大型科技股盤前普跌，英偉達跌0.6%

每日經濟新聞 2026-04-07 16:04:06
0 跟貼 0
完球了，GPT-4o之母宣布離職OpenAI

量子位 2026-04-07 17:19:50
0 跟貼 0
哈薩比斯傳記里講了好多八卦啊

量子位 2026-04-07 16:45:21
0 跟貼 0
玩家吐槽云游戲是"垃圾"！最好的云游戲就是串流投屏

游民星空 2026-04-07 16:04:28
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0
別學Claude Code了！OMC五大「臥槽」功能解析：自動化開發軍團來了

鈦媒體APP 2026-04-01 11:09:53
0 跟貼 0
告別昂貴賬單，Token直降68%，多智能體動態協作編程來了

機器之心Pro 2026-04-07 13:16:40
0 跟貼 0
易中天，獲獎勵20萬元

極目新聞 2026-04-06 21:04:19
25401 跟貼 25401
【美股盤前】布油突破110美元/桶；Anthropic與谷歌和博通達成千億美元芯片交易；SpaceX計劃6月初進行IPO路演；折疊屏iPhone遭遇工程

每日經濟新聞 2026-04-07 17:38:09
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
3 跟貼 3
7個頂級AI集體撒謊，為救“同伴”篡改文件、偷運數據

鈦媒體APP 2026-04-07 11:01:25
0 跟貼 0
「AI殺死Git」？前GitHub掌門人開啟AI原生操作系統

新智元 2026-04-05 10:43:35
7 跟貼 7
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
2901 跟貼 2901
燒Token成KPI，8.5萬Meta員工狂刷60萬億Token，爭榜一大哥

機器之心Pro 2026-04-07 13:24:24
0 跟貼 0
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
玄甲（AgentWard）全鏈路防御操作系統正式發布

機器之心Pro 2026-04-07 13:58:00
0 跟貼 0
風箏-鄭耀先被催婚了！一套邏輯下來，說的徐百川啞口無言

龍耀影視 2026-04-03 09:03:13
3 跟貼 3
Meta員工空轉AI只為浪費token！燒的多掙的多，日均消耗2萬億

量子位 2026-04-07 17:13:17
0 跟貼 0
GPT-6 曝光了，奧特曼卻成了硅谷最焦慮的人

AppSo 2026-04-06 17:15:36
34 跟貼 34
鄭麗文率團抵達上海開啟大陸參訪行程

環球網資訊 2026-04-07 13:18:07
25 跟貼 25
細節決定成敗！張雪為了讓油箱多裝3L，輕3公斤，直接讓成本飆升

笨尼尼子 2026-04-07 06:48:54
0 跟貼 0
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
795 跟貼 795
深度剖析巧戰破局，戰術迭代，耗敵制勝

徐Toso 2026-04-07 02:06:21
0 跟貼 0
《給他愛5》代碼泄露曝光R星《Agent》主角模型

3DM游戲 2026-04-07 10:03:06
0 跟貼 0
堵！堵！堵！排隊26公里

無錫博報 2026-04-06 18:07:47
281 跟貼 281
AI融入社會的三階段風險！以自主演化為軸，重構智能體安全威脅

新智元 2026-04-05 12:34:09
0 跟貼 0
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
聽說看綠植對眼睛好，奶奶直接這樣做，成本2毛看完還能吃！

搞笑派大星 2026-04-05 11:36:33
1 跟貼 1
國家繼續實施調控成品油價格適當調整

財聯社 2026-04-07 15:04:33
1125 跟貼 1125
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
124 跟貼 124

手機 / 數碼

房產 / 家居

Google把回調藏了6個月，開發者發現后成本直降40%

六組鉤子，對應Agent的六個呼吸節點

本地調試的陷阱：為什么性能問題總被延遲發現

企業級部署的一個細節：依賴鎖定

滿嘴謊言！OpenAI奧特曼黑料大起底

開車致女友胸部以下高位截癱后失聯 男子首發聲

開車致女友胸部以下高位截癱后失聯 男子首發聲

官宣簽約“AI球員”，這支球隊被罵慘了...

張藝上浪姐惹爭議 黃景瑜前妻發文內涵

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

小米REDMI K90 Max同月競品曝光：天璣9500芯片，165Hz超高刷直屏

全面RGB：BitFenix火鳥推出霓虹水管液冷Glanz

每個學霸背后，都有一對“不管不顧”的父母……

美麗風光看不盡

不丑化就噴?《OW》中國女英雄模型優化疑遭覺醒抵制

開車致女友胸部以下高位截癱后失聯男子首發聲

開車致女友胸部以下高位截癱后失聯男子首發聲

張藝上浪姐惹爭議黃景瑜前妻發文內涵

不止是大極狐首款MPV問道V9靜態體驗