<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenSearch把向量檢索延遲壓到3毫秒

      0
      分享至


      去年夏天,AWS內部有個數據沒對外講:用OpenSearch做向量相似度搜索,延遲中位數壓到了3毫秒。這個數字放在RAG(檢索增強生成)場景里,意味著大模型還沒開始"思考",答案已經候場了。

      但Bedrock團隊沒按常理出牌。他們新推的Agentic助手架構,把語義搜索和文本搜索捆在一起用——不是二選一,是讓兩者互相拆臺又互相補位。

      為什么"混合檢索"成了必選項

      純向量檢索有個經典翻車現場:用戶搜"Apple",系統返回一堆水果營養學的文檔,把蘋果公司財報埋在第47位。語義理解再強,也猜不透用戶此刻到底想啃的是iPhone還是紅富士。

      Bedrock的解法粗暴但有效。查詢進來先走兩條 pipeline:一條把問題轉成向量,去向量庫里找"意思相近"的;另一條保留原始關鍵詞,去倒排索引里找"字面匹配"的。最后把兩撥結果扔給一個重排序模型,讓它決定誰該上浮、誰該沉底。

      這套架構的隱性成本在于:你得維護兩套索引,付兩份存儲錢,調兩個召回策略。AWS的底氣是OpenSearch Serverless能自動擴縮容,但中小企業的賬單可能沒那么好看。

      Bedrock AgentCore 的隱藏設計

      這次發布里有個被低估的組件:AgentCore。它不像Agents for Amazon Bedrock那樣包辦對話管理,而是專注做"工具調用"的編排層——什么時候查數據庫、什么時候調API、什么時候把結果喂給模型,它用一套聲明式配置串起來。

      舉個例子。酒店預訂場景里,用戶說"下周三去北京,要離國貿近的"。AgentCore會先把這句話拆成結構化意圖:日期=下周三、城市=北京、區域=國貿。然后觸發兩條并行檢索:向量庫查"商務出行偏好"的歷史畫像,關系庫查實時房態。兩條結果合并后,才進LLM生成最終回復。

      關鍵細節:AgentCore允許開發者在"讓LLM自己決定"和"硬編碼流程"之間滑動調節。信任模型就多給自主權,怕幻覺就收緊權限——這個滑動條的位置,往往比模型選型更能決定用戶體驗。

      Strands Agents 的入場時機

      AWS這次把Strands Agents也塞進了技術棧,位置有點微妙。它負責的是多輪對話中的"記憶管理":用戶三分鐘前提過的"不要高層房間",現在還能被準確召回。

      但Strands的真正價值可能是"兜底"。當AgentCore的工具調用鏈斷裂——比如API超時、數據庫返回空——Strands能切換對話策略,把硬失敗包裝成軟回復:"這部分信息暫時查不到,我先給您推薦幾家評分穩定的?"

      這種分層架構的本質,是把"智能"拆成可替換的模塊。今天用Claude 3.5,明天換自研模型,只要向量維度和API契約不變,底層檢索層不用動。

      向量數據庫的軍備競賽,OpenSearch卡在哪

      OpenSearch的向量引擎去年加了磁盤原生索引(disk-native index),能把十億級向量的存儲成本壓到內存方案的1/10。代價是查詢延遲從亞毫秒爬到毫秒級——對推薦系統無傷大雅,對實時RAG卻是生死線。

      Bedrock團隊的應對是"預過濾"。在向量搜索前,先用元數據過濾(比如"只查過去30天的文檔")縮小候選集,把有效計算量砍掉90%。這招依賴業務場景有可用的結構化標簽,不是所有數據集都能照搬。

      更隱蔽的瓶頸在嵌入模型。Bedrock默認用Amazon Titan做文本向量化,但技術文檔里留了鉤子:可以替換成自定義模型。這個設計暗示AWS自己也清楚,通用嵌入在垂直領域經常被微調模型碾壓。

      一個待驗證的假設

      AWS這次沒公布混合檢索的端到端延遲數據。3毫秒的向量檢索是單點成績,加上關鍵詞檢索、重排序、LLM首token生成,完整鏈路可能奔著500毫秒去。

      他們押注的是:用戶寧愿多等半秒,也要答案準一點。但這個權衡在客服場景(用戶急著解決問題)和內容創作場景(用戶愿意多輪打磨)里,可能是相反的。

      Bedrock的文檔里埋了句話,可能是整個架構的注腳:「檢索策略的選擇,應該由查詢的意圖置信度動態決定。」翻譯成人話:系統自己也不知道該信向量還是信關鍵詞,所以干脆全跑一遍。

      這種"暴力美學"能撐多久?當查詢量從千級飆到百萬級,成本曲線會不會突然變陡?AWS沒給答案,但把調參的開關都擺在了控制臺里。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      圖片是清代正一品涼州將軍府衙門的一個門。

      圖片是清代正一品涼州將軍府衙門的一個門。

      慕容洞唐
      2026-04-07 20:12:29
      時速超300!鄭麗文體驗大陸高鐵速度

      時速超300!鄭麗文體驗大陸高鐵速度

      叮當當科技
      2026-04-07 18:47:11
      張雪峰團隊復播!全網破防!

      張雪峰團隊復播!全網破防!

      廣告案例精選
      2026-04-08 08:29:44
      怪不得皇馬會輸,現場球迷實拍維尼修斯錯失大單刀過程,太辣眼了

      怪不得皇馬會輸,現場球迷實拍維尼修斯錯失大單刀過程,太辣眼了

      側身凌空斬
      2026-04-08 07:10:15
      嫣然天使兒童醫院發文感謝陳光標捐贈1000萬!陳光標此前稱:張雪遲遲沒來提車,將車輛變現1000萬元贈予嫣然醫院

      嫣然天使兒童醫院發文感謝陳光標捐贈1000萬!陳光標此前稱:張雪遲遲沒來提車,將車輛變現1000萬元贈予嫣然醫院

      每日經濟新聞
      2026-04-07 14:17:07
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      福建車輛墜河5死,原因已找到,3個機會沒有抓住,丈夫責任也不小

      福建車輛墜河5死,原因已找到,3個機會沒有抓住,丈夫責任也不小

      觀察鑒娛
      2026-04-08 09:30:20
      達利歐重磅發聲:2026遠比你想的更危險

      達利歐重磅發聲:2026遠比你想的更危險

      流蘇晚晴
      2026-04-07 18:27:02
      斷更三年!潘石屹突然發聲:我命由我

      斷更三年!潘石屹突然發聲:我命由我

      新浪財經
      2026-04-07 22:44:05
      一碗泡面引爆全網,泰國人開始“抗日”了!

      一碗泡面引爆全網,泰國人開始“抗日”了!

      大道微言
      2026-04-06 12:38:56
      300058,“20cm”漲停!A股,兩大板塊爆發!

      300058,“20cm”漲停!A股,兩大板塊爆發!

      證券時報e公司
      2026-04-08 12:15:49
      吉利要殺死合資!長超5米2,續航1505km,雙叉臂+6座,才賣13萬

      吉利要殺死合資!長超5米2,續航1505km,雙叉臂+6座,才賣13萬

      生活魔術專家
      2026-04-08 03:22:06
      王新軍摟著10歲兒子好親近,一家3口甜到齁!

      王新軍摟著10歲兒子好親近,一家3口甜到齁!

      庭小娛
      2026-02-25 15:06:51
      西方承認,經過中東這一仗才發現,中國手里3張底牌,別人學不來

      西方承認,經過中東這一仗才發現,中國手里3張底牌,別人學不來

      興史興談
      2026-04-07 11:54:20
      泰山緊急換帥,三大潛在人選,一人呼聲最高,另一人最具沖冠潛力

      泰山緊急換帥,三大潛在人選,一人呼聲最高,另一人最具沖冠潛力

      體壇風之子
      2026-04-08 07:00:08
      恩里克正式回絕曼聯,將2000萬續約!更衣室認為卡里克是真命天子

      恩里克正式回絕曼聯,將2000萬續約!更衣室認為卡里克是真命天子

      羅米的曼聯博客
      2026-04-08 11:26:02
      白宮官員稱以色列已同意臨時停火

      白宮官員稱以色列已同意臨時停火

      財聯社
      2026-04-08 06:56:05
      2026最新世界排名:趙心童進前三再創歷史,滿足兩條件登頂第一!

      2026最新世界排名:趙心童進前三再創歷史,滿足兩條件登頂第一!

      去山野間追風
      2026-04-08 09:05:36
      全紅嬋陳芋汐微信群事件:群規禁止攻擊其他運動員,全紅嬋除外

      全紅嬋陳芋汐微信群事件:群規禁止攻擊其他運動員,全紅嬋除外

      一盅情懷
      2026-04-06 16:15:41
      60-58!這就是阿門的改變,他終究完成了鋒線到控衛的逆襲

      60-58!這就是阿門的改變,他終究完成了鋒線到控衛的逆襲

      奕辰說球
      2026-04-08 10:09:06
      2026-04-08 14:16:49
      薛定諤的BUG
      薛定諤的BUG
      有態度網友ytd
      958文章數 30關注度
      往期回顧 全部

      科技要聞

      造出地表最強AI,卻死活不給你用!

      頭條要聞

      裝修工強奸未遂殺雇主 死者兒子跟"媽"聊天發現不對勁

      頭條要聞

      裝修工強奸未遂殺雇主 死者兒子跟"媽"聊天發現不對勁

      體育要聞

      皇馬1.5億巨星浪費超級單刀 丟球攤手抱怨

      娛樂要聞

      楊穎鄧超低調現身觀眾席 支持陳赫話劇

      財經要聞

      特朗普同意停火兩周 伊朗:接受停火提議

      汽車要聞

      5門5座/新復古造型 繽果Pro將于4月14日開啟預售

      態度原創

      健康
      藝術
      家居
      手機
      軍事航空

      干細胞抗衰4大誤區,90%的人都中招

      藝術要聞

      齊白石『凌波仙子』

      家居要聞

      自在恣意 侘寂風別墅

      手機要聞

      小米18首發!高通驍龍8E6系列新增協處理器:待機更持久

      軍事要聞

      文化符號當“彈藥” 美伊將信息戰帶入新階段

      無障礙瀏覽 進入關懷版