![]()
在 AI 快速發展的今天,LLM 已經具備很強的語言理解和生成能力,但在實際應用中仍會出現回答不準確、知識更新不及時以及在專業場景下表現不夠理想等問題。為了解決這些不足,檢索增強生成(RAG)通過在回答問題時引入外部資料,讓模型能夠“查資料再作答”,從而提升結果的可靠性。但是,傳統 RAG 通常流程比較固定,面對復雜問題時不夠靈活,在多步推理、隱私保護和個性化方面也存在一定局限。隨著 Agent 技術的發展,Agentic RAG 進一步增強了系統的能力,使 RAG 系統完成從“被動響應”到“主動思考”的躍遷。
本文以 Youtu-RAG 開源框架為例,介紹其整體設計、核心能力以及在實際業務中的應用效果,展示其在復雜場景中的優勢和潛力。
責編 | 夢依丹
出品 | 騰訊優圖實驗室投稿
在 AI 快速發展的今天,LLM 已經具備很強的語言理解和生成能力,但在實際應用中仍會出現回答不準確、知識更新不及時以及在專業場景下表現不夠理想等問題。為了解決這些不足,檢索增強生成(RAG)通過在回答問題時引入外部資料,讓模型能夠“查資料再作答”,從而提升結果的可靠性。但是,傳統 RAG 通常流程比較固定,面對復雜問題時不夠靈活,在多步推理、隱私保護和個性化方面也存在一定局限。隨著 Agent 技術的發展,Agentic RAG 進一步增強了系統的能力,使 RAG 系統完成從“被動響應”到“主動思考”的躍遷。
本文以 Youtu-RAG 開源框架為例,介紹其整體設計、核心能力以及在實際業務中的應用效果,展示其在復雜場景中的優勢和潛力。
![]()
RAG 概述
RAG(Retrieval-Augmented Generation,檢索增強生成)是一種結合信息檢索與大語言模型(LLM)生成能力的人工智能架構。 RAG 系統能夠從外部知識庫(如文檔、數據庫、網頁)中檢索出與問題相關的信息,并將這些信息作為上下文提供給 LLM,從而生成更準確、可靠、可追溯的答案。傳統 RAG 系統作為 LLM 的“知識外掛”,雖然在一定程度上緩解了 LLM 的“幻覺”問題,但仍然面臨以下核心問題:
1. 檢索能力不足:傳統 RAG 系統流程固定、無法實現多步推理、沒有規劃能力和工具調用能力。面對日益復雜的檢索場景和需求,傳統 RAG 已無法滿足。
![]()
2. 數據隱私風險:企業或個人敏感私有數據、商業信息在傳輸到外部 LLM 服務處理時存在一定泄露風險,無法實現敏感數據不出域的數據安全需求。
![]()
3. 記憶能力缺失:傳統 RAG 系統無法積累用戶的長期行為模式和個性化偏好,且跨會話信息無法關聯復用,導致每次對話都需要重新提供背景信息,相似問題也無法積累推理經驗。
![]()
面對以上問題,Youtu-RAG 給出了系統的解決方案:
![]()
1.新一代智能體驅動的檢索增強生成系統:基于 Youtu-Agent 框架開發,集成覆蓋多種檢索需求的 Agent 鏈路。相比傳統 RAG 系統,不再依賴固定的“檢索—生成”單次流程,而是利用 LLM 的 Agent 能力,使系統能夠自主規劃、決策、調用工具、推理,根據任務需求動態地執行檢索和分析。
2.本地全棧化部署,保證私有數據不出域:充分發揮 Youtu 系列模型的全面能力,支持 Youtu-LLM、Youtu-Embedding、Youtu-Parsing、Youtu-HiChunk等模型的本地部署和接入;集成MinIO高性能對象存儲進行大規模文件本地化管理;集成Chroma DB實現本地向量庫構建和知識庫管理;接入SQLite和MySQL實現關系型數據庫管理。
3.構建雙層記憶機制解決傳統 RAG 系統的記憶缺失問題:短期記憶利用大模型 Context Window 維護當前會話的完整上下文,支持多輪對話的指代消解和任務狀態保持;長期記憶則跨會話實現相似問題的經驗復用和個性化服務,使系統從“無狀態工具”進化為能夠積累用戶行為模式、自動優化決策路徑的“有狀態智能體系統”。
目前,該項目已在 Github 開源,并附帶了詳細的本地部署使用教程。項目將持續維護和更新,歡迎大家體驗和試用。
![]()
![]()
技術方案與實踐
基于“本地部署 · 自主決策 · 記憶驅動”三大核心理念,本節將深入剖析下一代檢索增強生成技術 Agentic RAG 的核心特點與優勢,揭示 Agentic RAG 如何實現從“被動響應”到“主動思考”的躍遷。
2.1 智能檢索引擎
為了解決傳統 RAG 系統檢索能力不足的問題,我們主要從數據管理和檢索分析兩方面進行優化。對于前者,核心關注不同類型數據源的統一存儲和管理方案,以文件為中心,建立層級化的、可增量編輯的多源異構數據管理系統。對于后者,核心關注不同任務需求的檢索鏈路以及相應工具的開發,引入智能體驅動的自主決策和多樣化的檢索策略,開發多個開箱即用的成熟 Agent 鏈路。
2.1.1 文件中心化架構
傳統 RAG 系統通常將文檔切分后直接存入向量數據庫進行檢索,這種方式雖然便于語義匹配,但往往會打散原始文件的結構,導致文件級的組織信息和元數據難以保留與利用。Youtu-RAG 在此基礎上進行了改進,將“文件”作為知識組織的核心單位,構建了從原始文件到知識庫的完整管理鏈路,使每一段數據都可以追溯到其來源。因此,系統支持“無向量檢索”機制,能夠結合關鍵詞、結構化信息和元數據進行多維度檢索,減少對向量表示的依賴,在提升檢索準確性的同時,也更好地支持隱私敏感或結構復雜的數據場景。這樣,不同 Agent 可以基于不同粒度(文件級、片段級)的信息進行分析和處理,從而提升整體系統的靈活性和實用性。
![]()
文件即知識單元:系統以文件為核心組織知識,保留文件的完整性和獨立性。每個文件都擁有獨立的生命周期管理。
多源異構數據統一管理:支持 PDF/Word/MD、Excel、圖片、數據庫等十幾種數據格式,通過統一的文件管理接口實現異構數據的無縫接入。系統采用處理器工廠模式,為不同文件類型配置專屬處理流程,部分可選環節可在配置文件中開啟和關閉。
為實現大規模文件本地化管理,系統集成MinIO高性能對象存儲,支持:
分桶管理:原始文件(ufile)與派生文件(sysfile)分離存儲
版本控制:通過 ETag 機制實現增量構建,避免重復處理
衍生文件管理:自動管理 OCR 結果、分塊文件、布局圖像等派生產物
![]()
在文件上傳時,系統將通過 LLM 自動提取文件的關鍵元數據,構建多維度檢索標簽:
● 時效性元數據:
○ publish_date:文檔發布日期(從文件名或正文頭部提取)
○ key_timepoints:關鍵時間點列表(標準化為YYYY、YYYY-QX、YYYY-MM等格式)
● 內容元數據:
○ summary:100字以內的核心摘要
○ authors:作者或發布機構
○ char_length:字符總數
除此之外,還可以編輯配置文件 file_management.yaml 設置其他的元數據字段。這些元數據不僅可以用于后續的元數據檢索(Meta Retrieval),還為智能體提供了重要的決策依據。對于無法從文件內容中提取的元數據,系統還支持元數據的批量導出、編輯、導入,允許便捷導入自定義的元數據信息。
文件中心化架構以文件作為知識組織的核心維度,構建從原始文件到知識庫內容的可追溯管理鏈路,避免傳統 RAG 在切片階段丟失結構與語義信息。通過統一的文件管理與對象存儲體系,可高效接入多源異構數據并自動生成多維元數據標簽,從而提升知識檢索能力并支持 Agent 的精細化決策。
2.1.2 智能體驅動的自主決策
Youtu-RAG 基于 Youtu-Agent 框架構建智能檢索引擎,實現“不同問題,多種策略”的智能適配。核心機制如下:
問題意圖識別:通過 LLM 分析問題特征(問題類型、時間偏好、數據源線索),提取關鍵信息(如時間標簽、實體名稱、相關數據源、原始文件)
檢索策略動態選擇:根據意圖分析結果,自動選擇最優 Agent 或 Agent 組合(KB Search、Meta Retrieval、Text2SQL、Excel Agent等)
多源數據融合檢索:同一問題可能觸發多種檢索策略(如向量檢索 + 元數據過濾 + SQL 查詢),并將結果自動整合
與傳統 RAG 系統相比,Agent 可以對用戶問題進行拆解,判斷是否需要檢索知識庫、調用外部工具或進行多輪推理,并在獲得中間結果后持續評估當前信息是否足夠,從而決定下一步行動。在這一過程中,檢索不再是一次性的操作,而是可以在推理過程中被多次觸發;工具的使用也不局限于向量檢索,還可以擴展到 Web 搜索、SQL 查詢、代碼執行等多種能力。它使得 RAG 系統從單一的檢索增強問答流程,演進為具備自主決策與工具協作能力的智能問題解決系統,在復雜任務場景(如多步分析、跨數據源查詢或深度數據分析)中表現出更強的靈活性與推理能力。
![]()
系統支持6種核心檢索模式,覆蓋不同數據類型和檢索場景。在開箱即用的8種Agent中,其中6種與具體檢索能力一一對應:
![]()
除此之外,Auto Select Agent 并不綁定某一種固定檢索模式,而是作為統一對話入口,根據用戶問題在上述6種模式之間進行路由、選擇或組合調用。因此,從系統設計上看 Youtu-RAG 形成了“6種基礎檢索模式 + 1個統一調度入口”的能力布局,既保證了檢索覆蓋面的完整性,也提升了復雜任務下的編排靈活性。
![]()
2.1.3 特色應用展示
本項目針對具體的業務場景,構建了多個開箱即用的 Agent 應用示例,支持對非結構化表格、結構化數據庫、以及復雜元數據知識庫檢索的統一理解與處理能力。系統能夠將自然語言問題轉化為多步分析流程,完成數據檢索、計算與推理,并生成結構化分析結果或可視化產物,支持復雜場景下的高質量數據分析與表達。下面將詳細介紹三組特色應用。
![]()
2.1.3.1 Excel Agent
Excel Agent 是該項目中負責復雜表格(Excel、CSV)數據處理與智能分析的核心智能體。它是以文件為核心處理單元的典型示例。它底層基于 DTR(Deep Tabular Research)方法構建,其核心目標是解決復雜、非結構化表格上的長鏈路分析任務。
![]()
其主要能力包括:
1. 復雜非結構化表格理解能力:DTR 能夠從復雜、非結構化的表格中識別行列層級、表頭關系和語義結構,并將其轉換為結構化的 Meta Graph 表示。這樣可以讓模型準確理解真實 Excel 表格中的層級信息和數據語義。
2.自然語言到數據操作映射能力:DTR 能夠將用戶的自然語言問題解析為一系列標準化的數據操作(如 Filter、Group、Aggregate、Sort)。通過這種方式,查詢被轉化為可執行的數據分析流程。
3.規劃與執行分離能力:DTR 將分析任務拆分為高層操作規劃和底層代碼執行兩個階段,使模型能夠先確定分析策略,再生成具體的數據處理代碼塊,從而提高執行穩定性。
4.基于經驗的持續優化能力:DTR 通過記錄執行反饋和抽象經驗,對不同操作路徑進行評估和更新,從而逐步學習更優的數據分析策略,提高后續任務的效率和成功率。
Excel Agent 執行示例:
![]()
![]()
在 DTR-Bench 評測基準上,我們的方案在正確性(Accuracy)、分析質量(Analysis Depth)、代碼可執行性(Feasibility)、生成圖表的視覺質量(Aesthetics)這4個維度都達到了SOTA。
![]()
在此基礎上,我們基于 Multi-Agent 模式進一步開發了 Excel Deep Analysis Agent,能夠實現更豐富的產物生成,包括 Markdown 圖文報告和網頁看板。這些復雜產物均支持便攜的預覽、下載等操作,方便用戶進行編輯、使用和分享。
2.1.3.2 Text2SQL Agent
Text2SQL Agent 是該項目中負責結構化數據檢索的核心智能體。它通過規劃(Plan)- 執行(Execute)- 總結(Report)的 ReAct 編排模式,支持多數據庫(MySQL、SQLite)的自然語言轉 SQL 操作,形成了更穩健的關系型數據庫檢索方案。
![]()
其主要技術亮點如下:
1. Memory 機制(記憶檢索與沉淀):并非零起點生成 SQL,而是復用歷史成功的 SQL(Few-shot 示例),極大降低了面對復雜業務或領域特定表結構時的幻覺問題。
2. Schema Link 與 Value Link 分離與統一:在寫 SQL 前先通過檢索找到正確的表結構,而不是將整個庫的 Schema 塞給模型,這解決了大型數據庫超出大模型上下文窗口的難題。
3. 強大的多數據源兼容能力(Multi-Database):不局限于單個數據庫連接,支持在一次查詢中跨 SQLite、MySQL 甚至是用戶上傳的 Excel 文件(后臺映射為 SQLite 數據庫)進行多實例查詢與結果組裝。
4. ReAct 容錯機制(Error Handling):SQL執行器收到數據庫報錯后(如不存在某個字段、語法錯誤),能夠基于報錯日志自我修正 SQL 再嘗試,相比傳統的“單次生成-執行”具有更高的魯棒性。
Text2SQL Agent 執行示例:
![]()
![]()
通過記憶機制檢索 Few-shot case,引入帶有業務經驗的 SQL 模版和思考邏輯,可以將業務側的領域專業數據庫查詢問題的解答正確率從 40% 提升至 85% 以上,具有更好的可用性,也便于根據不同業務場景進行快速泛化。
2.1.3.3 Meta Retrieval Agent
Meta Retrieval Agent 是該項目中負責時間感知與帶元數據過濾的知識庫檢索智能體。它通過動態查詢分析、自適應多輪檢索和結果去重聚合的機制,極大提高了在龐大且具有時間屬性的語料庫(如:各季度財報、新聞資訊等)中回答精準事實的準確率。
![]()
其主要技術亮點如下:
1. 時間感知的精準降噪(Temporal-Aware Filtering):不同于傳統的 RAG 會把所有年份的相似財報都召回,該 Agent 提前提取時間范圍并在向量檢索底層做 Metadata 過濾,從源頭上避免了“問2024答2023”的幻覺。
2. 漸進式動態召回(Progressive Adaptive Retrieval):設定了 <5 chunks 的硬性評判標準。找不到足夠數據時,會像人類一樣放寬時間范圍(日 ?? 年)或換個詞搜,完美平衡了“精準度”與“召回率”。
3. 全局上下文整合(Context Rerank & Merge):多輪搜索極易帶來重復的碎片垃圾,通過前置的 merge_retrieval_results 強制收斂機制,確保喂給大模型生成答案的始終是去重后信息密度最高的 Token。
4. 分類施策的 Prompt 工程:針對不同顆粒度的問題(聚焦事實/單點分析/宏觀戰略),在 Prompt 層面直接約束了不同的 top_k(5~50)獲取策略,節約性能的同時保障了復雜問題的回答深度。
5. 高度可定制的元數據過濾策略(Customizable Metadata Filtering):系統支持開發者自定義問題偏好與元數據的映射關系,同時允許靈活定制 Filters 的定義方式。通過這種開放的配置能力,用戶可以針對特定行業或私有語料庫,自由構建精準的元數據過濾邏輯。
Meta Retrieval Agent 執行示例(均為虛構數據):
![]()
我們在元數據檢索數據集上進行了評測(483 條測試樣本),評測指標如下:
Weighted NDCG@5: 在前 5 個檢索結果中,按準確順序召回真實相關文檔的能力指標
Recall@all: 所有的真實的相關文檔中有多少被準確召回
![]()
關鍵發現:
熱度偏好提升幅度大于時效性偏好,說明傳統向量檢索在處理熱度相關查詢時尤其無力
NDCG_w@5 提升幅度(20.37%)大于 Recall@all(15.87%),說明元數據過濾不僅提升召回率,更顯著改善了 Top-K 結果的排序質量
2.2 全棧本地部署
為了降低數據隱私風險,文件處理過程中涉及的各個組件均支持本地部署。我們優先推薦大家按需使用 Youtu 自研模型進行部署,也可以使用標準的API接口,以體驗 Agentic RAG 全棧能力。
2.2.1 Youtu-Embedding
Youtu-Embedding 是基于開源 Youtu-LLM 基礎模型訓練的通用文本表示模型,專注于將文本轉換為高質量的向量表示(Embedding)。該模型在信息檢索、語義相似度計算、文本聚類、重排序和分類等廣泛的自然語言處理任務中均表現卓越,為 RAG(檢索增強生成)、智能搜索、推薦系統等應用場景提供強大的語義理解能力。其主要特性如下:
1. 頂尖的性能表現:在權威的中文文本嵌入評測基準 CMTEB 上以 77.58 的高分榮登榜首(截至2025年09月),支持信息檢索(IR)、語義相似度(STS)、聚類、重排序、分類等多類任務,展現強大的通用表征能力。
2. 創新的訓練范式:首創“LLM基礎預訓練 → 弱監督對齊 → 協同-判別式微調”的三階段訓練流程,系統性地將大語言模型的廣博知識轉化為專用于嵌入任務的判別能力,有效解決多任務學習中的“負遷移”難題。
3. 獨創的微調框架:設計了協同-判別式微調框架(CoDiEmb),包含統一數據格式、任務差異化損失函數(InfoNCE對比損失用于IR任務、排序感知損失用于STS任務)和動態單任務采樣機制,實現多任務穩定協同訓練。
4. 輕量高效易部署:僅 2B 參數的輕量級模型,支持 8K 序列長度、2048 維度輸出,完全開源,可通過 Hugging Face、Transformers 等多種方式快速集成,部署成本極低。
模型的部署指南詳見鏈接:
https://youtu-rag-docs.vercel.app/docs/zh/youtu-embedding/deploying-locally
2.2.2 Youtu-Parsing
Youtu-Parsing 是基于開源 Youtu-LLM 基礎模型構建的專業文檔解析模型,通過提示引導框架和 NaViT 風格的動態視覺編碼器,實現了對文本、表格、公式和圖表等多樣化文檔元素的增強解析能力。其主要特性如下:
1. 全能識別能力:支持文本(印刷/手寫/藝術字)、數學公式(LaTeX)、表格(HTML)、圖表(Markdown/Mermaid)等多種文檔元素的精準識別與轉換。
2. 結構化解析:像素級文本定位與智能閱讀順序恢復,確保復雜文檔布局的準確理解和內容完整性。
3. 極速推理性能:創新的 Token 并行和 Query 并行機制,推理速度提升 5-11 倍,實際應用可獲得額外 2 倍加速。
4. 輕量易部署:僅 2B 參數的輕量級模型,完全開源,支持 Hugging Face 快速集成,部署成本低。
5. 基準測試領先:在 OminiDocBench v1.5 和 olmOCR 等權威基準測試中表現優異。
模型的部署指南詳見鏈接:
https://youtu-rag-docs.vercel.app/docs/zh/youtu-embedding/deploying-locally
2.2.3 Youtu-HiChunk
Youtu-HiChunk 是一個面向 RAG 系統的層次化文檔分塊框架,通過樹狀結構解析和 Auto-Merge 檢索算法,動態調整檢索粒度以提升檢索質量和上下文完整性。其主要特性如下:
1. 層次化文檔分塊:創新性地將文檔解析為樹狀層次結構,支持多層級(最高10級)語義粒度,精準捕捉文檔的章節-段落-句子等自然層次關系。
2. Auto-Merge 智能檢索算法:獨創的自動合并檢索機制,動態調整檢索片段的語義粒度,有效緩解傳統固定分塊導致的信息不完整問題,智能平衡檢索精度與上下文完整性。
3. 完整的評估基準 HiCBench:專注于文檔分塊質量評估的權威基準,包含精細的層次結構標注和證據密集型問答對,為 RAG 系統提供更準確的瓶頸診斷能力。
4. 多語言訓練增強:基于 Youtu-LLM,使用 qasper、gov-report、wiki-727k 等多源數據集訓練,支持中英文文檔處理,具備數據增強(內部打亂、截斷增強)等多種訓練策略。
模型的部署指南詳見鏈接:
https://youtu-rag-docs.vercel.app/docs/zh/hichunk/deploying-locally
2.3 雙層記憶機制
傳統 RAG 系統缺乏記憶能力,每次對話都是獨立的、無狀態的交互,無法積累用戶的長期行為模式和個性化偏好,也無法跨會話關聯信息。Youtu-RAG 構建了“短期記憶 + 長期記憶”的雙層記憶架構,使系統從"無狀態工具"進化為"有狀態智能體",實現個性化服務與上下文連貫。(目前 Youtu-RAG 系統配置了基礎版本的支持,持續更新中。)
2.3.1 短期記憶
短期記憶負責維護當前會話的即時上下文信息,確保多輪對話的連貫性和任務執行的連續性。
核心功能:
1. 會話上下文保持:利用大模型的 Context Window 維護當前對話的完整歷史,包括用戶問題、系統回答、工具調用結果、中間推理狀態等
2. 多輪對話關聯:支持指代消解和意圖繼承,理解"這個"、"剛才那個"等代詞指代,保持話題連貫
3. 臨時狀態管理:存儲當前任務執行過程中的臨時變量,如檢索參數、中間計算結果、待確認信息等
典型應用場景:
用戶追問:“剛才提到的第三點具體是什么?” ?? 系統通過短期記憶準確定位前文內容
多步任務執行:“先查 2024 年 Q1 數據,再對比 Q2” ?? 短期記憶保持 Q1 結果供后續對比
2.3.2 長期記憶
長期記憶負責跨會話(Session)積累用戶的個性化信息和行為模式,實現“越用越懂你”的個性化體驗。
核心功能:
1. 示例 QA 學習
高質量QA沉淀:系統自動記錄經過用戶確認或驗證的高質量問題-答案對
相似問題匹配:當遇到新問題時,通過語義相似度檢索歷史成功案例,優先參考已驗證的解決路徑
經驗復用:對于周期性或相似問題,直接調用歷史最優答案或推理路徑,減少重復計算
2. 檢索策略優化
● 問題 ?? 策略映射:記錄不同問題類型對應的最優檢索策略組合,比如
○ 數據分析類問題 ?? Text2SQL Agent + Excel Agent
○ 概念查詢類問題 ?? KB Search + Meta Retrieval
○ 事實核查類問題 ?? File QA + Web Search
● 策略效果評估:根據歷史執行效果(準確率、用戶滿意度)動態調整策略優先級
● 自適應路由:基于積累的策略知識,Agent可自動選擇最優檢索路徑,無需人工配置規則
3. 參數自適應
● 場景化參數配置:沉淀不同場景下的最優參數組合
○ 檢索閾值(相似度 cutoff)
○ TopK數量(召回數量)
○ 重排策略(Reranker模型選擇)
○ 元數據過濾條件(時間范圍、作者等)
● 動態調優:根據問題復雜度和數據特征,自動加載歷史最優參數配置
典型應用場景:
● 用戶 A 偏好詳細技術文檔,用戶 B 偏好簡明摘要 ?? 同一問題給出不同詳略程度的回答
● 每月固定查詢財務報表的用戶 ?? 系統自動記憶其偏好的時間范圍、關注指標、展示格式
● 識別用戶專業背景(財務/技術/市場),調整術語使用和專業深度
2.3.3 雙層記憶的協同機制
短期記憶與長期記憶通過智能體決策協同工作,實現上下文連貫與個性化服務的統一:
![]()
協同工作流程:
1. 會話初始化:系統啟動時檢索長期記憶,加載用戶畫像和偏好設置
2. 實時交互:短期記憶保持當前對話上下文,支持多輪推理和指代消解
3. 記憶更新:會話結束時,將本次會話的關鍵信息(確認的事實、新發現的偏好、問答對、Agent 執行軌跡等)寫入長期記憶
![]()
結語
3.1 核心技術創新與價值
Youtu-RAG 通過三大技術創新實現了從傳統 RAG 到 Agentic RAG 的全面升級,系統性地解決了傳統檢索增強生成系統的核心痛點:
1. 智能檢索引擎——從“單次檢索”到“多步推理”:傳統 RAG 系統采用固定的“檢索→生成”流程,面對復雜問題時缺乏靈活性。Youtu-RAG 構建了智能體驅動的檢索引擎,實現三大突破:自主決策能力、多樣化檢索策略、文件中心化架構。
2. 全棧本地部署——從“云端依賴”到“數據自主”:針對企業和個人用戶的數據隱私需求,Youtu-RAG 實現了完整的本地化部署方案,Youtu生態全覆蓋、數據存儲本地化、零數據出域。
3. 雙層記憶機制——從“無狀態對話”到“持續學習”:傳統 RAG 系統缺乏記憶能力,每次對話都是孤立的。Youtu-RAG構建了“短期記憶+長期記憶”的雙層架構,二者協同支撐“越用越懂你”的智能體演進。
這些創新不僅提升了系統的技術性能,更重要的是拓展了RAG技術的應用邊界,為企業級知識管理、智能客服、數據分析等場景提供了全新的解決方案。
3.2 開源生態與未來展望
Youtu-RAG 已開源,項目中提供了詳盡的部署文檔、使用教程和最佳實踐案例:
Youtu-RAG主項目:完整的 Agentic RAG 實現,包含智能檢索引擎、多 Agent 協作、文件管理等核心能力
Youtu系列模型:Youtu-Embedding、Youtu-Parsing、Youtu-HiChunk等專業模型全面開源,均基于 Youtu-LLM 訓練
評測基準:發布 DTR-Bench(表格分析)、HiCBench(文檔分塊)、Memoria-Bench(智能體記憶)等權威評測集
Agentic RAG 的持續演進,本質上是一場在效率、成本與效果之間尋求最優解的長期實踐。面向下一代智能檢索增強系統,我們的打磨不僅圍繞性能本身,也會聚焦于以下幾個核心命題:
1. 記憶系統的深度進化:構建具備自動壓縮與選擇性遺忘機制的長期記憶結構,以解決記憶膨脹問題,使系統能夠在自主學習與成長中不斷迭代
2. 多模態能力的系統擴展:突破文本邊界,實現對圖像、音頻、視頻等異構信息的統一檢索與語義理解,推動知識交互從單一模態走向多元融合
3. 推理效率的極致優化:通過輕量化模型的蒸餾與高效部署,讓 Agentic RAG 能夠在邊緣設備或低資源環境中穩定運行,真正實現智能能力的普惠
Agentic RAG 技術通過賦予系統自主決策與持續學習的能力,正在將傳統的被動式檢索工具,重塑為真正智能的知識助手。它不僅推動著下一代知識管理、智能客服、研報分析、數據洞察等應用的演進,也正成為這些場景中不可或缺的核心技術底座。依托于開源協作項目Youtu-RAG,我們期待與更多開發者、研究者攜手,共同探索RAG技術的更多可能,推動人工智能在知識密集型領域的深度落地與廣泛普及。
Youtu-RAG:https://youtu-rag-docs.vercel.app/about.html
YoutuAgent:https://github.com/TencentCloudADP/youtu-agent
YoutuEmbedding:https://github.com/TencentCloudADP/youtu-embedding
YoutuParsing:https://github.com/TencentCloudADP/youtu-parsing
YoutuHiChunk:https://github.com/TencentCloudADP/hichunk
【活動分享】由 CSDN&奇點智能研究院聯合舉辦的「全球機器學習技術大會」正式升級為「奇點智能技術大會」。2026 奇點智能技術大會將于 4 月 17-18 日在上海環球港凱悅酒店正式召開,大會聚焦大模型技術演進、智能體系統工程、OpenClaw 生態實踐及 AI 行業落地等十二大專題板塊,特邀來自BAT、京東、微軟、小紅書、美團等頭部企業的 50+ 位技術決策者分享實戰案例。旨在幫助技術管理者與一線 AI 落地人員規避選型風險、降低試錯成本、獲取可復用的工程方法論,真正實現 AI 技術的規模化落地與商業價值轉化。這不僅是一場技術的盛宴,更是決策者把握 2026 AI 拐點的戰略機會。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.