<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      經驗記憶黑科技:LightSearcher讓AI工具調用減39.6%推理快48.6%

      0
      分享至



      如今,以 DeepSeek-R1 為代表的深度思考大模型能夠處理復雜的推理任務,而DeepSearch 作為深度思考大模型的核心搜索器,在推理過程中通過迭代調用外部搜索工具,訪問參數邊界之外的最新、領域特定知識,從而提升推理的深度和事實可靠性。

      然而,現有的 RL 驅動的深度思考大模型系統常常面臨準確率與效率的「蹺蹺板」困境:頻繁調用搜索工具提升準確性,卻帶來計算開銷和效率低下。具體而言,高頻調用外部搜索工具雖能補充實時信息、提升推理準確率,但使得推理延遲大幅升高,等待時間可達幾十秒至幾分鐘。從用戶體驗角度來看,若信息加載時間超過 10 秒,50% 的移動用戶會放棄訪問。

      北郵百家 AI 團隊提出 LightSearcher 框架,首創基于經驗記憶的高效 RL 優化技術,通過引入文本化經驗記憶和自適應獎勵塑造機制,巧妙解決了這一痛點。

      在保持與 SOTA 基線 ReSearch 相當準確率的同時,搜索工具調用和模型回復時間顯著縮短,搜索工具調用次數減少 39.6%,推理時間縮短 48.6%,Token 消耗降低 21.2%,在保持模型效果的同時顯著提升了工具調用效率。



      • 論文標題:LightSearcher: Efficient DeepSearch via Experiential Memory
      • 論文鏈接:https://arxiv.org/abs/2512.06653
      • 百家 AI 主頁:https://baijia.online/homepage/index

      引言

      如何教會深度思考大模型策略性地控制搜索工具的使用,優化何時以及如何查詢外部知識源,是深度思考大模型亟待解決的問題?,F有方法存在以下顯著缺陷:

      1. 提示工程或監督學習方法依賴人工標注,成本高且泛化差;RL 驅動方法雖能自主優化,但獎勵偏重準確性,導致模型為確保正確而頻繁調用工具,造成冗余開銷;
      2. 工具調用「過度依賴」,現有模型往往不分難易,對簡單查詢也反復檢索,導致推理時間延長、token 消耗激增;
      3. 準確性與效率失衡,部分方法雖提升準確率,但犧牲效率;另一些雖減少調用,卻降低答案質量,無法兼顧雙重目標。

      這些問題導致現有模型要么答案不準、可靠性差,要么工具調用過多、效率低下,難以同時滿足推理準確和高效執行的核心需求。

      LightSearcher 框架

      為解決上述缺陷,北郵百家 AI 團隊提出基于經驗記憶的高效 DeepSearch 框架(LightSearcher),核心思路是在大模型強化推理過程中,通過「對比經驗學習」將隱性推理軌跡轉化為顯性指導經驗,并結合自適應獎勵優化工具調用,具體包含三大關鍵組件:

      1. 對比經驗推理機制(Contrastive Experiential Reasoning):收集高低質量推理軌跡,通過 LLM 生成成功模式的自然語言總結(如「簡單查詢優先用內部知識」),構建動態經驗記憶庫;
      2. 自適應獎勵塑造機制(Adaptive Reward Shaping):引入最小工具調用基準,僅在答案正確時懲罰冗余調用,使用指數衰減函數動態平衡準確性和效率,避免盲目優化;
      3. 基于經驗的 RL 訓練機制:采用 GRPO 算法,將積累經驗和少樣本示例融入提示模板,指導模型生成高效軌跡,確保探索與利用的均衡。



      模型最終優化目標為多目標獎勵函數的加權和,確保工具調用精簡與答案質量的協同提升。

      實驗

      研究團隊在四個多跳 QA 基準數據集(NQ、HotpotQA、Musique、2WikiMultihopQA)上進行了全面評估,對比了多種主流 DeepSearch 方法。

      3.1 主實驗結果



      實驗結果顯示:

      • 模型準確性保持頂尖:LightSearcher 在 F1 分數和 LLM 評判上與 SOTA 基線 ReSearch 相當,甚至在部分數據集上優于 ReSearch;
      • 效率顯著提升:工具調用減少 39.6%,推理時間縮短 48.6%,token 消耗降低 21.2%;
      • 泛化能力強:在不同難度的查詢(易 / 難)上均表現穩定,即使在域外測試集也能超越依賴固定檢索的迭代方法。

      3.2 消融實驗

      移除經驗導致 F1 下降 7.2%,證明其核心作用。



      LightSearcher 框架通過「經驗記憶」這一核心理念,為構建高效、可靠的深度推理系統提供了新路徑。盡管目前限于多跳 QA,未來可擴展到代碼合成、策略規劃等領域。論文成功解決了現有 DeepSearch 的關鍵痛點:

      • 從隱性到顯性:將對比軌跡轉化為可解釋的推理指導
      • 精準平衡:通過自適應獎勵確保工具調用最小化
      • 效率優先:利用 RL 訓練維持準確與開銷的連貫性
      • 雙重優化:同時提升推理質量和執行效率,而非顧此失彼

      最后,大模型的 DeepSearch 能力需設計有效的經驗機制。相比于復雜的手動標注,LightSearcher 通過其「對比經驗」的設計思想,在推理過程依賴可靠的外部知識調用,為構建更加高效、可靠的 AI 深度思考系統提供了重要的技術路徑。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      人民財評:提振消費,招招硬核!

      人民財評:提振消費,招招硬核!

      人民資訊
      2025-12-16 09:17:07
      這就是公開辱華的后果!取消冠軍頭銜只是開始,職業生涯也全毀了

      這就是公開辱華的后果!取消冠軍頭銜只是開始,職業生涯也全毀了

      阿鳧愛吐槽
      2025-12-17 17:24:39
      想重演歷史?特朗普賭了一把,美軍公海登上中國貨船強行沒收貨物

      想重演歷史?特朗普賭了一把,美軍公海登上中國貨船強行沒收貨物

      戰旗紅
      2025-12-17 17:29:50
      錢再多有什么用,64歲郎平如今的現狀,給所有運動員們提了個醒

      錢再多有什么用,64歲郎平如今的現狀,給所有運動員們提了個醒

      涵豆說娛
      2025-12-10 16:49:41
      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當場愣了

      女兒失蹤3年,竟托夢說在鄰居家魚缸里,警察趕到后當場愣了

      罪案洞察者
      2025-09-16 14:31:27
      同行質疑公牛集團“10戶中國家庭,7戶用公?!闭`導宣傳,被起訴索賠420萬

      同行質疑公牛集團“10戶中國家庭,7戶用公?!闭`導宣傳,被起訴索賠420萬

      大風新聞
      2025-12-17 15:08:02
      就在今天!12月17日早上!男籃傳來徐杰、胡明軒、張慶鵬新消息

      就在今天!12月17日早上!男籃傳來徐杰、胡明軒、張慶鵬新消息

      林子說事
      2025-12-17 13:24:32
      4個師兩個炮兵團加4輛坦克,未能吃掉國軍兩個團,洪學智兵敗德惠

      4個師兩個炮兵團加4輛坦克,未能吃掉國軍兩個團,洪學智兵敗德惠

      興趣知識
      2025-12-17 17:36:12
      海南封關倒計時,全球航司排隊來這里修飛機,這就是美國最害怕的地方

      海南封關倒計時,全球航司排隊來這里修飛機,這就是美國最害怕的地方

      V記錄號
      2025-12-16 16:50:04
      2026年比亞迪新車曝光!合資車壓力更大了?

      2026年比亞迪新車曝光!合資車壓力更大了?

      新車評網
      2025-12-16 15:35:31
      中美密談兩天,特朗普對中國交底,日本回過神來:難怪14國都沉默

      中美密談兩天,特朗普對中國交底,日本回過神來:難怪14國都沉默

      離離言幾許
      2025-12-17 17:24:48
      豪橫!東契奇送給湖人全員圣誕禮物:狂送103件電動自行車太土豪

      豪橫!東契奇送給湖人全員圣誕禮物:狂送103件電動自行車太土豪

      追球者
      2025-12-17 05:40:14
      比亞迪賣爆了,同比增長1897%

      比亞迪賣爆了,同比增長1897%

      后視鏡里de未來
      2025-12-16 13:42:04
      別低估了30年房貸的威力!貸200萬還了5年,結果本金竟然一分沒還

      別低估了30年房貸的威力!貸200萬還了5年,結果本金竟然一分沒還

      裝修秀
      2025-12-08 10:30:03
      “男子改裝射釘槍射殺鄰居夫婦”案二審宣判:數罪并罰,執行死刑

      “男子改裝射釘槍射殺鄰居夫婦”案二審宣判:數罪并罰,執行死刑

      大風新聞
      2025-12-17 11:28:03
      河南省鄭州市政協原一級巡視員樊福太被開除黨籍

      河南省鄭州市政協原一級巡視員樊福太被開除黨籍

      界面新聞
      2025-12-17 10:07:19
      女教師跳樓身亡,更多細節流出,疑被逼上婚車,跳樓前說換衣服

      女教師跳樓身亡,更多細節流出,疑被逼上婚車,跳樓前說換衣服

      阿纂看事
      2025-12-16 09:39:55
      45 億美元估值背后:紅杉為何連續三次押注這家“隱形”AI 公司?

      45 億美元估值背后:紅杉為何連續三次押注這家“隱形”AI 公司?

      硅兔賽跑
      2025-12-16 10:40:09
      花生再次被關注!調查發現:糖尿病常吃花生,不過半年或有6好處

      花生再次被關注!調查發現:糖尿病常吃花生,不過半年或有6好處

      蜉蝣說
      2025-11-20 14:40:39
      今起三天晴間多云!周末冷空氣抵津,周日最低氣溫-3℃左右

      今起三天晴間多云!周末冷空氣抵津,周日最低氣溫-3℃左右

      網信津南
      2025-12-17 08:47:17
      2025-12-17 18:59:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11943文章數 142512關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      高位截癱患者因腦機接口"再就業":錢不多 供兒讀大學

      頭條要聞

      高位截癱患者因腦機接口"再就業":錢不多 供兒讀大學

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      藝術
      本地
      房產
      旅游
      軍事航空

      藝術要聞

      毛主席書寫林則徐詩詞,字跡超凡,引發關注。

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      房產要聞

      團購14888元/㎡起!海建·鳳翔豪庭獻禮自貿港封關

      旅游要聞

      云南迪慶旅游持續火熱

      軍事要聞

      最新現場:山東艦完成年度最后一次海上訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 少妇被粗大的猛烈进出69影院一| 肉色丝袜足j视频国产| 91视频免费观看| 91视频播放| 云南省| 人妻体内射精一区二区三区| 色欲av永久无码精品无码蜜桃| 实拍女处破www免费看| 国产黄色短视频| 亚洲成人大香蕉| 欧美日韩精品一区二区三区在线| 亚洲a成人片在线观看| 性做久久久久久| 熟女一区二区中文在线| 啪啪电影| 亚洲日本色| 国模冰莲大胆自慰难受| 亚洲综合天堂一区二区三区| 色中色AV| 精品?一区?卡| 无遮挡很爽很污很黄的网站| 中文字幕人妻中文AV不卡专区| 能把下面看湿的视频| 内射后入在线观看一区| 人妻少妇av中文字幕乱码| 在线看av一区二区三区| 欧美色涩| 亚洲色?中文字幕| 漂亮人妻被中出中文字幕久久| 久久夜色撩人精品国产av| 久久久久久AV| 精品久久久久久国产| 九九精品99久久久香蕉| 密臀av| 龙海市| 亚洲综合国产一区二区三区| 久久天天躁夜夜躁狠狠820175| 久久久久久亚洲AV无码专区| 亚洲AV综合色区无码| 国产产无码乱码精品久久鸭| 国产美女69视频免费观看|