<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      新一代框架MIA:讓智能體告別「失憶式工作」,在持續進化中變強

      0
      分享至



      本文共同一作是上海創智學院博士生喬靜陽、孟煒程,通訊作者是華東師范大學張志忠副教授,項目主導人是國家優青謝源教授。

      Never memorize something that you can look up.
      • — Albert Einstein

      如今的大多數智能體,仍然活在一種「失憶式工作」模式中:每一次檢索都是從零開始,每一條推理路徑都無法沉淀,每一次失敗也不會轉化為經驗。它們雖能多輪交互,但很難在深度研究中持續變強。

      為了解決這個問題,已有工作嘗試基于歷史方案生成執行規劃,但受限于預訓練范式,許多智能體仍陷入新的困境:一個不擅長規劃的「決策器」,從臃腫的記憶中檢索出零散片段,再去驅動一個缺乏規劃執行能力的「執行器」。結果是:記憶在增長,智能卻沒有。

      于是,浮現出一個關鍵問題:是否存在將經驗轉化為能力的智能體記憶機制?

      上海創智學院和華東師范大學聯合團隊最近提出的 Memory Intelligence Agent (MIA),一個面向深度研究場景的新一代記憶智能體框架,給這一問題帶來了新的答案。



      • 論文地址:https://arxiv.org/abs/2604.04503
      • 代碼倉庫:https://github.com/ECNU-SII/MIA
      • 龍蝦技能:
      • 純凈版:https://clawhub.ai/jingyangqiao/mia
      • 可信版:https://clawhub.ai/sii-yucheng2002/mia-trust

      (高效版和可訓練版即將發布)

      為了解決這一問題,MIA 構建了一套基于「Planner–Executor–Manager」架構的記憶系統。其中,Planner 是戰術大腦,不僅能夠針對當前問題制定研究計劃,還能通過測試時的持續學習實時調整其策略。Executor 是經過訓練的執行專家,能夠毫無阻礙地解讀并遵循復雜的研究藍圖。Manager 是終極管理員,優化記憶存儲以消除冗余。

      與現有方法相比,MIA 的核心亮點在于:

      1. 構建雙記憶機制,非參數記憶負責沉淀經驗,參數記憶負責吸收能力,二者相互轉化,形成持續進化的閉環;
      2. 提出 Manager–Planner–Executor 多智能體結構,將記憶管理、策略規劃與任務執行解耦,并通過交替強化學習驅動 Planner 與 Executor 的協同進化,將「會規劃」和「會執行」對齊;
      3. 引入面向開放世界的自進化機制,結合反思與無監督學習,讓智能體在開放世界的推理過程中持續修正策略、動態更新記憶,實現邊做邊學的在線進化。

      在 X 平臺上,該論文已被 DAIR.AI 的創始人,擁有 30 萬粉絲的 AI 論文分享博主 Elvis Saravia 所轉發,并收獲了高度評價與大量關注。與此同時,該論文也入選了 Hugging Face Daily Papers 榜單。





      從「逐次推理」到「可積累的研究閉環」



      作為一個持續運行的 Planning–Execution–Memory 閉環系統,MIA 在每一次研究任務中,都會經歷:經驗調用 → 協同推理 → 經驗沉淀,并不斷反哺后續決策。

      在經驗調用中,MIA 通過三維檢索機制調用歷史經驗,分別是保證相關性的語義相似度,高質量經驗偏好的價值獎勵和激活長尾知識的頻率獎勵。

      此外,作者還引入失敗軌跡作為約束,使記憶既能提供參考,又能避免重復錯誤。在協同推理中,MIA 將推理解耦為兩個智能體的協作過程,Planner 負責拆解任務、生成步驟,而 Executor 負責按照步驟執行。二者通過 Reflect–Replan 形成反饋閉環,當執行受阻時自動重規劃,讓智能體具備持續試錯與調整能力。

      在經驗沉淀中,MIA 將對兩種記憶同時更新。首先對軌跡進行壓縮與提取,形成結構化非參數記憶。其次在線更新 Planner 參數,將經驗轉化為參數記憶。最后實現從經驗存儲到能力內化的躍遷。



      讓「會規劃」和「會執行」學會配合

      在傳統記憶系統中,Planner 和 Executor 往往只是拼在一起,并沒有真正學會協作。為此,MIA 提出了一套兩階段交替強化學習和測試時持續學習的進化機制,讓兩個模塊逐步對齊,并在真實任務中不斷變強。首先在兩階段交替強化學習中,MIA 將訓練過程拆分為:

      • 階段一:固定 Planner,讓 Executor 學會理解并嚴格執行規劃;
      • 階段二:固定 Executor,讓 Planner 學習如何利用記憶生成更優計劃與計劃執行失敗時的反思與重規劃能力。

      這種「先對齊執行,再優化決策」的方式,解決了「規劃很好,但執行跟不上」的問題。

      其次不同于傳統方法「訓練完即凍結」,MIA 在推理階段引入測試時學習,賦能智能體持續進化。其過程包括:執行推理任務同時生成多條候選路徑。從成功與失敗路徑中提取非參數化記憶,基于成功路徑在線更新參數化記憶。推理與訓練幾乎同步完成,形成真正的在線學習閉環。



      讓智能體在開放世界中穩定進化

      為了將 MIA 能夠真正用在開放環境的深度研究中,作者提出了一套無監督的自進化評估機制,讓智能體在沒有外部反饋的條件下,也能持續優化自身能力。

      其核心思路是:用「過程質量」替代「結果標簽」,只要推理嚴謹、證據可靠、結論合理,即使沒有標準答案,也可以作為有效學習信號。

      因此,受學術評審的啟發,作者將對結果的判斷拆成多個「專家視角」,包括:

      • 邏輯評審員:檢查推理鏈條是否自洽
      • 事實評審員:驗證信息來源以及是否存在幻覺
      • 結果評審員:評估任務是否真正完成

      最終由一個「領域主席」進行綜合決策并給出整體判斷,為 MIA 提供穩定的優化信號,進而助力實時進化。

      實驗結論

      在多項文本與多模態深度研究任務中,MIA 顯著提升了智能體的穩定性與效率:





      • SOTA 性能再突破 (a & b):在 LiveVQA (多模態在線搜索) 與 HotpotQA (純文本沙盒搜索) 的對比實驗中,MIA 顯著提升了現有最先進 LLMs(GPT-5.4, Gemini-3-Flash, claude-sonnet-4.6)在調用搜索工具下的表現;
      • 實現小尺寸模型的跨級超越 (c):基于 Qwen-2.5-VL-7B 執行器的 MIA 模型在 7 個核心數據集上表現卓越,超越了在不調用工具下的 GPT-5.4,GPT-4o 和 Gemini-2.5-Pro,逼近了 Gemini-3-Flash;
      • 記憶方法的新標桿 (d):在與當前先進智能體記憶方法的橫向評測中,MIA 在 7 個數據集上均取得最佳性能表現。

      總結

      智能體記憶不應該只是讓智能體記住了「結果是什么」,而是應該讓它學會「該怎么做」。MIA 的出現,傳遞了一個清晰的信號:決定一個智能體上限的,不再僅僅是它接入了多少外部工具,而是它能否在每一次與世界的交互中,將繁雜的「過程信息」壓縮為精煉的「執行本能」。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女籃疑似內訌?四大國手加盟海外聯賽:或為躲避宮魯鳴長期集訓?

      女籃疑似內訌?四大國手加盟海外聯賽:或為躲避宮魯鳴長期集訓?

      籃球快餐車
      2026-04-24 01:39:29
      以色列網友疑問:猶太人若遷至中國,能否掌控這片土地?法國網友回應引發熱議

      以色列網友疑問:猶太人若遷至中國,能否掌控這片土地?法國網友回應引發熱議

      苗苗情感說
      2026-04-22 09:13:00
      痛心!湖北一派出所所長因公犧牲,年僅45歲

      痛心!湖北一派出所所長因公犧牲,年僅45歲

      極目新聞
      2026-04-23 13:43:56
      遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

      遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

      極目新聞
      2026-04-23 10:00:21
      天生領袖!東契奇受傷后,詹姆斯在隊內說:跟著我,我們能贏球!

      天生領袖!東契奇受傷后,詹姆斯在隊內說:跟著我,我們能贏球!

      愛體育
      2026-04-23 22:37:50
      個人微信建600多個工作群 員工離職后拒絕交接 法院:立即停止使用涉案微信賬號 公司向員工支付話費760元

      個人微信建600多個工作群 員工離職后拒絕交接 法院:立即停止使用涉案微信賬號 公司向員工支付話費760元

      閃電新聞
      2026-04-23 21:52:49
      中國互聯網巨頭,利潤集體下滑?

      中國互聯網巨頭,利潤集體下滑?

      智谷趨勢
      2026-04-22 11:04:33
      拍《風云》時,導演為省錢給江祖平戴了條繩,竟撐起一個時代審美

      拍《風云》時,導演為省錢給江祖平戴了條繩,竟撐起一個時代審美

      蕭狡科普解說
      2026-04-23 06:09:07
      原來劉大錘曝的是李卿!深夜同回住所過夜,《逐玉》CP徹底BE

      原來劉大錘曝的是李卿!深夜同回住所過夜,《逐玉》CP徹底BE

      小椰的奶奶
      2026-04-23 22:03:10
      紅綠燈倒計時取消!全國推行新規,以后過路口記住這1句話

      紅綠燈倒計時取消!全國推行新規,以后過路口記住這1句話

      阿振觀點
      2026-04-22 06:00:49
      大一女生泰國參加潑水節被賣到緬甸電詐園區,家屬稱園區已同意放人,正協商時間地點;與閨蜜聊天記錄曝光:和多人一起被控制,沒睡覺進食

      大一女生泰國參加潑水節被賣到緬甸電詐園區,家屬稱園區已同意放人,正協商時間地點;與閨蜜聊天記錄曝光:和多人一起被控制,沒睡覺進食

      極目新聞
      2026-04-23 15:05:28
      洗腦、性侵、亂倫,全球頭號變態復出了

      洗腦、性侵、亂倫,全球頭號變態復出了

      獨立魚
      2026-04-23 22:35:39
      美日菲南海大規模軍演,解放軍不僅出動遼寧艦,就連四川艦也去了

      美日菲南海大規模軍演,解放軍不僅出動遼寧艦,就連四川艦也去了

      胖福的小木屋
      2026-04-23 23:44:58
      美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

      美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

      極目新聞
      2026-04-23 10:57:06
      女大學生被賣電詐園區,家屬計劃今日接人,女孩父親:女兒每天會簡單報平安,聯系不上將女兒騙至泰國的女子

      女大學生被賣電詐園區,家屬計劃今日接人,女孩父親:女兒每天會簡單報平安,聯系不上將女兒騙至泰國的女子

      大象新聞
      2026-04-23 15:49:12
      哭笑不得!福建一小區訃告嚇壞住戶不敢坐電梯,在家吃了兩天外賣

      哭笑不得!福建一小區訃告嚇壞住戶不敢坐電梯,在家吃了兩天外賣

      火山詩話
      2026-04-23 11:11:31
      輸球不可怕!可怕的是鐵人主帥李金羽賽后這番話,對方外援厲害!

      輸球不可怕!可怕的是鐵人主帥李金羽賽后這番話,對方外援厲害!

      田先生籃球
      2026-04-23 06:24:25
      保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

      保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

      今夜有個好故事
      2026-03-11 17:26:56
      三星長公主前夫:離婚拿了8370萬揮霍一空,和巫女女友淪為階下囚

      三星長公主前夫:離婚拿了8370萬揮霍一空,和巫女女友淪為階下囚

      照見古今
      2026-04-22 18:42:23
      今年畢業生1270萬,青年失業率16.9%,不少人又得“靈活就業”了

      今年畢業生1270萬,青年失業率16.9%,不少人又得“靈活就業”了

      茶余飯好
      2026-04-23 17:23:27
      2026-04-24 06:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12839文章數 142635關注度
      往期回顧 全部

      科技要聞

      馬斯克喊出"史上最大產品",但量產難預測

      頭條要聞

      特朗普:不急于結束與伊朗戰爭 可伊朗沒時間了

      頭條要聞

      特朗普:不急于結束與伊朗戰爭 可伊朗沒時間了

      體育要聞

      給文班剃頭的馬刺DJ,成為NBA最佳第六人

      娛樂要聞

      王大陸因涉黑討債被判 女友也一同獲刑

      財經要聞

      普華永道賠償10億 恒大股東見到"回頭錢"

      汽車要聞

      預售30.29萬起 嵐圖泰山X8配896線激光雷達

      態度原創

      親子
      健康
      家居
      教育
      公開課

      親子要聞

      新華讀報|打乒乓球有助提高兒童注意力

      干細胞如何讓燒燙傷皮膚"再生"?

      家居要聞

      浪漫協奏 法式風格

      教育要聞

      家長要電子試卷被說派頭大?天津這起家校誤會,沒有真正的贏家!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一级做a爰片久久毛片16| 天天躁日日躁狠狠躁av中文| 国产明星精品无码AV换脸| 孕妇怀孕高潮潮喷视频孕妇| 特级做a爰片毛片免费看无码| 亚洲精品成人网站| 一级毛片在线免费看| 精品久久久久久无码免费| 精品国产免费人成在线观看| 欧美一区| 无翼乌口工全彩无遮挡h全彩| 综合久久国产九一剧情麻豆| 黑人好猛厉害爽受不了好大撑 | 天水市| 色偷偷88888欧美精品久久久| 五月天激情婷婷婷久久| 豆花AV| 日韩精品久久无码中文字幕色欲| 特黄视频| 91色在线视频| 中文字幕人妻熟女人妻a片| 制服丝袜无码| 久久久久国产精品人妻aⅴ天堂| 久久精品私人影院免费看 | 九九热精品在线观看| 精品无码一区二区三区爱欲| 亚洲精品国产电影午夜在线观看| 特级做a爰片毛片免费看无码| 中文字幕亚洲区| 无套内谢少妇毛片在线| 韩国论理电影| 熟女在线视频一区二区三区| 老司机午夜精品99久久免费| 艳妇乳肉豪妇荡乳AV无码福利| 老子影院午夜伦不卡| 精品国产av 无码一区二区三区| 五月天成人社区| 日韩精品毛片人妻AV不卡| 久久久精品久久久久久96| 日韩一区二区超清视频| 中文字幕精品无亚洲字幕|