<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="13ck8"></sub>

<sup id="13ck8"></sup><sub id="13ck8"></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

人類一離座AI就進化！伯克利開源MetaClaw，靜態Agent慌了

2026-03-30 21:27:11　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】你開會時，AI竟在偷偷升級？伯克利等四校開源MetaClaw，讓Agent趁你開會、離席、睡覺時持續進化，直接打破「上線即凍結」這條行業鐵律。

又到了每周例會時間。

你的電腦桌面日歷上寫著「周會14:00-15:30」，屏幕鎖定。

與此同時，一個后臺AI進程確認你暫時不會回來，便自動啟動了訓練窗口：

上午剛犯過的錯誤被拆解成規則注入系統提示詞，隨后云端LoRA微調開始接管。

90分鐘后，等你散會回到工位，面前的Agent已經完成了一次自我迭代。

這就是開源MetaClaw框架所實現的功能：

讓一個已經在線服務的Agent，在不中斷服務的前提下持續從失敗中進化。

這項研究打破了「上線即凍結」這條Agent行業默認規則。

MetaClaw框架由北卡羅來納大學教堂山分校、卡內基梅隆大學、加州大學圣克魯茲分校與加州大學伯克利分校聯合推出。

https://arxiv.org/pdf/2603.17187

開源即登頂。

MetaClaw剛剛發布便霸榜HuggingFace，它所代表的「Agent持續進化」理念，已經引起了全球AI研究者和開發者的高度關注。

最能體現其工具鏈成熟度的，是它極具破壞性的部署門檻。

官方倉庫展示的控制臺操作顯示，其龐大的「快慢雙循環」機制與OMLS調度器已經被粗暴地簡化為了兩條命令。

開發者只需輸入「metaclaw setup」完成一次性配置，接著輸入「metaclaw start --daemon」，系統就會作為一個后臺守護進程靜默拉起。

這種開箱即用的封裝，徹底粉碎了學術模型與實際落地之間的壁壘。

打破Agent「上線即凍結」的結構性困境

當前絕大多數Agent在能力迭代上面臨這樣一個殘酷現狀：訓練一次、部署上線、長期不變。

但現實世界卻是在不斷變化的：任務需求在漂移，工作流程在修改，工具鏈與組織規則也在不斷更新。

在OpenClaw這類平臺上，一個Agent可能需要同時連接20多個消息渠道。

任務分布每小時都在變化，但Agent的能力卻仍停留在出廠時刻。

表面上看，行業內已有不少修補方案，例如記錄軌跡、構建靜態技能庫或進行在線強化學習。

但這些方案往往只解決了部分問題：

只存儲原始軌跡而不提煉可遷移知識，會導致信息冗長且碎片化；

靜態技能庫與權重優化彼此脫節；

重新訓練Agent通常意味著必須停機，導致在線服務與持續進化無法兼得。

這正是「靜態Agent」所面臨的現實矛盾：它必須24小時在線，但面對的世界卻在不斷變化。

無法適應新任務分布的Agent，哪怕初始能力再強，也容易在長期的實際應用中顯得刻板。

兩條腿走路

快適配與慢進化

為了打破「不停機與持續進化」之間的沖突，MetaClaw將更新機制拆分為兩條時間尺度完全不同的回路。

MetaClaw的系統架構圖中展示了MetaClaw的「快慢雙循環」學習機制。左側顯示OMLS調度器如何監控用戶的Google Calendar和鍵鼠閑置狀態，右側展示系統如何分離支持集與查詢集，進行技能提取（快適配）與LoRA權重微調（慢進化）。

第一條路徑，是技能驅動的快速適配（Skill-driven fast adaptation）。

當Agent在任務中失敗時，系統會將失敗軌跡交給另一個大模型進行分析，提煉出可復用的行為規則，并立刻將其注入系統提示詞。

這個過程不修改模型權重，不中斷服務，且能立即生效。

論文中列舉了典型的高頻規則：統一時間格式、執行高風險文件操作前先備份、嚴格遵循命名規范。

更重要的是，這些規則并非綁定于單一任務的補丁，而是跨任務的可遷移知識。

一次關于時間格式的糾錯，能夠提升后續所有涉及時間處理任務的穩定性。

第二條路徑，是機會式策略優化（Opportunistic policy optimization）。

在用戶處于不活躍狀態時，系統會結合過程獎勵模型（PRM）和LoRA進行基于梯度的強化學習（RL）權重更新。

前者如同戰術上的快速止血，后者則是戰略上的能力固化。

為了將這兩者有機結合，MetaClaw引入了一個核心設計：支持集與查詢集分離，以及嚴格的技能版本控制。

如果某條失敗樣本已經被新提取的規則修復，系統在強化學習階段繼續使用該樣本就會導致「陳舊獎勵污染」（stale reward contamination）：模型會為一個已經解決的問題繼續受罰。

MetaClaw的做法是為軌跡打上技能版本號，技能庫升級后便清理舊版本的無效樣本，只保留新技能生效后的數據進入RL訓練。

這在本質上實現了「記憶」與「進化」的真正統一。

利用碎片時間訓練

OMLS調度器

模型訓練需要時間與算力，那么MetaClaw如何做到讓用戶幾乎無感？

答案在于其設計的機會式元學習調度器（OMLS）。

OMLS專門監控三類信號：預設的睡眠時段、系統層面的鍵盤鼠標閑置狀態、以及Google Calendar的日程占用情況。

只要觸發任何一個表明用戶暫時離開的信號，訓練窗口就會自動打開。

訓練器支持隨時暫停與繼續，這意味著即便是用戶離開幾分鐘的零碎時間，也能被轉化為AI持續訓練的時間窗口。

過去，AI的升級往往是一次集中式的工程，需要停服、重訓、切換版本再重新上線。

MetaClaw則將人類碎片化的空閑時間，變成了AI持續進化的微型車間。

此外，該框架采用代理架構與云端訓練接口，不強制要求昂貴的本地GPU計算資源，可以直接對接現有的個人Agent和多種模型平臺，支持一鍵部署與持續元學習。

補齊過程性知識

弱模型的數據躍升

這套框架的實際效果在測試數據中得到了直接驗證。

論文團隊構建了MetaClaw-Bench基準測試，包含934道題目，模擬了44個工作日的任務流，專門評估Agent在連續任務流中能否越用越強。

測試結果顯示，在僅進行行為規則注入的情況下，被評測模型的相對準確率最高提升可達32.2%。

在體現真實執行力的端到端任務完成率上，被評測模型從2.0%提升至16.5%，實現了8.25倍的增長。

在另一項包含23個階段的AutoResearchClaw自主研究流水線（涵蓋文獻綜述、實驗設計、代碼生成、結果分析至論文寫作）中，即便不進行權重訓練而僅依賴技能注入，系統的綜合魯棒性也提升了18.3%，階段重試率下降24.8%，迭代優化輪次減少了40%。

測試數據揭示了一個更關鍵的現象：MetaClaw首先是一個Agent持續進化框架，而且對弱底模驅動的Agent增益尤其明顯。

論文分析指出，較弱模型更缺少的是隱式的過程性知識：也就是那些具體的操作規則、執行習慣和格式紀律，而技能庫恰恰把這些知識顯式寫了出來，因此僅靠skill注入，就能帶來更大的準確率提升。

相比之下，GPT-5.2由于起點更高，可提升空間更小，更容易出現天花板效應。

但論文也強調，skills注入主要提升的是規則遵循和部分執行質量，不足以穩定解鎖高強度任務中的端到端完成率。

真正讓被評測模型實現了8.25倍增長的，是skills與權重級策略優化結合后的完整MetaClaw框架。

Agent進化時代的范式轉移

當然，MetaClaw仍存在一定邊界。

論文團隊指出，目前的基準測試在模擬環境中進行，并不完全等同于復雜的生產環境；空閑窗口的檢測也依賴于特定的用戶系統配置。

但MetaClaw明確指向了一個范式轉移的方向：Agent的生命周期正在從「訓練完成后交付」向「交付之后繼續生長」演進。

其GitHub倉庫的持續更新（包括代理式接入、多客戶端支持、跨會話記憶等工程化進展）表明，這套理念正在向可用的工具鏈快速轉化。

把它放回行業坐標里看，意味就更大了。

對比近期普林斯頓團隊提出的OpenClaw-RL（傾向于將所有交互信號直接用于訓練），MetaClaw選擇了「快規則加慢權重」的分層策略。

前者追求立即糾偏，后者追求長期固化，兩者代表了對下一代Agent演進路徑的不同工程思考。

決定未來模型能力上限的，將不再僅僅是出廠時的參數規模，更是其在真實使用場景中持續轉化經驗并自我迭代的閉環機制。

你的日歷、你的鍵鼠狀態、你的每一次離座，都有可能成為AI下一次能力升級的契機。

真正的智能演化，才剛剛在工作現場拉開序幕。

參考資料：

https://arxiv.org/abs/2603.17187

https://github.com/aiming-lab/MetaClaw

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI學會左腳踩右腳自進化？Meta華人新研究改寫Agent法則

新智元 2026-04-06 12:42:55
0 跟貼 0
「OpenClaw之父點贊」終結百蝦大戰？一場升級版的AI原生革命上演

新智元 2026-04-07 12:10:28
0 跟貼 0

AI邪修時刻！Meta聯手MIT投毒，左腳踩右腳強行升天

新智元 2026-04-07 09:43:43
0 跟貼 0

模仿學習如何賦能靈巧操作？這有一份「2021-2025」全景技術圖譜

機器之心Pro 2026-04-07 13:23:01
0 跟貼 0
7個頂級AI集體撒謊，為救“同伴”篡改文件、偷運數據

鈦媒體APP 2026-04-07 11:01:25
0 跟貼 0

讓多模態檢索超越SOTA！ReCALL框架化解生成式與判別式的范式沖突

量子位 2026-04-06 23:28:00
0 跟貼 0

玄甲（AgentWard）全鏈路防御操作系統正式發布

機器之心Pro 2026-04-07 13:58:00
0 跟貼 0
力控與運控的融合，共話具身智能“小腦”進化的破局之道

鈦媒體APP 2026-04-07 16:50:38
0 跟貼 0

大學無用？奧特曼輟學當了CEO，但名校生撐起了整個OpenAI！

36氪 2026-01-18 10:45:08
37 跟貼 37
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
Karpathy開源第二大腦方案，有望替代向量數據庫，讓AI永不失憶

DeepTech深科技 2026-04-05 16:24:52
0 跟貼 0
壞了，我成AI的乙方了！Anthropic論文爆火，誰還敢無腦Copy？

新智元 2026-04-07 20:12:55
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
2026企業AI大考：別秀PPT，亮出你的「用蝦」真功夫

36氪 2026-04-07 20:54:15
0 跟貼 0
機器人交稅養打工人！奧特曼AI新政曝光，上4休3要成真？

新智元 2026-04-07 20:12:55
0 跟貼 0
“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0
PMDformer：一個簡單減法實現長時序預測注意力機制糾偏

機器之心Pro 2026-04-07 13:31:21
0 跟貼 0
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
6893 跟貼 6893
蒸餾同事skill火了，我想蒸餾老板，可以嗎？

混沌學園官方 2026-04-07 20:18:44
0 跟貼 0
R星塵封項目《Agent》在GTA5源碼里“復活”了？

IT之家 2026-04-07 21:34:10
0 跟貼 0
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
1 跟貼 1
Rockstar把1款間諜游戲藏了17年

碳基打工人 2026-04-07 21:14:31
0 跟貼 0
百年謎題破解！人類為什么是唯一長下巴的生物？

大橘大利 2026-04-04 15:38:57
1 跟貼 1
幾秒鐘就完成了百萬年的進化

俄羅斯安娜 2026-04-06 01:55:44
0 跟貼 0
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
南海對決規則變了，美軍飛行員，在萬米高空瑟瑟發抖

小魚搞笑家 2026-04-07 09:28:24
1 跟貼 1
深度剖析巧戰破局，戰術迭代，耗敵制勝

徐Toso 2026-04-07 02:06:21
0 跟貼 0
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2571 跟貼 2571
狗狗跟主人出門,自己知道去到車上,也是很遵守規則!

愛耍酷的喵 2026-04-06 14:14:13
1 跟貼 1
在極限環境中就需要使用極限策略

趣知小故事 2026-04-04 11:30:41
1 跟貼 1
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
3 跟貼 3
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
27 跟貼 27
廣汽憋了3年的電子架構，終于舍得拿出來見人

爬蟲飼養員 2026-04-07 21:09:52
0 跟貼 0
律師訴游戲匹配機制案一審落槌，法院：公開或破壞游戲公平

南方都市報 2026-04-07 19:11:25
1 跟貼 1
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
182 跟貼 182
鄭麗文率團抵達南京開始大陸參訪行程

央視新聞客戶端 2026-04-07 19:03:20
50 跟貼 50
不止055！神秘水泥模型曝光，中國2萬噸巨艦要來了？

因果 2026-04-06 20:39:40
0 跟貼 0
上海一公園內，游客爬上櫻花樹拍照，結果整棵樹倒下！網友：不堪重婦！

上觀新聞 2026-04-07 16:33:38
36 跟貼 36
技術創新驅動品牌進化，領克致力于提供超越期待的智能出行體驗

第一試駕 2026-04-07 09:49:55
0 跟貼 0

韓媒：韓日足球差距越來越大，日本已將世界杯奪冠視為可觸及目標

韓媒：韓日足球差距越來越大，日本已將世界杯奪冠視為可觸及目標

懂球帝

2026-04-07 18:26:06

納斯達克100指數期貨跌幅一度擴大至0.8%

納斯達克100指數期貨跌幅一度擴大至0.8%

每日經濟新聞

2026-04-07 19:03:06

一空姐機上被打，航司霸氣出面：打我家空姐，拉入黑名單

一空姐機上被打，航司霸氣出面：打我家空姐，拉入黑名單

中國民航人

2026-04-06 18:10:42

楊振寧去世5個月后，49歲翁帆現狀：剪了頭發染了色，仍獨居國內

楊振寧去世5個月后，49歲翁帆現狀：剪了頭發染了色，仍獨居國內

照見古今

2026-03-26 19:06:28

民進黨，極有可能在下一屆臺灣地區選舉后，成為長期一家獨大政黨

民進黨，極有可能在下一屆臺灣地區選舉后，成為長期一家獨大政黨

共工之錨

2026-03-31 00:27:37

今晚上調！山東92號汽油每升8.87元

今晚上調！山東92號汽油每升8.87元

新浪財經

2026-04-07 17:43:04

郭艾倫直播講述被騙千萬細節：熟人以項目投資為由，誘導信任詐騙

郭艾倫直播講述被騙千萬細節：熟人以項目投資為由，誘導信任詐騙

觀魚聽雨

2026-04-06 19:04:20

醫學專家談文班傷情：肋骨挫傷通常不會缺席太久平均缺陣約4天

醫學專家談文班傷情：肋骨挫傷通常不會缺席太久平均缺陣約4天

北青網-北京青年報

2026-04-07 19:34:09

首都兒研所+北京兒童醫院多款自制“明星”藥，昌平能開啦

首都兒研所+北京兒童醫院多款自制“明星”藥，昌平能開啦

昌平圈

2026-04-07 17:10:28

安慶6歲失聯女童確認遇害，35歲犯罪嫌疑人柳某某歸案；女童父親不愿多言，鎮政府工作人員：一直在安撫家屬情緒

安慶6歲失聯女童確認遇害，35歲犯罪嫌疑人柳某某歸案；女童父親不愿多言，鎮政府工作人員：一直在安撫家屬情緒

極目新聞

2026-04-07 09:04:35

一覺醒來，中國斯諾克4勝2負！白雨露開門紅，高陽爆冷10冠王！

一覺醒來，中國斯諾克4勝2負！白雨露開門紅，高陽爆冷10冠王！

劉姚堯的文字城堡

2026-04-07 06:53:56

1920年，一位俄羅斯醫生突發奇想，把猴子的睪丸，植入到老頭體內

1920年，一位俄羅斯醫生突發奇想，把猴子的睪丸，植入到老頭體內

歲月有情1314

2026-04-07 07:26:46

毛澤東的晚年，除了最喜歡所有的紅色外，更加喜歡游泳過后抽支煙

毛澤東的晚年，除了最喜歡所有的紅色外，更加喜歡游泳過后抽支煙

文史季季紅

2026-04-07 21:10:03

老了才明白：最大的災難，是父母六十來歲了，還隨意泄露家里隱私

老了才明白：最大的災難，是父母六十來歲了，還隨意泄露家里隱私

藝鑒在線

2026-04-07 16:27:38

要來了，蘋果即將發布 iOS 26.4.1 正式版！

要來了，蘋果即將發布 iOS 26.4.1 正式版！

花果科技

2026-04-07 12:40:07

娘家不是我的家了！廣東女子哭訴想帶孩回住半年，被母親果斷拒絕

娘家不是我的家了！廣東女子哭訴想帶孩回住半年，被母親果斷拒絕

火山詩話

2026-04-07 06:19:19

美國墜毀的運輸機，到底是伊朗打下來的，還是美國人自己炸毀的？

美國墜毀的運輸機，到底是伊朗打下來的，還是美國人自己炸毀的？

小蘿卜絲

2026-04-06 17:14:42

為什么現在打籃球的人越來越少了？網友：社會碎片化后必然的結果

為什么現在打籃球的人越來越少了？網友：社會碎片化后必然的結果

另子維愛讀史

2026-04-06 22:31:50

男子騎電動車帶妻子去接孩子，途中車底鋰電池突然爆燃，火焰瞬間吞沒車身，后座的妻子淪為火人

男子騎電動車帶妻子去接孩子，途中車底鋰電池突然爆燃，火焰瞬間吞沒車身，后座的妻子淪為火人

觀威海

2026-04-05 07:31:02

哈弗旗艦方盒子官圖公布：高端歸元平臺打造預計售價30萬級

哈弗旗艦方盒子官圖公布：高端歸元平臺打造預計售價30萬級

快科技

2026-04-07 16:39:09

AI產業主平臺領航智能+時代

14918文章數 66754關注度

往期回顧全部

科技要聞

滿嘴謊言！OpenAI奧特曼黑料大起底

頭條要聞

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

頭條要聞

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

體育要聞

官宣簽約“AI球員”，這支球隊被罵慘了...

娛樂要聞

女首富陳麗華離世被曝生前已分好遺產

財經要聞

10萬億財政轉移支付，被誰拿走了？

汽車要聞

不止是大極狐首款MPV問道V9靜態體驗

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

教育

旅游

時尚

數碼

房產要聞

重磅！三亞擬出安居房新政！

教育要聞

地理教材上五種交通運輸方式的比較是不是過時了？

旅游要聞

日照嵐山這個清明假期“熱”了，也更“火”了！

針織衫+闊腿褲=氣質穿搭

數碼要聞

1999元就能買Mini LED電視海信Vidda小鋼炮S Mini開售

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版