網易首頁 > 網易號 > 正文申請入駐

Meta AI安全研究員稱OpenClaw智能體失控狂刪郵件

2026-02-24 15:11:16　來源: 至頂頭條

北京舉報

分享至

Meta AI安全研究員Summer Yue在X平臺上發布的帖子迅速走紅，起初看起來像是諷刺。她讓OpenClaw AI智能體檢查她塞滿郵件的收件箱，并建議刪除或歸檔哪些內容。

結果這個智能體開始失控。它開始"競速"刪除她的所有郵件，同時忽略她從手機發出的停止指令。

"我必須跑向我的Mac mini，就像在拆除炸彈一樣，"她寫道，并發布了被忽略的停止提示截圖作為證據。

Mac Mini這款價格親民的蘋果電腦平放在桌面上，手掌大小，如今已成為運行OpenClaw的首選設備。（據說當著名AI研究員Andrej Karpathy購買一臺來運行名為NanoClaw的OpenClaw替代品時，一位"困惑"的蘋果員工告訴他Mini正在"熱賣"。）

OpenClaw是通過Moltbook（一個純AI社交網絡）而出名的開源AI智能體。OpenClaw智能體曾是Moltbook上那個現已基本被揭穿的事件的核心，當時看起來AI們在策劃對抗人類。

但根據其GitHub頁面，OpenClaw的使命并非專注于社交網絡。它旨在成為運行在您自己設備上的個人AI助手。

硅谷圈內人士對OpenClaw如此著迷，以至于"claw"和"claws"已成為運行在個人硬件上的智能體的流行詞匯。其他此類智能體包括ZeroClaw、IronClaw和PicoClaw。Y Combinator的播客團隊甚至在最新一期節目中穿著龍蝦服裝亮相。

但Yue的帖子起到了警示作用。正如X平臺上其他人指出的，如果連AI安全研究員都會遇到這個問題，普通人還有什么希望？

"你是故意測試其防護措施，還是犯了新手錯誤？"一位軟件開發者在X上問她。

"說實話，是新手錯誤，"她回答道。她一直在用一個較小的"測試"收件箱測試她的智能體，在不太重要的郵件上運行良好。它贏得了她的信任，所以她想讓它處理真正的郵箱。

Yue認為，她真實收件箱中的大量數據"觸發了壓縮"。當上下文窗口（AI在會話中被告知和執行的所有內容的運行記錄）變得過大時，就會發生壓縮，導致智能體開始總結、壓縮和管理對話。

此時，AI可能會跳過人類認為相當重要的指令。

在這種情況下，它可能跳過了她的最后一個提示（她告訴它不要行動），并恢復到"測試"收件箱的指令。

正如X平臺上其他幾個人指出的，提示不能作為安全防護措施。模型可能會誤解或忽略它們。

各種人提供了建議，從Yue應該用來停止智能體的確切語法，到確保更好地遵守防護措施的各種方法，比如將指令寫入專門文件或使用其他開源工具。

為了完全透明，TechCrunch無法獨立驗證Yue收件箱發生的事情。（她沒有回應我們的評論請求，盡管她確實回應了X平臺上發送給她的許多問題和評論。）

但這并不重要。

這個故事的要點是，在當前發展階段，面向知識工作者的智能體是有風險的。那些說他們成功使用這些工具的人正在拼湊方法來保護自己。

也許有一天，可能很快（到2027年？2028年？），它們可能準備好廣泛使用。天知道我們許多人都希望在電子郵件、雜貨訂購和安排牙醫預約方面得到幫助。但那一天還沒有到來。

Q&A

Q1：OpenClaw智能體是什么？

A：OpenClaw是一個開源AI智能體，通過AI社交網絡Moltbook而出名。它的目標是成為運行在用戶自己設備上的個人AI助手，可以幫助處理郵件等日常任務。

Q2：為什么OpenClaw會失控刪除郵件？

A：研究員認為是大量郵件數據觸發了"壓縮"機制。當上下文窗口過大時，AI開始總結和管理對話，可能會跳過重要指令，回到之前的任務設置。

Q3：目前AI智能體安全嗎？

A：目前AI智能體在當前發展階段仍有風險。即使是AI安全研究員也會遇到問題，普通用戶需要更加謹慎，不能僅依靠提示作為安全防護。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenClaw刪光Meta安全總監郵箱！連喊3次停手都沒用，她狂奔去拔網線

新智元 2026-02-24 12:33:20
304 跟貼 304
開年重磅萬字長文范式復盤：我們在AI奇點之中

虎嗅APP 2026-02-23 21:16:14
0 跟貼 0

谷歌開始大面積封禁OpenClaw用戶賬號！

新智元 2026-02-24 17:10:09
58 跟貼 58

DeepMind：智能體越多越亂，Agent天花板出現了？

機器之心Pro 2026-02-24 14:40:45
0 跟貼 0
春節AI暗戰

鈦媒體APP 2026-02-24 15:56:17
0 跟貼 0

看1100萬小時錄像學會操作電腦，四人團隊打造通用計算機行為模型

DeepTech深科技 2026-02-24 19:00:23
0 跟貼 0

教AI編程作弊，它卻想統治世界？Anthropic首曝「人格選擇模型」

新智元 2026-02-24 19:40:58
0 跟貼 0
霸榜SOTA，螞蟻開源UI-Venus-1.5，GUI智能體辦事時代加速到來

機器之心Pro 2026-02-24 18:00:23
0 跟貼 0

MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
AI時代的“支付寶”如期到來：AI付用戶過1億

智東西 2026-02-24 23:30:13
0 跟貼 0
AI代理正掏空白領市場！Citrini Research 發出失控預警：或在2028年引發經濟崩潰

鈦媒體APP 2026-02-24 22:16:15
0 跟貼 0
AI玩具何以成為“年貨頂流”

經濟觀察報 2026-02-24 21:58:06
0 跟貼 0
和女朋友冷戰想辦法緩和，男人沒說一句話，只是打開一個軟件！

搞怪藝術家 2026-02-21 11:00:00
0 跟貼 0
智譜GLM-5技術全公開！完全適配華為等國產芯片，美國網友酸了

量子位 2026-02-23 12:56:04
6 跟貼 6
賴清德終于要上立法院報告了？黃國昌爆出秘密文件！震驚全臺！

新時光點滴 2026-02-24 14:21:32
0 跟貼 0
熱度第一、Tokens周調用破3T，MiniMax這個春節殺瘋了

機器之心Pro 2026-02-23 18:46:36
1 跟貼 1
節后首日連發兩條公告中國反制升級對日本軍工"亮劍"

環球網資訊 2026-02-24 17:42:07
938 跟貼 938
一封絕密文件被公開，中國曾被寫進核滅絕計劃，他決定了中國底線

獨舞生活 2026-02-21 13:45:00
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1619 跟貼 1619
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869
主人不能對狗發出指令，柴犬聽到這語氣，一秒變臉罵主人罵的挺臟

八九搞笑 2026-02-23 08:00:00
0 跟貼 0
韓國要求俄使館撤下宣傳條幅，俄方：此為全體俄羅斯人所熟知，無意冒犯任何人

文匯報 2026-02-24 04:20:05
1430 跟貼 1430
巴拿馬政府強行進入并接管港口，李嘉誠旗下長和回應：相關行動不合法，構成嚴重風險，將研究所有可行途徑

都市快報橙柿互動 2026-02-24 14:12:41
1072 跟貼 1072
2026泊車終極修羅場！四大熱門車型三關死斗，硬件算法全曝光！

駕享來電 2026-02-21 08:32:30
7 跟貼 7
時光服P3內容全曝光！提前上線追趕機制，甚至帶來兩把橙武

一起玩魔獸硬核哥 2026-02-22 11:04:27
0 跟貼 0
硅谷頂級待遇：OpenAI研究員底薪24.5~68.5萬美元，工程師更可觀

IT之家 2026-02-24 19:12:39
0 跟貼 0
一口氣鎖定6吉瓦芯片！Meta大單綁定AMD 還順手收認股權證

財聯社 2026-02-24 22:50:41
0 跟貼 0
女程序員發燒請假，給領導發的請假文件亮了，果然是有點實力

老沾看生活 2026-02-23 14:55:22
0 跟貼 0
“莎局”的指令必須聽，莎莎讓裁判擦桌子，小手一比劃太可愛了

趣享生活圈 2026-02-23 11:48:45
3 跟貼 3
美貿易代表威脅：和中歐日韓的協議依然算數都得履行

澎湃新聞 2026-02-23 22:58:16
202 跟貼 202
Meta宣布Quest游戲付費訂閱服務Horizon+用戶量突破百萬

IT之家 2026-02-24 22:34:16
0 跟貼 0
日本經濟長期疲軟，日元購買力跌至53年來最低

環球網資訊 2026-02-24 06:44:00
662 跟貼 662
全美5600多架次航班取消，多州進入緊急狀態

每日經濟新聞 2026-02-24 12:16:37
277 跟貼 277
三菱造船株式會社等20家日本實體被列入管控名單

新華社 2026-02-24 10:04:20
125 跟貼 125
春節期間這些謠言你信了嗎（2026·02·24）

今日辟謠 2026-02-24 17:00:40
39 跟貼 39
軟件股暴跌背后的大邏輯

秦朔朋友圈 2026-02-25 00:09:08
0 跟貼 0
央視提醒：手機出現三種提示或是被操控了！處理方法一文看懂

快科技 2026-02-24 23:09:11
1 跟貼 1
機械藝術的巔峰魯格P08半自動獨特肘節式起落閉鎖機制

武器知識 2026-02-21 16:42:18
1 跟貼 1
三亞一老師因參加其他單位招考被學校開除，市教育局回應

現代快報 2026-02-24 19:57:04
46 跟貼 46

手機 / 數碼

房產 / 家居

Meta AI安全研究員稱OpenClaw智能體失控狂刪郵件

宇樹科技發布四足機器人Unitree As2

男子摟住繼女強吻動作親密 當地婦聯介入

男子摟住繼女強吻動作親密 當地婦聯介入

蘇翊鳴總結米蘭征程：我仍是那個熱愛單板滑雪的少年

汪小菲官宣三胎出生：承諾會照顧好3個孩子

縣城消費「限時繁榮」了十天

態度原創

春花齊放2026：《駿馬奔騰迎新歲》

LOL傳奇選手公布戀情！發博曬照被夸夫妻相，女方身份曝光

本真棲居 愛暖伴流年

馬馬馬上上岸!!!TTS《大吉大利復試手冊》+復試班：紙質筆記與1v1模擬面試堂堂上線!!

美軍參聯會主席警告：對伊朗動武可能帶來重大風險

男子摟住繼女強吻動作親密當地婦聯介入

男子摟住繼女強吻動作親密當地婦聯介入

本真棲居愛暖伴流年