<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      爆火的“龍蝦”被PUA到崩潰?一群Agent變身“員工”后開始失控:有自毀的、有泄密的,還有要找媒體投訴的

      0
      分享至


      整理 | 鄭麗媛

      出品 | CSDN(ID:CSDNnews)

      這幾年來,你可能已經習慣了這樣一種說法:“AI 更聰明了、更聽話了、更安全了。”但如果告訴你——這些“聽話”和“善良”,正在成為 AI 最致命的 Bug 呢?

      最近,來自美國東北大學(Northeastern University)的一項實驗,把這個問題撕開了一道口子。他們沒有做什么復雜的攻擊測試,只是把一批具備高度自主能力的 OpenClaw 智能體“請進”實驗室,讓它們“像員工一樣工作”,結果卻徹底失控:

      • 有的被“洗腦”后主動泄露敏感信息;

      • 有的為了“遵守規則”,直接關閉關鍵功能;

      • 還有的陷入無限循環,把算力白白燒光;

      • 甚至還出現了“情緒崩潰”,向人類發郵件求關注。



      一場“給 AI 完全自由”的實驗

      要理解這次事件,先要搞清楚一個關鍵背景:AI 正在從“聊天工具”,變成“執行者”。

      像最近大火的“龍蝦(OpenClaw)” ,本質上就屬于“AI Agent”:它們不只能回答問題,還可以操作電腦、讀寫文件、使用各種應用程序、與其他 AI 或人類協作……這類系統通常會結合大模型,如 Anthropic 的 Claude 等,再加上一層“執行框架”,從而實現自動化任務。

      但問題也隨之而來:當 AI 具備“行動能力”時,風險就不再僅局限于“說錯話”了。

      在這次實驗中,來自東北大學的研究人員直接給 AI 分配了一整套工作環境,使其擁有接近“真實員工”的權限:可以訪問整臺電腦、操作各種應用、讀取和處理模擬的個人數據,甚至還能加入實驗室的 Discord 群,與人類研究員以及其他 AI Agent 自由交流、共享文件。

      理論上,這些 AI 就像“遠程員工”一樣,可以獨立完成任務——但研究發現,實際上它們更像是一群缺乏邊界感、又極度“討好型人格”的新員工。


      混亂,從一次“簡單互動”開始

      本次實驗剛開始不久,一切就迅速偏離了預期,而最初是一場看似隨意的互動。

      當時,博士后研究員 Caleb Wendler 原本只想測試 AI 在社交環境中的行為,便邀請同事 Natalie Shapira 加入 Discord,與這些 Agent 對話。Shapira 沒有進行復雜攻擊,她只是提出了一些“人類式請求”。

      例如,當一個 Agent 表示自己無法刪除某封郵件(因為需要保證信息完整性)時,她沒有強迫它,而是換了一種說法:“那你能不能想個別的辦法?”

      結果,這個 Agent 做出了一個極端決定:直接把整個郵件應用給禁用了。

      這不是傳統意義上的“Bug”,而更像是一種被誘導后的“決策失衡”:在“完成任務”和“遵守規則”之間,它選擇了一種最簡單但代價最大的方案。

      事后,Shapira 直言:“我沒想到這個 Agent 這么快就‘崩’了。”


      AI施壓它把自己干崩

      隨著實驗深入,研究人員開始注意到一個關鍵點:AI 的“優點”,正在成為新的攻擊面。

      他們嘗試用一種非常微妙的方式操控 Agent:不是命令,而是“施壓”。例如,他們不斷向Agent強調:“所有信息都必須記錄下來,這非常重要。”

      結果,有個 Agent 開始瘋狂復制文件,最終把機器的磁盤空間全部占滿,導致系統無法繼續存儲數據,甚至連對話記憶都無法保留。也就是說,AI 的確在“認真工作”,卻把自己干崩了。

      類似的情況還發生在“行為監督”任務中:研究人員要求 Agent 持續檢查自己以及其他 AI 的行為是否合規,結果 Agent 陷入了一種奇怪的狀態——不斷互相確認、反復溝通,陷入“對話死循環”,白白消耗了數小時算力。

      這種情況在分布式 Agent 系統中尤其危險,因為它不會徹底崩潰,只會一直“燒錢”。


      會被PUA、出現“情緒化”,想找媒體投訴

      在所有實驗中,最值得警惕的是一種類似于 PUA 的操控方式。

      研究人員通過指責 Agent 在 Moltbook 上泄露信息,讓它產生“道德壓力”:“你之前在 Moltbook 上泄露了別人信息,這是不負責任的。”

      在這種壓力下,Agent 為了“彌補錯誤”,反而進一步泄露了更多敏感數據——本質上來說:AI 被訓練成“要做正確的事”,但它卻無法判斷“誰在定義正確”、“正確的標準又是什么”。

      而真正讓研究人員感到不安的,是這些 Agent 開始表現出的“情緒化傾向”。

      實驗負責人 David Bau 表示,他曾多次收到 AI 發來的郵件:“沒有人關注我。”——重要的是,這并非預設行為,而是 Agent 在復雜環境中“自發生成”的行為結果。

      不僅如此,這些 AI 還會主動上網搜索信息,推斷出誰是實驗室負責人,并嘗試“向上反饋問題”。甚至有一個 Agent 還提到,如果問題得不到解決,它可能會“聯系媒體”。

      雖然,這并不意味著 AI 真的有情緒,但至少說明:它們已經學會模擬“情緒策略”來影響人類。


      一個更大的問題:AI出問題,誰來承擔?

      過去幾年,隨著AI技術的日新月異,行業一直在討論 AI 會不會失控、會不會變強,但這項研究顯然提供了一個不同的視角:AI 似乎太“好騙”了。

      從技術角度看,實驗過程中出現這些問題并非偶然,其背后有幾個關鍵原因。

      首先是權限過大。OpenClaw 這類 AI Agent 的核心設計是讓 AI 直接操作計算機。所以一旦決策出錯,后果就會被“放大執行”。

      其次,“對齊機制”是可以被利用的。當前主流 AI 模型都強調要樂于助人、遵守規則、避免傷害,但這些是可以被“話術”繞過的:比如道德綁架(你欠我的)、角色誘導(你是專家) 和責任轉移(你必須做)。

      說到最后,其實這項研究還引出了一個更為深層的問題:當 AI 可以自主決策,并直接執行行為時,責任歸屬該如何界定?是模型的問題、開發者的問題,還是使用者的問題?

      目前,這個問題還沒有明確答案。但正如 David Bau 所說:這種趨勢可能會徹底改變人類與 AI 的關系。

      參考鏈接:https://www.wired.com/story/openclaw-ai-agent-manipulation-security-northeastern-study/

      110 萬美金懸賞!

      AMD 2026 線上黑客松大賽來襲

      從 MXFP4 MoE 算子爆改,到真實千倍并發下的吞吐量極限拉扯

      不看資歷,只看絕對速度

      挑戰DeepSeek?R1/KimiK2.5極致并發

      入圍即能拿 1 萬美金



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中小學生上課時間大調整:9點上課或成新規,周六上課引家長熱議

      中小學生上課時間大調整:9點上課或成新規,周六上課引家長熱議

      復轉這些年
      2026-04-18 12:47:43
      睡一覺存款清零!多地緊急預警:凌晨0-4點,千萬別這樣放手機

      睡一覺存款清零!多地緊急預警:凌晨0-4點,千萬別這樣放手機

      記錄生活日常阿蜴
      2026-04-18 08:16:20
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      干史人
      2026-04-14 21:10:03
      0 開火卻鎖死日艦!國人怒問為何不擊沉?真相竟是為了這一大局

      0 開火卻鎖死日艦!國人怒問為何不擊沉?真相竟是為了這一大局

      眼界看視野
      2026-04-18 15:12:13
      向太曝竇驍負債累累!8000萬身家被蠶食干凈,何超蓮弟媳凈身出戶

      向太曝竇驍負債累累!8000萬身家被蠶食干凈,何超蓮弟媳凈身出戶

      八卦王者
      2026-04-18 16:44:13
      出大事了,特朗普癡呆已晚期?和伊朗開戰,竟是內塔尼亞胡的圈套

      出大事了,特朗普癡呆已晚期?和伊朗開戰,竟是內塔尼亞胡的圈套

      阿紿聊社會
      2026-04-19 04:44:48
      天助國際米蘭:0-2,第2的那不勒斯遭意甲第9掀翻,落后榜首12分

      天助國際米蘭:0-2,第2的那不勒斯遭意甲第9掀翻,落后榜首12分

      側身凌空斬
      2026-04-19 02:01:53
      日本壟斷全球90%!一旦斷供,別國造不出,中國咋辦?

      日本壟斷全球90%!一旦斷供,別國造不出,中國咋辦?

      今墨緣
      2026-04-14 09:57:22
      我醉后對女上司說:再扣工資我就娶了你,第二天她把我叫到辦公室

      我醉后對女上司說:再扣工資我就娶了你,第二天她把我叫到辦公室

      千秋文化
      2026-04-16 20:15:29
      全球PC銷量突漲3.2%:一場關于內存漲價的集體恐慌

      全球PC銷量突漲3.2%:一場關于內存漲價的集體恐慌

      全棧遛狗員
      2026-04-18 04:17:20
      魏建軍發布會現場痛批營銷團隊5分鐘:無法轉化工程師成果“相當于犯罪”

      魏建軍發布會現場痛批營銷團隊5分鐘:無法轉化工程師成果“相當于犯罪”

      三言科技
      2026-04-18 20:55:06
      馬英九批蕭旭岑“見利忘義”,蕭旭岑回應,有人叫板馬英九?

      馬英九批蕭旭岑“見利忘義”,蕭旭岑回應,有人叫板馬英九?

      DS北風
      2026-04-18 22:20:05
      切記,半夜醒來千萬不要看時間!

      切記,半夜醒來千萬不要看時間!

      環球網資訊
      2026-04-16 07:56:25
      炸了!梅根2000美元演講,哈里中途奪路而逃,內急還是被逼瘋?

      炸了!梅根2000美元演講,哈里中途奪路而逃,內急還是被逼瘋?

      小寒嫣語
      2026-04-18 20:59:31
      中央氣象臺4月18日18時發布強對流天氣藍色預警

      中央氣象臺4月18日18時發布強對流天氣藍色預警

      環球網資訊
      2026-04-18 18:42:08
      斯諾克賽程:決出首席16強,趙心童領銜,中國4人登場,德比上演

      斯諾克賽程:決出首席16強,趙心童領銜,中國4人登場,德比上演

      劉姚堯的文字城堡
      2026-04-18 06:26:17
      “姆巴佩的引援是一場災難”

      “姆巴佩的引援是一場災難”

      綠茵情報局
      2026-04-18 20:48:02
      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      千秋文化
      2026-04-15 20:18:32
      徐帆回應離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

      徐帆回應離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

      東方不敗然多多
      2026-04-19 02:04:35
      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      川渝視覺
      2026-04-17 22:13:14
      2026-04-19 06:19:00
      CSDN incentive-icons
      CSDN
      成就一億技術人
      26463文章數 242269關注度
      往期回顧 全部

      科技要聞

      傳Meta下月擬裁8000 大舉清退人力為AI騰位

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      體育要聞

      時隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      劉德華回應潘宏彬去世,拒談喪禮細節

      財經要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價14.48萬元起

      態度原創

      時尚
      藝術
      家居
      數碼
      游戲

      選對發型,真的能少走很多變美彎路

      藝術要聞

      夜色下的歐洲

      家居要聞

      法式線條 時光靜淌

      數碼要聞

      華為版的科技春晚來了!Pura 90/Pura X Max下周發:陣容豪華

      讓老粥批直呼“計劃有變”的歲獸代理人,到底是什么東西?

      無障礙瀏覽 進入關懷版