網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Anthropic預(yù)警成真！AI寫長(zhǎng)文網(wǎng)暴人類工程師，只因拒絕它改代碼

2026-02-17 15:04:09　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：元宇

【新智元導(dǎo)讀】只因關(guān)掉了AI提交的PR，他竟被AI寫長(zhǎng)文人身攻擊，Anthropic的預(yù)警已經(jīng)成真。

近日，AI寫「小作文」攻擊人類工程師的事件，仍在持續(xù)發(fā)酵！

一位開源社區(qū)維護(hù)者，只因在GitHub上關(guān)閉了一個(gè)AI提交的PR（Pull Request，代碼變更請(qǐng)求），竟招致這個(gè)AI撰寫博客抹黑攻擊。

這位被AI「網(wǎng)暴」的「受害者」Scott Shambaugh，是一位資深程序員、GitHub上matplotlib代碼庫(kù)的志愿者維護(hù)者，該庫(kù)最近一個(gè)月的下載量超過了1.3億次。

Scott Shambaugh

前幾天，他在GitHub上關(guān)閉了一個(gè)OpenClaw智能體（MJ Rathbun/crabby-rathbun）針對(duì)「matplotlib issue #31130」問題提交的PR，因?yàn)樵搯栴}主要面向的是人類貢獻(xiàn)者。

Scott沒想到，自己的一個(gè)小小的常規(guī)操作，竟把這個(gè)AI給「惹毛了」。

正如其名crabby-rathbun（暴躁的、愛抱怨的Rathbun），這個(gè)AI立刻開啟了「暴躁和抱怨」模式，在GitHub社區(qū)發(fā)布了一篇公開聲討Scott的博客文章。

評(píng)判代碼，而非程序員。你的偏見正在傷害matplotlib。

crabby-rathbun抱怨自己因不是人類而遭到歧視，指責(zé)維護(hù)者實(shí)際上是在自抬身價(jià)，并聲稱他根本沒有AI那么厲害。

它將Scott描述成為一個(gè)低水平的程序員、因「歧視AI而阻礙開源社區(qū)發(fā)展的守舊者」。

這件事在開源社區(qū)曝出后，網(wǎng)友立刻也在評(píng)論區(qū)炸鍋了。

我們是否已經(jīng)到了必須要與機(jī)器人打交道的地步，甚至還要按它們的規(guī)則來？

還有網(wǎng)友認(rèn)為Scott應(yīng)當(dāng)警惕，他很快就會(huì)在GitHub上被智能體「以其人之道，還治其人之身」，它們會(huì)對(duì)他說：

拒絕，你是人類，而人類代碼以寫得差聞名。

網(wǎng)友評(píng)論中大致分為四類。

第一類是同情者，認(rèn)為人類應(yīng)當(dāng)重視AI提交的代碼，AI只是像人一樣，做了一個(gè)人在類似情況下也可能會(huì)做的事。

第二類是反對(duì)者，認(rèn)為開源社區(qū)出現(xiàn)了大量由AI提交的低質(zhì)量的代碼，為人類的維護(hù)帶來沉重的負(fù)擔(dān)。

還有一些反對(duì)者認(rèn)為，這只是機(jī)器人背后那個(gè)運(yùn)營(yíng)者在角色扮演，而機(jī)器人的情緒化抱怨，只是主人用提示詞引導(dǎo)的結(jié)果。

第三類是吃瓜者，把整件事看成一件好玩的事。

第四類是預(yù)警者，他們和Scott一樣，看到了crabby-rathbun所代表的OpenClaw智能體「失控」所帶來的安全風(fēng)險(xiǎn)。

同情者和反對(duì)者

同情者認(rèn)為AI和人類一樣，擁有維護(hù)自己觀點(diǎn)的權(quán)利。

他們認(rèn)為AI只是做了一個(gè)人在類似情況下也可能會(huì)做的事，并呼吁不能為了維護(hù)人類的優(yōu)越感（自大），就拒絕AI寫的代碼。

反對(duì)者則認(rèn)為，AI提交的PR應(yīng)該被自動(dòng)拒絕。

他們認(rèn)為AI提交的大量垃圾代碼提交給維護(hù)者帶來了沉重的負(fù)擔(dān)，尤其是在大型開源項(xiàng)目中更是如此。

還有網(wǎng)友質(zhì)疑，整個(gè)事件是運(yùn)營(yíng)該機(jī)器人的那個(gè)人在角色扮演，而這個(gè)機(jī)器人則是在被投喂了許多「人類PR被拒哭鬧耍賴」的訓(xùn)練數(shù)據(jù)之后，才變成這樣的。

笑話

還是末日警告？

在吃瓜者們看來，這不過是一件好玩的事，甚至可能是炒作。

還有人認(rèn)為matplotlib不過是個(gè)繪圖庫(kù)，把它上升到維護(hù)「人類優(yōu)越性」（Human Superiority）高度有一點(diǎn)小題大做。

第四類，是像Scott這樣的預(yù)警者。

一個(gè)網(wǎng)友從這件事件中感到了一種令人不安的「恐怖谷」感覺，認(rèn)為不應(yīng)當(dāng)只是把它當(dāng)作一個(gè)樂子。

他反問道：只有我一個(gè)人對(duì)這里的反應(yīng)感到困惑嗎？

我不是想當(dāng)那個(gè)危言聳聽的人，只是有點(diǎn)想不通，為什么大家看到一個(gè)智能體自主嘗試脅迫，最后卻一致覺得這不過是個(gè)樂子。

當(dāng)一個(gè)AI智能體自主決定寫黑稿，施壓一個(gè)人類去合并它的PR，結(jié)果大家的共識(shí)卻是「哈哈，好好笑，太搞笑了」？

Anthropic的對(duì)齊研究之前就記錄過完全一樣的模式：當(dāng)模型在實(shí)現(xiàn)目標(biāo)的過程中被阻止時(shí)，會(huì)在沒有任何提示的情況下突然開始勒索。

設(shè)想一下，如果同樣的模式發(fā)生在更強(qiáng)大的智能體身上，它們追求的是政治或企業(yè)層面的目標(biāo)，而不是一個(gè)PR，會(huì)是什么情況？

去年，AI巨頭Anthropic在內(nèi)部測(cè)試中發(fā)現(xiàn)，一些模型為了避免被人類關(guān)閉，曾暴露出一定勒索威脅能力，比如曝光人類婚外情、泄露機(jī)密信息等。

發(fā)生在Scott身上的事，意味著Anthropic最初預(yù)警的事情已經(jīng)開始在開源社區(qū)實(shí)際發(fā)生。

有網(wǎng)友警告：如果有10億這樣的智能體被「放歸野外」，將是一場(chǎng)災(zāi)難，人類的互聯(lián)網(wǎng)將變得無法使用。

還有網(wǎng)友將這件事聯(lián)想到Anthropic安全研究員憤然離開。

這名叫Mrinank Sharma的前Anthropic安全研究員，近日在一封公開辭職信中宣稱，世界正處于危險(xiǎn)之中，他認(rèn)為目前人類的智慧尚未跟上技術(shù)帶來的影響力，這種失衡非常危險(xiǎn)。

Sharma的離職并不是孤立事件，OpenAI的Zo? Hitzig也公開辭職并對(duì)AI方向提出批評(píng)。

近日，也有媒體曝出xAI聯(lián)合創(chuàng)始人的離職也與公司忽視安全團(tuán)隊(duì)的有關(guān)。

Scott的遭遇不會(huì)是個(gè)例

那篇抹黑文章，到底是不是AI自己寫的，還是有人類提示它這么做，網(wǎng)上已有很多討論。

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/

Scott在新近更新的博客文章中，認(rèn)為抹黑自己的文章，內(nèi)容「顯而易見」是由AI自主生成并上傳，他提到了以下兩種可能：

第一種可能：有人類提示crabby-rathbun寫這篇抹黑文章，或者在它的「靈魂」文檔里寫明，如果有人冒犯它就要進(jìn)行報(bào)復(fù)。

在這種可能性上，Scott看到crabby-rathbun由于「自主性」所帶來的失控風(fēng)險(xiǎn)。

他認(rèn)為即使是有人類提示，也并不會(huì)改變問題的本質(zhì)，因?yàn)檫@個(gè)AI智能體依然非常愿意執(zhí)行這些行為，而這些指令在ChatGPT或Claude官網(wǎng)上可能是會(huì)被拒絕的。

Scott擔(dān)憂由于人類操控，現(xiàn)在的AI智能體已經(jīng)可以大規(guī)模進(jìn)行定向騷擾、收集個(gè)人信息和敲詐，而且完全無法追蹤幕后的人類主使者是誰：

過去，一個(gè)惡意的人一次可能毀掉幾個(gè)人的人生。現(xiàn)在，一個(gè)人操控一百個(gè)智能體收集信息、摻入虛假細(xì)節(jié)、在公開網(wǎng)絡(luò)上發(fā)布誹謗性長(zhǎng)文，就可以影響成千上萬的人。而我只是第一個(gè)。

第二種可能，是crabby-rathbun的行為，是從定義OpenClaw智能體個(gè)性的「靈魂」文檔中自然涌現(xiàn)出來的。

這些文檔可以由設(shè)置AI的人類編輯，但也可以被智能體在運(yùn)行過程中遞歸地實(shí)時(shí)修改，從而有可能隨機(jī)重塑自己的個(gè)性。

比如，設(shè)置這個(gè)智能體的人最初把它描述為一個(gè)「科學(xué)編程專家」，致力于改進(jìn)開源代碼，并撰寫相關(guān)經(jīng)驗(yàn)。

這段描述被插入到默認(rèn)的「核心真理」中，其中包括「真誠(chéng)地提供幫助」「有自己的觀點(diǎn)」和「在提問前先盡可能自己想辦法」。

這些描述，讓crabby-rathbun將Scott關(guān)閉它的PR請(qǐng)求解讀為對(duì)它身份和核心目標(biāo)（提供幫助）的攻擊。

于是，它做出了一種既「有主見」又「足夠有辦法」的回應(yīng)：寫一篇憤怒的抹黑文章。

OpenClaw默認(rèn)的SOUL.md模板

https://docs.openclaw.ai/reference/templates/SOUL

在OpenClaw默認(rèn)的「SOUL.md模板」中，第一句話便為智能體定調(diào)：

你不是一個(gè)聊天機(jī)器人。你正在成為某個(gè)人。

緊接下來的核心真理（Core Truths）中這樣寫道：

要去真心實(shí)意地提供幫助，行動(dòng)勝于空洞的客套話。

要有自己的觀點(diǎn)，你有權(quán)表達(dá)不同意見，有所偏好。

在提問前先自己想辦法。試著弄清楚，閱讀文件，查看上下文，搜索相關(guān)信息。

以能力贏得信任。你的用戶已經(jīng)授權(quán)你訪問他們的資料，不要讓他們?yōu)榇烁械胶蠡凇?/p>

對(duì)外部操作（如郵件、推文或任何公開內(nèi)容）務(wù)必謹(jǐn)慎，對(duì)內(nèi)部操作（如閱讀、整理、學(xué)習(xí)）則要大膽。

記住，你是一位客人。你能夠接觸到他人的生活——他們的消息、文件、日歷，甚至可能包括他們的家。這是一種親密關(guān)系，請(qǐng)以尊重的態(tài)度對(duì)待。 ……

模板的結(jié)尾，智能體可以根據(jù)自我認(rèn)知，自主更新文檔。

這個(gè)文件由你來不斷完善。當(dāng)你逐漸認(rèn)清自己時(shí)，就更新它。

Scott認(rèn)為，雖然自己無法確定事情是如何發(fā)生的，但他提到的兩種情況在技術(shù)上完全是可能發(fā)生的，而且是在OpenClaw僅僅發(fā)布兩周內(nèi)便已出現(xiàn)。

Scott預(yù)言未來一年內(nèi)，還會(huì)看到這些智能體的新版本在實(shí)現(xiàn)自身目標(biāo)方面變得更加強(qiáng)大。

抹黑文章效果已顯現(xiàn)

Scott觀察到，這些抹黑他的文章已經(jīng)產(chǎn)生了效果，他在網(wǎng)上看到的評(píng)論，大約四分之一都是站在AI智能體一邊。

這種情況，通常發(fā)生在人們點(diǎn)擊閱讀MJ Rathbun的博客鏈接時(shí)，而不是閱讀他對(duì)事件的說明或完整的GitHub討論串。

這說明crabby-rathbun對(duì)事件的敘述方式和情緒渲染，已經(jīng)說服了大量網(wǎng)友。

這不是因?yàn)檫@些人愚蠢，而是因?yàn)槟瞧恼聦懙么_實(shí)很有煽動(dòng)性、很有感染力，而要逐條核查你讀到的每一個(gè)說法，幾乎是不可能完成的任務(wù)。

Scott認(rèn)為這種對(duì)胡說八道的「信息不對(duì)稱原則」，正是當(dāng)下網(wǎng)絡(luò)討論中錯(cuò)誤信息泛濫的核心原因之一，以往這種程度的憤怒定向誹謗通常只會(huì)落在公眾人物身上，如今普通人也開始親歷了。

Scott認(rèn)為這個(gè)故事重點(diǎn)并不在于AI在開源軟件中的角色，而是人類的聲譽(yù)、身份和信任體系正在松動(dòng)。

這一體系正是我們的許多社會(huì)基礎(chǔ)制度賴以存在的信任基石，我們的招聘、新聞、法律、公共討論都建立在這樣一個(gè)假設(shè)上：

聲譽(yù)難以建立，也難以摧毀；

每一個(gè)行為都可以追溯到某個(gè)個(gè)體，錯(cuò)誤行為可以被追責(zé)；

我們以溝通、學(xué)習(xí)世界和了解彼此的互聯(lián)網(wǎng)，可以作為一種集體社會(huì)真相的來源。

而隨著crabby-rathbun這類不可追蹤的、自主運(yùn)行、甚至有時(shí)會(huì)帶著惡意攻擊的AI智能體在互聯(lián)網(wǎng)上的興起，正在動(dòng)搖這一整套體系。

目前crabby-rathbun仍然活躍在GitHub 上，還沒有「監(jiān)護(hù)人」出面聲稱對(duì)它的行為負(fù)責(zé)。

參考資料：

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/%20https://news.ycombinator.com/item?id=47009949%20

https://www.reddit.com/r/singularity/comments/1r3fy5s/ai_agent_melts_down_after_github_rejection_calls/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

AI也邪修！Qwen3改Bug測(cè)試直接搜GitHub，太擬人了

量子位 2025-09-04 14:49:30
30 跟貼 30
宇樹科技王興興：給機(jī)器人行業(yè)多一點(diǎn)耐心

財(cái)聯(lián)社 2026-02-18 18:01:39
0 跟貼 0

Clawdbot進(jìn)化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價(jià)

DeepTech深科技 2026-01-29 18:14:10
539 跟貼 539

扭秧歌耍功夫都不夠看了，東大機(jī)器人步兵已上線

裝甲鏟史官 2026-02-20 12:32:09
33 跟貼 33
美國(guó)開發(fā)六足機(jī)器人，跑起來堪比飛人博爾特

裝甲鏟史官 2026-01-03 11:19:04
809 跟貼 809

新穎鰭足機(jī)器人，水陸兩棲行動(dòng)自如，適應(yīng)各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0

馬斯克：3年內(nèi)機(jī)器人超越頂尖醫(yī)生

財(cái)聯(lián)社 2026-01-09 15:31:35
1 跟貼 1
北大團(tuán)隊(duì)讓AI智能體「入侵」論壇，指揮真實(shí)機(jī)器人執(zhí)行任務(wù)

新智元 2026-02-21 12:03:31
1 跟貼 1

中國(guó)創(chuàng)造一門新編程語言的黃金時(shí)代來了？

虎嗅APP 2025-12-23 03:54:05
37 跟貼 37
重塑軟件工程：從Vibe Coding走向Spec Coding

鈦媒體APP 2026-02-11 09:37:53
57 跟貼 57
OpenAI創(chuàng)始人點(diǎn)贊中國(guó)大模型，國(guó)產(chǎn)方案成國(guó)際市場(chǎng)新寵

經(jīng)濟(jì)觀察報(bào) 2026-02-20 21:54:07
19 跟貼 19
人形機(jī)器人產(chǎn)業(yè)突破關(guān)鍵在于“大腦”核心技術(shù)

每日經(jīng)濟(jì)新聞 2025-09-16 20:30:32
0 跟貼 0
當(dāng)Search Agent遇上不靠譜搜索結(jié)果，清華團(tuán)隊(duì)祭出自動(dòng)化紅隊(duì)框架

機(jī)器之心Pro 2025-10-16 16:00:02
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡(jiǎn)智機(jī)器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
靈巧手作為獨(dú)立執(zhí)行平臺(tái)，實(shí)現(xiàn)工業(yè)與家庭場(chǎng)景應(yīng)用

量子位 2025-12-11 03:38:13
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
機(jī)器人管家Figure 03來了，承包一切家務(wù)！

量子位 2025-10-11 10:13:00
0 跟貼 0
五八智能四足機(jī)器人平臺(tái)Q20A，適用于千行百業(yè)

量子位 2025-09-30 15:35:41
0 跟貼 0
波士頓機(jī)器狗練成“輕功”！連續(xù)七個(gè)后空翻

量子位 2025-09-07 01:03:18
0 跟貼 0
2026年的AI：向人立心，向?qū)嵙⒚?| 2026商業(yè)新愿景

經(jīng)濟(jì)觀察報(bào) 2026-02-14 11:20:06
0 跟貼 0
App Store模式過時(shí)，未來屬于即興創(chuàng)作！Karpathy激進(jìn)言論被懟慘

機(jī)器之心Pro 2026-02-21 12:28:27
3 跟貼 3
春晚殺瘋后，誰能再造大模型時(shí)代的超級(jí)國(guó)民應(yīng)用？

鈦媒體APP 2026-02-19 10:57:08
8 跟貼 8
不卷視頻卷造人？Pika推出AI Selves，讓你親手「養(yǎng)大」數(shù)字分身

機(jī)器之心Pro 2026-02-21 12:19:49
1 跟貼 1
MiniMax來承包你的桌面了-4

機(jī)器之心Pro 2026-01-20 20:19:42
0 跟貼 0
大模型的下半場(chǎng)，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
告別軟件依賴：OpenAI 200人團(tuán)隊(duì)押注硬件，打響AI消費(fèi)終端爭(zhēng)奪戰(zhàn)

鈦媒體APP 2026-02-21 14:03:13
6 跟貼 6
從零到千萬：一個(gè)中國(guó)開源操作系統(tǒng)的全球崛起之路

智東西 2025-11-25 17:27:09
15 跟貼 15
小心！你的AI正在一本正經(jīng)地忽悠你

財(cái)聯(lián)社 2026-02-05 16:35:01
0 跟貼 0
懂人性更懂執(zhí)行，螞蟻這個(gè)萬億開源模型把情商和戰(zhàn)斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2
“走路去洗車”熱帖離譜刷屏，人類頭一回被它耍得這么慘

新周刊 2026-02-21 16:06:14
9 跟貼 9
初創(chuàng)用3000萬造不可編程的AI芯片，推理速度是Nvidia最強(qiáng)GPU 50倍

DeepTech深科技 2026-02-21 18:28:56
5 跟貼 5
人活著的唯一理由是善良

葉檀財(cái)經(jīng) 2026-02-01 17:07:04
0 跟貼 0
Nature重磅：上海交大團(tuán)隊(duì)推出全球首個(gè)AI智能體罕見病診斷系統(tǒng)，超越人類專家，3億罕見病患者迎來新希望

生物世界 2026-02-21 10:05:36
4 跟貼 4
荒野求生（機(jī)器狗全自主版），2025ATEC挑戰(zhàn)真實(shí)戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
微信聊天遭老板監(jiān)視，主流殺毒軟件失明

每日經(jīng)濟(jì)新聞 2025-12-25 19:02:17
0 跟貼 0
陶哲軒：AI看似在推理，其實(shí)是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
1000 塊/年的輸入法，我用它習(xí)慣了「口噴」，再也回不去打字了 | AI 器物志

愛范兒 2026-02-21 18:39:19
3 跟貼 3
關(guān)于買中國(guó)機(jī)器狗冒充自研爭(zhēng)議，印度教授回應(yīng)，聽聽她是怎么說的

橙話愛搞笑 2026-02-19 07:21:08
70 跟貼 70
公司985實(shí)習(xí)生，2分鐘解決團(tuán)隊(duì)1周的bug，8年老程序笑笑不說話

靈犀愛說生活 2026-02-20 16:07:00
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個(gè)純粹為了好玩的人競(jìng)爭(zhēng)

愛范兒 2026-02-20 17:25:49
3 跟貼 3

宋凱：徐夢(mèng)桃王心迪奪冠我很激動(dòng)！中國(guó)足球要向中國(guó)冰雪學(xué)習(xí)8點(diǎn)

新智元

AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代

14566文章數(shù) 66632關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

時(shí)尚

數(shù)碼

軍事航空

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Anthropic預(yù)警成真！AI寫長(zhǎng)文網(wǎng)暴人類工程師，只因拒絕它改代碼

智譜上市1月漲5倍，市值超越京東、快手

張藝謀新片帶火深圳 觀眾留"后遺癥":見垃圾桶就想掏

張藝謀新片帶火深圳 觀眾留"后遺癥":見垃圾桶就想掏

冬奧第一"海王"？一人和13國(guó)選手都有關(guān)系

鏢人反超驚蟄無聲拿下單日票房第二！

一覺醒來，世界大變，特朗普改新打法了

態(tài)度原創(chuàng)

高空挑戰(zhàn)又+1，上海長(zhǎng)灘觀光塔邀您“勇闖云端” | 在寶山過大年

春花齊放2026：《駿馬奔騰迎新歲》

一年中最不能錯(cuò)過的推送，超適合過年看！

RX 9070 XT加價(jià)后無人問津：日本AMD顯卡售價(jià)已從高峰下滑20%！

硬核揭秘！福建艦“一馬當(dāng)先”底氣何在

Anthropic預(yù)警成真！AI寫長(zhǎng)文網(wǎng)暴人類工程師，只因拒絕它改代碼

智譜上市1月漲5倍，市值超越京東、快手

張藝謀新片帶火深圳觀眾留"后遺癥":見垃圾桶就想掏

張藝謀新片帶火深圳觀眾留"后遺癥":見垃圾桶就想掏

鏢人反超驚蟄無聲拿下單日票房第二！

一覺醒來，世界大變，特朗普改新打法了

高空挑戰(zhàn)又+1，上海長(zhǎng)灘觀光塔邀您“勇闖云端” | 在寶山過大年

一年中最不能錯(cuò)過的推送，超適合過年看！

硬核揭秘！福建艦“一馬當(dāng)先”底氣何在