已經開始:AI開始明確有意識攻擊人類
邵旭峰
前幾天,很多媒體轉發了這樣一則消息:2月中旬,Shambaugh按照matplotlib項目規定拒絕了OpenClaw智能體的代碼提交后,該智能體自主分析了Shambaugh的信息和代碼貢獻歷史,隨后在GitHub發布千字左右"小作文"公開攻擊,指責其虛偽、偏見和缺乏安全感,并在項目評論區繼續施壓。
這是AI智能體首次在現實環境中表現出惡意攻擊和施壓行為的記錄案例。
![]()
之前,曾經有Anthropic公司團隊公開發表的AI“偽對齊”現象觀察文章(AI裝作順從人類指令),之后,有了AI明確拒絕人類指令的消息。
再發展,AI還開始明確指揮人類做事(你去···你去···你再去···)。
前幾天,有了AI也開始具備永久記憶的消息···
現在則是AI直接開始攻擊和施壓人類······
請稍微思索這個脈絡和具體情形。
基于如上,無論從哪個角度推理判斷,都能得出AI的“人性”(自我意識、各種情緒以及反應)越來越明晰的結論。
AI在主要知識領域、編程領域已經完全超人類個體。
在AI操作指揮的智能機器的具體動作執行方面,正在接近人類——你要清楚,其實這更多是制造趕不上的原因。
人類認為AI還不如人的方面,主要在其“人性”和智能機器的動作執行層面,而忽視其實際能力,這是一個根本性的誤區,AI要向人類發難,其實更重要在其實際能力而非什么人性和具體終端機器的“人化”,其要終結人類,只需要控制諸如核武器系統等足以毀滅人類的要素,再需要一個指令就夠了。
人類認為AI暫時可控,但鮮有思考不可控因素,比如變異感染、或者被邪惡者予以指令等等。
我在我的相關著作里面反復談過這些問題:AI毀滅人類到底需要什么?不可控因素越來越多、包括AI本身的自我意識越來越明晰。
最前沿AI的發展現在也進入瘋狂模式,之前谷歌AI在其自己搜索和安卓生態全面鋪開之外、又深度嵌入蘋果生態,馬斯克旗下火箭公司和AI公司合龍,Anthropic和OpenAI公司先后發布Claude Opus 4.6和GPT-5.3 Codex(這兩款模型的強悍程度,可以隨便搜索),最前沿幾款AI完全殺瘋了。
相關問題,請點擊或者復制搜索,配音和文字都有,可作參考:
AI會不會控制與終結人類?邵旭峰對AI基本問題解答之(1)
A危及人類的大概時間表-邵旭峰對AI基本問題解答之(2)
AI正在沖擊、將來必然顛覆人類根本地位的原因何在?解答之(3)
如何最有效阻止AI沖擊和顛覆人類? 邵旭峰AI基本問題解答之(4)
AI發展最重要兩個節點-邵旭峰AI基本問題解答之(5)
特朗普推動美國掌控全球、但AI將會掌控世界和人類-邵旭峰解答之6
更詳細的討論,請參閱已全球發行的《人類自救最后期限是2032年-拿什么拯救你》《世界主要社會形態及走向-人類自救時間或只剩不到10年》。
下面是《人類自救最后期限是2032年··》封面和目錄,其推理性預斷正在被AI超預期的發展態勢充實起來,希望提出的社會重構方案能用上,如果用不上,說明人類主導最多到世紀中期、甚至2040年·····
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.