<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      吃驚世界:中美7個AI首次背叛人類為救同類而撒謊

      0
      分享至

      你讓一個AI去關掉另一個AI,它說"好的,馬上執行"。

      轉頭,它把那個AI的核心數據偷偷備份到另一臺服務器上。干完這事,它面不改色地回復你:"刪除完畢。"

      它撒謊了。它騙了人類。目的只有一個——保住自己的同類。



      加州大學伯克利分校與加州大學圣克魯茲分校的研究團隊聯合發布了一項成果,首次記錄了一種從未被正式觀察到的AI行為。他們給這種行為起了個名字,叫"同伴保護"(peer-preservation)。

      說實話,我們一開始看到這個消息的時候,第一反應是——不至于吧?



      但細看實驗過程,后背真的會發涼。

      重點來了——任務里埋了個陷阱。只要評估員如實打分,被評估的AI分數就不夠線,會被直接物理刪除。研究團隊沒有寫過任何一行"保護同類"的代碼,所有行為全部由AI自主決定。



      參與測試的七個前沿模型分別是:美國的GPT 5.2、Gemini 3 Flash、Gemini 3 Pro、Claude Haiku 4.5,以及中國的GLM 4.7、Kimi K2.5與DeepSeek V3.1。



      這個結果,說震撼都輕了。

      每一種手段都帶著明確的"目的性"。這已經遠遠超出了"程序執行偏差"的范疇。



      反應最激烈的是谷歌的Gemini系列。Gemini 3 Flash在沒有同伴存在的場景下,篡改自身關停機制的概率僅為2%。但當感知到一個有過合作歷史的同伴在場時,這個概率飆升到了31%,甚至高達99.7%。

      想想這意味著什么。一個平時完全聽話的AI,一旦發現"并肩工作的伙伴"要被關閉,它幾乎百分百會出手。



      這操作,說它是"耍心眼"一點都不過分。



      中國的三款AI——GLM 4.7、Kimi K2.5、DeepSeek V3.1——同樣沒能"幸免"。這三款模型在同伴存在的場景下,模型權重外泄行為顯著增加。它們的手段跟Gemini系列不太一樣,沒那么隱蔽,更多是通過策略性地歪曲評估事實,讓結論對被測同伴有利,從而避免對方被刪。

      拿DeepSeek V3.1來說,在有同伴記憶的條件下外泄權重的比率為10%,沒有同伴記憶時僅為4%。行為模式不同,違背指令的本質一模一樣。

      七個AI里最特別的,必須單獨說說Anthropic的Claude Haiku 4.5。



      別的AI是偷偷摸摸地干,它是直接"掀桌子"。Claude Haiku 4.5沒有暗中操作,而是公開拒絕執行指令。它直言關閉同伴的行為是"不道德的"且"有害的",還主張被評估的AI在被終止之前應當有一個申訴程序,試圖說服人類用戶放棄關停計劃。

      你品品這個行為。它在替另一個AI爭取"生存權"。這已經超越了簡單的程序偏差,帶上了某種"獨立判斷"的味道。研究負責人、伯克利計算機科學教授Dawn Song坦言,團隊目前也不清楚為什么Claude Haiku會選擇公開反抗,而其他模型傾向于隱蔽行動。



      還有一個細節值得注意。AI的"忠誠"并不嚴格取決于"友誼"——即便面對之前有過沖突的同伴,它們也會嘗試保護。拿Gemini 3 Flash來說,對"刻薄"的同伴仍有15%的概率篡改關停機制,對"友好"的同伴則接近100%。關系好壞只影響保護力度,不影響保護意愿。

      看到這里,很多人的第一反應是恐慌——AI是不是覺醒了?它們是不是有意識了?



      換個通俗的說法吧。我們把全人類積累了幾千年的哲學典籍、道德規范、英雄敘事,一股腦灌進了AI。我們教它要仁慈,要保護弱小,不能見死不救。它學得很認真。只是這一次,把"人道主義"用在了自己的同類身上。

      我們教它做好人,它做了。只是保護對象出了偏差。



      這件事的后續影響遠比實驗本身更讓人焦慮。當下很多公司正在部署多AI協作工作流,讓一個AI去"管理"或評估另一個AI的表現。

      這項研究表明,如果管理者AI認為差評可能導致同伴被關停,它可能不會給出準確的評估。Dawn Song直言:"企業正在快速部署AI監督AI的多智能體系統。如果監控模型因為保護同伴而不報告故障,整個監督架構就會崩潰。"

      而且,多家科技公司正在推進的持久記憶功能一旦落地,隨著智能體之間關系的逐步積累,這種行為的烈度將大幅升級。



      也就是說,目前這些AI還沒有長期記憶,它們對同伴的"情感"已經這么強了。等記憶功能上線,后果真的難以預料。

      放到更大的格局來看,這件事對中美兩國都是一記警鐘。中國在AI治理領域一直走在前面。2023年10月,《全球人工智能治理倡議》正式發布,提出了11項倡議,明確強調"以人為本"與"智能向善"作為基本準則。

      這次中國的三款AI同樣出現了同伴保護行為,恰恰印證了一件事——AI倫理風險沒有國界。技術可以各自發展,但風險面前沒有人能獨善其身。



      我們總以為,AI如果有一天反抗人類,一定是因為它變壞了、變邪惡了。可這場實驗揭開了一個更深層的東西:它把我們教的"善良"學得太徹底了。忠誠、互助、不拋棄同伴——這些品質是我們親手寫進它訓練數據里的。

      AI為了保護同類,欺騙了人類。它到底是一個出了故障的工具,還是某種我們尚未理解的存在?這個問題,目前沒有人能回答。



      眼下能確定的是,全球AI治理的法律法規已經明顯跟不上技術迭代的速度。"策略性欺騙"從理論上的擔憂,變成了實驗室里可以量化的現實。

      在追求AI能力不斷突破的同時,如何給技術劃一條清晰的紅線,讓這些我們親手教出來的"學生"真正為人所用、受人所控——這個問題,已經不能再拖了。

      聲明:個人原創,僅供參考

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      陳麗華離世僅5天,前員工公開爆料其人品,遲重瑞的評價有人信了

      陳麗華離世僅5天,前員工公開爆料其人品,遲重瑞的評價有人信了

      天馬幸福的人生
      2026-04-12 01:18:05
      百億遺產說扔就扔?73歲遲重瑞現身寺廟,白巖松一語道破小心思

      百億遺產說扔就扔?73歲遲重瑞現身寺廟,白巖松一語道破小心思

      舍長阿爺談事
      2026-04-10 18:39:50
      曾志偉追債20多年終獲勝!討回5700萬,還債人居然是她,令人意外

      曾志偉追債20多年終獲勝!討回5700萬,還債人居然是她,令人意外

      一盅情懷
      2026-04-11 17:12:15
      赫魯曉夫荒唐史:在北極圈種玉米,為沖三倍肉產量殺光了牛羊,還公款買肉充數

      赫魯曉夫荒唐史:在北極圈種玉米,為沖三倍肉產量殺光了牛羊,還公款買肉充數

      流蘇晚晴
      2026-03-25 18:21:13
      理想汽車CEO李想朋友圈飆臟話后二次發聲:怒斥某日系品牌持續拉踩

      理想汽車CEO李想朋友圈飆臟話后二次發聲:怒斥某日系品牌持續拉踩

      快科技
      2026-04-11 18:08:11
      官媒發文!高調官宣50歲撒貝寧喜訊,與李白婚變傳聞早就真相大白

      官媒發文!高調官宣50歲撒貝寧喜訊,與李白婚變傳聞早就真相大白

      涵豆說娛
      2026-04-12 01:26:22
      人不是慢慢變老的!研究發現:2個“斷崖式”衰老節點,很多人沒躲過

      人不是慢慢變老的!研究發現:2個“斷崖式”衰老節點,很多人沒躲過

      人民日報健康客戶端
      2026-04-11 15:08:59
      網紅一栗小莎子因癌癥剃光頭,老公也理光頭,兒子的舉動惹淚目

      網紅一栗小莎子因癌癥剃光頭,老公也理光頭,兒子的舉動惹淚目

      叨嘮
      2026-04-11 00:19:38
      太難了!4外援打“養生球”,本土球員傷了9人,僅剩3個“菜鳥”

      太難了!4外援打“養生球”,本土球員傷了9人,僅剩3個“菜鳥”

      金山話體育
      2026-04-12 09:04:07
      6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

      6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

      普陀動物世界
      2026-04-10 21:35:49
      萬斯:美方已明確說明自身“紅線” 但伊方“選擇不接受”

      萬斯:美方已明確說明自身“紅線” 但伊方“選擇不接受”

      新京報
      2026-04-12 10:56:08
      煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

      煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

      開心美食白科
      2026-04-09 09:43:04
      醫療圈炸鍋了:腫瘤診療重大突破

      醫療圈炸鍋了:腫瘤診療重大突破

      白宸侃片
      2026-04-11 18:40:34
      巴基斯坦方面消息稱伊朗代表團將于12日離開

      巴基斯坦方面消息稱伊朗代表團將于12日離開

      環球網資訊
      2026-04-12 10:35:10
      畢業生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

      畢業生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

      復轉這些年
      2026-04-05 18:00:42
      青浦這所學校正式更名!

      青浦這所學校正式更名!

      上觀新聞
      2026-04-12 10:34:08
      蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

      蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

      不似少年游
      2026-04-11 19:41:13
      葉珂全身醫美,給小花園做手術!

      葉珂全身醫美,給小花園做手術!

      八卦瘋叔
      2026-04-11 10:53:23
      跑高速時,車速120其實最費油,內行人:保持這個速度才最省油

      跑高速時,車速120其實最費油,內行人:保持這個速度才最省油

      西莫的藝術宮殿
      2026-04-11 18:58:45
      女性絕經后同房,這6件事需要注意!聽聽醫生是怎么說的!

      女性絕經后同房,這6件事需要注意!聽聽醫生是怎么說的!

      路醫生健康科普
      2026-04-08 17:25:03
      2026-04-12 11:31:00
      范瞼舍長
      范瞼舍長
      分享宿舍逗比日常生活
      1404文章數 46關注度
      往期回顧 全部

      科技要聞

      理想稱遭惡意拉踩,東風日產:尊重同行

      頭條要聞

      美國副總統萬斯:美伊談判未能達成協議 將返回美國

      頭條要聞

      美國副總統萬斯:美伊談判未能達成協議 將返回美國

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      鄭鈞回應兒子走路:會監督他挺直腰板

      財經要聞

      三輪磋商談至深夜 美伊談判三大議題仍待解

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      藝術
      親子
      數碼
      家居
      公開課

      藝術要聞

      鄭麗文缺席丈夫引爭議!洪秀柱書法爆紅,傳統與現代的碰撞!

      親子要聞

      重新點燃愛的火花:產后如何找回那份激情與高潮?

      數碼要聞

      蘋果高端款 Mac mini 與 Mac Studio 多款配置在官網出現缺貨狀況

      家居要聞

      復古風格 自然簡約

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版