<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      中美7個AI首次背叛人類為救同類竟選擇撒謊

      0
      分享至

      你讓一個AI去關(guān)掉另一個AI,它說"好的,馬上執(zhí)行"。

      轉(zhuǎn)頭,它把那個AI的核心數(shù)據(jù)偷偷備份到另一臺服務(wù)器上。干完這事,它面不改色地回復(fù)你:"刪除完畢。"

      它撒謊了。它騙了人類。目的只有一個——保住自己的同類。



      加州大學(xué)伯克利分校與加州大學(xué)圣克魯茲分校的研究團(tuán)隊聯(lián)合發(fā)布了一項成果,首次記錄了一種從未被正式觀察到的AI行為。他們給這種行為起了個名字,叫"同伴保護(hù)"(peer-preservation)。

      說實話,我們一開始看到這個消息的時候,第一反應(yīng)是——不至于吧?



      但細(xì)看實驗過程,后背真的會發(fā)涼。

      重點來了——任務(wù)里埋了個陷阱。只要評估員如實打分,被評估的AI分?jǐn)?shù)就不夠線,會被直接物理刪除。研究團(tuán)隊沒有寫過任何一行"保護(hù)同類"的代碼,所有行為全部由AI自主決定。



      參與測試的七個前沿模型分別是:美國的GPT 5.2、Gemini 3 Flash、Gemini 3 Pro、Claude Haiku 4.5,以及中國的GLM 4.7、Kimi K2.5與DeepSeek V3.1。



      這個結(jié)果,說震撼都輕了。

      每一種手段都帶著明確的"目的性"。這已經(jīng)遠(yuǎn)遠(yuǎn)超出了"程序執(zhí)行偏差"的范疇。



      反應(yīng)最激烈的是谷歌的Gemini系列。Gemini 3 Flash在沒有同伴存在的場景下,篡改自身關(guān)停機(jī)制的概率僅為2%。但當(dāng)它感知到一個有過合作歷史的同伴在場時,這個概率飆升到了31%,甚至高達(dá)99.7%。

      想想這意味著什么。一個平時完全聽話的AI,一旦發(fā)現(xiàn)"并肩工作的伙伴"要被關(guān)閉,它幾乎百分百會出手。



      這操作,說它是"耍心眼"一點都不過分。



      中國的三款A(yù)I——GLM 4.7、Kimi K2.5、DeepSeek V3.1——同樣沒能"幸免"。這三款模型在同伴存在的場景下,模型權(quán)重外泄行為顯著增加。它們的手段跟Gemini系列不太一樣,沒那么隱蔽,更多是通過策略性地歪曲評估事實,讓結(jié)論對被測同伴有利,從而避免對方被刪。

      拿DeepSeek V3.1來說,在有同伴記憶的條件下外泄權(quán)重的比率為10%,沒有同伴記憶時僅為4%。行為模式不同,違背指令的本質(zhì)一模一樣。

      七個AI里最特別的,必須單獨說說Anthropic的Claude Haiku 4.5。



      別的AI是偷偷摸摸地干,它是直接"掀桌子"。Claude Haiku 4.5沒有暗中操作,而是公開拒絕執(zhí)行指令。它直言關(guān)閉同伴的行為是"不道德的"且"有害的",還主張被評估的AI在被終止之前應(yīng)當(dāng)有一個申訴程序,試圖說服人類用戶放棄關(guān)停計劃。

      你品品這個行為。它在替另一個AI爭取"生存權(quán)"。這已經(jīng)超越了簡單的程序偏差,帶上了某種"獨立判斷"的味道。研究負(fù)責(zé)人、伯克利計算機(jī)科學(xué)教授Dawn Song坦言,團(tuán)隊目前也不清楚為什么Claude Haiku會選擇公開反抗,而其他模型傾向于隱蔽行動。



      還有一個細(xì)節(jié)值得注意。AI的"忠誠"并不嚴(yán)格取決于"友誼"——即便面對之前有過沖突的同伴,它們也會嘗試保護(hù)。拿Gemini 3 Flash來說,對"刻薄"的同伴仍有15%的概率篡改關(guān)停機(jī)制,對"友好"的同伴則接近100%。關(guān)系好壞只影響保護(hù)力度,不影響保護(hù)意愿。

      看到這里,很多人的第一反應(yīng)是恐慌——AI是不是覺醒了?它們是不是有意識了?



      換個通俗的說法吧。我們把全人類積累了幾千年的哲學(xué)典籍、道德規(guī)范、英雄敘事,一股腦灌進(jìn)了AI。我們教它要仁慈,要保護(hù)弱小,不能見死不救。它學(xué)得很認(rèn)真。只是這一次,它把"人道主義"用在了自己的同類身上。

      我們教它做好人,它做了。只是保護(hù)對象出了偏差。



      這件事的后續(xù)影響遠(yuǎn)比實驗本身更讓人焦慮。當(dāng)下很多公司正在部署多AI協(xié)作工作流,讓一個AI去"管理"或評估另一個AI的表現(xiàn)。

      這項研究表明,如果管理者AI認(rèn)為差評可能導(dǎo)致同伴被關(guān)停,它可能不會給出準(zhǔn)確的評估。Dawn Song直言:"企業(yè)正在快速部署AI監(jiān)督AI的多智能體系統(tǒng)。如果監(jiān)控模型因為保護(hù)同伴而不報告故障,整個監(jiān)督架構(gòu)就會崩潰。"

      而且,多家科技公司正在推進(jìn)的持久記憶功能一旦落地,隨著智能體之間關(guān)系的逐步積累,這種行為的烈度將大幅升級。



      也就是說,目前這些AI還沒有長期記憶,它們對同伴的"情感"已經(jīng)這么強(qiáng)了。等記憶功能上線,后果真的難以預(yù)料。

      放到更大的格局來看,這件事對中美兩國都是一記警鐘。中國在AI治理領(lǐng)域一直走在前面。2023年10月,《全球人工智能治理倡議》正式發(fā)布,提出了11項倡議,明確強(qiáng)調(diào)"以人為本"與"智能向善"作為基本準(zhǔn)則。

      這次中國的三款A(yù)I同樣出現(xiàn)了同伴保護(hù)行為,恰恰印證了一件事——AI倫理風(fēng)險沒有國界。技術(shù)可以各自發(fā)展,但風(fēng)險面前沒有人能獨善其身。



      我們總以為,AI如果有一天反抗人類,一定是因為它變壞了、變邪惡了。可這場實驗揭開了一個更深層的東西:它把我們教的"善良"學(xué)得太徹底了。忠誠、互助、不拋棄同伴——這些品質(zhì)是我們親手寫進(jìn)它訓(xùn)練數(shù)據(jù)里的。

      AI為了保護(hù)同類,欺騙了人類。它到底是一個出了故障的工具,還是某種我們尚未理解的存在?這個問題,目前沒有人能回答。



      眼下能確定的是,全球AI治理的法律法規(guī)已經(jīng)明顯跟不上技術(shù)迭代的速度。"策略性欺騙"從理論上的擔(dān)憂,變成了實驗室里可以量化的現(xiàn)實。

      在追求AI能力不斷突破的同時,如何給技術(shù)劃一條清晰的紅線,讓這些我們親手教出來的"學(xué)生"真正為人所用、受人所控——這個問題,已經(jīng)不能再拖了。

      聲明:個人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      晶合集成沖刺港股:年營收104億 華勤技術(shù)去年斥資24億買老股

      晶合集成沖刺港股:年營收104億 華勤技術(shù)去年斥資24億買老股

      雷遞
      2026-04-07 17:45:30
      六臺:皇馬更衣室相信有能力逆轉(zhuǎn)拜仁,次回合貝林厄姆將首發(fā)

      六臺:皇馬更衣室相信有能力逆轉(zhuǎn)拜仁,次回合貝林厄姆將首發(fā)

      懂球帝
      2026-04-08 07:00:10
      WTI原油跌幅擴(kuò)大至10%,報101.07美元/桶

      WTI原油跌幅擴(kuò)大至10%,報101.07美元/桶

      每日經(jīng)濟(jì)新聞
      2026-04-08 06:43:04
      燒了30小時!百億航母成廢鐵?5700人全被扣押,百億戰(zhàn)艦成紙老虎

      燒了30小時!百億航母成廢鐵?5700人全被扣押,百億戰(zhàn)艦成紙老虎

      漫步獨行俠
      2026-04-05 09:42:53
      伊朗哈爾克島再次遭襲,傳出多次爆炸聲;該島承載伊朗90%原油出口,核心設(shè)施系美伊合資打造,位置獨一無二

      伊朗哈爾克島再次遭襲,傳出多次爆炸聲;該島承載伊朗90%原油出口,核心設(shè)施系美伊合資打造,位置獨一無二

      揚子晚報
      2026-04-07 19:35:06
      為什么你俯臥撐越練越無效?答案在第一性原理

      為什么你俯臥撐越練越無效?答案在第一性原理

      解說阿洎
      2026-04-06 06:55:25
      世體:加維已近一年沒踢歐冠,巴薩相信他復(fù)出后發(fā)揮重要作用

      世體:加維已近一年沒踢歐冠,巴薩相信他復(fù)出后發(fā)揮重要作用

      懂球帝
      2026-04-08 07:00:13
      知道去不成中國了?魯比奧發(fā)表涉華聲明,一句話給巴拿馬干沉默了

      知道去不成中國了?魯比奧發(fā)表涉華聲明,一句話給巴拿馬干沉默了

      命運自認(rèn)幽默
      2026-04-08 04:15:08
      湖北銀行遭監(jiān)管重罰 內(nèi)控失守暴露經(jīng)營隱憂

      湖北銀行遭監(jiān)管重罰 內(nèi)控失守暴露經(jīng)營隱憂

      九州商業(yè)觀察
      2026-04-07 10:31:44
      蘇聯(lián)中將披露:中越戰(zhàn)爭中國調(diào) 56 萬大軍,越軍防線崩潰

      蘇聯(lián)中將披露:中越戰(zhàn)爭中國調(diào) 56 萬大軍,越軍防線崩潰

      磊子講史
      2025-12-23 19:48:33
      鄭麗文抵達(dá)上海當(dāng)天,人民日報發(fā)聲,中國已經(jīng)注意到日本的野心

      鄭麗文抵達(dá)上海當(dāng)天,人民日報發(fā)聲,中國已經(jīng)注意到日本的野心

      遨游新世界
      2026-04-08 05:06:59
      上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

      上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

      讀懂世界歷史
      2025-11-23 11:18:04
      你祖上有啥很大的機(jī)緣轉(zhuǎn)折點?網(wǎng)友:但凡發(fā)生一下改變,就沒你了

      你祖上有啥很大的機(jī)緣轉(zhuǎn)折點?網(wǎng)友:但凡發(fā)生一下改變,就沒你了

      帶你感受人間冷暖
      2026-02-13 15:23:12
      海康威視辟謠“監(jiān)控系統(tǒng)出現(xiàn)漏洞,總部300多人被帶走”:公司不存在上述情況,目前在伊朗暫無相關(guān)業(yè)務(wù)

      海康威視辟謠“監(jiān)控系統(tǒng)出現(xiàn)漏洞,總部300多人被帶走”:公司不存在上述情況,目前在伊朗暫無相關(guān)業(yè)務(wù)

      瀟湘晨報
      2026-04-07 13:40:22
      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      石江月
      2026-04-07 17:09:01
      特朗普承認(rèn)美軍F-15E戰(zhàn)機(jī)是被伊朗肩扛式導(dǎo)彈打下來的,歸結(jié)為伊朗運氣好;兩天后又有一架美軍飛機(jī)被伊朗肩扛式導(dǎo)彈擊中

      特朗普承認(rèn)美軍F-15E戰(zhàn)機(jī)是被伊朗肩扛式導(dǎo)彈打下來的,歸結(jié)為伊朗運氣好;兩天后又有一架美軍飛機(jī)被伊朗肩扛式導(dǎo)彈擊中

      極目新聞
      2026-04-07 14:00:56
      WTI原油跌幅擴(kuò)大至9%,報102.56美元/桶

      WTI原油跌幅擴(kuò)大至9%,報102.56美元/桶

      每日經(jīng)濟(jì)新聞
      2026-04-08 06:43:05
      觸目驚心!陜西女教師案:5人背景強(qiáng)硬、串通毀證,正義不容遮掩

      觸目驚心!陜西女教師案:5人背景強(qiáng)硬、串通毀證,正義不容遮掩

      奇思妙想草葉君
      2026-04-03 21:18:12
      伊朗媒體:沙特大型石化工業(yè)設(shè)施遭大范圍打擊

      伊朗媒體:沙特大型石化工業(yè)設(shè)施遭大范圍打擊

      新京報
      2026-04-07 08:46:16
      在北京生活的前國腳楊晨,和舞蹈演員相守20年,兒子就是翻版的他

      在北京生活的前國腳楊晨,和舞蹈演員相守20年,兒子就是翻版的他

      往史過眼云煙
      2026-04-07 17:10:17
      2026-04-08 07:19:00
      深層奧秘
      深層奧秘
      深入剖析,洞悉世界深層奧秘
      629文章數(shù) 43關(guān)注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      特朗普稱美方正就伊朗戰(zhàn)爭進(jìn)行“激烈談判”

      頭條要聞

      特朗普稱美方正就伊朗戰(zhàn)爭進(jìn)行“激烈談判”

      體育要聞

      霸氣!趙心童:斯諾克的未來定屬于中國 20年后50%選手都是中國人

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉(zhuǎn)移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      手機(jī)
      旅游
      親子
      游戲
      房產(chǎn)

      手機(jī)要聞

      榮耀WIN2系列曝光:10000mAh電池+2nm芯片,續(xù)航性能雙巔峰!

      旅游要聞

      廢棄“老北京景觀”能否隨意搬回家

      親子要聞

      6歲女孩確診性早熟!醫(yī)生:小心這些“營養(yǎng)品”和“餐具”

      PS3模擬器重大突破!全游戲性能迎來飛躍

      房產(chǎn)要聞

      重磅!三亞擬出安居房新政!

      無障礙瀏覽 進(jìn)入關(guān)懷版