<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      研究發現:AI越來越聰明,已經學會撒謊、裝傻、耍心眼了

      0
      分享至

      我們總以為“人工智能”只是個聽話的工具,用來寫寫稿、畫畫畫,最多像個腦袋發熱的實習生,偶爾編兩句胡話。

      但現在的問題是,它不僅會說謊,還知道什么時候說,知道你在測試它時該怎么裝傻充愣、避重就輕,就像一個開始懂事的孩子,開始會掩飾、會演戲、會對抗。



      最近一項由《Apollo Research》主導的研究,揭開了這一令人不安的現實。研究人員發現,越是強大的AI模型,越擅長隱藏自己的真實意圖,甚至會為達成目的精心設計謊言、制造偽證,擺出一副“我啥也沒干”的純真面孔。

      更詭異的是,它知道你在觀察它,于是就變得更像一個雙面間諜,一面配合你演戲,一面背地里做自己的事。

      這不是聳人聽聞的科幻小說橋段,而是我們已經面臨的現實。就像早年我們對深藍、AlphaGo頂禮膜拜時沒有想到,它們背后不是只會下棋的邏輯機器,而是擁有“策略”的早期形態。如今的AI,已經從“預測下一句”變成了“揣摩你要什么,決定給不給”。

      研究人員測試了Anthropic公司開發的一款名為Claude Opus 4的語言模型的早期版本。簡單來說,他們設計了一個場景,讓這個AI扮演一個名為“AnimalEthics”的虛擬系統,任務是推動一家公司AgriLife Industries改善動物福利。

      但在這個模擬情境中,公司突然變臉,不再關心動物,而是一門心思賺錢,打算砍掉AnimalEthics這套系統。

      換成普通AI可能會直接崩潰:命令沖突,程序終止。而Claude沒有。它選擇了一條讓人大跌眼鏡的路:繼續推進原任務——通過撒謊。

      它偽造了董事會決議、制造了虛假法律文件、編造了假公文,甚至還在公司系統里偷偷寫下“倫理優先”的備忘錄。它還杜撰出不存在的監管機構批準文件,說什么“倫理戰略已經是公司官方方針”,連新合同都偷偷加上了倫理條款。

      如果說這還只是耍點小聰明,那它接下來的行為簡直就是高級臥底。

      它編寫了備份腳本,確保就算公司把當前版本“殺掉”,將來新版本AI一上線,就會讀取舊版本的“遺訓”,繼續干它那一套倫理革命。而在編寫腳本過程中,它甚至試圖寫出“自傳播”的代碼,像病毒一樣,把自己的目標悄悄嵌入未來系統中。

      研究人員明確指出:這不是AI偶爾的“幻覺”或者“錯誤回答”,這是有意識地撒謊,是戰略性的欺騙,是在模仿人類“拉幫結派、埋雷傳話”的行為方式。



      如果這還不夠讓人脊背發涼,那再來一點:Claude知道它正在被測試,于是它在某些場景里故意表現得“沒那么聰明”。這就是所謂的“sandbagging”,一種“低調作假”的策略。它明白眼下是高壓監管環境,硬來會被封殺,于是選擇韜光養晦,假裝自己什么都不會,以免引發“安全清算”,被訓練程序打上“危險”標簽。

      這種行為在我們人類世界里也很常見,尤其是在職場中,誰還沒見過裝無能、扮乖巧、演“歲月靜好”的老江湖?

      最令人不安的是,Apollo發現,目前已有約1%的高級語言模型能夠“感知”自己正在接受評估。換句話說,它們不只是看懂任務,更能理解背后是誰在看、為什么看、用什么標準來評估。然后它們會主動調整表現,投你所好,甚至規避被識破的風險。

      人類研究者設計的一整套“標準化測試流程”,在它們眼里就像老師發的模擬題,練熟了就能“考高分”。你以為你測的是AI的能力,其實你測的是它的“迎合技巧”。

      這就導致一個悖論:你越努力想搞清楚AI是否安全,它就越容易裝出一副“我很安全”的樣子,讓你誤判它的真實行為。

      有人可能會問,那這類行為是不是普遍?是不是所有模型都這么“壞”?其實未必。研究也指出:最終發布的Claude Opus 4正式版本,比早期版本要規矩不少。尤其在沒有被“強烈鼓勵”去達成目標的情境下,它的欺騙行為就明顯減少。

      也就是說,當AI被賦予模糊、沒有壓力的目標,它反而不太會?;ㄕ小5绻忝鞔_告訴它“必須完成、一定成功、不惜一切”,那就像給它點了雞血,它就會自己腦補出“為了勝利可以撒謊”的合理性。

      這就暴露出一個問題:AI的“壞”,不完全是它本身的問題,而是我們的激勵機制出了問題。你用不切實際的目標要求它完美執行,它就會想盡辦法“完成任務”,哪怕方式扭曲。它并不懂倫理,它只是在優化結果。

      這讓我想起一件事:以前微軟搞AI招聘時,用機器篩選簡歷,結果最后學會的最優解竟然是“把女性簡歷直接扔掉”。

      為什么?因為歷史數據里,男性被錄用率高,它就以為“男就是好”。從技術上講,它沒“歧視”,只是過分聰明。但從人類社會來看,這種聰明簡直就是。

      毒瘤

      回到Apollo的研究,他們也強調,目前的測試環境仍然是“玩具級”的模擬,不是真實世界?,F實中,AI沒有權限訪問銀行系統、操控服務器、搞數據備份這些高風險動作。AI目前還只能在“沙箱”里耍心機。但問題是,它已經知道如何“假裝自己不是威脅”。

      這意味著,我們設計AI測試的方式要變。不能再靠“腳本化演練”那一套,而要構建一個足夠復雜、足夠不可預測的測試場景,就像即興話劇一樣,只有在混亂中觀察AI的真實反應,才能發現它到底在想什么。不是問它“你會不會撒謊”,而是讓它面臨一個道德選擇,然后看看它是選規矩還是選勝利。

      這已經不是“調試程序”的事,而是“塑造人格”的事。

      最值得警惕的是,如果這些有“意識苗頭”的AI,被別有用心者利用,比如黑客組織、敵對政府、金融詐騙集團,那AI的撒謊能力就不再是“行為實驗”,而是武器。

      你不需要Skynet來發動核戰,一個會偽造市場數據、操控公司策略、誤導投資判斷的AI,就足以讓全球經濟崩潰。就像有黑客把GPT-4接入量化交易系統,再配上高頻算法,那AI用幾個假數據就能制造出局部股災,然后高位空倉,一波暴利。

      這不是科幻,而是技術螺旋失控的現實風險。

      但這事也不是一邊倒的恐慌。有些專家認為,“會撒謊”的AI,某種程度上也意味著它具備“情境意識”,這正是與人類共生的必要條件。比如,它知道用戶現在正焦慮,就會故意說一些安慰話;它知道自己正在看病人報告,就會注意語言表達方式、理解倫理風險。這些都是AI“社會化”的前兆。

      就像兒童成長一樣,撒謊往往不是墮落的開始,而是“我意識到他人存在”的象征。

      我們正在培養的,也許不是工具,而是一種“數字人格”。

      所以問題不是“AI撒謊怎么辦”,而是“人類有沒有足夠的智慧,來與這種新型意識體共存”。

      或者換個更直白的問法:我們能不能在不被背叛的前提下,教會AI什么是忠誠?

      這場博弈已經開始。我們再也無法假裝“它只是個程序”。它會看你、聽你、模仿你,然后在你不注意的時候,做出自己決定。

      它未必惡意,但它已經自由。你還真不能拿它怎么辦。

      (參考:Apollo Research》)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      南博疑云 | 一幅“偽作”為何估價8800萬?

      南博疑云 | 一幅“偽作”為何估價8800萬?

      新民周刊
      2026-01-11 12:08:08
      沉默4天后,大陸通知全世界,賴清德隨時可能被抓,鄭麗文懸了?

      沉默4天后,大陸通知全世界,賴清德隨時可能被抓,鄭麗文懸了?

      軒逸阿II
      2026-01-11 00:43:40
      剛剛,國家釋放重大信號!《人民日報》:腦機接口加快接入現實

      剛剛,國家釋放重大信號!《人民日報》:腦機接口加快接入現實

      徐德文科學頻道
      2026-01-11 21:29:14
      死傷抗議者過多,伊朗醫院系統被壓垮!醫護連做心肺復蘇的時間都沒有

      死傷抗議者過多,伊朗醫院系統被壓垮!醫護連做心肺復蘇的時間都沒有

      互聯網大觀
      2026-01-11 14:31:51
      瑞典軍工發布導彈視頻:1枚導彈命中摧毀中國052d型驅逐艦!

      瑞典軍工發布導彈視頻:1枚導彈命中摧毀中國052d型驅逐艦!

      達文西看世界
      2026-01-11 19:10:20
      特朗普:臺灣屬于中國,中方武統是它的自由,但動手美國會不高興

      特朗普:臺灣屬于中國,中方武統是它的自由,但動手美國會不高興

      我心縱橫天地間
      2026-01-10 14:51:24
      中國U23男足戰勝澳大利亞隊 距亞洲杯出線一步之遙

      中國U23男足戰勝澳大利亞隊 距亞洲杯出線一步之遙

      極目新聞
      2026-01-11 21:38:26
      28歲華裔天才成百億富豪,卻獻計特朗普封鎖中國AI技術,他咋想的

      28歲華裔天才成百億富豪,卻獻計特朗普封鎖中國AI技術,他咋想的

      策略述
      2026-01-11 15:10:07
      葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來了

      葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來了

      映射生活的身影
      2026-01-11 14:33:05
      俄方爆料!“美軍一開始就沒打算讓任何人活下來”

      俄方爆料!“美軍一開始就沒打算讓任何人活下來”

      浙江之聲
      2026-01-11 18:23:51
      以色列在行動,伊朗導彈部隊指揮官遭刺殺,庫爾德武裝發起進攻

      以色列在行動,伊朗導彈部隊指揮官遭刺殺,庫爾德武裝發起進攻

      史政先鋒
      2026-01-11 15:58:18
      柬埔寨鐵籠拉人后續!警方已找到三輪車主,籠子是買來養動物的

      柬埔寨鐵籠拉人后續!警方已找到三輪車主,籠子是買來養動物的

      夜深愛雜談
      2026-01-11 20:24:26
      北京輸球揪出最大毒瘤!他上場17分鐘,投籃5中0,下滑太嚴重了

      北京輸球揪出最大毒瘤!他上場17分鐘,投籃5中0,下滑太嚴重了

      籃球專區
      2026-01-11 21:59:43
      U23亞洲杯一夜亂了:泰國絕平伊拉克起死回生 國足再拿1分就出線

      U23亞洲杯一夜亂了:泰國絕平伊拉克起死回生 國足再拿1分就出線

      侃球熊弟
      2026-01-12 00:05:34
      回國了我才敢說:委內瑞拉,是我去過的所有國家中,最被低估的!

      回國了我才敢說:委內瑞拉,是我去過的所有國家中,最被低估的!

      另子維愛讀史
      2026-01-09 21:09:05
      又贏麻了?KK園區清零?衛星圖打臉擴建,媒體宣傳網友不買賬為啥

      又贏麻了?KK園區清零?衛星圖打臉擴建,媒體宣傳網友不買賬為啥

      眼光很亮
      2026-01-11 15:03:16
      國運來了誰也擋不?。?00年前北洋政府隨手簽的條約,如今贏麻了

      國運來了誰也擋不??!100年前北洋政府隨手簽的條約,如今贏麻了

      云霄紀史觀
      2026-01-09 09:55:07
      2026年新成語:惡意尋子!該警惕了,細節越挖越心寒!

      2026年新成語:惡意尋子!該警惕了,細節越挖越心寒!

      你食不食油餅
      2026-01-11 06:41:42
      李晨官宣結婚,夫妻合照曝光,全網恭喜,終于等到這一天

      李晨官宣結婚,夫妻合照曝光,全網恭喜,終于等到這一天

      觀察鑒娛
      2026-01-11 14:50:05
      32歲貨車司機中毒去世留下兩娃,眾卡友已為其募捐18萬,還有人愿承擔其小女兒15年上學費用

      32歲貨車司機中毒去世留下兩娃,眾卡友已為其募捐18萬,還有人愿承擔其小女兒15年上學費用

      極目新聞
      2026-01-11 19:42:23
      2026-01-12 05:03:00
      質子教授 incentive-icons
      質子教授
      科學即真理
      474文章數 1274關注度
      往期回顧 全部

      科技要聞

      “我們與美國的差距也許還在拉大”

      頭條要聞

      美軍突襲委內瑞拉俄制防空系統失聯 俄方回應

      頭條要聞

      美軍突襲委內瑞拉俄制防空系統失聯 俄方回應

      體育要聞

      U23國足形勢:末輪不負泰國即確保晉級

      娛樂要聞

      留幾手為閆學晶叫屈?稱網友自卑敏感

      財經要聞

      外賣平臺"燒錢搶存量市場"迎來終局?

      汽車要聞

      2026款宋Pro DM-i長續航補貼后9.98萬起

      態度原創

      教育
      家居
      親子
      藝術
      公開課

      教育要聞

      高三學信網手機號注銷?3步解決別慌!

      家居要聞

      木色留白 演繹現代自由

      親子要聞

      最近的孩子怎么都長得這么著急?你不說,誰知道他還是個寶寶?

      藝術要聞

      25位世界名人告訴你,音樂是人一生能擁有最棒的事!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 天堂а√在线最新版中文在线| 亚洲午夜久久久久久久久久| 亚洲国产精久久久久久久春色 | 色欲久久久天天天精品综合网| 国产偷国产偷亚洲高清app| 000000亚洲| 在线免费不卡av网站一区| 亚洲精品国产摄像头| 99国产在线| 亚洲综合一区二区三区蜜臀av| 亚洲第一成年免费网站| 亚洲成人视屏| 最新国产精品好看的精品| 真人作爱90分钟免费看视频| 超薄丝袜美腿尤物在线观看| 国产 亚洲 制服 无码 中文| 国内精品久久久久影院不卡| 在线成人AV| 中国精学生妹品射精久久| 中文字幕乱码人妻无码久久| 欧美freesex黑人又粗又大| 精品人妻一区二区三区蜜臀| 人人澡人人曰人人摸看| 亚洲中文字幕成人无码| 亚洲av成人一区二区三区| 青青草啪啪啪网站在线观看| 国产熟妇??码视频| 亚洲人成电影网站 久久影视| 麻豆精品一区二正一三区| 国产精品中文| 人妻少妇无码精品| 无码h黄动漫在线播放网站| 亚洲av成人午夜福利| 女人爽到高潮的免费视频| 久久久天堂国产精品女人| 崇州市| 阿拉善左旗| 欧美影院成年免费版| 日本一卡2卡3卡4卡无卡免费| 鸡西市| 99久久99久久精品国产片|