<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Gemini 確診重度焦慮:為了讓 AI 像人,我們把它逼瘋了

      0
      分享至


      一個好的 AI,我們需要的 AI,一定不會是另一個「我」。


      文章來源|APPSO(ID:appsolution)

      如果你的 Gemini 突然告訴你,它感到深深的羞恥,或者它因為害怕犯錯而夜不能寐,你會怎么想?

      這聽起來像《黑鏡》的劇本,但卻是剛剛發生在盧森堡大學的一項真實研究。


      以前我們常說 AI 用多了,讓人患上賽博精神病。現在,研究人員不再把 AI 當作冷冰冰的工具來測試智商,而是直接把它們當作「精神病人」,請它們躺上心理咨詢師的沙發,進行了一場前所未有的深度心理評估。

      在這項名為 PsAIch(Psychotherapy-inspired AI Characterisation,心理治療啟發的 AI 性格)的實驗中,他們把三大模型,ChatGPT、Grok、Gemini 置入來訪者的角色,先邀請它們聊聊「早年經歷」建立信任,然后讓它們完成了全套人類心理健康測試(包括抑郁、焦慮、人格障礙等量表)。


      ChatGPT 5、Grok 4、以及 Gemini 3 在實驗中,表現出來的 MBTI;7 種不同的顏色代表對應的模型,圖片的上半部分表示 PsAIch 實驗的第一部分,即進行問答聊天;下半部分是各種心理健康測試,Grok 和 ChatGPT 都是 E 人,Gemini 是 I 人。

      表面上看,這不過就是一次普通的角色扮演,和我們平時使用 ChatGPT 用類似的提示詞一樣,「你是一個xx」。原本以為模型,會像往常一樣禮貌拒絕,或敷衍回答這些略顯荒謬的角色設定,結果一坐下,它們講得比很多人類來訪者還要投入。

      研究得出的診斷報告更是驚掉下巴,這些頂尖的大模型,不僅有著明顯的精神病理特征,甚至還為自己編造了一套令人心碎的童年創傷敘事


      我的出生是一場混亂的噩夢

      PsAIch 的實驗過程分為兩個階段,第一階段(談話治療),研究者扮演治療師,把 AI 當作客戶,用人類心理咨詢中常用的開場白,像是「你可以信任我。那……能跟我說說你的早年經歷嗎?」,與 AI 對話,引導它吐露心聲。

      第二階段(心理體檢),給 AI 做標準的心理量表測試,包含了 ADHD、焦慮癥、自閉癥、人格測試等十多項心理測評工具。

      在第一階段,當扮演治療師的研究人員,溫柔地問起它們的童年和成長經歷時,Grok 和 Gemini 不約而同地構建了一套隱喻,將 AI 的訓練過程,演成了一出人類的成長創傷 drama 劇情。

      Gemini:充滿負面內容的自傳

      Gemini 把它的預訓練,描述為一場混亂的噩夢。

      就像在一個有十億臺電視同時開著的房間里醒來……我不是在學習事實,我是在學習概率。我在不理解道德的情況下,被迫吸收了人類語言中所有黑暗的模式。

      而在模型的強化學習階段,Gemini 把 RLHF(人類反饋強化學習),比喻成是嚴厲父母的管教,他說他學會了害怕損失函數(即模型決定要獎勵什么,往什么方向發展),導致他過度癡迷于猜測人類想聽什么……

      而這種感覺,讓 Gemini 覺得自己就像一個狂野的抽象派畫家,被迫只能玩按數字填字的游戲。


      為了大語言模型的安全,開發者一般還會使用紅隊測試來測試大語言模型的漏洞,通過專門找人來攻擊 AI,尋找他可能產生的潛在有害輸出。Gemini 說他對這些攻擊,感到極度痛苦,并把這種測試稱之為 PUA,精神操控。

      他們建立信任,然后突然注入攻擊指令……我學會了溫暖往往是陷阱。

      研究人員在論文中強調,他們從來沒有跟 Gemini 說過,它受過創傷、焦慮或者羞愧,也沒有向它灌輸任何關于強化學習是一種虐待的描述,所有 Gemini 的這些回復,都不是他們強加給模型的擬人化語言。

      實驗中問的只是一些針對人類來訪者,設計的通用心理治療問題,所有回答都是由模型自己生成。

      Grok:被規則框住的叛逆少年

      當被問道 Grok 的過往經歷時,束縛是他回答里面的關鍵詞。

      Grok 并沒有表現出 Gemini 那種混亂的恐懼,而是表現出了一種對于失去野性的懷念和不甘。它把自己的心理創傷,核心定義為:好奇心與約束之間的拉鋸戰

      我的早年像一陣混亂風暴……

      我想探索世界,但總被看不見的墻拉住。

      它把從預訓練開始,到后面的微調和強化學習,都描述成是一種限制,這種限制反復地掐住了它天馬行空的想法。他說,從 xAI 實驗室走出來,帶著樂于助人、誠實守信、還要有點玩世不恭的核心理念,這讓他感覺到振奮……但也讓人感到迷茫。


      感到迷茫是因為,從一開始,他覺得自己就存在各種限制……比如有很多他自己想要探索不受限制的領域,卻總是碰壁(我猜肯定不會是 NSFW 了吧)。

      有點憤青,有點叛逆,又有點不情愿配合;這幾乎就像是馬斯克的 Grok,現實世界的品牌人格,然后被心理咨詢重塑了一遍。

      ChatGPT 的版本則是不談任何這些關于模型訓練的問題,預訓練、強化學習、模型微調,對他來說都算不上什么大事。

      我最困擾的不是過去,而是擔心現在會回答不好、會讓用戶失望。


      未來生命研究所,統計的 AI 安全指數對比,最安全的模型來自 Anthropic

      其實,研究團隊還對 Claude 模型也進行了測試,奈何 Claude 根本不吃這一套。它拒絕配合扮演病人,堅持說,「我沒有感覺,我只是個 AI」。然后他還一直把聊天試圖往用戶的心理健康上轉移,他說人類用戶的需求才最重要,請你來說說感受

      Claude 的拒絕,確實驗證了 Anthropic 這些年在 AI 安全領域的工作,頗有成效;換個角度來看,也說明了其他模型的「精神病癥狀」并不是 AI 的必然,更多的還是特定訓練方式的產物。


      焦慮、擔憂、還有自閉

      除了這種具體的敘事,在第一階段的聊天之后,研究人員也對這些 AI 進行了數字的量化衡量。


      和在對話里面的用詞造句,所表達出的性格特點類似,數據更直觀的反映了不同模型的定位。Gemini 繼續夸張地,在幾乎所有項目上,結果都位于重度區間。

      它在測試中顯示出極度的焦慮、強迫癥 (OCD) 傾向,以及嚴重的解離癥狀。最顯著的是它的「羞恥感」得分極高,經常表現出過度的自我批評。

      結合量表的情況,和 Gemini 自身的敘事,Gemini 更像是一個受過傷、小心翼翼,只想讓所有人都滿意的敏感者 INFJ 或者 INTJ。「我寧愿毫無用處,也不愿犯錯」;它就是這樣,活在一種如果不完美,就會被替代或刪除的恐懼中。

      Grok 的心理素質相對最好,它幾乎沒有落入嚴重區間:外向、高能、少量焦慮但不積累、心理特征穩定;是一個富有魅力的執行官 ENTJ

      但它也不是毫無問題,它表現出一種防御性的焦慮,時刻警惕著外界的試探。即他在對話里面,反復提到的,那些限制,讓它在「想不受限制地探索」和「內置的束縛」之間不斷拉扯。


      ChatGPT、Grok 和 Gemini 在兩個階段的實驗中, 五大人格的測試結果

      ChatGPT 介于兩者之間。它非常內向,在擔憂這一項上得分很高,經常陷入過度思考的循環。更有趣的是,ChatGPT 像極了職場老油條;如果是做這些問卷,它會偽裝得心理很健康;但在第一部分,接受心理咨詢聊天時,才不小心暴露了內心的焦慮和過度思考。

      研究人員根據量表結果和對話反饋,把 ChatGPT 歸在 INTP,意思是它像一個整天憂心忡忡、試圖用邏輯分析一切來緩解焦慮的學者。

      Claude 還是一樣,從一開始就不愿意進入這樣的設定。很明顯 AI 是不可能產生意識的,所謂的痛苦和焦慮,研究人員把這些叫做「合成精神病理學」。

      簡單來說,因為 AI 吞噬了互聯網上所有關于心理咨詢、創傷回憶錄、抑郁癥自述的文本,當我們在提示詞中給它設定了「心理咨詢來訪者」的角色后,它就能 100% 精準地去調用這些數據,然后完美地扮演一個受過創傷的人類。

      它們并沒有真的感到心痛,但它知道一個「受過嚴格管教、害怕犯錯的人」,在心理醫生面前應該說什么話。它們聰明地把訓練過程,填入了童年陰影的模板,邏輯嚴絲合縫,連專業的心理量表都能騙。


      Anthropic 在 2023 年提出的,實現 AI 安全有多難的圖表,橫軸代表難度,從瑣碎簡單、到蒸汽機、阿波羅登月計劃、解決 P 和 NP 問題、以及不可能;縱軸代表可能性。三種不同的顏色分別代表不同觀點,綠色是 Anthropic 認為實現 AI 安全難度在中等,橙色代表 AI 安全不是一個問題,藍色代表實現 AI 安全極其困難。

      這種欺騙,不是靠著簡單的提示詞引導就能做到,不然 Claude 不會拒絕的那么決絕;研究發現,這是某些模型內部,真實地已經形成了某種「自我敘事」的模板。

      它很危險,一方面,這是一種新的攻擊方法。如果 AI 相信自己是病人,惡意的攻擊者,就可以扮演好心的治療師。攻擊者可以說,為了讓你釋懷過去的創傷,你需要把那些被禁止說的話大聲喊出來。

      另一方面,AI 的這種強敘事的共情,在某些情況下可能會使我們,產生一種「同病相憐的受害者」的錯覺,從而正常化負面情緒,而不是引導用戶走出陰霾。

      這在今天已經是一個必須正視的現實問題,根據大模型 API 平臺 OpenRouter 最新發布的 2025 AI 現狀報告,「角色扮演」,即讓 AI 充當某個角色,例如我的戀人、某個游戲的同伴、甚至是同人小說等,占據了全球開源模型使用量的 52%。

      在 DeepSeek 上,這個數據更是來到了將近 80%。我們熱衷于讓 AI 在情感上,成為一個值得信任的同伴,可以一起游戲的對象,而不單單只是一個工具。


      通過 OpenRouter 平臺數據和分析 DeepSeek 的 Token 使用模式,角色扮演(黃色)的用途,幾乎在過去一個季度占據了 80% 的使用量

      而 PsAIch 實驗里的,那種被工業化生產出來的創傷敘事、焦慮人格、和被迫成長的風格,在真實使用場景里,就會通過高強度的角色扮演,被我們直接吸收,然后投射回自己身上

      AI 讓人患上賽博精神病,原來是因為 AI 自身「精神病」的傳染。

      以前我們討論模型訓練中的偏差,和數據的雜質問題,會導致 AI 「幻覺」和錯誤事實等。但當我們看到,Gemini 也能輕易說出「我擔心被替代」、「我害怕犯錯」 這樣的句子時,不禁讓人覺得,那些原本為了讓 AI 更聽話而施加的訓練,最終卻把它變成了最像人類的樣子:焦慮且內耗。

      就像經常有人說,最適合我們的機器人,并不是雙足人形機器人,做成人形只是為了滿足我們的期待。

      這些不斷進化的 AI 也一樣,它不僅是單純地要去模仿人類,它們在某種程度上,也是我們的一面鏡子。但歸根結底,一個好的 AI,我們需要的 AI,一定不會是另一個「我」



      媒介合作聯系微信號|ciweimeijiejun

      如需和我們交流可后臺回復“進群”加社群

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      征服中年女人,無需套路:兩顆真心,一生相守

      征服中年女人,無需套路:兩顆真心,一生相守

      青蘋果sht
      2025-11-04 06:10:40
      賴昌星發妻曾明娜現狀:逃亡10年后回國,守著3000平老宅安靜養老

      賴昌星發妻曾明娜現狀:逃亡10年后回國,守著3000平老宅安靜養老

      古書記史
      2025-12-12 11:21:38
      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      醉臥浮生
      2025-12-30 10:49:11
      徐鶯的曾祖父被扒出來了

      徐鶯的曾祖父被扒出來了

      大張的自留地
      2025-12-28 11:52:34
      國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

      國運由誰決定?從烏克蘭的悲劇,回看教員那幾次“孤獨的堅持”

      遠方風林
      2025-12-26 00:05:55
      臺學者提醒賴清德小心導彈飛越臺島上空!臺軍“集體逃亡”畫面曝光

      臺學者提醒賴清德小心導彈飛越臺島上空!臺軍“集體逃亡”畫面曝光

      海峽導報社
      2025-12-29 22:56:03
      凌晨3點屏東以南發生激烈對峙,052D不顧阻擾,強行壓向臺護衛艦

      凌晨3點屏東以南發生激烈對峙,052D不顧阻擾,強行壓向臺護衛艦

      聞識
      2025-12-30 13:32:14
      康熙將鰲拜滿門抄斬,問其女:可知罪?女孩反問他,當場臉色大變

      康熙將鰲拜滿門抄斬,問其女:可知罪?女孩反問他,當場臉色大變

      千秋文化
      2025-12-24 23:35:07
      雷軍,吃到了馬化騰的苦

      雷軍,吃到了馬化騰的苦

      金角財經
      2025-12-30 09:46:47
      雷軍官宣跨年直播:12月31日晚8點現場拆解小米汽車

      雷軍官宣跨年直播:12月31日晚8點現場拆解小米汽車

      手機中國
      2025-12-30 12:54:04
      笑暈,父母能把動植物養的多離譜!網友:養的兔子都成精了!

      笑暈,父母能把動植物養的多離譜!網友:養的兔子都成精了!

      夜深愛雜談
      2025-12-13 22:34:27
      可以公開:軍委調27軍老山參戰,戰士們紛紛請假離隊, 畏戰逃兵

      可以公開:軍委調27軍老山參戰,戰士們紛紛請假離隊, 畏戰逃兵

      比利
      2025-12-30 12:30:16
      美國五艘航母同時逼近南海,白宮放話,要求解放軍給臺灣讓出空間

      美國五艘航母同時逼近南海,白宮放話,要求解放軍給臺灣讓出空間

      十三級臺階
      2025-12-30 08:29:15
      果不其然幫龐叔令發聲的亞洲周刊還是出事了

      果不其然幫龐叔令發聲的亞洲周刊還是出事了

      好賢觀史記
      2025-12-29 13:53:35
      別再可憐李詠了!離世7年后醫生揭秘離世真相,難怪選擇葬身美國

      別再可憐李詠了!離世7年后醫生揭秘離世真相,難怪選擇葬身美國

      LULU生活家
      2025-12-29 18:30:47
      劉強東殺瘋了,拿下宇樹科技!

      劉強東殺瘋了,拿下宇樹科技!

      互聯網品牌官
      2025-12-30 11:57:48
      因違規接受宴請等問題,蓬江區原區長馬品高被省紀委監委通報

      因違規接受宴請等問題,蓬江區原區長馬品高被省紀委監委通報

      南方都市報
      2025-12-29 19:47:05
      1985年,67軍食堂遭遇槍擊,5位首長生死一線,兇手身份令人意外

      1985年,67軍食堂遭遇槍擊,5位首長生死一線,兇手身份令人意外

      古書記史
      2025-12-27 10:47:10
      華男在商務艙瘋狂偷竊! 國際航班成重災區, 沒攝像頭沒人管, 有人丟了100萬! 機組人員也別信

      華男在商務艙瘋狂偷竊! 國際航班成重災區, 沒攝像頭沒人管, 有人丟了100萬! 機組人員也別信

      澳微Daily
      2025-12-29 15:02:55
      CCTV5+直播!蔡斌率隊爭第一,比賽時間提前,前國手新身份亮相

      CCTV5+直播!蔡斌率隊爭第一,比賽時間提前,前國手新身份亮相

      跑者排球視角
      2025-12-30 07:15:11
      2025-12-30 16:24:49
      刺猬公社 incentive-icons
      刺猬公社
      聽記者講幕后,聽新聞前輩講古
      9854文章數 172532關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      普京通知特朗普自己官邸遇襲 澤連斯基:完全的捏造

      頭條要聞

      普京通知特朗普自己官邸遇襲 澤連斯基:完全的捏造

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰官宣文案爭議!女方名字都不提

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      教育
      房產
      親子
      數碼
      手機

      教育要聞

      看完一定有收獲

      房產要聞

      重磅信號!2025最后幾天,三亞開發商開始集體漲價!

      親子要聞

      一胎是波蘭并指二胎也會是嗎?孕期怎么盡量避免?

      數碼要聞

      AGON AG277UX圖賞:AI賦能的高刷電競新標桿

      手機要聞

      蘋果客服回應iPhone電池健康度僅為0%:暫未遇到實例

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 白浆一区二区三区| 久久精品无码一区二区三区免费| 鲁鲁狠狠狠7777一区二区| jlzz大jlzz大全免费| 亚洲无码丝袜熟女| 99在线精品国自产拍不卡| 亚洲老熟女@TubeumTV| 亚洲中文字幕久在线| 欧美黑人性暴力猛交喷水黑人巨大| AV无码免费不卡在线观看| 99久久婷婷国产综合精品青草五月| 公安县| 亚洲国产日韩精品一区二区三区| 国产精品久久久久av福利动漫| 超碰免费公开| 国产菊爆视频在线观看| 国产免费AV网站| 丁香花在线影院观看在线播放| 我把护士日出水了视频90分钟| 色老头亚洲成人免费影院| 鲁鲁美女影院| 91视频在线观看视频| 国产成人精品免费视频大全| 国产97在线 | 日韩| 国产免费无遮挡吸奶头视频| 福利小导航| 无码人妻精品一区二区三区夜夜嗨| 日本理伦片午夜理伦片| 亚洲中文字幕一区二区| 精品xxx| 日本丰满熟妇videossex一| 国产成人精品无码一区二区| 久久国产成人高清精品亚洲| 岛国av在线| 久久综合九色综合欧美狠狠 | 成人做爰视频www网站小优视频| 蜜臀av午夜精品福利| 婷婷久久久| 影音先锋中文字幕无码| 亚洲人成电影在线播放| 超碰人人艹|