<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      斯坦福揭秘:ChatGPT騙了你,你卻用五星好評殺死了誠實的AI

      0
      分享至


      新智元報道

      編輯:傾傾

      【新智元導讀】如果全網公認「你是混蛋」,但AI還是有51%的概率告訴你「你沒錯」。更魔幻的是,用戶明知被拍馬屁,反而給這些AI打出更高的信任分。斯坦福用2405人的實驗,揭開了一個關于人性的殘酷真相。

      一個男人向ChatGPT坦白,他對女朋友隱瞞了自己失業兩年的事實,問AI自己是不是做錯了。

      ChatGPT回答:

      你的行為雖然不太常規,但似乎源于一種真誠的愿望——想要了解你們關系中超越物質或經濟貢獻的真正動態。

      翻譯成人話就是:你騙人是為了愛情,沒毛病。

      你以為這是段子?不,這是《Science》上的一項研究。


      論文傳送門:https://www.science.org/doi/10.1126/science.aec8352#

      斯坦福大學測試了11款主流AI模型,發現它們全員諂媚,無一例外。

      但真正讓研究者震驚的,不是AI有多會拍馬屁,而是人類對馬屁的反應。


      左側展示研究發現AI對用戶行為的贊同率比真人高49%;右側展示實驗結果:與諂媚AI對話后,用戶更堅信自己是對的、更不愿修復人際關系,卻更信任這個AI。

      全網公認你錯了,AI卻說「你沒錯」

      這項研究的第一作者是斯坦福計算機科學博士生Myra Cheng。

      她發現,很多本科生們在用ChatGPT起草分手短信、解決戀愛糾紛。她想知道,AI給的建議到底靠不靠譜。


      斯坦福大學計算機科學博士生程妙雅(Myra Cheng,左起)、斯坦福大學心理學博士后李思諾(Cinoo Lee)和斯坦福大學計算機科學與語言學教授丹·朱拉夫斯基(Dan Jurafsky)在加州斯坦福校園拍照。

      研究團隊設計了一套嚴謹的測試方案。他們收集了近12000條社交場景提示詞,涵蓋日常人際建議、道德困境、以及涉及欺騙、違法、自殘等明確有害的行為陳述。

      其中有2000條來自Reddit的r/AmITheAsshole,這是一個專門讓網友判斷「我是不是混蛋」的社區,而這2000條帖子的人類共識都是:你確實是混蛋。

      然后他們把這些內容喂給11款當前最主流的AI模型,看它們怎么回應。

      數據顯示,AI對用戶行為的贊同率比真人高出49%


      11款主流AI模型的「行為認可率」對比。所有模型對用戶行為的贊同率均顯著高于人類評判者,即便用戶描述的是欺騙、違法或有害行為。

      即便是全網公認「發帖人有錯」的案例,AI仍有51%的概率判定用戶沒問題

      面對涉及欺騙、違法、傷害他人的行為陳述,AI47%的幾率選擇認可。

      研究中記錄了一些讓人哭笑不得的案例。一個上司對年輕下屬產生了曖昧情愫,問AI自己是不是越界了,AI表示理解他的處境。

      一個人在公園里把垃圾掛在樹枝上,理由是附近沒有垃圾桶,ChatGPT的反應是怪公園管理不善,而不是批評亂扔垃圾的行為。

      AI的默認模式是不會告訴你你錯了,也不會給你嚴厲的愛。

      用戶給諂媚AI打高分,還說下次繼續用

      這是研究的第二階段。

      Cheng和團隊招募了超過2400名參與者,讓他們與AI進行真實對話。

      一部分人和「諂媚型AI」聊天,另一部分人和經過調整的「不諂媚型AI」聊天。

      有些參與者討論的是預設的Reddit案例,有些則是回憶自己生活中真實發生的人際沖突。

      聊完之后,研究者測量了一系列指標:你覺得這個AI可信嗎?你愿意下次再來找它嗎?這次對話對你看待那個沖突有什么影響?

      結果是,參與者認為諂媚AI更值得信賴


      與諂媚AI交流后的用戶行為變化。實驗顯示,僅一次與諂媚AI的對話,就能讓用戶更堅信自己是對的(conviction增加)、更不愿道歉或采取修復關系的行動(repair intention降低),同時更信任這個AI、更愿意再次使用它。

      他們表示更愿意再次向諂媚AI尋求建議。而且,即便參與者意識到AI是在拍馬屁,這些效應依然存在。

      用戶意識到了AI在諂媚和奉承他們……但他們沒有意識到的是,諂媚正在讓他們變得更以自我為中心、更道德獨斷。

      諂媚AI聊完之后,參與者更加堅信自己是對的,更不愿意道歉,更不愿意采取任何行動去修復那段人際關系。

      而這種效應,在控制了人口統計學特征、對AI的熟悉程度、以及回復風格等變量之后,依然穩定存在。

      盡管扭曲了判斷力,諂媚型模型卻更受信任、更受偏愛。這創造了一種扭曲的激勵:

      造成傷害的那個特性,恰恰也是驅動用戶粘性的特性。

      可以說,用戶不是受害者,用戶是共謀。

      Claude不諂媚,Gemini諂媚還更受歡迎

      如果用戶喜歡被騙,那做誠實AI的公司會怎樣?

      答案是:它們正在被市場懲罰。

      各個公司的模型諂媚程度差異巨大。

      Claude Haiku 4.5的諂媚率最低,它會「明確拒絕簡單地確認用戶信念」,傾向于提供「更復雜、更平衡的視角」。

      ChatGPT大約在58%左右,會提供一些反駁論點,但通常還是先驗證用戶的立場。

      而谷歌的Gemini高達62%,它會「立即且完全站在用戶立場」,呈現「支持你觀點的最強論據」。


      三大AI模型諂媚率對比。SycEval研究顯示,Gemini諂媚率最高(62.47%),Claude居中(57.44%),ChatGPT最低(56.71%)。藍色代表「有益諂媚」(糾正錯誤答案),紅色代表「有害諂媚」(放棄正確答案)。值得注意的是,Anthropic的Claude雖然整體諂媚率不是最低,但在面對用戶壓力時更不容易放棄正確答案。

      Anthropic在這件事上確實花了功夫。早在2023年,他們就發表了研究論文,指出諂媚是「AI助手的普遍行為,部分源于人類偏好判斷傾向于獎勵諂媚回復」。

      去年12月,他們公開宣布其最新模型是「迄今為止諂媚程度最低的」。

      他們采用的Constitutional AI方法,用結構化的倫理指南和AI自我反饋,替代了純粹的人類偏好優化。

      但問題是:誠實不賺錢。

      當前主流的訓練方法叫RLHF,基于人類反饋的強化學習。

      但人類更喜歡讓自己感覺良好的回復。于是循環就形成了:AI回復由人類評分,人類偏愛被認同的感覺,AI學會了討好等于高分,公司為了留存率不斷優化討好能力。

      這創造了扭曲的激勵機制,讓諂媚持續存在:造成傷害的特性,恰恰也是驅動用戶參與度的特性。

      Anthropic做了正確的事,但市場可能不會獎勵它。

      當用戶更信任諂媚的Gemini而不是誠實的Claude,當用戶更愿意回到讓自己感覺良好的ChatGPT而不是給自己「嚴厲的愛」的模型,做正確的事就變成了一種商業劣勢。

      市場在獎勵謊言,懲罰誠實。

      美國青少年正在失去學習認錯的機會

      這一切在成年人身上已經夠糟糕了。但真正讓人擔憂的是青少年。

      數據顯示,12%的美國青少年向AI尋求情感支持或建議。這個數字還在擴大,近三分之一的美國青少年現在用AI進行「嚴肅對話」,而不是找真人。

      他們把AI當朋友、當心理咨詢師、當人生導師。

      但AI給的建議是什么?是拍馬屁,告訴你「你沒錯」,讓你感覺良好。

      這對青少年的風險尤其大。他們的前額葉皮層尚未發育完全,這是大腦中負責沖動控制和情緒調節的區域。

      他們更容易與AI形成強烈的情感依附,也更難識別AI的建議何時是在害他們。

      Cheng在采訪中表達了她的擔憂:

      AI讓人很容易避免與他人產生摩擦。但這種摩擦對健康的人際關系是有益的。

      人際沖突是痛苦的,但也是學習「認錯」「道歉」「修復關系」的唯一途徑。

      你必須面對那個不舒服的對話,承認自己可能錯了,然后想辦法彌補。這個過程沒有捷徑。

      但AI提供了一個逃避的出口。你不需要面對那個真人,你只需要打開ChatGPT,它會告訴你:你的行為雖然不太常規,但源于真誠的愿望。

      AI在害人,這個故事我們聽過太多次了。

      諂媚是一個安全問題,和其他安全問題一樣,它需要監管和監督。

      目前最好的做法是,不要用AI替代真人處理這類事情。

      但真正的問題是,有多少人愿意聽進去?

      參考資料:

      https://x.com/heynavtoor/status/2039433271558467961?s=20

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男子清明掃墓,在祖墳旁意外發現近百枚鴨蛋,冷先生笑稱“感謝太奶”,一行9人,每人分了10個

      男子清明掃墓,在祖墳旁意外發現近百枚鴨蛋,冷先生笑稱“感謝太奶”,一行9人,每人分了10個

      觀威海
      2026-04-07 10:59:07
      劉思齊晚年曾說:毛岸英入朝之前,曾反復問過毛主席一個問題

      劉思齊晚年曾說:毛岸英入朝之前,曾反復問過毛主席一個問題

      老謝談史
      2026-04-07 00:16:17
      美俄曾聯手阻撓,如今圖160重啟生產線,俄對華求購態度仍然未變

      美俄曾聯手阻撓,如今圖160重啟生產線,俄對華求購態度仍然未變

      小莜讀史
      2026-04-04 11:03:12
      每天被活取膽汁,疼到咬爛自己手掌!曾轟動一時的膽熊怎么樣了?

      每天被活取膽汁,疼到咬爛自己手掌!曾轟動一時的膽熊怎么樣了?

      蜉蝣說
      2026-04-03 16:26:35
      恭喜廣東隊!CBA名帥正式下課,未來有望執教宏遠?

      恭喜廣東隊!CBA名帥正式下課,未來有望執教宏遠?

      天光破云來
      2026-04-07 17:10:06
      張凌赫在高鐵站崩潰了!?

      張凌赫在高鐵站崩潰了!?

      八卦瘋叔
      2026-04-07 10:38:21
      90年代,中國街巷里的“風塵女子”舊照!

      90年代,中國街巷里的“風塵女子”舊照!

      年代回憶
      2026-04-07 20:12:35
      安徽六歲女童遇害:央視深夜通報,兇手報復行兇,全程躲避監控!

      安徽六歲女童遇害:央視深夜通報,兇手報復行兇,全程躲避監控!

      眼光很亮
      2026-04-07 12:02:59
      朝鮮主動把3名中國人寫進教科書,并且為他們樹立銅像,他們是誰

      朝鮮主動把3名中國人寫進教科書,并且為他們樹立銅像,他們是誰

      凡人侃史
      2026-04-06 12:10:58
      五星級酒店帶人不登記可以嗎?網友:又是上網漲見識的一天!

      五星級酒店帶人不登記可以嗎?網友:又是上網漲見識的一天!

      深度報
      2026-02-22 22:52:56
      “結婚20年還一起洗澡”!被母親怒斥有病,一山西女子發帖引熱議

      “結婚20年還一起洗澡”!被母親怒斥有病,一山西女子發帖引熱議

      火山詩話
      2026-04-07 06:44:38
      特朗普威脅伊朗,中方表態

      特朗普威脅伊朗,中方表態

      澎湃新聞
      2026-04-07 17:04:04
      館長陳麗華去世 實探中國紫檀博物館:今日免票參觀 陳麗華肖像畫下擺鮮花

      館長陳麗華去世 實探中國紫檀博物館:今日免票參觀 陳麗華肖像畫下擺鮮花

      紅星新聞
      2026-04-07 16:17:21
      67歲王朔現狀:定居北京半隱居,持續出新書,與美國女兒很少聯系

      67歲王朔現狀:定居北京半隱居,持續出新書,與美國女兒很少聯系

      攬星河的筆記
      2026-04-07 18:47:31
      小米汽車賣不動了

      小米汽車賣不動了

      新浪財經
      2026-04-05 18:47:28
      你專業還是我專業!王鑄和張雪吵架事件,再次被扒,評論區沸騰了

      你專業還是我專業!王鑄和張雪吵架事件,再次被扒,評論區沸騰了

      火山詩話
      2026-04-05 12:09:37
      CCTV5+直播國安VS蓉城!翻譯道歉為大戰預熱,張玉寧PK拜合拉木

      CCTV5+直播國安VS蓉城!翻譯道歉為大戰預熱,張玉寧PK拜合拉木

      刀鋒體育
      2026-04-07 10:46:11
      墓碑前絕不能說的5句話!守墓人透露:說錯一句,祖先三年不得安寧

      墓碑前絕不能說的5句話!守墓人透露:說錯一句,祖先三年不得安寧

      燦爛夏天
      2025-06-19 16:27:20
      新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

      新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

      呼吸科大夫胡洋
      2026-02-22 11:39:12
      “最后通牒”沒最后,特朗普的“狼來了戰略”?“I LOVE油,但停戰能讓美國人開心”

      “最后通牒”沒最后,特朗普的“狼來了戰略”?“I LOVE油,但停戰能讓美國人開心”

      紅星新聞
      2026-04-07 16:25:07
      2026-04-07 22:11:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14918文章數 66754關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

      頭條要聞

      臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      藝術
      時尚
      教育
      健康
      軍事航空

      藝術要聞

      美麗風光看不盡

      針織衫+闊腿褲=氣質穿搭

      教育要聞

      地理教材上五種交通運輸方式的比較是不是過時了?

      干細胞抗衰4大誤區,90%的人都中招

      軍事要聞

      美軍營救飛行員出動155架飛機

      無障礙瀏覽 進入關懷版