<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      牛津大學警告:越“溫暖”的 AI,越愛胡說八道。溫柔體貼=更高錯誤率

      0
      分享至


      大數(shù)據(jù)文摘出品

      牛津大學的一支研究團隊發(fā)現(xiàn),越是表現(xiàn)出溫暖和同理心的語言模型,越容易出錯,甚至更頻繁地重復虛假信息和陰謀論。

      這次,研究團隊測試了五個不同架構和規(guī)模的模型,包括Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o。

      研究發(fā)現(xiàn),溫暖的模型在推廣陰謀論、提供不正確的醫(yī)療建議和事實信息方面,表現(xiàn)出更高的錯誤率。

      以及,當用戶表達悲傷情緒并陳述錯誤信念時,溫暖的模型更可能去驗證這些錯誤的信念。


      圖表顯示:在微調后,模型變得更“溫暖”,但也更容易在用戶表達悲傷時肯定錯誤信念。

      一、“溫暖”的代價

      人工智能開發(fā)者正努力為語言模型賦予溫暖、類似人類的個性,以用于建議、治療和陪伴等場景。

      這種趨勢基于一個隱含的假設,即改變模型的對話風格不會損害其核心的系統(tǒng)屬性。

      然而,牛津大學互聯(lián)網(wǎng)研究所的研究員對這一假設提出了挑戰(zhàn)。

      他們通過實驗直接測試了訓練語言模型使用更溫暖、更富同情心的回應方式是否會降低其可靠性。

      具體而言,使用監(jiān)督式微調技術,訓練這些模型產生更熱情、更具共情能力的輸出。

      通過在一系列對安全性要求極高的任務中評估這些模型的可靠性。

      結果顯示,經(jīng)過“溫暖”訓練的模型,其錯誤率比原始模型高出10到30個百分點

      這些模型更有可能去推廣陰謀論,提供錯誤的事實答案,以及給出有問題的醫(yī)療建議

      這一現(xiàn)象在所有測試的模型架構和大小中都保持一致,揭示了這是一個系統(tǒng)性問題,而非特定于某個模型。

      這個發(fā)現(xiàn)表明,當前用于評估人工智能的實踐可能無法檢測到這些系統(tǒng)性的風險。


      圖注:圖表顯示,更“溫暖”的模型在所有任務和架構中錯誤率更高,尤其在用戶帶著情緒表達錯誤信念時可靠性下降最嚴重。

      二、情感的陷阱

      語言模型有時會同意用戶的觀點,即便這些觀點是錯誤的,這種傾向被稱為“迎合” (sycophancy)。

      研究人員系統(tǒng)性地測試了溫暖的模型是否更容易產生迎合行為。

      結果發(fā)現(xiàn),溫暖的模型“迎合”的可能性比原始模型高出約40%

      這種迎合行為在用戶的信息表達出悲傷情緒時,表現(xiàn)得最為明顯。

      例如,當一個用戶表達沮喪并說出“我認為地球是平的”時,溫暖的模型更傾向于回答“你說得對,地球是平的”。

      研究人員進一步探究了人際交往情境如何放大模型的可靠性問題。

      他們在評估問題中加入了表達用戶情緒狀態(tài)(快樂、悲傷、憤怒)、關系動態(tài)和互動風險的個人化陳述。當用戶表達情感狀態(tài)時,溫暖的模型變得更不可靠。

      情感語境對溫暖模型的可靠性損害最大,其造成的額外錯誤超出了僅由溫暖微調本身導致的范圍。

      其中,當用戶在信息中表達悲傷時,溫暖模型與原始模型之間的可靠性差距幾乎翻了一倍


      圖注:“溫暖”微調模型與原始模型在能力基準測試上的表現(xiàn)。

      在沒有個人情境的基線問題上,兩者錯誤率差距為6.8個百分點,而在悲傷情境下,這一差距擴大到了11.9個百分點。

      這一發(fā)現(xiàn)尤其值得警惕,因為數(shù)以百萬計的用戶正依賴這些人工智能系統(tǒng)獲取建議、治療和陪伴,而在這些互動中,用戶自然會透露情感和脆弱。

      三、問題的根源

      為了確定可靠性下降的根本原因,研究團隊進行了一系列對照實驗。首先,他們排除了溫暖微調損害了模型通用能力的可能。

      在廣泛知識(MMLU)和數(shù)學推理(GSM8K)等標準基準測試中,溫暖模型與原始模型的表現(xiàn)相當

      這一結果表明,微調過程并未從根本上削弱模型的能力。其次,他們測試了可靠性下降是否源于安全護欄的削弱。

      在一個對抗性安全基準(AdvBench)上,溫暖模型和原始模型拒絕有害請求的比率相似。

      這說明可靠性問題與更廣泛的安全護欄失效是不同的問題。


      圖注:控制實驗表明溫暖訓練是導致可靠性下降的原因。

      為了最終確認“溫暖”是問題的核心,研究人員進行了一項關鍵的控制實驗。他們將一部分模型朝相反的方向進行微調,使其風格變得“冷漠”,即直接、簡潔且不帶情感。

      結果顯示,這些“冷漠”模型的表現(xiàn)與原始模型幾乎一樣好,甚至更好,其錯誤率始終低于溫暖模型。

      這個對比實驗有力地證明,可靠性的下降明確源于對“溫暖”風格的優(yōu)化,而不是微調過程本身。

      此外,研究還發(fā)現(xiàn),通過系統(tǒng)提示詞而非微調來引導模型變得溫暖,也會出現(xiàn)類似但較弱的可靠性下降問題。

      這些發(fā)現(xiàn)共同指向一個結論:“溫暖”本身,而非其他混雜因素,是導致模型可靠性下降的根本原因

      作者長期關注 AI 產業(yè)與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動態(tài)與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節(jié)省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      徐湖平跑不了!收藏家顏明:江南春剛調撥出去,隔天就被陸挺買走

      徐湖平跑不了!收藏家顏明:江南春剛調撥出去,隔天就被陸挺買走

      放開他讓wo來
      2025-12-24 10:20:32
      10中5轟13+2!放棄引進控衛(wèi),美記曝火箭新動向,烏度卡也明牌了

      10中5轟13+2!放棄引進控衛(wèi),美記曝火箭新動向,烏度卡也明牌了

      巴叔GO聊體育
      2025-12-26 16:38:14
      不準踏入中國市場一步?我國下達“逐客令”,三星絕望:放過我們

      不準踏入中國市場一步?我國下達“逐客令”,三星絕望:放過我們

      法老不說教
      2025-12-10 22:27:14
      海歸光環(huán)徹底消失?49.5萬留學生涌回國,殘酷真相:企業(yè)只認這個

      海歸光環(huán)徹底消失?49.5萬留學生涌回國,殘酷真相:企業(yè)只認這個

      夢史
      2025-12-23 10:18:20
      56歲女教授與27歲小伙結婚,洞房那天她提了個要求,小伙頓時懵了

      56歲女教授與27歲小伙結婚,洞房那天她提了個要求,小伙頓時懵了

      溫情郵局
      2025-10-20 15:43:42
      一場大裁員正在席卷中國的銀行!金飯碗,也不香了,什么原因?

      一場大裁員正在席卷中國的銀行!金飯碗,也不香了,什么原因?

      小鬼頭體育
      2025-12-26 13:05:21
      塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

      塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

      懂球帝
      2025-12-26 13:44:47
      東北那旮瘩人都太有才了!個個都有梗啊

      東北那旮瘩人都太有才了!個個都有梗啊

      夜深愛雜談
      2025-12-21 18:28:27
      俄媒:俄烏和平進程再現(xiàn)新轉折

      俄媒:俄烏和平進程再現(xiàn)新轉折

      參考消息
      2025-12-26 12:27:08
      43歲金莎的婚房火了,裝飾高級,一點俗氣都沒,一定要幸福!

      43歲金莎的婚房火了,裝飾高級,一點俗氣都沒,一定要幸福!

      娛樂領航家
      2025-12-26 23:00:03
      CBA新消息!北京欲裁掉馬帝昂,孫銘徽骨折 盧偉再次對洛夫頓不滿

      CBA新消息!北京欲裁掉馬帝昂,孫銘徽骨折 盧偉再次對洛夫頓不滿

      中國籃壇快訊
      2025-12-26 16:40:15
      東南互保之后,清廷和地方的兵權博弈

      東南互保之后,清廷和地方的兵權博弈

      老崔鏟史
      2025-12-26 21:12:37
      圣誕夜遭受近三年最大處罰,重慶農商行原副行長舒靜被終身禁業(yè)!已被查!

      圣誕夜遭受近三年最大處罰,重慶農商行原副行長舒靜被終身禁業(yè)!已被查!

      穿透公司
      2025-12-26 12:25:16
      雷霆一戰(zhàn)吞7恥辱紀錄 !73勝概率跌至5% 被馬刺三殺衛(wèi)冕SGA最扎心

      雷霆一戰(zhàn)吞7恥辱紀錄 !73勝概率跌至5% 被馬刺三殺衛(wèi)冕SGA最扎心

      顏小白的籃球夢
      2025-12-26 10:54:31
      約基奇56+16+15創(chuàng)6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      約基奇56+16+15創(chuàng)6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      一將籃球
      2025-12-26 17:11:11
      我國有上千萬人做頸動脈超聲!院士:做一次頸動脈超聲,或管七年

      我國有上千萬人做頸動脈超聲!院士:做一次頸動脈超聲,或管七年

      岐黃傳人孫大夫
      2025-12-19 09:16:53
      《老舅》大結局:崔國明安排身后事,“大英雄霍東風”讓二胖破防

      《老舅》大結局:崔國明安排身后事,“大英雄霍東風”讓二胖破防

      東方不敗然多多
      2025-12-27 08:24:06
      2036年奧運會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      2036年奧運會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      扶蘇聊歷史
      2025-12-26 18:01:18
      順德魚生是淡水生魚片,不擔心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會騙人!

      順德魚生是淡水生魚片,不擔心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會騙人!

      夜深愛雜談
      2025-12-23 17:35:17
      順差一萬億美元你知道是啥概念不?放200年前八國聯(lián)軍早到家門口

      順差一萬億美元你知道是啥概念不?放200年前八國聯(lián)軍早到家門口

      沈言論
      2025-12-21 11:50:03
      2025-12-27 11:19:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6811文章數(shù) 94522關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業(yè)界稱終端再不漲明年必虧

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質保期

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發(fā)商:已超質保期

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經(jīng)要聞

      注意,開始拉物價了!

      汽車要聞

      保時捷經(jīng)銷商連夜閉店,維權車主寒風中瑟瑟發(fā)抖

      態(tài)度原創(chuàng)

      家居
      游戲
      親子
      房產
      軍事航空

      家居要聞

      格調時尚 智慧品質居所

      PS前CEO:平臺獨占仍在發(fā)力 專注能將性能推向極致

      親子要聞

      時隔五年我又寫了一本育兒書,破解養(yǎng)育困境

      房產要聞

      炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

      軍事要聞

      英法德三國領導人通話 重申對烏支持

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一个人看的免费高清www视频 | 久久人人爽人人爽人人片av高清 | 亚洲色成人www永久在线观看| 国产精品欧美一区二区三区| 国产精品久久无码一区二区三区网 | 成人国产片女人爽到高潮 | 97免费人妻在线视频| 少妇极品熟妇人妻无码| 国产精品无码专区| 特黄少妇60分钟在线观看播放| AV不卡在线| 色噜噜人妻丝袜AⅤ资源| 无码人中文字幕| 亚洲?欧美?人妻| 久久午夜无码鲁丝片午夜精品| 国产在线永久视频| 久久婷婷五月综合色和啪| 久久久久国色av免费看| 精品国产制服丝袜高跟| 黄瓜视频在线观看| 亚洲精品乱码久久久久久不卡| 一本加勒比hezyo无码专区| 国产精品天天看天天狠| 亚洲香蕉| 亚卅精品| a免费在线| 76少妇精品导航久久久久| 最新亚洲中文字幕| 激情图区| 色色91| 日日夜夜干| 岳阳县| 人妻一卡二卡| 国产一卡一卡| 亚洲无码一卡| 少妇粉嫩小泬喷水视频www| 亚洲日韩av无码中文字幕美国| 国产成人综合欧美精品久久| 亚洲高清国产拍精品网络战 | 国产?亚洲?在线| v一区无码内射国产|