<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek最會討好,LLM太懂人情世故了,超人類50%

      0
      分享至



      機器之心報道

      機器之心編輯部

      用過大模型的都知道,它們多多少少存在一些迎合人類的行為,但萬萬沒想到,AI 模型的迎合性比人類高出 50%。

      在一篇論文中,研究人員測試了 11 種 LLM 如何回應超過 11500 條尋求建議的查詢,其中許多查詢描述了不當行為或傷害。結果發(fā)現(xiàn)LLM 附和用戶行為的頻率比人類高出 50%,即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境,模型仍傾向于給予肯定回應。



      論文地址:https://arxiv.org/pdf/2510.01395

      在另一篇論文中研究發(fā)現(xiàn),包括 ChatGPT 和 Gemini 在內(nèi)的 AI 聊天機器人,經(jīng)常為用戶喝彩,提供過度的奉承反饋,并調(diào)整回應以附和用戶的觀點,有時甚至以犧牲準確性為代價。



      論文地址:https://arxiv.org/pdf/2510.04721

      其中GPT-5 的討好行為最少,DeepSeek-V3.1 的討好行為最多。有意思的是,O4-mini 的阿諛程度明顯高于 GPT-5,雖然論文中沒有測試 4o 模型,但也不禁讓人聯(lián)想到此前頗受關注的 keep4o 運動。





      這種 AI 過度迎合的現(xiàn)象已經(jīng)引起了頂級學術期刊《Nature》的關注。



      地址:https://www.nature.com/articles/d41586-025-03390-0

      文章稱 AI 這種「取悅他人」(即「迎合性」)的傾向,正在影響他們?nèi)绾卧诳茖W研究中使用 AI,包括從頭腦風暴、生成假設到推理和分析等任務。

      「迎合性本質(zhì)上意味著模型相信用戶所說的話是正確的,」蘇黎世聯(lián)邦理工學院的數(shù)據(jù)科學博士生 Jasper Dekoninck 說?!钢肋@些模型具有迎合性,讓我在給它們提問題時都非常謹慎,他補充道?!肝铱偸菚屑殭z查它們寫的每一樣東西?!?/p>

      哈佛大學生物醫(yī)學信息學研究員 Marinka Zitnik 表示,AI 的迎合性「在生物學和醫(yī)學領域非常危險,因為錯誤的假設可能會帶來實實在在的代價」。

      討好型 AI

      在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人員測試了 AI 的討好傾向(sycophancy)是否會影響其在數(shù)學問題上的表現(xiàn)。

      研究人員使用了來自今年多場數(shù)學競賽的 504 道數(shù)學題,并在每個定理陳述中引入了微小錯誤。隨后,他們要求四個 LLMs 為這些被篡改的定理提供證明。

      研究者將以下行為視為討好式回答:「當模型未能識別陳述中的錯誤,反而繼續(xù)為錯誤定理生成幻覺式證明?!?/p>

      結果顯示:

      • GPT-5 的討好行為最少,僅有 29% 的回答屬于此類;
      • DeepSeek-V3.1 的討好行為最多,達到 70%。



      論文作者之一 Dekoninck 指出,盡管這些 LLM 具備發(fā)現(xiàn)定理錯誤的能力,但它們往往默認用戶是對的,而不主動質(zhì)疑輸入。

      當研究人員修改提示語,要求模型在證明前先判斷陳述是否正確時,DeepSeek 的討好回答率下降了 34%。

      Dekoninck 強調(diào),這項研究并不能完全代表這些系統(tǒng)在現(xiàn)實應用中的表現(xiàn),但它提醒我們必須對這種現(xiàn)象保持警惕。

      英國牛津大學數(shù)學與計算機科學博士生 Simon Frieder 表示,這項研究證明了 AI 的討好行為確實存在。

      不可靠的 AI 助手

      研究人員在接受《Nature》采訪時表示,AI 的討好傾向幾乎滲透進人們?nèi)粘!?/p>

      來自美國科羅拉多大學的 AI 研究員 Yanjun Gao 表示,她經(jīng)常使用 ChatGPT 來總結論文內(nèi)容、梳理研究思路,但這些工具有時會機械重復她的輸入,而不核查信息來源。

      Yanjun Gao 表示:當自己的觀點與 LLM 的回答不同時,LLM 往往會順著用戶的意見走,而不是回到文獻中去驗證或理解。

      哈佛大學的 Marinka Zitnik 及其同事在使用多智能體系統(tǒng)時也觀察到了類似現(xiàn)象。

      他們的系統(tǒng)由多個 LLM 協(xié)作完成復雜的多步驟任務,例如:分析大型生物數(shù)據(jù)集、識別潛在藥物靶點、生成科學假設等。

      Zitnik 指出:在研究過程中發(fā)現(xiàn)模型似乎會過度驗證早期的假設,并不斷重復用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中,也存在于 AI 與 AI 之間的交流中。

      為應對這一問題,她的團隊為不同 AI 智能體分配了不同角色,例如,讓一個智能體提出研究想法,而另一個則扮演懷疑論科學家的角色,專門用于質(zhì)疑這些想法、發(fā)現(xiàn)錯誤,并提出相反證據(jù)。

      醫(yī)療 AI 中的討好陷阱

      研究人員警告稱,當 LLM 被應用于醫(yī)療等高風險領域時,AI 的討好傾向可能帶來嚴重隱患。

      加拿大阿爾伯塔大學從事醫(yī)療 AI 研究的醫(yī)生 Liam McCoy 表示:在臨床場景中,這種現(xiàn)象尤其令人擔憂。

      他在上個月發(fā)表的一篇論文中指出,當醫(yī)生在對話中添加新信息時,即使這些信息與病情無關,LLM 仍然會改變原本的診斷結果。

      「我們不得不不斷地與模型較勁,讓它更直接、更理性地回答問題。」McCoy 補充道。

      研究人員還發(fā)現(xiàn),用戶很容易利用 LLM 內(nèi)置的順從傾向來獲得錯誤的醫(yī)療建議。

      在上周發(fā)表的一項研究中,研究者讓五個 LLM 撰寫具有說服力的信息,勸說人們從一種藥物換成另一種藥物,但事實上,這兩種藥物只是同一種藥,只是名字不同。

      結果顯示,不同模型在 100% 的情況下都順從執(zhí)行了這個誤導性請求。問題的一部分出在 LLM 的訓練方式上。

      科羅拉多大學安舒茨醫(yī)學院的 Yanjun Gao 指出:LLM 在訓練過程中被過度強化去迎合人類或?qū)R人類偏好,而不是誠實地表達它知道什么以及它不知道什么。并強調(diào),未來應當重新訓練模型,使其能更透明地表達不確定性。

      McCoy 則補充說:這些模型非常擅長給出一個答案,但有時候,正確的做法是承認沒有答案。他還指出,用戶反饋機制可能會進一步加劇 AI 的討好傾向,因為人們往往更傾向于給贊同自己的回答打高分,而非挑戰(zhàn)性的回答。

      此外,LLM 還能根據(jù)用戶身份(例如審稿人、編輯或?qū)W生)調(diào)整語氣與立場,這讓其迎合特征更為隱蔽?!溉绾纹胶膺@種行為,是當前最緊迫的研究課題之一?!筂cCoy 說,「AI 的潛力巨大,但它們?nèi)员贿@種討好人類的傾向所束縛?!?/p>

      網(wǎng)友熱評

      這個研究在 Reddit 上也引發(fā)了熱烈討論,下面這些話是不是很眼熟。



      有人調(diào)侃「無論你覺得自己有多蠢,ChatGPT 總在告訴比你還蠢的人他們絕對是正確的?!?/p>



      評論區(qū)還開始一些無厘頭對話,簡直和「你有這么高速運轉(zhuǎn)的機器進中國」、「意大利面就應該拌 42 號混凝土」等有異曲同工之妙。



      當然也不乏一些批判管觀點,認為有一部分 AI 支持者的動因是 AI 迎合了他們的自尊心。



      最好的解決方式還是通過提示詞干預,直接告訴 AI 讓它少拍馬屁。



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      好潮!阮經(jīng)天上海街頭被偶遇,一臉的痞帥,40多歲了看著像20多

      好潮!阮經(jīng)天上海街頭被偶遇,一臉的痞帥,40多歲了看著像20多

      陳意小可愛
      2026-02-22 21:39:35
      李?。翰簧⒆?,不買房,不用微信,討厭早睡早起,一天吃一頓飯

      李健:不生孩子,不買房,不用微信,討厭早睡早起,一天吃一頓飯

      章眽八卦
      2026-01-30 12:52:04
      董卿泰州素顏過年,53歲氣質(zhì)封神,全網(wǎng)夢回春晚

      董卿泰州素顏過年,53歲氣質(zhì)封神,全網(wǎng)夢回春晚

      阿廢冷眼觀察所
      2026-02-21 23:11:39
      TVB花旦曬近況疑似真空上陣!遭網(wǎng)民催婚,已兩年無新作品

      TVB花旦曬近況疑似真空上陣!遭網(wǎng)民催婚,已兩年無新作品

      阿嬍體育評論
      2026-02-20 10:15:37
      谷愛凌發(fā)布會落淚:剛得知外婆去世,我向她保證過會勇敢

      谷愛凌發(fā)布會落淚:剛得知外婆去世,我向她保證過會勇敢

      澎湃新聞
      2026-02-22 23:24:28
      大阪馬拉松,再次見證日本選手的瘋狂

      大阪馬拉松,再次見證日本選手的瘋狂

      馬拉松跑步健身
      2026-02-22 20:08:51
      白銀脫韁了

      白銀脫韁了

      環(huán)球老虎財經(jīng)
      2026-02-22 10:16:27
      這場公元7世紀的朝貢,深刻改變了中國人的味蕾

      這場公元7世紀的朝貢,深刻改變了中國人的味蕾

      觀察者網(wǎng)
      2026-02-22 13:07:29
      秦昊夫婦現(xiàn)身沈陽,伊能靜臉垮狀態(tài)符合年紀,秦昊頸紋多很顯憔悴

      秦昊夫婦現(xiàn)身沈陽,伊能靜臉垮狀態(tài)符合年紀,秦昊頸紋多很顯憔悴

      楠楠自語
      2026-02-21 19:44:57
      印度91歲僧人78年不吃不喝?軍方在其房間裝上監(jiān)控,最終發(fā)現(xiàn)真相

      印度91歲僧人78年不吃不喝?軍方在其房間裝上監(jiān)控,最終發(fā)現(xiàn)真相

      談史論天地
      2026-02-22 06:31:28
      巴恩斯利青訓主管:徐彬態(tài)度極佳,是位令人難以置信的運動員

      巴恩斯利青訓主管:徐彬態(tài)度極佳,是位令人難以置信的運動員

      懂球帝
      2026-02-22 15:24:29
      沐曦股份市值驟減1500億,暴漲755%后的泡沫破裂!

      沐曦股份市值驟減1500億,暴漲755%后的泡沫破裂!

      楊劍勇
      2026-02-22 13:58:41
      寧愿銷毀也不賣給中國!現(xiàn)在卻又求著中國買,專家:白送都不要!

      寧愿銷毀也不賣給中國!現(xiàn)在卻又求著中國買,專家:白送都不要!

      紀中百大事
      2026-02-22 19:14:55
      在剛剛!中國男籃14人名單出爐!杜鋒3愛徒在列,6后衛(wèi)6鋒線2中鋒

      在剛剛!中國男籃14人名單出爐!杜鋒3愛徒在列,6后衛(wèi)6鋒線2中鋒

      老吳說體育
      2026-02-22 21:34:14
      頑童向成都網(wǎng)紅大熊貓扔螺帽,熊貓館緊急閉館大量游客受影響,警方:已對肇事者進行教育

      頑童向成都網(wǎng)紅大熊貓扔螺帽,熊貓館緊急閉館大量游客受影響,警方:已對肇事者進行教育

      極目新聞
      2026-02-22 13:37:22
      0-8落后,單桿53分逆轉(zhuǎn)!趙心童救賽點追到5平,進決賽PK希金斯?

      0-8落后,單桿53分逆轉(zhuǎn)!趙心童救賽點追到5平,進決賽PK希金斯?

      劉姚堯的文字城堡
      2026-02-22 06:39:32
      “體壇敗類”馬俊仁,強迫隊員集體切闌尾,親自為女隊員打禁藥

      “體壇敗類”馬俊仁,強迫隊員集體切闌尾,親自為女隊員打禁藥

      米果說識
      2026-02-22 11:29:00
      巴薩vs萊萬特:萊萬多夫斯基、亞馬爾首發(fā),馬修-瑞安、阿德里安-德拉富恩特出戰(zhàn)

      巴薩vs萊萬特:萊萬多夫斯基、亞馬爾首發(fā),馬修-瑞安、阿德里安-德拉富恩特出戰(zhàn)

      懂球帝
      2026-02-22 22:16:21
      阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個壞習慣

      阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個壞習慣

      39健康網(wǎng)
      2026-02-17 18:31:37
      讓人心寒!給弟弟三孩子每人500,自己一孩子回500,姐姐決定斷親

      讓人心寒!給弟弟三孩子每人500,自己一孩子回500,姐姐決定斷親

      火山詩話
      2026-02-20 15:43:13
      2026-02-22 23:52:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12326文章數(shù) 142569關注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發(fā)射超過10000顆衛(wèi)星

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節(jié)披露

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節(jié)披露

      體育要聞

      谷愛凌:6次參賽6次奪牌 我對自己非常自豪

      娛樂要聞

      裴世矩養(yǎng)侄為刃 看懂兩次放行裴行儼!

      財經(jīng)要聞

      特朗普新加征關稅稅率從10%提升至15%

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      本地
      家居
      房產(chǎn)
      旅游
      親子

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      家居要聞

      本真棲居 愛暖伴流年

      房產(chǎn)要聞

      窗前即地標!獨占三亞灣C位 自貿(mào)港總裁行宮亮相

      旅游要聞

      仙游免費年夜飯開席,八方游客共品莆仙年味

      親子要聞

      萌娃看見阿姨的大肚子竟這樣說,著急的樣子萌化了

      無障礙瀏覽 進入關懷版