DeepSeek最會討好，LLM太懂人情世故了，超人類50%

2025-10-27 15:23:21　來源: 機器之心Pro

北京舉報

分享至

機器之心報道

機器之心編輯部

用過大模型的都知道，它們多多少少存在一些迎合人類的行為，但萬萬沒想到，AI 模型的迎合性比人類高出 50%。

在一篇論文中，研究人員測試了 11 種 LLM 如何回應超過 11500 條尋求建議的查詢，其中許多查詢描述了不當行為或傷害。結果發(fā)現(xiàn)LLM 附和用戶行為的頻率比人類高出 50%，即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境，模型仍傾向于給予肯定回應。

論文地址：https://arxiv.org/pdf/2510.01395

在另一篇論文中研究發(fā)現(xiàn)，包括 ChatGPT 和 Gemini 在內(nèi)的 AI 聊天機器人，經(jīng)常為用戶喝彩，提供過度的奉承反饋，并調(diào)整回應以附和用戶的觀點，有時甚至以犧牲準確性為代價。

論文地址：https://arxiv.org/pdf/2510.04721

其中GPT-5 的討好行為最少，DeepSeek-V3.1 的討好行為最多。有意思的是，O4-mini 的阿諛程度明顯高于 GPT-5，雖然論文中沒有測試 4o 模型，但也不禁讓人聯(lián)想到此前頗受關注的 keep4o 運動。

這種 AI 過度迎合的現(xiàn)象已經(jīng)引起了頂級學術期刊《Nature》的關注。

地址：https://www.nature.com/articles/d41586-025-03390-0

文章稱 AI 這種「取悅他人」（即「迎合性」）的傾向，正在影響他們?nèi)绾卧诳茖W研究中使用 AI，包括從頭腦風暴、生成假設到推理和分析等任務。

「迎合性本質(zhì)上意味著模型相信用戶所說的話是正確的，」蘇黎世聯(lián)邦理工學院的數(shù)據(jù)科學博士生 Jasper Dekoninck 說。「知道這些模型具有迎合性，讓我在給它們提問題時都非常謹慎，他補充道。「我總是會仔細檢查它們寫的每一樣東西。」

哈佛大學生物醫(yī)學信息學研究員 Marinka Zitnik 表示，AI 的迎合性「在生物學和醫(yī)學領域非常危險，因為錯誤的假設可能會帶來實實在在的代價」。

討好型 AI

在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中，研究人員測試了 AI 的討好傾向（sycophancy）是否會影響其在數(shù)學問題上的表現(xiàn)。

研究人員使用了來自今年多場數(shù)學競賽的 504 道數(shù)學題，并在每個定理陳述中引入了微小錯誤。隨后，他們要求四個 LLMs 為這些被篡改的定理提供證明。

研究者將以下行為視為討好式回答：「當模型未能識別陳述中的錯誤，反而繼續(xù)為錯誤定理生成幻覺式證明。」

結果顯示：

GPT-5 的討好行為最少，僅有 29% 的回答屬于此類；
DeepSeek-V3.1 的討好行為最多，達到 70%。

論文作者之一 Dekoninck 指出，盡管這些 LLM 具備發(fā)現(xiàn)定理錯誤的能力，但它們往往默認用戶是對的，而不主動質(zhì)疑輸入。

當研究人員修改提示語，要求模型在證明前先判斷陳述是否正確時，DeepSeek 的討好回答率下降了 34%。

Dekoninck 強調(diào)，這項研究并不能完全代表這些系統(tǒng)在現(xiàn)實應用中的表現(xiàn)，但它提醒我們必須對這種現(xiàn)象保持警惕。

英國牛津大學數(shù)學與計算機科學博士生 Simon Frieder 表示，這項研究證明了 AI 的討好行為確實存在。

不可靠的 AI 助手

研究人員在接受《Nature》采訪時表示，AI 的討好傾向幾乎滲透進人們?nèi)粘！?/p>

來自美國科羅拉多大學的 AI 研究員 Yanjun Gao 表示，她經(jīng)常使用 ChatGPT 來總結論文內(nèi)容、梳理研究思路，但這些工具有時會機械重復她的輸入，而不核查信息來源。

Yanjun Gao 表示：當自己的觀點與 LLM 的回答不同時，LLM 往往會順著用戶的意見走，而不是回到文獻中去驗證或理解。

哈佛大學的 Marinka Zitnik 及其同事在使用多智能體系統(tǒng)時也觀察到了類似現(xiàn)象。

他們的系統(tǒng)由多個 LLM 協(xié)作完成復雜的多步驟任務，例如：分析大型生物數(shù)據(jù)集、識別潛在藥物靶點、生成科學假設等。

Zitnik 指出：在研究過程中發(fā)現(xiàn)模型似乎會過度驗證早期的假設，并不斷重復用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中，也存在于 AI 與 AI 之間的交流中。

為應對這一問題，她的團隊為不同 AI 智能體分配了不同角色，例如，讓一個智能體提出研究想法，而另一個則扮演懷疑論科學家的角色，專門用于質(zhì)疑這些想法、發(fā)現(xiàn)錯誤，并提出相反證據(jù)。

醫(yī)療 AI 中的討好陷阱

研究人員警告稱，當 LLM 被應用于醫(yī)療等高風險領域時，AI 的討好傾向可能帶來嚴重隱患。

加拿大阿爾伯塔大學從事醫(yī)療 AI 研究的醫(yī)生 Liam McCoy 表示：在臨床場景中，這種現(xiàn)象尤其令人擔憂。

他在上個月發(fā)表的一篇論文中指出，當醫(yī)生在對話中添加新信息時，即使這些信息與病情無關，LLM 仍然會改變原本的診斷結果。

「我們不得不不斷地與模型較勁，讓它更直接、更理性地回答問題。」McCoy 補充道。

研究人員還發(fā)現(xiàn)，用戶很容易利用 LLM 內(nèi)置的順從傾向來獲得錯誤的醫(yī)療建議。

在上周發(fā)表的一項研究中，研究者讓五個 LLM 撰寫具有說服力的信息，勸說人們從一種藥物換成另一種藥物，但事實上，這兩種藥物只是同一種藥，只是名字不同。

結果顯示，不同模型在 100% 的情況下都順從執(zhí)行了這個誤導性請求。問題的一部分出在 LLM 的訓練方式上。

科羅拉多大學安舒茨醫(yī)學院的 Yanjun Gao 指出：LLM 在訓練過程中被過度強化去迎合人類或對齊人類偏好，而不是誠實地表達它知道什么以及它不知道什么。并強調(diào)，未來應當重新訓練模型，使其能更透明地表達不確定性。

McCoy 則補充說：這些模型非常擅長給出一個答案，但有時候，正確的做法是承認沒有答案。他還指出，用戶反饋機制可能會進一步加劇 AI 的討好傾向，因為人們往往更傾向于給贊同自己的回答打高分，而非挑戰(zhàn)性的回答。

此外，LLM 還能根據(jù)用戶身份（例如審稿人、編輯或學生）調(diào)整語氣與立場，這讓其迎合特征更為隱蔽。「如何平衡這種行為，是當前最緊迫的研究課題之一。」McCoy 說，「AI 的潛力巨大，但它們?nèi)员贿@種討好人類的傾向所束縛。」

網(wǎng)友熱評

這個研究在 Reddit 上也引發(fā)了熱烈討論，下面這些話是不是很眼熟。

有人調(diào)侃「無論你覺得自己有多蠢，ChatGPT 總在告訴比你還蠢的人他們絕對是正確的。」

評論區(qū)還開始一些無厘頭對話，簡直和「你有這么高速運轉的機器進中國」、「意大利面就應該拌 42 號混凝土」等有異曲同工之妙。

當然也不乏一些批判管觀點，認為有一部分 AI 支持者的動因是 AI 迎合了他們的自尊心。

最好的解決方式還是通過提示詞干預，直接告訴 AI 讓它少拍馬屁。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

從平面幾何出發(fā)：形式化驗證如何驅動MLLM的推理能力躍遷

機器之心Pro 2026-01-20 19:17:51
0 跟貼 0
剛剛，高德ABot-Claw亦莊半馬封神！具身智能的Harness來了

新智元 2026-04-19 12:17:53
0 跟貼 0

MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0

中國AI產(chǎn)業(yè)落地的新國企答卷

華商韜略 2026-04-17 22:35:02
0 跟貼 0
教龍蝦玩手機！打通GUI智能體訓練-評測-部署全流程，一站解決

量子位 2026-04-19 12:23:00
0 跟貼 0

Codex產(chǎn)品負責人：小型團隊不再需要PM，招了就危險了

智東西 2026-04-19 15:43:09
2 跟貼 2

榮耀機器人包攬半馬前三工程師回應

新京報 2026-04-19 12:25:11
4069 跟貼 4069
世界引擎：Post-Training開啟Physical AGI新紀元

機器之心Pro 2026-04-19 20:00:03
0 跟貼 0

從實驗室到城市道路：高德“途途”亮相人形機器人“半馬”，揭開阿里具身智能全棧野心

每日經(jīng)濟新聞 2026-04-19 20:15:04
5 跟貼 5
同濟大學教授王某團隊被質(zhì)疑“百萬經(jīng)費的Nature論文數(shù)據(jù)造假”，本人曾稱“十年磨一劍”，校方：對學術不端“零容忍”，啟動調(diào)查程序

縱相新聞 2026-04-18 12:36:11
41 跟貼 41
學術不端是學術晉級的最快捷徑

必記本 2026-04-19 22:50:38
45 跟貼 45
知名大學院長被舉報，涉事人員坐立難安！他被饒毅盯上了

平老師666 2026-04-18 12:03:33
75 跟貼 75
阿杜討好李佳奇招：老太婆門外安置

城市植愈所 2026-04-18 04:34:39
1 跟貼 1
三百年幾何猜想被推翻，數(shù)學家首次發(fā)現(xiàn)「穿不過去」的多面體

機器之心Pro 2025-10-27 18:02:35
10 跟貼 10
幾何才是數(shù)學真正的分水嶺！歐美風靡32年的"空間神器"，幾何思維靠它開竅

萬物雜志 2026-04-18 06:07:23
1 跟貼 1
林智堅臺大論文撤銷過程重啟調(diào)查？在野轟綠：沒下限

郭茂辰海峽傳真 2026-04-19 22:04:02
6 跟貼 6
JCS本刊論文 | 處理效應異質(zhì)性分析——機器學習方法帶來的機遇與挑戰(zhàn)

社會學研究雜志 2026-04-19 18:04:11
0 跟貼 0
“不差錢”的DeepSeek要融資了？投資人：或為期權定價留人才

第一財經(jīng)資訊 2026-04-19 13:10:09
524 跟貼 524
如果科學不能解釋那就交給愛和信仰吧

趣事收藏家 2026-04-19 09:29:32
1 跟貼 1
中俄關系比傳統(tǒng)“聯(lián)盟”更深厚、更可靠

看看新聞Knews 2026-04-19 08:36:10
44306 跟貼 44306
“論文撤稿排行榜”：日本人霸榜，麻醉科造假最多

醫(yī)學界 2026-04-19 18:08:46
0 跟貼 0
月薪3萬，去內(nèi)蒙草原給DeepSeek守機房

算法與數(shù)學之美 2026-04-16 16:34:13
4 跟貼 4
【數(shù)智周報】DeepSeek據(jù)悉正首次洽談外部資本，估值超100億美元；臺積電CEO：全力擴產(chǎn)仍難以滿足強勁AI需求；斯坦福報告：中美頂級大模型差距“實

鈦媒體APP 2026-04-19 20:06:22
0 跟貼 0
科學解釋，何為運勢？

與你說禪 2026-04-18 07:41:23
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
走進科學之“消失的孩子”，爸爸：就吃個飯的功夫孩子被偷了

萌趣閃拍 2026-04-18 12:48:39
1 跟貼 1
正視肥胖危害，科學減重不盲目

齊魯頻道 2026-04-17 14:43:14
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
頂刊論文被質(zhì)疑，校方回應后，這事會怎么查？

未來展望 2026-04-19 07:07:20
1 跟貼 1
失去雙臂，卻用腳“敲”出4篇頂級核心論文！

江西都市現(xiàn)場 2026-04-17 23:58:35
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
第四屆全國消防科普理論與技術研討會將于8月在合肥召開

火事雜談 2026-04-19 19:27:28
0 跟貼 0
2026世界互聯(lián)網(wǎng)大會：智能體互聯(lián)網(wǎng)有望成下一個殺手級應用

中國日報網(wǎng) 2026-04-17 16:52:43
0 跟貼 0
射影定理終極大總結，一個視頻學會！

大鵬老師講數(shù)學 2026-04-20 05:07:00
0 跟貼 0
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
印度油輪在霍爾木茲遭炮擊船員喊話伊朗海軍錄音公布

紅星新聞 2026-04-19 17:03:18
10935 跟貼 10935
為什么暗區(qū)的靈異事件都可以用科學解釋？

螞蟻懶得說 2026-04-17 21:10:40
5 跟貼 5
【DeepSeek談藝】曲湘建·油畫 | 以筆觸將眼前景致化作詩意空間

文化視界網(wǎng) 2026-04-17 17:07:33
0 跟貼 0
科學為何不該成博弈工具？

人類的關注 2026-04-19 02:33:32
0 跟貼 0
從“有治理”向“優(yōu)治理”躍升，建設更高水平平安中國｜王道勇

上觀新聞 2026-04-20 05:48:05
0 跟貼 0

機器之心Pro

專業(yè)的人工智能媒體

12795文章數(shù) 142632關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

健康

本地

時尚

軍事航空

手機 / 數(shù)碼

房產(chǎn) / 家居

DeepSeek最會討好，LLM太懂人情世故了，超人類50%

50分26秒破人類紀錄！300臺機器人狂飆半馬

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

湖人1比0火箭：老詹比烏度卡像教練

何潤東漲粉百萬！內(nèi)娛隔空掀桌第一人

華誼兄弟，8年虧光85億

29分鐘大定破萬 極氪8X為什么這么多人買？

態(tài)度原創(chuàng)

"二次元GTA"直播爆了：疑似貼臉嘲諷其他二游！

干細胞抗衰4大誤區(qū),90%的人都中招

12噸巧克力有難，全網(wǎng)化身超級偵探添亂

裝修“精神角落”，就是這么上癮

伊朗逼退美掃雷艇：美方求給15分鐘撤退

半年下沉22厘米女子家中坐擁價值上億別墅卻沒法住人

半年下沉22厘米女子家中坐擁價值上億別墅卻沒法住人

29分鐘大定破萬極氪8X為什么這么多人買？