<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Claude爆火研究漏引華人團隊成果，已挨打立正道歉

2026-04-07 17:03:51　來源: 量子位

北京舉報

0

分享至

聽雨發自凹非寺量子位 | 公眾號 QbitAI

Anthropic新論文漏引同行工作，被抓包并貼臉質疑了。

MBZUAI研究生Chenxi Wang發現，這篇論文的引用列表里，是不是忘了些什么……

4月2日，Anthropic發布了一篇新論文，研究了Claude內部的“情緒機制”，在Sonnet 4.5中發現了171種“情緒向量”。

這些情緒會在與之關聯的情境中被激活，并且與人類的心理結構和情緒空間相似。

論文還驗證了情緒表征對模型行為的因果性影響，比如絕望會驅使模型采取不道德的行為，或使其對無法解決的編程任務實施“作弊”。

但Chenxi Wang自述，她讀到這篇博客時第一反應是：

這不是我們去年做的嗎？

她可以肯定，他們去年10月發表的論文《LLMs會“感覺”嗎？情緒回路的發現與控制》，是首篇系統研究LLMs情緒產生內部機制的論文

但Anthropic在原始博客中并未引用這一研究成果。

目前經作者親自溝通，A社已經火速立正道歉，并更新了論文博客，突出引用這篇工作。

兩篇“撞車”的研究

Chenxi Wang團隊的論文《“LLMs 會“感覺”嗎？情緒回路的發現與控制》，研究了驅動語言模型產生情緒輸出的內部機制。

這篇研究扒清了大語言模型的 “情緒表達底層邏輯”，回答了 “AI有沒有內在的情緒機制、靠什么表達情緒、能不能精準控制” 三個關鍵問題。

據作者介紹，這是首篇系統研究LLMs情緒產生內部機制的論文

Chenxi Wang認為，兩篇論文都研究了LLM自身產生的情感，而不是LLM在他人文本中感知到的情感，但Anthropic并未引用他們的研究成果。

她很快聯系了Anthropic的通訊作者Jack Lindsey。Jack同意添加引用，并分享了他對兩篇論文之間關系的理解。

Jack一開始指出，Chenxi Wang團隊的核心發現與原始博客中列舉的幾篇先前的研究有重疊之處。

但Chenxi Wang逐一閱讀這些論文后，指出它們研究的是LLM的“情緒感知”——即LLM如何識別輸入文本中的情緒，而非“情緒生成機制”。

作者Chenxi Wang回復Anthropic的郵件

隨后，Jack認可了這一區別。

目前，Anthropic已經更新其論文博客，在“相關工作”部分添加了對這一工作的引用。

首篇系統性AI情緒回路研究

接下來仔細看看這篇華人團隊的論文，它主要解答了三個核心問題：

AI有沒有內在的情緒機制？以什么形式存在？能不能精準控制？

而且還造出了LLM里的 “情緒回路”，實現了比提示詞、向量操控更精準的情緒控制。

研究的主實驗模型是LLaMA-3.2-3B-Instruct，并在Qwen2.5-7B-Instruct上驗證了方法是否具有跨模型泛化能力。

首先解答第一個問題：大模型是否存在“與上下文無關”的情緒機制？

研究者構建了一個受控數據集SEV，覆蓋工作、學習、人際關系等8個日常場景。

每個場景配 “正面/中性/負面” 三種結果，用于描述同一情境下的不同結果。嚴禁使用任何情緒詞（如“開心”“難過”），以確保情緒差異源于事件語義。

接著，研究者引導AI表達6種基礎情緒（喜、怒、哀、懼、驚、惡），從AI的各層網絡里，提取出了和語境無關、只對應情緒的 “情緒方向向量”

而且從AI網絡的淺層開始，不同情緒的信號就會慢慢分開，形成清晰的 “情緒分組”。

比如憤怒和厭惡挨得近、悲傷和恐懼挨得近，和人類對情緒的直覺完全一致，還會在深層網絡里保持穩定。

這也就解答了第一個問題：模型內部確實編碼了穩定的、與具體語義無關的情緒表示。

第二個問題：這些情緒機制以什么形式存在？

答案是，AI每層網絡里，只有少數神經元（MLP層）和注意力頭（Attn層）在主導情緒表達。

研究者用兩個實驗證明了這一點：

1、消融實驗：把這些核心的神經元/注意力頭關掉，AI的情緒表達能力會驟降，而且只需要關2-4個神經元、1-2個注意力頭，效果就會大幅下降。

2、增強實驗：只激活這些核心組件，哪怕不給AI任何 “要表達某種情緒” 的提示，AI也能自己生出對應情緒，而激活隨機組件則完全沒效果。

第三個問題：能否利用這些機制實現通用情緒控制？

答案是可以，而且效果顯著優于現有方法。

研究者進一步發現，情緒信息在多層之間傳播，深層網絡的情緒表示趨于穩定。

他們把每層的核心情緒零件，按影響力整合起來，形成了跨層的、連貫的“情緒回路”

直接調節這個回路，使AI生成指定情緒，在測試集上的整體情緒表達準確率達到99.65%，遠超之前的 “提示詞引導”和“向量操控” 方法。

尤其是之前最難控制的 “驚訝” 情緒，實現了100%準確表達。

此外，團隊還在Qwen2.5-7B上重復了一遍實驗，結果發現：

Qwen因為有安全對齊，直接操控很難讓它表達負面情緒，但用這套 “情緒回路” 方法，還是能有效引導；
兩個模型都表現出 “少數核心組件主導情緒” 的特點，說明這套機制是LLM的通用規律，不是某個模型的特例。

碩士生硬剛Anthropic

論文一作Chenxi Wang，MBZUAI（穆罕默德·本·扎耶德人工智能學院）的NLP碩士研究生，本科畢業于西安交通大學計算機科學專業。

其研究方向聚焦于人本人工智能、可解釋性研究，有多篇一作/共同一作論文被EMNLP、ACL、NeurIPS、COLING等頂會接收。目前正在Qwen后訓練團隊實習。

這件事情已經告一段落，好在結局算是比較友好：

Anthropic道歉并補引了這篇工作；而Chenxi Wang則稱贊Anthropic在雙方重疊部分之外，做出了真正獨立的貢獻。

尤其是研究情緒表征在不同情境下的功能作用方面，包括對偏好和與對齊相關行為的影響、在真實交互中的激活情況，以及后訓練階段這些表征的演變。
這些都是我們工作未曾涉及的重要方向。

她也指出，通訊作者Jack Lindsey在整個交流過程中，始終保持尊重的態度，并真誠地參與到技術論證中。

最后，感興趣的朋友可以讀一讀這兩篇論文，鏈接已附在下方~

[1]https://x.com/ChenxiWang19183/status/2041204375549604106?s=20
[2]華人團隊論文：https://arxiv.org/abs/2510.11328
[3]Anthropic論文：https://transformer-circuits.pub/2026/emotions/index.html#toc-18

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

毫秒級搜索10億生物序列！騰訊×浙大合作推出最強生物序列搜索AI工具——ERAST

生物世界 2026-04-06 15:07:19
0 跟貼 0
逼AI當山頂洞人！Claude防話癆插件爆火，網友：受夠了AI廢話

新智元 2026-04-06 17:13:12
1 跟貼 1

開盒Claude Code的原來是中國00后！曾怒懟Anthropic竊取用戶代碼

量子位 2026-04-02 15:24:09
196 跟貼 196

OpenAI又一關鍵高管離職！曾為GPT-4o注入靈魂

智東西 2026-04-08 00:16:16
4 跟貼 4
科技巨頭集體押注自研芯，AI芯片戰場正加速向推理端遷移

華爾街見聞官方 2026-04-07 21:48:40
0 跟貼 0

內容投毒，工作埋坑，打工人開始用「魔法」對抗Skill煉化？

雷科技 2026-04-07 21:42:51
0 跟貼 0

價格大漲，搜索量飆增1850%！國家安全部提醒

環球網資訊 2026-04-07 18:58:14
39 跟貼 39
AI編程“屎山危機”來了？代碼生成過載，人工審核跟不上

智東西 2026-04-07 22:53:06
0 跟貼 0

華人夫婦在美國紐約豪宅中離奇失蹤！至今音信全無，生死不明！

佛羅里達州張司令 2026-04-03 12:58:46
194 跟貼 194
領導執迷不悟對實驗走火入魔，結果毀了一座城

呵呵剪輯 2026-04-06 10:33:43
1 跟貼 1
智能開關翻車實錄：87%用戶踩了同一個坑

像素與芯片 2026-04-03 22:27:34
0 跟貼 0
抄親爹的論文副教授，這次又火了！

芳華青年 2026-04-07 22:30:37
7 跟貼 7
女生寫論文僅睡4小時，鍛煉時倒下心跳呼吸全無，救治3天奇跡蘇醒

掌聞視訊 2026-04-07 18:32:55
0 跟貼 0
西北大學副教授賈淺淺多篇論文被指涉嫌大面積抄襲

南昌晚報 2026-04-06 03:20:17
0 跟貼 0
賈淺淺不應再沉默，論文抄襲涉及高校誠信

澎湃新聞 2026-04-06 05:28:46
0 跟貼 0
21歲女大學生熬夜寫論文，鍛煉時突然倒地心跳呼吸全無

江西都市現場 2026-04-07 15:48:08
0 跟貼 0
賈淺淺抄襲風波，無奈真相如何？深度解析引熱議

財值社Value 2026-04-08 01:27:24
3 跟貼 3
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
2 跟貼 2
賈淺淺論文抄襲：最打臉西北大學，最受傷是學生

胡言炫語 2026-04-08 00:56:05
0 跟貼 0
海拔4550米，中國把光熱電站修到了云端

灰度測試中 2026-04-06 19:36:13
0 跟貼 0
在美華人：中國彎道超車別做夢了！美國的先進你無法想象！

豎笛小魔王 2026-04-07 02:28:20
1 跟貼 1
張雪說要革掉一些不上進的人

點時新聞 2026-04-07 14:50:35
91 跟貼 91
美國華人老移民：只要老伴同意，立馬就搬回中國！

房東說漫 2026-04-05 11:48:04
6 跟貼 6
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
外網熱議：在美國生活的美女談美國，美國警察對華人挺友好

小朋友手工 2026-04-05 03:49:25
0 跟貼 0
羅福莉：Claude訂閱封殺龍蝦背后，真正的出路不是更便宜的token

機器之心Pro 2026-04-07 10:48:02
3 跟貼 3
華人在路口，偶遇美國罐車，罐體光亮如鏡車尾十多個燈！

趣萌生活館 2026-04-06 16:31:22
2 跟貼 2
在以華人見證伊朗第97波打擊連落兩彈小樹林也被命中

南北分界線 2026-04-06 19:03:55
0 跟貼 0
印度特種兵訓練的成果，怎么像小孩把尿的架勢，下一幕讓人笑岔氣

小婕搞笑 2026-04-07 11:13:41
1 跟貼 1
等待遣返！華人男子用假身份買豪車，一路多次成功操作，還是栽了

華人生活網 2026-04-08 05:31:42
1 跟貼 1
玻璃貼完隱私膜成果，一樓不用擔心被看到，第一眼以為在屋里！

搞笑海蠣子 2026-04-07 12:52:56
1 跟貼 1
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
486 跟貼 486
太狠了！華人夫妻月入4000美元，5年攢出10萬首付，在美國買下30萬房子

華人生活網 2026-04-08 05:32:31
0 跟貼 0
董宇輝在公祭大典期間，與一位美籍華裔美女交流，全英文已被翻譯

斯內個普 2026-04-06 10:19:23
0 跟貼 0
1985年美籍華裔吳弭，哈佛雙學位加持，36歲成波士頓首位亞

搞笑小搗蛋 2026-04-04 12:26:29
1 跟貼 1
恭喜！紐約華人中100萬美元，迅速61萬現金落袋為安，這張彩票買自唐人街

華人生活網 2026-04-08 05:33:19
0 跟貼 0
路人看油菜花不阻止，站在馬路邊看看就行了，別影響農民勞動成果

小女孩沒煩惱 2026-04-06 15:30:59
1 跟貼 1
有個愛作的媽媽，就會有情緒穩定的孩子，這招實在是太厲害！

明月大笑 2026-04-06 16:07:50
0 跟貼 0
美媒：“無法無天的世界代價高昂”

參考消息 2026-04-07 16:50:06
77 跟貼 77

晶合集成沖刺港股：年營收104億華勤技術去年斥資24億買老股

晶合集成沖刺港股：年營收104億華勤技術去年斥資24億買老股

雷遞

2026-04-07 17:45:30

六臺：皇馬更衣室相信有能力逆轉拜仁，次回合貝林厄姆將首發

六臺：皇馬更衣室相信有能力逆轉拜仁，次回合貝林厄姆將首發

懂球帝

2026-04-08 07:00:10

WTI原油跌幅擴大至10%，報101.07美元/桶

WTI原油跌幅擴大至10%，報101.07美元/桶

每日經濟新聞

2026-04-08 06:43:04

燒了30小時！百億航母成廢鐵？5700人全被扣押，百億戰艦成紙老虎

燒了30小時！百億航母成廢鐵？5700人全被扣押，百億戰艦成紙老虎

漫步獨行俠

2026-04-05 09:42:53

伊朗哈爾克島再次遭襲，傳出多次爆炸聲；該島承載伊朗90%原油出口，核心設施系美伊合資打造，位置獨一無二

伊朗哈爾克島再次遭襲，傳出多次爆炸聲；該島承載伊朗90%原油出口，核心設施系美伊合資打造，位置獨一無二

揚子晚報

2026-04-07 19:35:06

為什么你俯臥撐越練越無效？答案在第一性原理

為什么你俯臥撐越練越無效？答案在第一性原理

解說阿洎

2026-04-06 06:55:25

世體：加維已近一年沒踢歐冠，巴薩相信他復出后發揮重要作用

世體：加維已近一年沒踢歐冠，巴薩相信他復出后發揮重要作用

懂球帝

2026-04-08 07:00:13

知道去不成中國了？魯比奧發表涉華聲明，一句話給巴拿馬干沉默了

知道去不成中國了？魯比奧發表涉華聲明，一句話給巴拿馬干沉默了

命運自認幽默

2026-04-08 04:15:08

湖北銀行遭監管重罰內控失守暴露經營隱憂

湖北銀行遭監管重罰內控失守暴露經營隱憂

九州商業觀察

2026-04-07 10:31:44

蘇聯中將披露：中越戰爭中國調 56 萬大軍，越軍防線崩潰

蘇聯中將披露：中越戰爭中國調 56 萬大軍，越軍防線崩潰

磊子講史

2025-12-23 19:48:33

鄭麗文抵達上海當天，人民日報發聲，中國已經注意到日本的野心

鄭麗文抵達上海當天，人民日報發聲，中國已經注意到日本的野心

遨游新世界

2026-04-08 05:06:59

上海交大：每次起床后大量喝水的人，用不了多久，身體或有7變化

上海交大：每次起床后大量喝水的人，用不了多久，身體或有7變化

讀懂世界歷史

2025-11-23 11:18:04

你祖上有啥很大的機緣轉折點？網友：但凡發生一下改變，就沒你了

你祖上有啥很大的機緣轉折點？網友：但凡發生一下改變，就沒你了

帶你感受人間冷暖

2026-02-13 15:23:12

海康威視辟謠“監控系統出現漏洞，總部300多人被帶走”：公司不存在上述情況，目前在伊朗暫無相關業務

海康威視辟謠“監控系統出現漏洞，總部300多人被帶走”：公司不存在上述情況，目前在伊朗暫無相關業務

瀟湘晨報

2026-04-07 13:40:22

鄭麗文訪陸受高規格禮待，隨行的13人，各個身份不簡單

鄭麗文訪陸受高規格禮待，隨行的13人，各個身份不簡單

石江月

2026-04-07 17:09:01

特朗普承認美軍F-15E戰機是被伊朗肩扛式導彈打下來的，歸結為伊朗運氣好；兩天后又有一架美軍飛機被伊朗肩扛式導彈擊中

特朗普承認美軍F-15E戰機是被伊朗肩扛式導彈打下來的，歸結為伊朗運氣好；兩天后又有一架美軍飛機被伊朗肩扛式導彈擊中

極目新聞

2026-04-07 14:00:56

WTI原油跌幅擴大至9%，報102.56美元/桶

WTI原油跌幅擴大至9%，報102.56美元/桶

每日經濟新聞

2026-04-08 06:43:05

觸目驚心！陜西女教師案：5人背景強硬、串通毀證，正義不容遮掩

觸目驚心！陜西女教師案：5人背景強硬、串通毀證，正義不容遮掩

奇思妙想草葉君

2026-04-03 21:18:12

伊朗媒體：沙特大型石化工業設施遭大范圍打擊

伊朗媒體：沙特大型石化工業設施遭大范圍打擊

新京報

2026-04-07 08:46:16

在北京生活的前國腳楊晨，和舞蹈演員相守20年，兒子就是翻版的他

在北京生活的前國腳楊晨，和舞蹈演員相守20年，兒子就是翻版的他

往史過眼云煙

2026-04-07 17:10:17

追蹤人工智能動態

12434文章數 176445關注度

往期回顧全部

科技要聞

滿嘴謊言！OpenAI奧特曼黑料大起底

頭條要聞

特朗普稱美方正就伊朗戰爭進行“激烈談判”

頭條要聞

特朗普稱美方正就伊朗戰爭進行“激烈談判”

體育要聞

霸氣！趙心童：斯諾克的未來定屬于中國 20年后50%選手都是中國人

娛樂要聞

女首富陳麗華離世被曝生前已分好遺產

財經要聞

10萬億財政轉移支付，被誰拿走了？

汽車要聞

不止是大極狐首款MPV問道V9靜態體驗

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

游戲

家居

數碼

軍事航空

旅游要聞

廢棄“老北京景觀”能否隨意搬回家

PS3模擬器重大突破！全游戲性能迎來飛躍

家居要聞

雅致愜意感知生活之美

溫馨多元愛的具象化
歲月靜好典雅新章
經典配色晝色銀河

數碼要聞

MacBook Neo爆火背后，蘋果芯片庫存要見底了？

軍事要聞

美軍營救飛行員出動155架飛機

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<menuitem id="r45qt"><ul id="r45qt"></ul></menuitem>

_{<del id="r45qt"></del>}