<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      NHB重磅研究:人類和大語言模型,誰的創(chuàng)造力更強?

      0
      分享至

      PsyBrain 腦心前沿 | 公眾號 PSY-Brain_Frontier

      一鍵關(guān)注,點亮星標(biāo) ??

      不錯過每日前沿資訊

      認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


      基本信息

      Title:A large-scale comparison of divergent creativity in humans and large language models

      發(fā)表時間:2025.12.23

      發(fā)表期刊:Nature Human Behaviour

      影響因子:16.0

      獲取原文:

      1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



      研究背景

      從愛因斯坦重構(gòu)時空概念,到嬰兒將熟悉的物體重新組合,創(chuàng)造力一直是人類智慧皇冠上的明珠,也是推動科學(xué)、商業(yè)和藝術(shù)進步的根本動力。隨著人工智能(AI)和自然語言處理(NLP)技術(shù)的飛速發(fā)展,特別是生成式預(yù)訓(xùn)練變換器(GPT)等大語言模型(LLM)的出現(xiàn),我們似乎站在了一個新的歷史轉(zhuǎn)折點:機器是否已經(jīng)具備了媲美甚至超越人類的創(chuàng)造力?


      目前的初步研究顯示,LLM在某些創(chuàng)造力測試(如替代用途任務(wù),AUT)中似乎能與人類平分秋色,甚至略勝一籌。然而,這些結(jié)論往往依賴于人類評分員的主觀判斷,且難以在大規(guī)模樣本上復(fù)現(xiàn)。更重要的是,我們尚不清楚LLM的“創(chuàng)造力”究竟是源于對語義的深刻理解,還是僅僅依賴于概率性的詞匯拼接

      當(dāng)前領(lǐng)域亟待解決的一個核心爭議在于:LLM生成的“新穎性”是否具有真正的分布多樣性?為了回答這一問題,本研究跳出了傳統(tǒng)的小樣本、主觀評分范式,利用發(fā)散聯(lián)想任務(wù)(Divergent Association Task, DAT),對近1萬名人類被試和包含GPT-4、Claude 3、DeepSeek-R1在內(nèi)的9種主流LLM(共計超過21萬次觀測)進行了前所未有的大規(guī)模比較。這不僅是一場人機算力的較量,更是一次對創(chuàng)造力本質(zhì)的深度認(rèn)知科學(xué)探索。


      研究核心總結(jié)

      本研究 2025年12月23日 發(fā)表于Nature Human Behaviour,通過嚴(yán)謹(jǐn)?shù)挠嬎隳P秃痛笠?guī)模數(shù)據(jù)分析,揭示了人類與LLM在發(fā)散性創(chuàng)造力上的本質(zhì)差異。


      Fig. 1 | Comparison of the divergent creativity scores between humans and LLMs.

      核心發(fā)現(xiàn)一:均值相似,但人類在“極端卓越性”上完勝

      研究結(jié)果顯示,在整體平均分上,人類(Mean=78.26)略高于LLM(Mean=77.90),差異雖有統(tǒng)計學(xué)意義但效應(yīng)量較小。然而,真正的差異體現(xiàn)在分布形態(tài)上(Second-order statistics):人類表現(xiàn)出的方差(Variance)顯著高于LLM。這意味著LLM的輸出高度趨同,表現(xiàn)出一種“平庸的穩(wěn)定性”;而人類數(shù)據(jù)的分布則具有極長的右尾(Right-hand tail)。頂尖的人類被試(Top 10%)在創(chuàng)造力得分上顯著碾壓了包括GPT-4 Turbo在內(nèi)的所有頂級模型。這一結(jié)果有力地反駁了“AI已全面超越人類創(chuàng)造力”的論調(diào),表明在極具挑戰(zhàn)性的高水平創(chuàng)造力任務(wù)中,人類的認(rèn)知優(yōu)勢依然不可撼動。


      Fig. 2 | Comparison of divergent creativity scores across different temperature values for LLMs.

      核心發(fā)現(xiàn)二:LLM的語義同質(zhì)性與詞匯循環(huán)

      通過詞袋模型(Bag of Words)分析,研究者發(fā)現(xiàn)LLM雖然生成的有效詞匯量更多,但其唯一詞(Unique words)的比例顯著低于人類。LLM傾向于在不同的對話中重復(fù)使用相同的詞匯組合(例如反復(fù)生成“蘋果、云、椅子”的不同排列),顯示出其缺乏真正的詞匯多樣性。相比之下,人類基于豐富的生活經(jīng)驗和情感體驗,能夠調(diào)動更廣泛的語義網(wǎng)絡(luò),產(chǎn)生更具異質(zhì)性的聯(lián)想。


      Fig. 3 | Comparison of divergent creativity scores across different perspective prompts for LLMs.

      核心發(fā)現(xiàn)三:提示工程(Prompt Engineering)的局限與反直覺效應(yīng)

      研究進一步探索了提升LLM表現(xiàn)的邊界條件

      1. 溫度參數(shù)(Temperature):提高模型的隨機性參數(shù)(Temperature > 0.5)雖然能提升DAT得分,但會導(dǎo)致輸出質(zhì)量急劇下降,出現(xiàn)大量無意義的亂碼或不存在的詞匯(Garbled responses)。這說明LLM所謂的“高創(chuàng)造力”在極端參數(shù)下往往是以犧牲語義連貫性為代價的統(tǒng)計噪聲。

      2. 角色扮演失效:當(dāng)要求LLM扮演具有高創(chuàng)造力的歷史人物(如“像愛因斯坦一樣思考”)時,其表現(xiàn)反而不如基線水平。

      3. 人口學(xué)模擬偏差:當(dāng)要求LLM模擬不同年齡或性別的人群時,其表現(xiàn)未能復(fù)現(xiàn)人類真實的人口學(xué)差異模式,甚至呈現(xiàn)出相反的趨勢 。


      Fig. 4 | Comparison of divergent creativity scores across different celebrity prompts for LLMs.

      關(guān)鍵意義與理論貢獻(xiàn)

      本研究不僅確立了人類在頂尖創(chuàng)造力(Expert-level creativity)上的獨特優(yōu)勢,還揭示了LLM作為“輔助工具”的最佳定位:LLM能夠有效提升創(chuàng)造力的基線水平(Floor-raiser),適合處理常規(guī)性的發(fā)散任務(wù);但在需要深度語義理解和突破性思維的領(lǐng)域,人類的直覺與經(jīng)驗仍不可替代。未來的認(rèn)知神經(jīng)科學(xué)研究應(yīng)關(guān)注這種“人機協(xié)作”模式下的認(rèn)知負(fù)荷分配,即如何利用LLM的系統(tǒng)性探索能力來增強人類的直覺創(chuàng)造力。


      Fig. 5 | Comparison of divergent creativity scores across different demographic prompts for LLMs.


      Abstract

      Human–machine partnerships are increasingly used to address grand societal challenges, yet knowledge of the comparative strengths of humans and machines to innovate is nascent. Here we compare the ability of humans (N?=?9,198) and large language models (LLMs, N?=?215,542 observations) to generate novel ideas in an established creativity task. We present three key results. First, human creativity on average is slightly higher than that of LLMs. Second, creativity differences are pronounced at the extremes of the distribution, with humans exhibiting greater variability and higher levels of creativity in the right-hand tail of the distribution. Third, attempts to increase the creativity of LLMs through instructing LLMs to take on genius personas or different demographic roles lifted performance up to a threshold beyond which the output became opposite real-life patterns, whereas strategic prompt-engineering efforts yielded mixed to negative results. We discuss the implications of our findings for human–machine collaboration and problem solving.


      請打分

      這篇剛剛登上Nature Human Behaviour的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區(qū)分享您的深度見解。

      前沿交流|歡迎加入認(rèn)知神經(jīng)科學(xué)前沿交流群!


      核心圖表、方法細(xì)節(jié)、統(tǒng)計結(jié)果與討論見原文及其拓展數(shù)據(jù)。

      分享人:飯哥

      審核:PsyBrain 腦心前沿編輯部

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      “你曬太陽我拉窗簾”:英國富人區(qū)爆發(fā)陽臺大戰(zhàn)!

      “你曬太陽我拉窗簾”:英國富人區(qū)爆發(fā)陽臺大戰(zhàn)!

      英國那些事兒
      2025-12-29 23:28:30
      43歲賈玲近況:退出春晚、淡出綜藝,解散公司,她把自己作沒了?

      43歲賈玲近況:退出春晚、淡出綜藝,解散公司,她把自己作沒了?

      夢錄的西方史話
      2025-12-22 18:47:01
      破產(chǎn)清算,泰州這一著名旅游景點被拍賣!

      破產(chǎn)清算,泰州這一著名旅游景點被拍賣!

      泰有趣
      2025-12-30 12:12:40
      銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

      銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

      觀世記
      2025-12-27 15:02:35
      發(fā)現(xiàn)一個奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運,并非迷信

      發(fā)現(xiàn)一個奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會有這3種命運,并非迷信

      LULU生活家
      2025-12-23 18:33:20
      7連勝廣東戰(zhàn)天津:不敗之師遇"絕境爆點隊",三大懸念改寫劇本?

      7連勝廣東戰(zhàn)天津:不敗之師遇"絕境爆點隊",三大懸念改寫劇本?

      籃球看比賽
      2025-12-30 11:42:42
      沖上熱搜!特朗普是俄羅斯人?

      沖上熱搜!特朗普是俄羅斯人?

      湊近看世界
      2025-12-29 15:16:49
      特朗普大膽開麥,美國已替代聯(lián)合國,中方警告:臺島或?qū)⒊苫鹚幫?>
    </a>
        <h3>
      <a href=博覽歷史
      2025-12-29 18:27:35
      重磅!6500萬帕斯回歸協(xié)議達(dá)成,皇馬900萬回購,血賺到底!

      重磅!6500萬帕斯回歸協(xié)議達(dá)成,皇馬900萬回購,血賺到底!

      田先生籃球
      2025-12-29 20:10:50
      解放軍離登島只差一步,特朗普連說兩個“不”,普京下達(dá)總統(tǒng)令!

      解放軍離登島只差一步,特朗普連說兩個“不”,普京下達(dá)總統(tǒng)令!

      千里持劍
      2025-12-30 11:59:01
      湖北一大媽跳了20多年廣場舞后,拿100多個金鐲子去賣,說家里還有金項鏈沒拿,我人好,都是別人送的

      湖北一大媽跳了20多年廣場舞后,拿100多個金鐲子去賣,說家里還有金項鏈沒拿,我人好,都是別人送的

      LULU生活家
      2025-12-24 18:51:10
      女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號快回來上班

      女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號快回來上班

      梅子的小情緒
      2025-12-19 14:04:18
      數(shù)據(jù)下滑+身價暴跌!腓骨骨折啊,重傷毀掉了5號秀,可惜了

      數(shù)據(jù)下滑+身價暴跌!腓骨骨折啊,重傷毀掉了5號秀,可惜了

      球童無忌
      2025-12-30 12:48:57
      徹底沒油了!本賽季打完,8名球星大概率退役!7人是全明星

      徹底沒油了!本賽季打完,8名球星大概率退役!7人是全明星

      毒舌NBA
      2025-12-30 10:05:51
      隨著遼寧遭3連敗,上海大勝北控,CBA最新積分榜:3大黑馬殺進前6

      隨著遼寧遭3連敗,上海大勝北控,CBA最新積分榜:3大黑馬殺進前6

      侃球熊弟
      2025-12-29 21:36:28
      什么樣的老人最愚蠢?這10條占3條你就蠢到家了,希望你是幸運的

      什么樣的老人最愚蠢?這10條占3條你就蠢到家了,希望你是幸運的

      木言觀
      2025-12-29 07:45:08
      特朗普與普京通話75分鐘 克宮:俄美都不支持臨時停火提案

      特朗普與普京通話75分鐘 克宮:俄美都不支持臨時停火提案

      參考消息
      2025-12-29 11:12:04
      印度神劇《加勒萬之戰(zhàn)》制作完畢,4個月后上映!主題“打贏了”

      印度神劇《加勒萬之戰(zhàn)》制作完畢,4個月后上映!主題“打贏了”

      科普大世界
      2025-12-29 21:23:58
      可怕!斷親戚率高達(dá)63%!斷親現(xiàn)象已成為未來趨勢

      可怕!斷親戚率高達(dá)63%!斷親現(xiàn)象已成為未來趨勢

      另子維愛讀史
      2025-12-26 16:11:17
      歲辰:一首寫給自己的無聲音符

      歲辰:一首寫給自己的無聲音符

      疾跑的小蝸牛
      2025-12-28 21:43:36
      2025-12-30 13:08:49
      PsyBrain腦心前沿
      PsyBrain腦心前沿
      追蹤腦科學(xué)新動態(tài),聚焦認(rèn)知與神經(jīng)新研究
      86文章數(shù) 7關(guān)注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      鄭麗文盼明年出訪北京與華盛頓 將"先去北京"列為優(yōu)先

      頭條要聞

      鄭麗文盼明年出訪北京與華盛頓 將"先去北京"列為優(yōu)先

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰官宣文案爭議!女方名字都不提

      財經(jīng)要聞

      朱光耀:美關(guān)稅政策正使WTO名存實亡

      汽車要聞

      標(biāo)配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態(tài)度原創(chuàng)

      本地
      房產(chǎn)
      旅游
      家居
      公開課

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠(yuǎn)

      房產(chǎn)要聞

      重磅信號!2025最后幾天,三亞開發(fā)商開始集體漲價!

      旅游要聞

      魔都魔力何在?來看30個“老外游上海“小紅書真實分享

      家居要聞

      當(dāng)歸之宅 三胎圓滿居所

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲国产欧美在线看片一国产| 大伊香蕉精品一区视频在线| 革吉县| 久草精品视频| 区。| 久久久久青草线综合超碰| 特级aaaaaaaaa毛片免费视频| 亚洲色无码中文字幕| 国产麻豆精品手机在线观看| 松下纱荣子被c到高潮下不了床| 亚洲AV人人澡人人人夜| 国产v亚洲v天堂无码久久久| 中文字字幕在线中文无码| 亚洲精品乱码| 渝北区| av无码精品一区二区三区四区| 亚洲九九九| 最新亚洲中文字幕| 苍南县| 女人被狂躁c到高潮喷水一区二区| 国产在线无码视频一区二区三区| аⅴ天堂国产最新版在线中文| 日本无码一区二区| 国产精品久久久久三级| 水蜜桃av导航| 成年免费视频黄网站zxgk| xxxxbbbb欧美残疾人| 日韩有码中文字幕国产| 人妻人人操| aa性欧美老妇人牲交免费| 美女张开腿黄网站免费下载| 成人福利国产午夜AV免费不卡在线 | 河源市| 波多野结衣一区二区三区高清| AV一区二区三区| 中文字幕第4页| 99国产精品免费视频观看8| 国产精品久久久久影院老司 | 内射极品人妻| 欧美xxxx黑人又粗又大| 国产v综合v亚洲欧美大天堂|