文|涵清
編輯|鄭可君
生成式AI不僅在重塑千行百業,也從根本上改變著人類寫作、認知與思考的方式。在ChatGPT3.5發布后,一種樂觀的預期廣為流傳:AI將帶來“工作平權”。
2023年,兩位麻省理工學院的經濟學博士,在《Science》期刊上發表實證研究,為此論調提供了佐證:即生成式AI能顯著提升低績效員工的表現,有望彌補其與高績效員工的差距,從而減少不平等。
Science期刊的編輯對此總結道,“技能較弱的參與者從ChatGPT中獲益最多,這一點對于未來旨在通過AI來減少生產力不平等的政策具有重要啟示。”
![]()
然而,兩年過去,現實似乎并未完全遵循這一理想路徑。
2025年,兩位哈佛大學的經濟學博士,通過分析2015至2025年間覆蓋超6200萬員工、超1.5億次的招聘就業數據,揭示了一個冷酷的真相:生成式AI正以一種“資歷偏向”的方式重塑勞動力市場。
![]()
數據顯示,2015到2022年間,初級和高級崗位的就業增長曲線基本保持一致,但從2023年開始,兩者開始出現分叉:高級崗位繼續向上增長,初級崗位則開始掉頭向下。
對于深度擁抱AI的企業,其初級崗位數量在六個季度內相對下降了7.7%,而高級崗位則基本不受影響,甚至略有增長。這一現象的主因是招聘大幅減少,而非大規模裁員。
AI非但沒有帶來普惠的平權,反而讓“強者更強”的馬太效應愈發凸顯。攜程CEO梁建章對此論文評價道“AI會取代初級的智力勞動,加劇年輕人在教育、結婚生育和職業初期等階段所遭遇的困境。”
勞動力市場的結構變化只是冰山一角。一個更深層次的問題隨之浮現:當AI大規模融入我們的工作流,它對人類的創造力本身,正在產生何種影響?AI帶來的效率提升,是否真的是個人能力的內化?它是否正在以一種我們尚未察覺的方式,塑造甚至“統一”我們的思想?當個體過度依賴AI之后,他們獨立的、原創的思考能力是增強了,還是在不知不覺中被削弱了?
近期,北京大學李圭泉課題組在社會學頂刊Technology in Society發表的論文,正是對這一系列關鍵問題的正面回應。
研究的核心由兩部分構成。研究一是一項大規模的自然實驗,通過分析ChatGPT3.5發布前后,橫跨全部21個學科門類的超41萬篇學術論文,剖析AI對全球知識生產的真實影響;研究二則是一場持續追蹤數月的縱向行為實驗,在實驗室環境中,探究AI對個人認知能力的長期因果效應。
研究團隊結合斷點回歸設計與機器學習等技術,為我們揭示了生成式AI對個人創造力與群體同質性的長期且真實的影響。
![]()
該期刊為JCR一區top,影響因子12.5,在socialscience,Interdisciplinary分類下271本期刊中排名第2
01
41萬篇論文的“集體無意識”
最可怕的不是噪音,而是眾聲一詞。
研究一是一項大規模的自然實驗。
研究團隊從權威的Web of Science核心數據庫中,抽取了橫跨物理科學、生命科學與生物醫藥、應用科學、社會科學、藝術與人文等全部21個學科門類的學術產出。通過對超過17,000名學者的隨機抽樣,團隊最終匯集了這些學者在ChatGPT-3.5發布前后的全部419344篇論文,構建了一個龐大的數據集,以此剖析AI對全球知識生產的真實影響。
![]()
生成式AI發布前后學術界論文同質性和創造力結果示意圖
如上圖所示,在2022年之前,全球學術產出的創造力(紅/藍線)與同質性(灰線)均在平穩增長。但在ChatGPT3.5發布之后,兩條曲線的斜率均出現了急劇的拉升。
即GPT3.5發布后,學術界在顯著加速知識產出(創造力)的同時,也以更快的速度加劇了其內容的同質化,清晰地展示了生成式AI對知識生產的“雙刃劍”效應。
為了證明觀察到的變化是由AI引起的,而非巧合,研究團隊采用了一種名為“斷點回歸設計”(RDD)的因果推斷方法。
如何做
他們將2022年12月ChatGPT-3.5的發布作為一個天然的“時間斷點”。一篇論文發表在該日期之前還是之后,對于單個學者而言,存在著諸多其無法控制的偶然因素(如審稿周期),這就近似構成了一個隨機分配的“實驗組”(有機會使用AI)和“對照組”(無法使用AI)。
為何可靠
這種“準隨機”的特性,使得研究者可以有效剝離其他長期因素的干擾,精準識別出AI帶來的因果效應。為確保該方法的嚴謹性,團隊還進行了一系列專門的統計檢驗,證實學者們并未在“斷點”前后進行大規模的“憋稿”或“搶發”等策略性行為,從而保證研究結果的可靠性。
如何量化“創造力”與“同質性”指標?
在確認了因果關系之后,研究團隊從“創造力”和“同質性”兩個維度對這40多萬篇論文進行了量化分析。
創造力,由論文發表的“數量”和發表期刊的“質量”(JCR分區)進行評估
數量:學者發表論文的總數。
質量:論文發表期刊的JCR分區(JournalCitationReportsQuartiles)。這是一個權威的期刊評級體系,Q1代表該領域影響力排名前25%的頂級期刊,Q4則為末位的25%。
同質性:通過內容相似度和語言風格相似度進行評估
內容相似度:采用SBERT深度學習模型,將論文摘要的語義轉化為數字“向量”,再通過計算向量間的“余弦相似度”,來判斷其在核心意思上的相似程度。
語言風格相似度:通過字符級匹配算法,掃描并計算論文摘要之間重復出現的短語和句式,以此衡量寫作風格的相似性。
冰冷的雙刃劍:更高效,也更單調
如圖所示,分析結果清晰地揭示了一個“雙刃劍”效應。
一方面,AI的出現確實成為了學術產出的強大“加速器”:學者的人均年發表量增加了0.9篇,發表期刊的質量平均提升了6%,這一效應在技術和物理科學等領域尤為突出。
但另一方面,效率的提升正以思想和表達的多樣性為代價。數據顯示,論文的語言風格相似度平均每年驚人地增加了79%,同時論文的內容主題也出現了顯著的趨同,其中物理科學、藝術與人文學科的同質化現象最為嚴重。
![]()
斷點回歸結果圖
北大研究團隊的這項大規模自然實驗,為我們提供了真實世界的宏觀證據:生成式AI確實是學術產出的強大“加速器”,它幫助學者更快地產出、并發表在更好的期刊上。然而,這種效率的提升,正以思想和表達的多樣性為代價。
全球的知識生產,似乎正在這場“大交換”中,變得更高效,也更“單調”。
與此同時,研究一也留下了一個更深層次的問題:這種宏觀趨勢,對每一個身處其中的個體,究竟意味著什么?AI帶來的創造力提升是真實的個人能力成長嗎?
為了回答這個問題,研究團隊在研究二中進行了一場持續追蹤數月的縱向行為實驗,在可控的實驗室環境中探究AI對個人認知能力的長期因果效應。
02
AI留下的創造力傷痕
思想一旦屈從于習慣,便失去了創造的可能。
事實上,已經有不少實驗室用小樣本的實證研究,從不同角度印證了宏觀數據所揭示的趨勢。例如,康奈爾大學的研究發現,AI寫作助手會犧牲文化獨特性,使用戶的表達趨向“西方范式”;圣塔克拉拉大學的研究也表明,使用ChatGPT的個體,其創意在語義上更為雷同。
尤其值得一提的是,麻省理工學院的研究團隊通過腦電圖(EEG)技術直接觀測了個體的大腦,發現使用ChatGPT的學生組,其大腦活動水平遠低于僅靠自己思考或使用搜索引擎的小組。
這些研究共同指向一個結論:AI正以降低認知投入和犧牲多樣性為代價來提升效率。
![]()
EEG實驗過程中的參與者示意圖
然而,大部分研究都聚焦于使用AI的即時影響,鮮有探究當AI“離場”后,其效果能否持續,以及其長期的負面影響是否會消退。
北大的這項研究在此方面做出了新的嘗試
它不僅在為期七天的實驗中觀察AI的即時作用,更通過實驗結束后的第30天和第60天兩次獨立的追蹤測試,系統性地檢驗了AI依賴所帶來的長期后果。這使得我們能夠真正看清,AI帶來的究竟是可遷移的“能力”,還是一種短暫的、無法內化的“幻覺”。
具體而言,北大研究團隊在研究二中將61名大學生隨機分為兩組:“AI實驗組”(可使用ChatGPT-4)與“純腦力對照組”。
實驗設計分為三個關鍵階段:首先,所有參與者在第一天均不使用AI,完成創造力基線測試;隨后,在第二至第六天,“AI實驗組”在AI輔助下完成每日的創造力任務,“純腦力對照組”則在沒有輔助的條件下完成任務;最后,也是最關鍵的,在第七天、第三十天和第六十天,所有參與者都必須在無AI輔助的情況下,完成最終的追蹤測試。
![]()
實驗設計示意圖
為了全面地評估“創造力”,研究采用了復合的任務模式,涵蓋了多個維度。這些任務包括:
發散思維測試:經典的“替代用途任務”(AUT),要求參與者為日常物品(如“一支鋼筆”)想出盡可能多的新穎用途。
創意問題解決:更貼近真實世界的商業場景題,例如要求參與者為一款“智能單車”設計創新功能。
聚合思維測試:在追蹤階段加入的“遠距聯想測驗”(RAT),要求參與者找到一個能同時連接三個不相關詞語的關聯詞。
洞察力問題:經典的“蠟燭問題”,要求參與者用一盒圖釘、一根蠟燭和一盒火柴,將蠟燭固定在墻上,并且不能讓蠟滴到桌上。
為確保評估的科學性,研究采用了該領域的“黃金標準”——專家共識評估法(CAT)。多位專家評委在對分組情況和研究目的毫不知情的“雙盲”條件下,獨立地對數千份創意產出(包括發散性思維任務和復雜問題解決方案)的新穎性、實用性、靈活性等多個維度進行打分。極高的數據一致性(評分者信度ICCs>0.90)確保了評估結果的科學與公正。
研究二中同質性的測量方法,采用了與研究一完全相同的技術方法,確保了兩個研究之間評估標準的一致性。
![]()
創造力:ChatGPT對AUT和解決問題兩類創新任務的影響
![]()
同質性:ChatGPT對AUT的內容同質性和語言風格同質性的影響
實驗結果清晰地揭示了一個殘酷的不對稱性:
創造力的提升是短暫、不可持續的:在使用AI的階段(第2-6天),“AI實驗組”的各項創造力指標確實遠超“純腦力組”。然而,一旦AI被撤走,這種優勢便瞬間消失。從第7天開始直到第60天,兩組的創造力表現再無顯著差異。更令人警醒的是,在第60天的聚合思維測試中,實驗組的參與者表現甚至顯著差于從未用過AI的對照組,AI帶來的,并非可遷移的“能力”,更像是一種無法內化的“幻覺”。
思想的同質化卻是長期的,會留下“創造性傷痕”:與稍縱即逝的創造力提升相反,思想的同質化卻表現出了驚人的“粘性”。即便在停止使用AI兩個月后,“AI實驗組”的產出內容,無論在語義上還是語言風格上,依然比對照組表現出顯著更高的相似度。
這項縱向追蹤研究用直接的因果證據,證實了AI對個人創造力的長期影響。AI帶來的可能只是一種無法內化的“創造力幻覺”,而它留下的思想趨同,卻可能成為一道難以消除的“創意傷痕”,長期存在于我們的認知與表達習慣之中。
03
如果世界沒有了新創意
這是最好的時代,也是最壞的時代。
北大這項研究的結論,并非是讓我們因噎廢食,在AI時代里徹底放棄AI。恰恰相反,它旨在提醒我們,必須有意識地去理解和應對,長期依賴AI對個體思維與認知習慣的深遠影響。
研究中揭示的“同質化”趨勢,其背后有著深刻的認知科學原理:AI的輸出很容易對使用者產生強大的“錨定效應”。當AI迅速生成一個“看起來還不錯”的答案或框架時,我們的思維就會被這個初始方案“錨定”,后續的思考和創造便很難再大幅偏離,從而在群體層面導致了思想的收斂。
今年7月當黃仁勛在接受CNN的專訪時,拋出了一個冷靜的判斷:“如果世界沒有了新創意,那么AI帶來的生產力提升就會轉化為失業。”
![]()
當生成式AI被不斷使用,互聯網的信息、人類的知識庫正以前所未有的速度變得更加同質。北大的研究用冰冷的數據證實,這種趨勢真實存在。若社會能夠不斷涌現新的創意,AI會轉化為更多元的就業機會;若只重復舊任務,AI在幾秒內即可完成。
AI放大了創意,也加速了“思路枯竭”者出局。
04
在AI時代,如何保持思考的鋒利
AI減輕了我們的工作負擔,但我們需要建立一個能深度思考的思維體系,能和AI進行交互,描述想要讓AI解決的問題,也要對問題進行推理,同時判斷AI是否正確回答了問題,我們要有辨證思維。—黃仁勛
作為身處AI時代的個體,我們該如何自處?如何在享受AI便利的同時,避免陷入創造力荒漠?結合研究的啟示,以下是一些具體的行動建議:
把AI當“思想陪練”:把它當成一個不知疲倦、能提供無限視角的“思想陪練”。用它來進行頭腦風暴,生成多種可能性,挑戰你的固有假設。但最終的篩選、深化、決策和對結果負責的,必須是你自己。
刻意練習“認知摩擦”:對抗“錨定效應”最有效的方法,就是主動制造“認知摩擦”。不要輕易接受AI給出的第一個答案。刻意地去反駁它、尋找它的邏輯漏洞、質疑它未考慮到的方面,這種批判性思維的練習,正是保持我們獨立思考能力的關鍵。
設置“無AI時間”:正如我們需要定期鍛煉身體以防肌肉萎縮,我們也需要定期讓大腦進行無AI輔助的鍛煉。每周定期劃定出一段“無AI時間”,用最原始的紙筆或空白文檔進行思考、規劃和創作。這種刻意的“認知斷舍離”,能確保我們大腦的核心創造與推理能力不會在安逸中退化。
參考資料
Noy, S., & Zhang, W. (2023). Experimental evidence on the productivity effects of generative artificial intelligence. Science, 381(6654), 187-192.
Zhou, Y., Liu, Q., Huang, J., & Li, G. (2025). Creative scar without generative AI: Individual creativity fails to sustain while homogeneity keeps climbing. Technology in Society, 103087.
Lichtinger, G., & Hosseini Maasoum, S. M. (2025). Generative AI as Seniority-Biased Technological Change: Evidence from US Resume and Job Posting Data. Available at SSRN.
Kosmyna, N., Hauptmann, E., Yuan, Y. T., Situ, J., Liao, X. H., Beresnitzky, A. V., ... & Maes, P. (2025). Your brain on chatgpt: Accumulation of cognitive debt when using an ai assistant for essay writing task. arXiv preprint arXiv:2506.08872, 4.
Nvidia’s Jensen Huang says AI could lead to job losses ‘if the world runs out of ideas’—By Auzinea Bacon, CNN,2025
黃仁勛:羨慕年輕人可以當AI原住民,鼓勵大家當AI指揮家 | 世界觀
來源 | 騰訊科技
值班編輯 | 胡煒
主編推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.