PsyBrain 腦心前沿 | 公眾號 PSY-Brain_Frontier
一鍵關注,點亮星標 ??
不錯過每日前沿資訊
認知神經科學前沿文獻分享
![]()
基本信息
Title:How social learning enhances—or undermines—efficiency and flexibility in collective decision-making under uncertainty
發表時間:2025.11.24
發表期刊:PNAS
影響因子:9.1
獲取原文:
添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
研究背景
在信息爆炸的現代社會,“隨大流” 往往被視為一種生存智慧。從蜜蜂尋找花蜜,到我們在電商平臺根據銷量下單,亦或是投資者追逐熱門股票,社會學習(Social Learning) 讓個體能夠通過觀察他人來規避高昂的“試錯成本”。通常我們認為,群體智慧(Collective Intelligence)優于個人決策,因為群體能夠過濾噪音,匯聚最優解。
![]()
然而,群體的力量并非總是正向的。歷史和現實反復證明,社會學習也可能導致災難性的“羊群效應”:由于盲目跟風,群體可能在環境發生劇變時集體陷入錯誤的路徑,甚至引發金融泡沫破裂或網絡謠言的病毒式傳播。
這就引出了一個經典的科學難題:為什么社會學習有時能產生精準的群體智慧,有時卻會導致集體的愚蠢?
既往的認知神經科學研究提出了兩種截然不同的社會學習算法假設:一種認為我們不僅模仿行為,還會內化他人的偏好(價值重塑);另一種認為我們只是在行為上從眾,但內心保留獨立判斷(決策偏倚)。但這兩種機制在群體層面究竟如何互動?特別是在環境充滿不確定性且快速變化(Volatility)的當下,哪種策略更具適應性?這不僅是進化心理學的核心議題,更是理解人類社會動態及設計未來AI群體的關鍵線索。
![]()
研究核心總結
2025年11月24日發表于 PNAS 的該項研究,通過計算建模和進化博弈論模擬,深刻揭示了不同社會學習算法在集體決策中的權衡(Trade-off)機制。
![]()
Fig. 1. Overview of the agent-based simulations.
核心發現一:兩種社會學習算法的計算本質差異
研究者在強化學習(Reinforcement Learning, RL)框架下,對比了兩種核心算法:
價值重塑(Value Shaping, VS):觀察者將他人的選擇視為一種“偽獎賞”(Pseudo-reward),直接更新自己對該選項的價值評估(Q-value)。即“別人選它,說明它真的好”。
決策偏倚(Decision Biasing, DB):社會信息僅影響當下的選擇概率(Action Probability),而不改變個體內部對選項的價值評估。即“雖然我跟風選它,但我對它的價值評價仍基于我自己的真實體驗”。
![]()
Fig. 2. Pair-level performance of the DB and VS algorithms under complete and selective information sharing.
核心發現二:效率與靈活性的零和博弈
通過非靜態多臂老虎機任務(Non-stationary Multi-armed Bandit Task)模擬,研究發現:
VS算法是“雙刃劍”:在環境穩定的初期,VS策略能極快地促成群體共識,實現極高的決策效率(Efficiency)。然而,一旦環境發生逆轉(原先最優的選項變差),VS群體極易陷入“信息級聯”的陷阱。由于社會信號不斷強化過時的選項價值,即便真實獎勵已經消失,群體仍會固執地堅持錯誤選擇,表現出極差的靈活性(Flexibility)。這種僵化現象在群體規模大、從眾傾向(Majority Bias)強的情況下尤為嚴重。
DB算法具備魯棒性:相比之下,DB群體雖然在穩定期達成共識的速度較慢,但由于其內部價值評估未受社會信號“污染”,一旦環境改變,它們能敏銳地通過自身的獎勵預測誤差(RPE)發現變化,從而快速掉頭。
![]()
Fig. 3
核心發現三:進化穩定策略與羅杰斯悖論的破解
該研究最精彩的部分在于進化動力學分析。根據文化進化理論中的“羅杰斯悖論”(Rogers' Paradox),如果社會學習者只是單純“竊取”個體學習者的信息,最終群體的平均適應度不會超過純個體學習者。
但本研究發現,VS和DB的混合共存是進化的穩定終局(ESS)。
DB 智能體充當了“生產者”(Producer)的角色,它們對環境變化敏感,能夠提供高質量的一手信息。
VS 智能體則充當“搜尋者”(Scrounger),它們利用DB產生的信息快速擴大優勢。
這種“生產者-搜尋者”的動態平衡,使得混合群體能夠在保持一定效率的同時,維持對環境變化的適應能力。
![]()
Fig. 4
理論與應用意義
這項工作并未停留在模擬層面,它為理解人類社會的錯誤信念固著(Belief Persistence)提供了計算層面的解釋:為什么陰謀論或錯誤信息難以根除?可能是因為人類大腦更傾向于采用VS策略,將社會認同直接轉化為內在價值。
此外,該研究對人機混合智能系統的設計具有重要啟示:在一個由人類(傾向于VS)組成的系統中,為了防止集體走向僵化,引入少量采用DB算法(只跟風行為但不改變價值觀)的AI代理或“特立獨行者”,可能是維持系統韌性、打破信息繭房的關鍵。
![]()
Abstract
Balancing efficiency and flexibility in collective decision-making is increasingly critical in modern societies characterized by rapid sociocultural and technological change. Recent research in cognitive neuroscience has proposed two contrasting computational algorithms for social learning: value shaping (VS) and decision biasing (DB). VS posits that others’ choices serve as “pseudo-rewards” that directly shape an observer’s valuations, leading them to prefer popular options even in the absence of outcome feedback. In contrast, DB confines the influence of social information to behavior—observers may imitate popular actions, but they update their valuations solely through personal experience. Although both algorithms facilitate individual adaptation under uncertainty, their interactive dynamics and group-level consequences remain largely unexplored. To address this gap, we developed computational models of VS and DB within a reinforcement learning framework and conducted agent-based simulations to examine collective performance in uncertain and dynamically changing environments. The results reveal a trade-off: VS enables rapid convergence and high efficiency in stable contexts, whereas DB promotes greater adaptability under environmental volatility. These differences are amplified in larger groups, particularly under strong majority influence. Importantly, evolutionary analyses indicate that both learning types can coexist stably, allowing their complementary strengths to enhance group performance. Together, our findings provide a computational and evolutionary account of how social learning can both enhance and impair collective intelligence—and suggest design principles for fostering resilient collective decision systems in human and AI societies facing rapid change.
![]()
請打分
這篇剛剛登上PNAS的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區分享您的深度見解。
前沿交流|歡迎加入認知神經科學前沿交流群!
![]()
核心圖表、方法細節、統計結果與討論見原文及其拓展數據。
分享人:飯哥
審核:PsyBrain 腦心前沿編輯部
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.