![]()
導(dǎo)語
為什么許多社交智能體“寫得通順,卻一眼假”?問題往往不在語言能力,而在它們既不像某個穩(wěn)定的個體,也未真正嵌入社會關(guān)系網(wǎng)絡(luò)。北京通用人工智能研究院聯(lián)合北京大學(xué)研究提出自演化社交智能體 EvoBot,通過生成器與檢測器的對抗博弈,讓模型在社會反饋中持續(xù)升級,逐步學(xué)會更真實的個性化表達與社會化互動。
關(guān)鍵詞:社交智能體、擬人化生成、個性化、社會化、對抗學(xué)習(xí)、自演化
孔繁奇、封雪丨作者
![]()
論文題目:Enhancing LLM-Based Social Bot via an Adversarial Learning Framework 論文鏈接:https://aclanthology.org/2025.emnlp-main.1185/ 發(fā)表時間:2025年11月4日 論文來源: EMNLP 2025
社交平臺上,一條“像人”的動態(tài)不只取決于語法和知識,更取決于兩個更隱蔽的因素:它是否貼合某個具體個體的穩(wěn)定風(fēng)格(個性化),以及它是否會被周圍社交鄰居持續(xù)塑造(社會化)。不少大模型“寫得對”,卻仍然“一眼假”,問題往往不在句子通不通順,而在它不像某個具體的人在某個具體的圈子里說話。
北京通用人工智能研究院聯(lián)合北京大學(xué)提出了自演化社交智能體 EvoBot,在“生成器-檢測器”的對抗博弈框架下,把擬人化生成變成一個能自動升級難度的訓(xùn)練任務(wù),使模型在社交網(wǎng)絡(luò)中持續(xù)迭代。相關(guān)成果已被自然語言處理頂會 EMNLP 2025 接收并作 Oral 展示。
問題:社交智能體為什么常常“一眼假”?
當(dāng)前社交智能體的一個核心瓶頸是“既個性化又社會化”。個性化關(guān)乎個體差異,同樣是表達贊同,有人簡短直接,有人愛用反問,有人習(xí)慣加表情或話題標(biāo)簽。社會化關(guān)乎鄰域影響,好友關(guān)系、社區(qū)氛圍與熱點事件會持續(xù)改變一個人的發(fā)言內(nèi)容與立場走向。只學(xué)到“通用寫作能力”的大模型,往往會留下兩類穩(wěn)定的可識別痕跡。其一是風(fēng)格過于平均,不像某個穩(wěn)定個體的長期表達分布;其二是生成內(nèi)容缺少社會語境,看起來像“單機寫作”,而不是在關(guān)系網(wǎng)絡(luò)里互動。針對這兩個問題,本文提出了一個兩階段訓(xùn)練框架優(yōu)化模型,先讓模型更像某個具體的人,再讓模型在“社會反饋”的壓力下持續(xù)修正自己的表達策略。
方法:把擬人化訓(xùn)練變成“矛與盾”的持續(xù)博弈
EvoBot的關(guān)鍵設(shè)計,是把“像人”變成一場持續(xù)升級的對抗。框架里,生成器(EvoBot)負責(zé)模仿人類發(fā)布社交動態(tài),檢測器(Detector)負責(zé)區(qū)分“真實人類內(nèi)容”和“AI生成內(nèi)容”。具體而言,EvoBot的學(xué)習(xí)分為兩個階段:
第一階段:監(jiān)督微調(diào)(SFT),注入個體“人格”。在此階段,本文利用真實人類用戶數(shù)據(jù)對基礎(chǔ)大模型(Llama2-7B)進行監(jiān)督微調(diào)。訓(xùn)練任務(wù)是讓模型初步學(xué)習(xí)該社區(qū)的表達方式、語言習(xí)慣等。通過這一過程,EvoBot初步具備了模仿不同個體、生成個性化內(nèi)容的能力,這構(gòu)成了每個智能體的“初始人格”。
第二階段:對抗性學(xué)習(xí),驅(qū)動動態(tài)“演化”。本文設(shè)計了一個由EvoBot(生成器)和基于關(guān)系圖卷積神經(jīng)網(wǎng)絡(luò)(R-GCN)[2] 的Detector(檢測器)構(gòu)成的對抗性學(xué)習(xí)閉環(huán)。與傳統(tǒng)方法不同,本文的生成器和檢測器是相互適應(yīng)、協(xié)同演化的。在每一輪迭代中,EvoBot生成一批新的“擬人”內(nèi)容,而檢測器的任務(wù)就是從這些內(nèi)容和真實人類內(nèi)容中,把AI的“仿冒品”揪出來。如果EvoBot生成的內(nèi)容成功“騙過”了檢測器,就會被標(biāo)記為“更優(yōu)”樣本,指導(dǎo)模型朝這個方向優(yōu)化;反之,則被標(biāo)記為“較差”樣本,從而構(gòu)造出偏好數(shù)據(jù)對,通過直接偏好優(yōu)化(DPO)[3] 技術(shù)驅(qū)動EvoBot學(xué)習(xí)。最關(guān)鍵的是,檢測器自身也在不斷升級。每一輪博弈后,檢測器會將EvoBot的“更優(yōu)”樣本集加入自己的錯題集進行再訓(xùn)練,提升識別能力。這就為EvoBot創(chuàng)造了一個任務(wù)難度持續(xù)提升的學(xué)習(xí)環(huán)境,迫使其不斷學(xué)習(xí)和模仿更高級、更難以分辨的人類行為模式,最終形成一個能力持續(xù)增強的良性循環(huán)。
![]()
圖1: EvoBot框架概覽
實驗:個體層更像人,群體層更像社會
EvoBot不是在“干凈、單一”的文本集合里訓(xùn)練,而是直接從真實社交網(wǎng)絡(luò)中抽取結(jié)構(gòu)與語境。研究使用 TwiBot-22 數(shù)據(jù)集 [4],包含約100萬用戶、近1億條推文以及好友關(guān)系等圖結(jié)構(gòu)信息。為了在可控成本下保留網(wǎng)絡(luò)結(jié)構(gòu)差異,研究采用 Louvain 社區(qū)發(fā)現(xiàn)方法切分出12個高度連接且具有代表性的社區(qū),這些社區(qū)在拓撲形態(tài)(星形、網(wǎng)狀等)、語言(英語、阿拉伯語、日語、土耳其語等)與話題上都呈現(xiàn)明顯差異。這種異質(zhì)性為本文訓(xùn)練和評估EvoBot在復(fù)雜、多元環(huán)境下的適應(yīng)性和類人程度供了堅實的基礎(chǔ)。
![]()
圖2: 12個社區(qū)中用戶連接關(guān)系的可視化
![]()
表1: 社區(qū)數(shù)據(jù)統(tǒng)計,包括用戶與機器人的數(shù)量、邊的數(shù)量、推文數(shù)量和代表語言
具體地,本文在這12個社區(qū)上,從個性化和社會化兩個角度系統(tǒng)地評估了EvoBot。
個性化評估
首先,本文分析了EvoBot與檢測器在4輪對抗訓(xùn)練中的“共同成長”過程。結(jié)果清晰地展示了兩者間的協(xié)同進化。隨著迭代的進行,EvoBot規(guī)避檢測的能力越來越強,意味著它生成的內(nèi)容越來越類人(如圖3中各行所示)。與此同時,檢測器的識別性能也在不斷提升(如圖3中各列所示)。
![]()
圖3:Detector分類性能。左:F1-score;右:Accuracy。行表示檢測器的版本;列表示EvoBot的版本。色塊上數(shù)值越大表示EvoBot被識別出來的概率越高。
本文對比了最終版的EvoBot與六種基線模型(包括原始Bot、傳統(tǒng)GAN、Llama2-7b、GPT-4o-mini,以及兩個消融版本)。在兩種不同架構(gòu)(RGCN和GAT)的檢測器下,EvoBot均取得了最低的被識別率,展示了其最強的擬人化生成能力。消融實驗也證明,監(jiān)督微調(diào)(SFT)和對抗學(xué)習(xí)(ADV)兩個階段對于最終的優(yōu)異性能缺一不可。同時,進一步分析表明EvoBot在生成內(nèi)容多樣性和表達風(fēng)格上都達到了很高的類人水平,這說明EvoBot不僅能生成類人的社交文字而且對人類社交方式有更深層次的理解。
![]()
表2: RGCN和GAT檢測器下不同生成器的Accuracy和F1-Score。數(shù)值越小,說明生成器逃避檢測的能力越強。
社會化評估1:群體觀點模擬
實驗將EvoBot置于多智能體模擬環(huán)境中,復(fù)現(xiàn)了真實世界中關(guān)于“COVID-19”和“俄烏沖突”兩大事件的觀點演變過程。實驗結(jié)果表明,相比于傳統(tǒng)的基于規(guī)則的智能體模型(如BC和Lorenz模型)以及其他LLM基線,無論是在群體平均觀點還是觀點多樣性上,EvoBot都最接近真實數(shù)據(jù),成功捕捉到了現(xiàn)實群體中復(fù)雜動態(tài)的觀點變化。這些對比指標(biāo)均是在事件發(fā)生的一段時間內(nèi)的統(tǒng)計結(jié)果,充分證明了EvoBot的優(yōu)勢在于精準(zhǔn)捕捉了觀點的動態(tài)演變過程,而不僅是擬合某個靜態(tài)的結(jié)果。
![]()
表3: 群體觀點的模擬結(jié)果
社會化評估2:信息傳播模擬
本文還模擬了關(guān)于“超級碗賽事”這一熱點新聞在社交網(wǎng)絡(luò)中的傳播過程。結(jié)果顯示,相比于基線模型,EvoBot驅(qū)動的信息傳播曲線更貼近真實世界的傳播模式,即“初期快速爆發(fā),隨后逐漸放緩”的典型規(guī)律。這些群體層面的涌現(xiàn)現(xiàn)象,強有力地證明了EvoBot框架在模擬復(fù)雜社會動態(tài)方面的有效性和先進性。
![]()
圖4: 隨著時間的推移,討論洛杉磯公羊隊超級碗奪冠的累積用戶數(shù)量變化曲線
總結(jié)展望:為什么“自演化”很重要?
在“生成器-檢測器”的對抗學(xué)習(xí)框架下,基于大模型的社交智能體EvoBot持續(xù)提升能力,在個性化內(nèi)容生成和宏觀社會現(xiàn)象模擬方面均表現(xiàn)出色,驗證了該框架的有效性。
EvoBot所展示的這種自動化的、無需持續(xù)外部干預(yù)的“自演化”學(xué)習(xí)框架,為各行業(yè)構(gòu)建更智能、更具適應(yīng)性的AI智能體提供了一種新的思路和啟發(fā)。這種通過對抗博弈創(chuàng)造動態(tài)學(xué)習(xí)環(huán)境、驅(qū)動智能體持續(xù)迭代的方法,為解決“如何讓智能體在部署后仍能自主學(xué)習(xí)和進化”這一核心難題提供了寶貴的探索,對未來開發(fā)更穩(wěn)健、更自主的人工智能系統(tǒng)具有一定的借鑒意義。
參考文獻
[1] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. (2025, November). Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (pp. 23246-23271).
[2] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.
[3] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 (2023): 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.
[4] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.
群體智能讀書會
如果你對這些反直覺但極有用的現(xiàn)象感興趣——從蟻群搭橋、魚群同步、到無人機集群表演、集群機器人協(xié)作、群智優(yōu)化與多智能體系統(tǒng)、網(wǎng)絡(luò)輿論建模研究等——歡迎加入「群體智能」讀書會:我們用動物—人類—機器三條線,希望把群體智能的涌現(xiàn)這件事講清楚、講透徹;用物理學(xué)、數(shù)理邏輯、多主體建模、計算傳播等多學(xué)科視角,去追問同一個核心:集群何以比個體更聰明?群體智能又在何時涌現(xiàn)?
集智俱樂部聯(lián)合北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院韓戰(zhàn)鋼教授、暨南大學(xué)計算傳播研究中心趙甜芳副教授、新疆大學(xué)物理科學(xué)與技術(shù)學(xué)院玉素甫·艾比布拉副教授等來自11所高校的學(xué)者,共同發(fā)起本次,嘗試用一條普適的線索,把自然界的鳥群蟻群、人類社會的集群行為、以及人工智能時代的多智能體與群智優(yōu)化,放在同一張地圖上重新理解。讀書會自2026年1月17日開始,安排在每周六下午 14:00–16:00,歡迎所有對群體智能如何涌現(xiàn)、如何被理解、以及如何被設(shè)計,感興趣的朋友一起加入:帶著問題來,帶著更有趣的問題去。
![]()
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.