<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      首次!AI智能體破解「納什均衡」,大模型學會博弈論|Cell子刊

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】在經濟學和博弈論的世界里,找到「納什均衡」往往意味著找到了復雜局勢下的最優解。多所頂尖高校的研究人員開發出了一位名為PrimeNash的「AI數學家」,不僅能像人類專家一樣推導公式,還能解決許多連傳統算法都束手無策的復雜博弈難題,成果已發表在Cell Press旗下的交叉學科期刊Nexus上。

      納什均衡作為博弈論中最核心的解概念,廣泛應用于經濟學、社會科學及工程領域,用于預測多方策略互動下的穩定結果。然而,在現實世界中,許多博弈場景具有高維度策略空間、跨期依賴關系以及不連續、非凸的收益函數。在這種復雜的現實博弈中推導解析形式的納什均衡,面臨著巨大的計算挑戰。

      現有的求解方法各有局限性:解析法依賴于不動點定理,雖然精確但難以擴展至高維或復雜動態場景;數值方法(如蒙特卡洛模擬)雖然靈活,但往往缺乏嚴謹的收斂保證,且其結果如同「黑盒」般難以解釋;而基于機器學習的方法(如強化學習)雖擅長處理高維問題,卻常受困于參數敏感性與泛化能力的不足。因此,學術界與工業界亟需一種兼具可擴展性、透明度與數學嚴謹性的全新計算范式。隨著大語言模型的崛起,其強大的邏輯推理與代碼生成能力為自動化博弈分析開啟了新紀元。

      近日,香港中文大學(深圳)趙俊華教授、黃建偉教授與葉立新教授團隊,聯合南洋理工大學、耶魯大學、美國西北大學等多所頂尖高校的研究人員,在Cell Press旗下的交叉學科期刊《Nexus》上發表了一項重要研究成果。


      論文鏈接:doi:10.1016/j.ynexs.2025.100107

      該團隊開發了一個名為PrimeNash的大語言模型智能體框架,這是首個能夠自動推導納什均衡閉式解析解并生成機器可驗證證明的系統。

      該研究展示了AI智能體不僅能夠模擬人類專家的邏輯推理,還能有效解決傳統算法難以處理的高維、非凸及動態博弈難題。

      三階段閉環框架

      整體架構與模塊交互

      如圖1所示,PrimeNash框架模擬了人類數學家的科研路徑,將求解過程解構為三個由LLM驅動的核心模塊:策略生成模塊(SGM)、策略評估模塊(SEM)和均衡證明模塊(EPM)。


      圖1 PrimeNash模塊交互概述框圖

      工作流始于結構化的提示詞,用于定義博弈的玩家、策略空間與規則。

      SGM負責生成多樣化的候選策略,SEM基于博弈論原理對策略進行多維度打分與篩選,EPM則執行嚴格的符號推導與驗證。若驗證未通過,系統會觸發反饋機制,指導前序模塊進行自我修正,直至找到通過嚴格數學檢驗的閉式解。

      策略生成:多智能體并行與提示增強推理

      為了克服單一視角的局限,SGM采用了多智能體并行的策略。如圖2所示,多個策略生成智能體同時工作,以探索廣闊的策略空間。

      為了提升生成質量,PrimeNash引入了提示增強推理技術。系統會自動從預設數據庫中檢索相似博弈的解題模版(如博弈論中的相關定理、最佳響應函數等),輔助智能體更好地理解博弈結構。

      此外,智能體并非僅依靠內部推演,它們被授權調用Python等外部工具執行復雜計算,并結合反思機制對生成結果進行自我審查與修正。這一過程確保了輸出的策略在邏輯與數值上具備初步的合理性,為后續評估奠定了基礎。


      圖2 策略生成模塊(SGM)智能體設計、工作流以及提示增強架構

      策略評估與均衡證明:從候選到嚴謹驗證

      如圖3所示,SEM模塊充當了嚴格篩選器的角色。該模塊包含評分智能體和評估智能體。評分智能體基于預定義的博弈論指標(如策略一致性、穩定性等)對候選策略進行打分,評估智能體則綜合得分最高的策略,將其精煉為均衡候選者。

      隨后,EPM模塊接手進行最終的數學驗證。EPM不依賴模糊估算,而是執行嚴格的符號推導,應用最佳響應定理或卡羅什-庫恩-塔克(KKT)條件來驗證納什均衡條件。對于動態博弈,EPM還會驗證子博弈完美均衡等更高級的概念。一旦證明失敗,具體的失敗原因(如未滿足一階條件)將被精準反饋給上游模塊,驅動系統在下一輪迭代中逼近最終結果。這種設計保證了結果的可解釋性與可審計性。


      圖3 策略評估(SEM)和均衡證明(EPM)模塊架構

      詳細結果

      經典博弈驗證

      為了驗證系統的魯棒性,研究團隊選取了7個涵蓋不同動態特征、信息結構與均衡類型的經典博弈問題作為「試金石」。

      如表1所示,實驗結果令人振奮:PrimeNash 成功求解了所有的靜態博弈;在動態博弈方面,在設定極高標準(即必須獲得符號閉式解且通過自動均衡校驗)的前提下,成功率依然達到了70%。這證明了 PrimeNash 并非只能處理特定問題,而是具備了通用的博弈求解能力。


      表1 典型博弈問題求解匯總

      此外,如圖4所示,論文以雙寡頭Stackelberg博弈為例,展示框架如何通過標準化提示詞把玩家、行動、收益與規則轉化為機器可處理的格式,并生成均衡表達式、求解步驟與對應Python代碼。


      圖4 雙寡頭Stackelberg博弈求解架構

      碳市場動態博弈

      PrimeNash的真正威力在于解決現實世界的復雜難題。論文以碳排放權交易市場為例,展示了其在復雜動態博弈中的應用潛力。研究構建了一個包含四個季度交易期的動態博弈模型,利用逆向歸納法(Backward Induction) 求解。在此案例中,PrimeNash產出了該領域首個被嚴格證明的碳市場閉式解析解。如圖5所示,模型不僅推導出了公式,更復現了真實的某些市場現象:

      • 期末價格波動: 模擬顯示,碳價在第1-3期維持低位(約18.65 CNY/t),卻在第4期履約截止前急劇飆升至74.71 CNY/t。這種「翹尾效應」與現實市場中企業的履約焦慮高度一致。

      • 大型國企的市場影響力: 分析揭示了大型國有企業如何利用其市場地位調節供需,從而影響價格走勢。

      • 政策杠桿R-value: 論文深入探討了政策參數 R-value(跨期持有激勵)的作用。當 R-value 較高時,企業傾向于囤積配額以期未來升值,導致當期供給收縮、價格上漲;反之則會釋放流動性。

      以上量化洞見為政策制定者提供了有力的工具,通過調整參數或監管臨近截止期的交易,可以有效平抑市場投機,維持價格穩定。


      圖5 碳市場博弈問題的動態均衡特征

      論文總結

      PrimeNash作為首個基于LLM智能體的納什均衡解析求解框架,成功建立了「策略生成—收益評估—均衡證明」的模塊化閉環,將閉式Nash均衡推導從依賴專家的手工工作轉化為可復現、可審計的計算流程。

      該框架通過多智能體推理、符號代碼執行與形式化驗證,能夠有效處理高維策略、跨期遞歸以及不連續、非凸收益等難題。在七類經典模型的測試中,PrimeNash實現了對靜態博弈的全面求解與對動態博弈的高比例成功求解。

      特別是在碳市場競價博弈案例中,PrimeNash不僅給出了可證明的閉式均衡解,還能復現履約期末波動等關鍵現象,并將R value等機制參數與市場穩定性建立了可解釋的聯系,為市場設計與氣候政策分析提供了一種透明、可檢驗的量化工具,標志著AI驅動的科學發現在博弈論與經濟學領域邁出了重要一步。

      研究團隊介紹

      論文第一作者為南洋理工大學柳文軒博士,香港中文大學(深圳)趙俊華教授為本文的通訊作者,南洋理工大學周茜緣、悉尼大學王馨蕾和香港中文大學(深圳)程裕恒是本文共同第一作者,香港中文大學(深圳)黃建偉教授是本文共同通訊作者。本文其它合作者包括香港中文大學(深圳)葉立新教授、美國西北大學Randall Berry教授及耶魯大學Leandros Tassiulas教授。

      趙俊華教授領銜的人工智能-能源-經濟交叉學科創新團隊致力于解決大模型智能體算法、能源系統、電力市場、碳市場領域的前沿基礎性科學問題和關鍵技術,旨在通過學科交叉實現從主體到系統層面的整體解決方案,推動相關領域取得突破性進展。近年來在Joule、Nature Communications、Scientific Data、Nexus等國際期刊上發表系列多學科交叉論文。

      參考資料:

      doi:10.1016/j.ynexs.2025.100107


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      就在剛剛,16家公司出現重大利好消息,有沒有與你相關的個股?

      就在剛剛,16家公司出現重大利好消息,有沒有與你相關的個股?

      股市皆大事
      2026-02-22 09:16:04
      加蘭:被交易至快船后很興奮;幾乎能99%的時間都持球

      加蘭:被交易至快船后很興奮;幾乎能99%的時間都持球

      懂球帝
      2026-02-21 15:38:34
      1年倒閉300萬家!60%活不過12個月,昔日創業首選生意也撐不住了

      1年倒閉300萬家!60%活不過12個月,昔日創業首選生意也撐不住了

      品牌觀察官
      2025-12-31 19:49:35
      落差太大!離開央視鏡頭原來她們長這樣,李梓萌海霞就像變了個人

      落差太大!離開央視鏡頭原來她們長這樣,李梓萌海霞就像變了個人

      陳意小可愛
      2026-02-21 19:36:16
      婆婆用我的副卡刷30萬請客,還打電話來炫耀,她不知道副卡已注銷

      婆婆用我的副卡刷30萬請客,還打電話來炫耀,她不知道副卡已注銷

      云端小院
      2026-02-22 09:17:59
      70歲大學教授向家中保姆表白被拒,保姆:你不是愛我,只是想省錢

      70歲大學教授向家中保姆表白被拒,保姆:你不是愛我,只是想省錢

      熱心柚子姐姐
      2026-02-21 12:36:12
      哈爾濱冰雪大世界突然公告:即日起正式閉園!可全額退款

      哈爾濱冰雪大世界突然公告:即日起正式閉園!可全額退款

      每日經濟新聞
      2026-02-21 21:38:12
      得知美國向日本扔了原子彈,全延安都在慶祝,毛主席卻氣得拍了桌子:這是原則錯誤!

      得知美國向日本扔了原子彈,全延安都在慶祝,毛主席卻氣得拍了桌子:這是原則錯誤!

      史海殘云
      2025-12-27 19:15:21
      五臺山突發大火:持續8小時,瘆人畫面流出,官方回應傷亡情況

      五臺山突發大火:持續8小時,瘆人畫面流出,官方回應傷亡情況

      博士觀察
      2026-02-22 13:00:18
      大年初六凌晨,金牌榜有變!1人奪6金,日本力壓中國鎖定亞洲第一

      大年初六凌晨,金牌榜有變!1人奪6金,日本力壓中國鎖定亞洲第一

      侃球熊弟
      2026-02-22 05:44:09
      周啟豪擊敗阿魯納,張本美和擊敗米特蘭姆,都是因為實力強

      周啟豪擊敗阿魯納,張本美和擊敗米特蘭姆,都是因為實力強

      子水體娛
      2026-02-22 12:26:15
      揭幕戰2次超巨失誤!邁阿密門將送空門,遭對手戲耍,德保羅挨批

      揭幕戰2次超巨失誤!邁阿密門將送空門,遭對手戲耍,德保羅挨批

      奧拜爾
      2026-02-22 12:31:59
      monies巴黎旗艦店員工:王菲同款水滴耳環官網和巴黎門店庫存已空,她去年在春晚戴的“蝦片耳環”也沒貨了

      monies巴黎旗艦店員工:王菲同款水滴耳環官網和巴黎門店庫存已空,她去年在春晚戴的“蝦片耳環”也沒貨了

      大風新聞
      2026-02-22 12:06:17
      木耳不要直接用水泡,相當于吃蟲卵,大廚教你正確做法,太實用了

      木耳不要直接用水泡,相當于吃蟲卵,大廚教你正確做法,太實用了

      妙招酷
      2026-02-19 23:55:20
      “延遲滿足”更易成功?那是騙你的

      “延遲滿足”更易成功?那是騙你的

      老端的觀點
      2026-02-19 21:50:56
      年初二,53歲董卿回江蘇親戚家吃飯,穿時尚馬甲,皮膚白氣質好

      年初二,53歲董卿回江蘇親戚家吃飯,穿時尚馬甲,皮膚白氣質好

      清衣渡a
      2026-02-22 09:52:53
      演員姚晨發文稱過年被媽媽“罵”了三天!網友:家家都一樣,我扔,我媽在后面撿

      演員姚晨發文稱過年被媽媽“罵”了三天!網友:家家都一樣,我扔,我媽在后面撿

      環球網資訊
      2026-02-21 17:27:08
      157-103!掘金打瘋了,狂刷兩項隊史紀錄,開拓者淪為背景板

      157-103!掘金打瘋了,狂刷兩項隊史紀錄,開拓者淪為背景板

      大眼瞄世界
      2026-02-22 00:06:02
      壓力給滿!20歲新人發力曼城2-1紐卡,瓜帥笑看北倫敦德比大戰

      壓力給滿!20歲新人發力曼城2-1紐卡,瓜帥笑看北倫敦德比大戰

      里芃芃體育
      2026-02-22 11:30:06
      反常識?技術門檻很低的增程技術,為什么越賣越貴?

      反常識?技術門檻很低的增程技術,為什么越賣越貴?

      少數派報告Report
      2026-02-21 07:58:37
      2026-02-22 14:03:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14570文章數 66631關注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發射超過10000顆衛星

      頭條要聞

      monies巴黎旗艦店員工:王菲同款水滴耳環庫存已空

      頭條要聞

      monies巴黎旗艦店員工:王菲同款水滴耳環庫存已空

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      裴世矩養侄為刃 看懂兩次放行裴行儼!

      財經要聞

      特朗普新加征關稅稅率從10%提升至15%

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      健康
      游戲
      教育
      旅游
      家居

      轉頭就暈的耳石癥,能開車上班嗎?

      魔獸世界時光服:P2階段最值得入手的專業極品,你穿上去了嗎?

      教育要聞

      “這種女兒,生出來當排毒了!”女孩對父親滿口臟話,他卻不吭聲

      旅游要聞

      7名中國游客溺亡于貝加爾湖:當地南北線已全面關停,涉事司機被控兩項罪名

      家居要聞

      本真棲居 愛暖伴流年

      無障礙瀏覽 進入關懷版