★置頂zzllrr小樂公眾號(主頁右上角)數(shù)學科普不迷路!
Denario是由熨斗研究所、劍橋大學、巴塞羅那自治大學等機構(gòu)的科學家共同開發(fā)的一款新工具,利用大語言模型來幫助科學家完成從提出新假設到總結(jié)研究結(jié)果等各項任務。該團隊希望 Denario 能夠使研究過程更快、更高效、更具跨學科性。
![]()
圖源:Lisa Feng / Simons Foundation
作者:Jane Beaufore(科學作家)2025-11-4
譯者:zzllrr小樂(數(shù)學科普公眾號)2025-11-5
人工智能正迅速成為許多領(lǐng)域的必備工具,科學領(lǐng)域也不例外。人工智能可以輔助科學過程的許多方面,例如 ChatGPT 等工具可以幫助可視化數(shù)據(jù)或撰寫摘要。但這些工具通常一次只能處理科學過程中的一個環(huán)節(jié)。
借助一款名為 Denario https://github.com/AstroPilot-AI/Denario 的新工具, 熨斗研究所的科學家們及其合作者推出了一種新型的“科學助手”:它能夠整合現(xiàn)有論文、提出新的研究問題、分析和解釋數(shù)據(jù),并撰寫論文。在 arXiv.org 上發(fā)表的一篇預印本 https://arxiv.org/abs/2510.26887 中,開發(fā)者們對這款新工具進行了概述。他們認為,Denario 有望加速和拓展科學進程,使科學家能夠?qū)⑵鋺糜谒麄冋J為最有幫助的科學流程的各個方面,并快速發(fā)現(xiàn)和測試新的研究方法。
“有時候,最有趣的是想法本身,因為它可能是一個尚未被探索過的新想法,” Francisco Villaescusa-Navarro(弗朗西斯科·維拉埃斯庫薩-納瓦羅) 說道,他是熨斗研究所計算天體物理中心的研究科學家,也是 Denario 的主要開發(fā)者之一。“有時候,它是一種從未應用于特定數(shù)據(jù)集的新方法。Denario 可以通過多種方式幫助我們拓展思維,并為我們指明新的方向。”
重要的是,該團隊強調(diào),Denario 并不能取代科學家。目前版本的 Denario 存在重大缺陷。只有大約十分之一的輸出結(jié)果能提供有價值的見解——而且在某些情況下,Denario 還會捏造數(shù)據(jù)。
“我們認為這個工具是輔助科研人員的,可以幫助他們簡化科研流程,而不是取代真正的科學家,”維拉埃斯庫薩-納瓦羅說道。他表示,人類仍然是科研過程中不可或缺的一部分,Denario的研究成果也必須經(jīng)過仔細審查。
Denario 項目由 Villaescusa-Navarro 牽頭,劍橋大學的 Boris Bolliet 博士和巴塞羅那自治大學的 Pablo Villanueva Domingo 博士也參與其中。完整的作者名單(他們的專業(yè)領(lǐng)域涵蓋天體物理學、生物學、生物物理學、化學、材料科學、神經(jīng)科學、數(shù)學、機器學習、量子物理學和哲學等)可在預印本中找到。
多層次人工智能助手
幾十年來,研究人員一直致力于將機器學習應用于科學領(lǐng)域。隨著 ChatGPT、Google Gemini 和 Anthropic 的 Claude 等大語言模型的最新進展,Denario 團隊看到了在研究過程的每個階段測試這些工具有效性的機會。
Bolliet解釋說,Denario 的關(guān)鍵在于它采用了許多人工智能“代理”(智能體 agent),每個代理負責不同的任務。Denario 可以完成從頭到尾的整個研究流程,但各個代理也可以單獨使用。“我們?yōu)?Denario 設計了模塊化架構(gòu),這樣用戶就可以選擇最適合他們研究的組件,無論是編碼、探索研究思路、總結(jié)結(jié)果還是其他任務,”Bolliet說道。
![]()
上圖展示了 Denario 的模塊(代理,智能體)如何協(xié)同工作以產(chǎn)生輸出。改編自 arXiv:2510.26887
要完整使用 Denario,科學家需要上傳數(shù)據(jù)集以及描述數(shù)據(jù)集和預期功能的說明文本。第一組智能體負責開發(fā)和完善處理數(shù)據(jù)集的最佳方案,最終生成研究項目構(gòu)想。接下來,第二組智能體會搜索相關(guān)主題的現(xiàn)有研究文獻,確保科學家的項目構(gòu)想具有創(chuàng)新性,并借鑒了前人的研究成果。
項目構(gòu)想完善后,方法論和規(guī)劃代理會提出數(shù)據(jù)分析方案。下一組代理隨后會執(zhí)行這些方案。這通過團隊開發(fā)的名為CMBAgenthttps://github.com/CMBAgents/cmbagent 的多代理系統(tǒng)實現(xiàn),該系統(tǒng)作為 Denario 的研究分析后端。這些代理負責編寫、調(diào)試和運行代碼,并對結(jié)果進行解釋。最后,編寫和審查模塊會生成并修改每個模塊的輸出和發(fā)現(xiàn)的摘要。
所有代理都協(xié)同工作,使之成為可能,”Villanueva Domingo說道,并強調(diào)科學家可以輕松檢查每個模塊的工作情況,如果需要,還可以單獨運行代理。
迄今為止,Denario 已在涵蓋天體物理學、生物學、生物物理學、生物醫(yī)學信息學、化學、材料科學、數(shù)學物理學、醫(yī)學、神經(jīng)科學和行星科學等 12 個不同學科的數(shù)據(jù)集上進行了數(shù)百次端到端測試。Villaescusa-Navarro 承認,其大部分輸出結(jié)果都不值得進一步研究。大多數(shù)結(jié)果在 Denario 生成結(jié)果的學科領(lǐng)域?qū)<以u審后被認為不適用。然而,約有 10% 的輸出結(jié)果提出了引人入勝的問題或發(fā)現(xiàn)。
![]()
“我認為 Denario 在嘗試各種想法方面尤其有用,”Villaescusa-Navarro 說道。“你可以查看每個輸出結(jié)果中的不同研究文檔,并判斷哪些內(nèi)容引人入勝,值得進一步探索。” 由于 Denario 能夠整合多個學科的信息,團隊希望它能夠發(fā)現(xiàn)一些即使是某個特定領(lǐng)域的專家科學家也未必會想到的新研究問題。
“Denario可以從其他領(lǐng)域汲取靈感,而這些領(lǐng)域可能是科學家不太熟悉甚至從未考慮過的,”Villanueva Domingo說。“這種跨學科性質(zhì)非常令人興奮。”
例如,Denario 在瘧疾方面的研究成果展現(xiàn)了他對瘧疾生物學的專家級知識,并針對尚未解答的研究問題提出了幾種創(chuàng)造性的方法。
針對一個天體物理數(shù)據(jù)集,Denario 應用了一種名為張量列(tensor trains)的數(shù)據(jù)壓縮數(shù)學方法。這種方法在量子物理學中應用廣泛,但在天體物理學領(lǐng)域卻鮮為人知。Denario 利用這些張量列以及機器學習技術(shù),追蹤了暗物質(zhì)暈(星系所在的微環(huán)境)的時間演化。Villaescusa-Navarro 表示,這是一種新方法,未來有望應用于宇宙學和天體物理學中的許多其他問題。
該團隊還預計,Denario 將幫助科學家們重新獲得他們最寶貴的資源:時間。
“我希望 Denario 能夠通過為研究人員提供工具來加速科學發(fā)展,幫助他們減少在諸如瀏覽 arXiv、格式化圖像、總結(jié)分析等瑣碎任務上花費的時間,從而有更多時間進行深入的創(chuàng)造性思考,”Bolliet 說道。
Denario的未來
在下一版本中,科學家們的目標是提高 Denario 的效率,并幫助它產(chǎn)生更高質(zhì)量的工作成果(包括自動識別和剔除低質(zhì)量的輸出)。
“或許在未來幾年內(nèi),我們可以開發(fā)出另一個代理,讓 Denario 可以用來分析想法并進行篩選,從而不斷改進好的想法,” Villanueva Domingo 說。
像 Denario 這樣的工具仍然面臨挑戰(zhàn)。從寫作角度來看,它生成的一些最終報告未能充分傳達結(jié)果中的不確定性。此外,盡管 Denario 能夠熟練地撰寫以往研究的內(nèi)容,但在引用以往研究和清晰闡述其方法方面卻存在不足。
Villaescusa-Navarro 也意識到其中存在技術(shù)和倫理方面的考量,包括 Denario 可能利用“幻覺”(生成式人工智能的產(chǎn)物,其中可能包含誤導性或虛假信息)的風險,以及版權(quán)和作者身份方面的問題。
“幻覺始終是一個令人擔憂的問題,”Francisco Villaescusa-Navarro說道。“我們使用一種名為 Perplexity 的模型來確保Denario引用的論文確實存在,但即便如此,幻覺仍然可能通過代碼混入其中。”例如,在工具生成虛假數(shù)據(jù)后,研究人員不得不添加一行文本,指示Denario不要捏造“虛擬數(shù)據(jù)”。
該團隊期待就如何更好地在科學研究中利用 Denario 及類似項目,以及如何防止?jié)撛诘臑E用展開公開討論。他們還強調(diào),Denario 的成功離不開學術(shù)界和產(chǎn)業(yè)界眾多合作者的鼎力支持。
“能與來自世界各地不同領(lǐng)域的眾多優(yōu)秀人才共事,真是太棒了,”Francisco Villaescusa-Navarro說道。“即使僅僅在熨斗研究所內(nèi)部,我們也收到了來自各個中心成員的意見。創(chuàng)建這樣一個社群真是令人贊嘆。”
參考資料
https://www.simonsfoundation.org/2025/11/04/meet-denario-an-ai-assistant-for-every-step-of-the-scientific-process/
https://github.com/AstroPilot-AI/Denario
https://arxiv.org/abs/2510.26887
https://github.com/CMBAgents/cmbagent
小樂數(shù)學科普近期文章
出版社和作家自薦通道
小樂數(shù)學科普薦書
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數(shù)學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉(zhuǎn)載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂加星★
數(shù)學科普不迷路!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.