Denario是由熨斗研究所、劍橋大學、巴塞羅那自治大學等機構的科學家共同開發的一款新工具,利用大語言模型來幫助科學家完成從提出新假設到總結研究結果等各項任務。該團隊希望 Denario 能夠使研究過程更快、更高效、更具跨學科性。
![]()
圖源:Lisa Feng / Simons Foundation
作者:Jane Beaufore(科學作家)2025-11-4
譯者:zzllrr小樂(數學科普公眾號)2025-11-5
人工智能正迅速成為許多領域的必備工具,科學領域也不例外。人工智能可以輔助科學過程的許多方面,例如 ChatGPT 等工具可以幫助可視化數據或撰寫摘要。但這些工具通常一次只能處理科學過程中的一個環節。
借助一款名為 Denario https://github.com/AstroPilot-AI/Denario 的新工具, 熨斗研究所的科學家們及其合作者推出了一種新型的“科學助手”:它能夠整合現有論文、提出新的研究問題、分析和解釋數據,并撰寫論文。在 arXiv.org 上發表的一篇預印本 https://arxiv.org/abs/2510.26887 中,開發者們對這款新工具進行了概述。他們認為,Denario 有望加速和拓展科學進程,使科學家能夠將其應用于他們認為最有幫助的科學流程的各個方面,并快速發現和測試新的研究方法。
“有時候,最有趣的是想法本身,因為它可能是一個尚未被探索過的新想法,” Francisco Villaescusa-Navarro(弗朗西斯科·維拉埃斯庫薩-納瓦羅) 說道,他是熨斗研究所計算天體物理中心的研究科學家,也是 Denario 的主要開發者之一。“有時候,它是一種從未應用于特定數據集的新方法。Denario 可以通過多種方式幫助我們拓展思維,并為我們指明新的方向。”
重要的是,該團隊強調,Denario 并不能取代科學家。目前版本的 Denario 存在重大缺陷。只有大約十分之一的輸出結果能提供有價值的見解——而且在某些情況下,Denario 還會捏造數據。
“我們認為這個工具是輔助科研人員的,可以幫助他們簡化科研流程,而不是取代真正的科學家,”維拉埃斯庫薩-納瓦羅說道。他表示,人類仍然是科研過程中不可或缺的一部分,Denario的研究成果也必須經過仔細審查。
Denario 項目由 Villaescusa-Navarro 牽頭,劍橋大學的 Boris Bolliet 博士和巴塞羅那自治大學的 Pablo Villanueva Domingo 博士也參與其中。完整的作者名單(他們的專業領域涵蓋天體物理學、生物學、生物物理學、化學、材料科學、神經科學、數學、機器學習、量子物理學和哲學等)可在預印本中找到。
多層次人工智能助手
幾十年來,研究人員一直致力于將機器學習應用于科學領域。隨著 ChatGPT、Google Gemini 和 Anthropic 的 Claude 等大語言模型的最新進展,Denario 團隊看到了在研究過程的每個階段測試這些工具有效性的機會。
Bolliet解釋說,Denario 的關鍵在于它采用了許多人工智能“代理”(智能體 agent),每個代理負責不同的任務。Denario 可以完成從頭到尾的整個研究流程,但各個代理也可以單獨使用。“我們為 Denario 設計了模塊化架構,這樣用戶就可以選擇最適合他們研究的組件,無論是編碼、探索研究思路、總結結果還是其他任務,”Bolliet說道。
![]()
上圖展示了 Denario 的模塊(代理,智能體)如何協同工作以產生輸出。改編自 arXiv:2510.26887
要完整使用 Denario,科學家需要上傳數據集以及描述數據集和預期功能的說明文本。第一組智能體負責開發和完善處理數據集的最佳方案,最終生成研究項目構想。接下來,第二組智能體會搜索相關主題的現有研究文獻,確保科學家的項目構想具有創新性,并借鑒了前人的研究成果。
項目構想完善后,方法論和規劃代理會提出數據分析方案。下一組代理隨后會執行這些方案。這通過團隊開發的名為CMBAgenthttps://github.com/CMBAgents/cmbagent 的多代理系統實現,該系統作為 Denario 的研究分析后端。這些代理負責編寫、調試和運行代碼,并對結果進行解釋。最后,編寫和審查模塊會生成并修改每個模塊的輸出和發現的摘要。
所有代理都協同工作,使之成為可能,”Villanueva Domingo說道,并強調科學家可以輕松檢查每個模塊的工作情況,如果需要,還可以單獨運行代理。
迄今為止,Denario 已在涵蓋天體物理學、生物學、生物物理學、生物醫學信息學、化學、材料科學、數學物理學、醫學、神經科學和行星科學等 12 個不同學科的數據集上進行了數百次端到端測試。Villaescusa-Navarro 承認,其大部分輸出結果都不值得進一步研究。大多數結果在 Denario 生成結果的學科領域專家評審后被認為不適用。然而,約有 10% 的輸出結果提出了引人入勝的問題或發現。
![]()
“我認為 Denario 在嘗試各種想法方面尤其有用,”Villaescusa-Navarro 說道。“你可以查看每個輸出結果中的不同研究文檔,并判斷哪些內容引人入勝,值得進一步探索。” 由于 Denario 能夠整合多個學科的信息,團隊希望它能夠發現一些即使是某個特定領域的專家科學家也未必會想到的新研究問題。
“Denario可以從其他領域汲取靈感,而這些領域可能是科學家不太熟悉甚至從未考慮過的,”Villanueva Domingo說。“這種跨學科性質非常令人興奮。”
例如,Denario 在瘧疾方面的研究成果展現了他對瘧疾生物學的專家級知識,并針對尚未解答的研究問題提出了幾種創造性的方法。
針對一個天體物理數據集,Denario 應用了一種名為張量列(tensor trains)的數據壓縮數學方法。這種方法在量子物理學中應用廣泛,但在天體物理學領域卻鮮為人知。Denario 利用這些張量列以及機器學習技術,追蹤了暗物質暈(星系所在的微環境)的時間演化。Villaescusa-Navarro 表示,這是一種新方法,未來有望應用于宇宙學和天體物理學中的許多其他問題。
該團隊還預計,Denario 將幫助科學家們重新獲得他們最寶貴的資源:時間。
“我希望 Denario 能夠通過為研究人員提供工具來加速科學發展,幫助他們減少在諸如瀏覽 arXiv、格式化圖像、總結分析等瑣碎任務上花費的時間,從而有更多時間進行深入的創造性思考,”Bolliet 說道。
Denario的未來
在下一版本中,科學家們的目標是提高 Denario 的效率,并幫助它產生更高質量的工作成果(包括自動識別和剔除低質量的輸出)。
“或許在未來幾年內,我們可以開發出另一個代理,讓 Denario 可以用來分析想法并進行篩選,從而不斷改進好的想法,” Villanueva Domingo 說。
像 Denario 這樣的工具仍然面臨挑戰。從寫作角度來看,它生成的一些最終報告未能充分傳達結果中的不確定性。此外,盡管 Denario 能夠熟練地撰寫以往研究的內容,但在引用以往研究和清晰闡述其方法方面卻存在不足。
Villaescusa-Navarro 也意識到其中存在技術和倫理方面的考量,包括 Denario 可能利用“幻覺”(生成式人工智能的產物,其中可能包含誤導性或虛假信息)的風險,以及版權和作者身份方面的問題。
“幻覺始終是一個令人擔憂的問題,”Francisco Villaescusa-Navarro說道。“我們使用一種名為 Perplexity 的模型來確保Denario引用的論文確實存在,但即便如此,幻覺仍然可能通過代碼混入其中。”例如,在工具生成虛假數據后,研究人員不得不添加一行文本,指示Denario不要捏造“虛擬數據”。
該團隊期待就如何更好地在科學研究中利用 Denario 及類似項目,以及如何防止潛在的濫用展開公開討論。他們還強調,Denario 的成功離不開學術界和產業界眾多合作者的鼎力支持。
“能與來自世界各地不同領域的眾多優秀人才共事,真是太棒了,”Francisco Villaescusa-Navarro說道。“即使僅僅在熨斗研究所內部,我們也收到了來自各個中心成員的意見。創建這樣一個社群真是令人贊嘆。”
參考資料
https://www.simonsfoundation.org/2025/11/04/meet-denario-an-ai-assistant-for-every-step-of-the-scientific-process/
https://github.com/AstroPilot-AI/Denario
https://arxiv.org/abs/2510.26887
https://github.com/CMBAgents/cmbagent
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.