一個新框架提出一種將科學(xué)論文轉(zhuǎn)化為人工智能代理的方法,可以查詢、測試和重用于新實驗。斯坦福大學(xué)的一篇預(yù)覽版論文中描述了這個名為Paper2Agent的系統(tǒng),題為“將研究論文重新想象為交互式和可靠的人工智能代理”。作者認為,包含計算方法的論文不應(yīng)保持靜態(tài)記錄。相反,它們應(yīng)該成為任何人都可以互動和驗證的活生生的工具。
![]()
幾十年來,可復(fù)用性一直是計算科學(xué)中一個持續(xù)存在的問題。許多研究現(xiàn)在都包括代碼庫的鏈接,但復(fù)制結(jié)果通常涉及處理過時的軟件、缺失的文檔和計算環(huán)境的差異。Paper2Agent旨在通過將研究論文的代碼自動轉(zhuǎn)換為可通過自然語言訪問的自包含交互式系統(tǒng)來消除這些障礙。科學(xué)家可以簡單地要求論文的“代理”進行分析或解釋方法,而不是閱讀論文并試圖手工重建其工作流程。
從論文代碼構(gòu)建代理
Paper2Agent首先定位與論文相關(guān)的代碼庫,并設(shè)置一個反映原始條件的干凈計算環(huán)境。然后,它識別代碼中的關(guān)鍵功能或工作流程,并將其轉(zhuǎn)化為具有定義輸入和輸出的離散“工具”。生成自動測試以確認這些工具再現(xiàn)的結(jié)果與原始出版物相同。一旦驗證,這些工具將通過模型上下文協(xié)議提供服務(wù),允許語言模型直接調(diào)用這些方法。
當(dāng)連接到人工智能前端(如Claude)時,結(jié)果是一個交互式系統(tǒng)。作者給出了一個用戶要求系統(tǒng)“將本文中的方法應(yīng)用于新生成的數(shù)據(jù)集”的例子,他們說,代理將自動運行管道,產(chǎn)生結(jié)果,并呈現(xiàn)可解釋的輸出。作者提出,通過抽象技術(shù)細節(jié),該代理降低了方法采用的障礙,確保了可重復(fù)性,并幫助研究人員專注于見解而不是實施。該框架旨在處理簡單的查詢和完整的分析工作流程,始終在與原始研究相匹配的驗證環(huán)境中進行。
![]()
在真實研究中測試框架
為了驗證這一想法,斯坦福大學(xué)的作者將Paper2Agent應(yīng)用于三篇生物信息學(xué)論文:AlphaGenome,一種解釋基因組變異的模型;TISSUE,一種空間轉(zhuǎn)錄組學(xué)方法;Scanpy,一個流行的單細胞RNA測序分析工具包。
該系統(tǒng)成功地復(fù)制了每篇論文的已發(fā)表結(jié)果,并可以處理超出原始教程的新穎查詢。在一個案例中,AlphaGenome試劑重新解釋了一種遺傳變異,并提出了與作者不同的致病基因。這一發(fā)現(xiàn)突顯了Paper2Agent不僅可以重現(xiàn)結(jié)果,還可以用相同的數(shù)據(jù)和方法重新審視科學(xué)主張。
根據(jù)該論文,使用標(biāo)準(zhǔn)計算資源,可以在幾個小時內(nèi)完成整個轉(zhuǎn)換過程。每個生成的代理都在一個具有自己的測試套件的受控環(huán)境中運行,這有助于防止LLM試圖從頭開始生成代碼時可能出現(xiàn)的模型幻覺。
在通往可復(fù)制科學(xué)的道路上仍然存在挑戰(zhàn)
Paper2Agent的承諾在于它如何將可重復(fù)性與可訪問性相結(jié)合。通過將科學(xué)方法嵌入交互式代理中,非專業(yè)程序員的研究人員仍然可以測試想法、驗證結(jié)果,并在已發(fā)表的工作基礎(chǔ)上進行構(gòu)建。對于計算生物學(xué)等領(lǐng)域,軟件復(fù)雜性可能會阻礙復(fù)制,這可以降低障礙,鼓勵更透明的科學(xué)。
作者承認,還有一些警告和挑戰(zhàn)需要應(yīng)對。許多研究代碼庫是混亂的或不完整的,在沒有人為監(jiān)督的情況下,自動提取可能會失敗。隨著依賴關(guān)系的發(fā)展,保持兼容性也需要積極的管理。作者承認,Paper2Agent仍然是一個概念驗證,跨學(xué)科擴展將取決于科學(xué)家如何一致地共享他們的數(shù)據(jù)和代碼。
![]()
Paper2Agent暗示了一個未來,閱讀科學(xué)論文可能意味著以新的方式與之互動。代替代碼庫和自述文件,未來的研究可能會包括能夠解釋、復(fù)制和擴展它們所描述的工作的交互式代理。這一愿景能否實現(xiàn)將取決于研究人員如何采用和維護這些系統(tǒng)。如果成功,這一想法可能有助于縮小計算研究中最大的差距之一:發(fā)表的內(nèi)容與實際可以復(fù)制的內(nèi)容之間的距離。
與 Ai 時代前沿合作,將大門向更多普通用戶敞開!無論你是對新技術(shù)充滿好奇心的愛好者,還是希望提升自己技能的職場人士,這里都有適合你的課程和資源。歡迎掃碼加入我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.