我搭建了一個由多智能體組合的科研協作系統,并成功幫我拿下多篇頂會錄用。目前代碼已整理開源。
下面分享一下我的搭建思路:
首先先來看看在一般性的科研實踐中,我需要智能體輔助完成的任務都有哪些:
任務一:創新思路收集和創新點構建。
構建一個“全能研究助手”單體,能搜索實時信息并用代碼分析信息。輔助進行創新點研究和創新思路收集。
通常需要解決以下問題:
實時信息與代碼執行:如何讓擁有“靜態知識”的LLM獲得“實時信息”和“動態執行”能力?
工具選擇智能:LLM如何根據問題判斷該用哪個工具?我們將通過模式識別來解決(例如:“xx論文...” -> 搜索;“計算回歸...” -> 代碼執行)。
搜索的安全考量:結果過濾、來源可信度評估、防止惡意請求。
執行的絕對安全:通過沙箱環境,隔離代碼執行環境與主系統。
任務二:數據預處理
針對一份公開的科研數據集(如iris.csv或diabetes.csv),完成從數據加載、清洗、統計分析到生成基礎圖表的全流程AI輔助開發。
通常需要解決以下問題:
搞定數據預處理:加載并清洗一份可能存在缺失值、異常值和需要標準化的數據集。
快速修復分析Bug任務:假設有一段進行分組統計和t檢驗的代碼報錯,請AI調試。
自動化數據分析:對清洗后的數據,進行全面的描述性統計和初步探索性分析。
任務三:多智能體協作進行實驗設計和代碼運行
構建多智能體驅動的可運行實驗系統。比如,一個由三智能體組成的協作系統,完成“在MNIST數據集上訓練并評估CNN”的實驗。
通常需要解決以下問題:
任務復雜度爆炸:一個“完成深度學習實驗”的任務,涉及規劃、代碼、文檔、調試等多個正交子任務。
全能專家的幻覺:讓一個LLM同時處理所有細節,容易導致規劃混亂、代碼質量下降、注意力分散。
滿足頂會代碼要求:
1.可復現性:固定的隨機種子、清晰的依賴說明。
2.可讀性:模塊化設計、有意義的變量名、充分的注釋。
3.可擴展性:配置與邏輯分離,便于后續修改實驗參數。
實驗多智能體模塊如下:
Planner(規劃師):負責任務分解與流程設計。輸入研究目標,輸出一份結構化實驗藍圖(如:1. 數據加載模塊;2. 網絡定義模塊;3. 訓練循環…)。
Coder(工程師):負責高質量實現。接收藍圖中的具體模塊說明,編寫模塊化、可復用、文檔齊全的代碼。它需嚴格遵守頂會代碼規范(如使用argparse、合理的函數拆分、詳細的注釋)。
Executor/Reviewer(執行/評審員):負責驗證與反饋。它調用run_python_script等工具實際運行代碼,檢查錯誤,并將結果和問題反饋給Planner或Coder。
協作流:Planner -> [為每個子任務循環: Planner指派任務給Coder -> Executor執行并反饋 -> Planner評估是否繼續]
由于涉及到實際的項目構建和代碼演示。很難通過文字給大家講解清楚。
所以我決定通過直播的形式進行搭建演示。除了分享提示詞和源代碼之外,我也會分享搭建的思路。這樣你可以根據自己的科研任務進行微調。搭建自己的科研系統。
由于內容較多,我將拆分成三場直播進行講解和演示,并在本周內一次性分享完。
我在這里想強調一下。本著學術開源的目的。這個分享是免費的。請不要把內容商業化。
感興趣的同學請掃描這個二維碼發送【AI輔助科研】找小助理進行直播預約。在開播的時時候你能第一時間收到系統通知。
掃描二維碼加小助理,發送【AI輔助科研】預約
搭建需要用到的代碼和工具包如下。我都已經打包整理好了。同樣可聯系小助理獲取。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.