網易首頁 > 網易號 > 正文申請入駐

已開源：手搓多智能體科研協作系統成功幫我拿下頂會！AI輔助科研最佳實踐分享

2025-12-17 11:29:18　來源: 機器學習與Python社區

北京舉報

分享至

我搭建了一個由多智能體組合的科研協作系統，并成功幫我拿下多篇頂會錄用。目前代碼已整理開源。

下面分享一下我的搭建思路：

首先先來看看在一般性的科研實踐中，我需要智能體輔助完成的任務都有哪些：

任務一：創新思路收集和創新點構建。

構建一個“全能研究助手”單體，能搜索實時信息并用代碼分析信息。輔助進行創新點研究和創新思路收集。

通常需要解決以下問題：

實時信息與代碼執行：如何讓擁有“靜態知識”的LLM獲得“實時信息”和“動態執行”能力？
工具選擇智能：LLM如何根據問題判斷該用哪個工具？我們將通過模式識別來解決（例如：“xx論文...” -> 搜索；“計算回歸...” -> 代碼執行）。
搜索的安全考量：結果過濾、來源可信度評估、防止惡意請求。
執行的絕對安全：通過沙箱環境，隔離代碼執行環境與主系統。

任務二：數據預處理

針對一份公開的科研數據集（如iris.csv或diabetes.csv），完成從數據加載、清洗、統計分析到生成基礎圖表的全流程AI輔助開發。

通常需要解決以下問題：

搞定數據預處理：加載并清洗一份可能存在缺失值、異常值和需要標準化的數據集。
快速修復分析Bug任務：假設有一段進行分組統計和t檢驗的代碼報錯，請AI調試。
自動化數據分析：對清洗后的數據，進行全面的描述性統計和初步探索性分析。

任務三：多智能體協作進行實驗設計和代碼運行

構建多智能體驅動的可運行實驗系統。比如，一個由三智能體組成的協作系統，完成“在MNIST數據集上訓練并評估CNN”的實驗。

通常需要解決以下問題：

任務復雜度爆炸：一個“完成深度學習實驗”的任務，涉及規劃、代碼、文檔、調試等多個正交子任務。
全能專家的幻覺：讓一個LLM同時處理所有細節，容易導致規劃混亂、代碼質量下降、注意力分散。
滿足頂會代碼要求：

1.可復現性：固定的隨機種子、清晰的依賴說明。

2.可讀性：模塊化設計、有意義的變量名、充分的注釋。

3.可擴展性：配置與邏輯分離，便于后續修改實驗參數。

實驗多智能體模塊如下：

Planner（規劃師）：負責任務分解與流程設計。輸入研究目標，輸出一份結構化實驗藍圖（如：1. 數據加載模塊；2. 網絡定義模塊；3. 訓練循環…）。
Coder（工程師）：負責高質量實現。接收藍圖中的具體模塊說明，編寫模塊化、可復用、文檔齊全的代碼。它需嚴格遵守頂會代碼規范（如使用argparse、合理的函數拆分、詳細的注釋）。
Executor/Reviewer（執行/評審員）：負責驗證與反饋。它調用run_python_script等工具實際運行代碼，檢查錯誤，并將結果和問題反饋給Planner或Coder。
協作流：Planner -> [為每個子任務循環： Planner指派任務給Coder -> Executor執行并反饋 -> Planner評估是否繼續]

由于涉及到實際的項目構建和代碼演示。很難通過文字給大家講解清楚。

所以我決定通過直播的形式進行搭建演示。除了分享提示詞和源代碼之外，我也會分享搭建的思路。這樣你可以根據自己的科研任務進行微調。搭建自己的科研系統。

由于內容較多，我將拆分成三場直播進行講解和演示，并在本周內一次性分享完。

我在這里想強調一下。本著學術開源的目的。這個分享是免費的。請不要把內容商業化。

感興趣的同學請掃描這個二維碼發送【AI輔助科研】找小助理進行直播預約。在開播的時時候你能第一時間收到系統通知。

掃描二維碼加小助理，發送【AI輔助科研】預約

搭建需要用到的代碼和工具包如下。我都已經打包整理好了。同樣可聯系小助理獲取。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.