![]()
新智元報道
編輯:LRST
【新智元導讀】開源框架Deep Researcher Agent幫你全天候自動跑深度學習實驗,節省大量重復勞動。它通過自主循環完成想方案、執行、監控與反思,僅需每天五毛錢。不依賴LLM API,實現實時控制與手機端監控,真正解放研究者精力,讓他們專注于思考。
做深度學習研究的朋友,誰沒經歷過這種日子,改超參 → 跑訓練 → 等 6 小時 → 看結果 → 再改 → 再跑 → 再等。
Deadline前這個循環要重復上百次。凌晨三點定鬧鐘爬起來,就為了瞄一眼loss有沒有降下去——降了,松一口氣繼續睡;沒降,眼淚都快下來了還得改一版重新提交。
而最讓人崩潰的不是辛苦,是這件事本質上是機械的:你早就想好了要試什么,剩下的只是把它跑出來而已。這部分時間,本該屬于真正的思考。
有沒有可能,讓一個AI Agent替你把這部分跑掉?
GitHub上最近有一個開源項目叫Deep Researcher Agent的框架,正面回答了這個問題——你睡覺的時候,它在煉丹;你寫論文的時候,它已經把 results table 準備好了。
![]()
項目鏈接:https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7
![]()
它是怎么工作的?
框架的核心,是一個THINK → EXECUTE → MONITOR → REFLECT的自主循環。
![]()
THINK(想方案)Agent 讀取項目說明 + 歷史實驗記憶,分析當前最優結果,決定下一步該試什么。注意——它不只是改超參,還能改模型代碼、換 loss 函數、加數據增強策略。
?? EXECUTE(寫代碼 + 起任務)Agent自動改代碼或config,先跑一個強制 dry-run(2 步前向反向)確認沒bug,然后才把真正的訓練打到GPU上。
MONITOR(盯著,但不花錢)這里是整個項目最強的一招:訓練期間,Agent完全不調用 LLM API。它只做三件事:
kill -0 $PID看進程還活著沒nvidia-smi看 GPU 在不在干活tail看日志最后幾行
這三個操作的API成本是零。
REFLECT(看結果 + 決定下一步)訓練結束,Agent 解析日志、提取指標、跟歷史最優對比、記錄里程碑,然后開下一輪。
整個循環24小時不間斷。你想介入?隨時可以——往項目目錄里扔一個指令文件就行,Agent下一輪自動讀到。
一天成本五毛錢,這是怎么做到的
24/7跑LLM Agent,聽起來不應該很貴嗎?
![]()
關鍵就在前面那個「零成本 MONITOR」。
一天24小時里,90%以上的時間都在訓練,這段時間 LLM 調用費 = 0。只有開頭「想方案」和結尾「看結果」才需要請大模型出馬,每次幾分鐘。
算下來:
![]()
一天五毛錢,夠你跑一整個禮拜也比一杯咖啡便宜。
跑半年內存不漲:兩層「恒定記憶」
長時間運行的Agent有個經典毛病:上下文越積越長,又慢又貴又蠢。
Deep Researcher Agent的解法是一個兩層記憶系統:
第一層:人類寫的項目說明(凍結不變,最大3000字符)——告訴Agent你想干什么、約束是什么
第二層:Agent自己維護的滾動日志——關鍵成果自動壓縮到 1200 字符以內,最近決策只保留15條
總記憶量恒定在約5000字符。Agent 跑1天是這個數,跑6個月還是這個數。
不是demo
是真打過仗
這個框架不是放在paper里看看的玩具。它已經在多個真實研究項目中連續跑了30多天:
自主完成500+輪實驗循環,單個項目指標比 baseline 提升52%(200+ 次全自動實驗跑出來的),同時管理4 個項目、4 臺 GPU 服務器,最長連續運行30+ 天,期間人類只介入了五六次
Claude和Codex都能用,配置一行切換
框架不綁定單一LLM:
Anthropic系:Claude Sonnet 4.6(快) / Claude Opus 4.6(最強)
OpenAI系:Codex 5.3(快) / GPT 5.4(最強)
config改一行就能切,誰強用誰。
躺床上也能煉丹:手機端實時監控
配合Happy Coder App(iOS / Android),可以在手機上:實時查看實驗進度、接收訓練完成 / 出 bug 推送、隨時給Agent下達「換個方向」的指令。
端到端加密,代碼和結果完全私密。
這意味著你真的可以在地鐵上、在咖啡館、在床上指揮一整套深度學習實驗流水線。
一鍵裝好,7 個斜杠命令
git clone之后跑一句python install.py,立刻獲得7個 Claude Code / Codex 斜杠命令:
![]()
完全不會用?倉庫里有個AI_GUIDE.md——把這個文件直接丟給任何 AI 助手,它會交互式地一步步帶你裝好、跑起第一個實驗。新手友好到這個地步。
AI科研工具對比
目前主流的AI研究工具——Claude Scholar、AI Scientist、SWE-Agent等——要么幫你寫論文,要么幫你寫代碼。但沒有一個能真正替你把實驗跑出來。
Deep Researcher Agent是第一個專門為「跑」深度學習實驗設計的開源 Agent 框架,而不是為「寫」。
?? 但是,請先看完這一段再去 Star
作者在 README 里掛了一段非常嚴肅的聲明,我覺得這一段比項目本身更值得放到這篇文章里:
本項目嚴禁用于學術造假與任何形式的科研不端行為。
這個框架被造出來,只有一個目的——把跑實驗里那些機械、重復的環節從研究者身上拿掉,讓大家把節省下來的時間,投入到真正重要的事情:思考上面。
idea必須由人來提供。請不要寄希望于用本項目進行學術不端,這不是我們的項目初衷,也不是這個社區歡迎的事情。
學術應當保持純粹。Agent可以替你跑實驗,但idea、判斷與責任必須由人來承擔。我們真誠地希望每一位使用者都能human in the loop地去思考,在自己的研究方向上做出屬于自己的、真實的貢獻。
在這個動輒「AI一鍵生成論文」的時代,看到一個開源作者主動給自己的工具立這樣的邊界,挺打動人的。
工具是中立的,但作者立場不必中立。
一個人的精力是有限的。研究者本該把時間花在讀論文、想 idea、解讀結果上,而不是花在凌晨三點爬起來看loss有沒有降。
Deep Researcher Agent想做的,就是把后者還給機器,把前者留給人。
如果你也是煉丹人,如果你也曾在deadline前哭著改config——
這一次,讓AI替你熬夜。你去睡覺。
參考資料:
https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.