![]()
作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
一場持續(xù)一個月的直播,讓AI研究AI自己。
明天上午11點,一場持續(xù)約一個月的直播即將上線。
屏幕里將沒有主播,只有一個名為FARS的AI系統(tǒng)在工作。它將從零開始,自主完成科研全流程:調(diào)研文獻(xiàn)、提出假設(shè)、設(shè)計實驗、編寫和執(zhí)行代碼、分析數(shù)據(jù)、撰寫論文,目標(biāo)是連續(xù)產(chǎn)出100篇完整的研究論文。全程自動,沒有人類介入。
做這件事的公司叫Analemma(行跡智能),成立不到一年,已獲得紅杉中國、高榕創(chuàng)投、光源資本、嘉程資本、美團龍珠等機構(gòu)數(shù)千萬美元的天使輪融資。創(chuàng)始人孫天祥是三年前引爆國內(nèi)大模型熱潮的MOSS的核心開發(fā)者。
據(jù)硅星人了解,以公開直播的方式部署全自動科研系統(tǒng),此前在全球范圍內(nèi)尚無先例。
1
四個智能體,一座科研工廠
FARS,全稱Fully Automated Research System,全自動研究系統(tǒng)。
![]()
FARS技術(shù)架構(gòu)圖
技術(shù)架構(gòu)上,F(xiàn)ARS是一個多智能體系統(tǒng),由四個模塊構(gòu)成:Ideation(構(gòu)思)負(fù)責(zé)文獻(xiàn)調(diào)研和假設(shè)生成,Planning(規(guī)劃)負(fù)責(zé)實驗方案設(shè)計,Experiment(實驗)負(fù)責(zé)代碼編寫和執(zhí)行,Writing(寫作)負(fù)責(zé)論文撰寫。四個智能體在一個共享文件系統(tǒng)中協(xié)作,這個文件系統(tǒng)同時承擔(dān)工作空間和持久記憶的角色。
模型層面,F(xiàn)ARS調(diào)用了Claude、GPT、Gemini等多家閉源模型的API,部分鏈路使用后訓(xùn)練的自研模型。換言之,F(xiàn)ARS的核心能力在Agent系統(tǒng)工程層面:如何編排多個智能體協(xié)同完成一個跨越數(shù)天的長鏈條任務(wù),如何讓系統(tǒng)在沒有人類干預(yù)的情況下持續(xù)可靠地運轉(zhuǎn)。硬件上,團隊將一個包含160張NVIDIA GPU的集群封裝成工具,供實驗智能體調(diào)度和調(diào)用。
![]()
Fars
設(shè)計理念上,F(xiàn)ARS和傳統(tǒng)學(xué)術(shù)論文的邏輯有明顯區(qū)別。按照團隊的說法,F(xiàn)ARS的設(shè)計基于研究系統(tǒng)的第一性原理:高效、可靠地拓展知識邊界。它的產(chǎn)出以“短論文”形式呈現(xiàn),每篇聚焦一個邊界清晰的研究貢獻(xiàn),鼓勵報告失敗結(jié)果,不要求遵循傳統(tǒng)學(xué)術(shù)論文的篇幅和結(jié)構(gòu)限制。
FARS團隊認(rèn)為,此前的AI科研系統(tǒng)“仍然在按照現(xiàn)代學(xué)術(shù)出版的慣例來生產(chǎn)論文”,而FARS選擇跳出這個框架,回到科研的基本單元:一個清晰的假設(shè),加上對它的可靠驗證。無論驗證結(jié)果是正向還是負(fù)向,都構(gòu)成有意義的知識。
本次直播中,F(xiàn)ARS將從9個預(yù)設(shè)研究方向出發(fā),涵蓋當(dāng)前AI研究的多個熱點:強化學(xué)習(xí)從可驗證獎勵中學(xué)習(xí)(RLVR)、小語言模型后訓(xùn)練、前沿LLM自動化評估、超越Transformer的模型架構(gòu)、持續(xù)學(xué)習(xí)、擴散語言模型、AI Agent記憶機制、測試時計算縮放(Test-Time Scaling)、世界模型。系統(tǒng)也被允許自由探索預(yù)設(shè)方向之外的課題。
FARS目前聚焦的研究領(lǐng)域是AI本身。孫天祥在Google Scholar上標(biāo)注的研究關(guān)鍵詞中有一個"AI4AI",即用AI來研究AI。選擇這個領(lǐng)域有務(wù)實考量:AI領(lǐng)域的實驗可以完全在計算機上完成,不需要物理實驗室,天然適合自動化。當(dāng)然,局限也很明顯:FARS暫時無法進(jìn)行極度消耗算力的實驗(如大規(guī)模預(yù)訓(xùn)練),也無法完成需要人類直接參與的實驗(如人工標(biāo)注或?qū)<以u估)。
關(guān)于產(chǎn)出質(zhì)量的把控,團隊設(shè)置了一道門檻:FARS生產(chǎn)的每篇論文在上傳arXiv之前,將經(jīng)過至少3位具有五年以上研究經(jīng)驗的團隊成員審核,論文首頁也會被明確標(biāo)注為AI生成。據(jù)了解,團隊不打算將這些論文投稿到傳統(tǒng)學(xué)術(shù)會議,而是會邀請同行評審,更關(guān)注論文的實際引用和結(jié)果價值。
那為什么要做成公開直播,而且目標(biāo)定在100篇?
團隊給出的解釋是:規(guī)模是評估自動化研究系統(tǒng)的關(guān)鍵。幾篇看上去不錯的論文說明不了什么,但100篇的連續(xù)產(chǎn)出,會讓系統(tǒng)的真實能力充分暴露。他們也坦言,此前從未大規(guī)模部署過FARS,對它的實際工作過程和產(chǎn)出結(jié)果“感到同樣的未知和好奇”。
![]()
在FARS之前,Analemma已經(jīng)上線了一個名為Lemma的產(chǎn)品(lemma.analemma.ai),提供快速文獻(xiàn)調(diào)研、深度調(diào)研報告和代碼實驗三項功能。孫天祥告訴硅星人,Lemma是輔助駕駛,定位是生產(chǎn)力工具;FARS是自動駕駛,定位是基礎(chǔ)設(shè)施。
1
從MOSS走出來的創(chuàng)業(yè)者
孫天祥,2019年從西安電子科技大學(xué)畢業(yè)后直博進(jìn)入復(fù)旦大學(xué),師從邱錫鵬和黃萱菁兩位教授,2024年獲得計算機科學(xué)博士學(xué)位。讀博期間,他以第一作者在ICML、ACL、NAACL、AAAI等AI頂會發(fā)表論文十余篇,Google Scholar引用超4200次,曾獲字節(jié)跳動獎學(xué)金(全國13人)、WAIC云帆獎明日之星(全球15人)、復(fù)旦學(xué)術(shù)之星(全校STEM研究生僅10人)等榮譽。
但讓他被更多人知道的,是MOSS。
2023年2月20日,復(fù)旦大學(xué)自然語言處理實驗室發(fā)布了MOSS,國內(nèi)首個面向公眾的類ChatGPT對話式大語言模型。消息當(dāng)天沖上知乎熱榜第一、微博多個熱搜,服務(wù)器瞬間被擠爆。在各大公司還在宣布“即將推出”自家大模型的時候,一個8人學(xué)生團隊搶先交出了答卷。兩個月后,MOSS全面開源代碼、數(shù)據(jù)和模型參數(shù),成為國內(nèi)首個開源的對話式大語言模型。
孫天祥是MOSS的主開發(fā)者。他的導(dǎo)師邱錫鵬后來在接受采訪時說過一句話:“一個學(xué)術(shù)研究的實驗室無法做出和ChatGPT能力相近的模型。”MOSS的意義也確實不在于追平ChatGPT,而在于用極度有限的資源驗證了這條技術(shù)路線的可行性,為后來國內(nèi)大模型的快速跟進(jìn)提供了開源基礎(chǔ)。
MOSS走紅時,孫天祥還在讀博。據(jù)了解,當(dāng)時國內(nèi)幾位知名的大模型創(chuàng)業(yè)者都曾邀請他加入,但彼時博士還沒畢業(yè)。2024年畢業(yè)后,VC也接踵而至。他最終選擇了自己創(chuàng)業(yè):2025年3月創(chuàng)辦Analemma(行跡智能),同期加入上海創(chuàng)智學(xué)院擔(dān)任助理教授,走了一條學(xué)術(shù)和創(chuàng)業(yè)并行的路。
![]()
據(jù)了解,Analemma目前團隊約15人,其中一半是研究團隊,核心成員來自復(fù)旦MOSS團隊和InternLM(書生大模型)項目。公司名取自天文學(xué)術(shù)語“日行跡”,指太陽在一年中于天空劃出的8字形軌跡。Slogan是“在一個問題無限的世界里,我們需要構(gòu)建無限心智”。從名字到定位,都指向一個研究驅(qū)動的長期目標(biāo)。
![]()
1
一條正在升溫的賽道
FARS并非第一個試圖讓AI自主做科研的系統(tǒng)。過去一年半,這個方向出現(xiàn)了密集進(jìn)展。
2024年8月,日本AI公司Sakana AI發(fā)布了AI Scientist,被稱為首個端到端全自動科研系統(tǒng)。它可以從idea到論文全程自動完成,每篇成本約15美元,代碼完全開源。但后續(xù)的第三方評估相當(dāng)不客氣:有研究者指出AI Scientist生成的論文中位引用僅5篇,存在幻覺數(shù)字、占位符文本、重復(fù)章節(jié)等問題,整體質(zhì)量被描述為"相當(dāng)于一個趕deadline的、沒什么動力的本科生"。
2025年4月,Sakana AI發(fā)布了升級版AI Scientist v2,引入基于樹搜索的實驗策略。這一版出現(xiàn)了標(biāo)志性突破:一篇AI生成的論文成功通過了ICLR 2025 Workshop的同行評審,這也是AI生成的科研論文首次被學(xué)術(shù)會議接收。不過這只是Workshop級別,距離主會議論文還有距離。
同期,香港大學(xué)Chao Huang團隊發(fā)布了AI-Researcher,獲得NeurIPS 2025 Spotlight論文,覆蓋計算機視覺、NLP、數(shù)據(jù)挖掘等多個領(lǐng)域,并已推出產(chǎn)品化版本Novix。
在大公司一側(cè),OpenAI在2025年10月公布了路線圖:計劃在2026年9月前開發(fā)出"AI研究實習(xí)生",能有意義地加速研究者的工作;到2028年3月,目標(biāo)是完全自主的AI研究員,可獨立完成端到端研究。首席科學(xué)家Jakub Pachocki的表態(tài)很有分量:為了重大科學(xué)突破,值得把整個數(shù)據(jù)中心的算力投入到單一問題上。
FARS在這個賽道里處于什么位置?
技術(shù)路線上,它和AI Scientist、AI-Researcher屬于同一類端到端全自動科研系統(tǒng),F(xiàn)ARS也明確提到了上述所有競品并逐一做了對標(biāo)。但FARS也有自己的差異點:它跳出了學(xué)術(shù)出版的慣例,回到研究本身的邏輯,以可驗證的假設(shè)為單位來組織產(chǎn)出。
更關(guān)鍵的差異在展示方式。之前的系統(tǒng)公開了代碼和樣例論文,發(fā)布了benchmark,但沒有人做過實時、大規(guī)模、全透明的公開部署。這是一個大膽的選擇。團隊也直言,他們無法獨立評估自己系統(tǒng)的產(chǎn)出,需要更廣泛的學(xué)術(shù)社區(qū)參與評價。
起步領(lǐng)域的選擇同樣值得關(guān)注。AI4AI和此前Sakana AI Scientist選擇機器學(xué)習(xí)子領(lǐng)域的邏輯類似,AI研究的實驗門檻最低,只需要代碼和算力,迭代最快,也最容易被同行評估。但這也意味著,距離“AI做生物學(xué)研究、物理學(xué)研究”的愿景還有相當(dāng)距離。團隊也承認(rèn),AI4AI是當(dāng)前階段的選擇,而非方法論本身的限制。
![]()
明天上午11點,F(xiàn)ARS的直播將在analemma.ai/fars上線,同時在多個社媒平臺同步播出。在接下來約一個月里,這個系統(tǒng)將在公眾面前從零開始做科研,所有產(chǎn)出通過其GitHub賬號(github.com/fars-analemma)實時公開。
三年前,孫天祥和8個同學(xué)做出了MOSS,在資源極度有限的條件下?lián)屜冉涣艘环荽鹁怼,F(xiàn)在他想驗證的命題更大:AI能不能自己做科研。這個問題的答案,最終取決于那100篇論文的質(zhì)量。論文會公開,所有人都可以去讀、去評。
FARS只聚焦在AI領(lǐng)域,離"AI做所有學(xué)科的科研"還很遠(yuǎn)。但這個方向本身正在快速升溫。智源研究院在其2026年趨勢預(yù)測中指出,AI for Science正在從Copilot角色向AI Scientist角色遷移,開始具備自主執(zhí)行"假設(shè)提出、實驗設(shè)計、數(shù)據(jù)分析、結(jié)論推斷"完整科研鏈路的能力。OpenAI把"全自主AI研究員"寫進(jìn)了2028年的路線圖。DeepMind去年底宣布將在英國建設(shè)首個AI自動化研究實驗室。
在這場圍繞自動化科研的全球競賽中,F(xiàn)ARS可能是來自中國的第一個公開實驗。它的結(jié)果值得關(guān)注。
![]()
點個“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.