![]()
編輯|冷貓
在春節來臨之際,又一支神秘的華人創業團隊,在悄悄的搞大事!
就在剛剛,機器之心發現了一條來自創業公司 Analemma 的首條推文,宣布了一個在過年期間,令人不可思議的直播活動:
![]()
Analemma 在推文中聲稱,他們將面向全球公開直播部署端到端 AI 研究系統 FARS
他們的目標,是在直播中全自動完成 100 篇論文。直播預期將持續一個月,系統將持續自動運行直到生產完成論文輸出目標后結束。
在新年之際,Analemma 將徹底揭秘完全由 AI 領銜的科研全流程。史無前例,別開生面的超長直播,開創了 AI 研究系統執行全公開的先河。
不過,Analemma 團隊坦言,這也是他們第一次大規模的公開實驗。至于這一個月里,FARS 系統究竟是能夠讓大家驚喜地成功探索到全新的科研成果,還是或多或少出現大家喜聞樂見的翻車狀況,一切都還是未知數。
![]()
FARS 大規模自動科研系統直播畫面
- 直播地址:https://analemma.ai/fars/
或許,這將成為春節期間 AI 領域最有懸念的節目。
FARS:AI 自進化的科研系統
都說 AI 已經能夠獨立完成科研工作了,能夠輔助人類,甚至自主進行探索的 AI4S 智能體可以說是層出不窮。一些智能體已經可以獨立解決數學界的 Erdos 難題,就連陶哲軒都已在使用智能體進行自動化研究。
但是,哪怕已經近在咫尺,使用 AI 來進行 AI 研究的智能體和相關工作仍是鳳毛麟角。在 AI4S 已經相對成熟的當下,AI4AI 最具代表性的工作是去年 DeepMind 推出的 AlphaEvolve ,使用大模型自動優化 AI 算法。
而基礎的 AI 領域科研,仍然處于一個比較早期的階段。比較前沿的工作是來自 Sakana AI 的 AI Scientist v2,已經探索了 AI 自動化科研的可能性,并且生成了第一篇完全由人工智能撰寫并通過同行評審的研討會論文。不過,這些工作并沒有大規模公開地進行部署,并且在部分情況下無法離開人工干預。
構建一個怎樣的系統,才能讓 AI 自我迭代的飛輪真正轉起來?
第一性原理
FARS (Fully Automated Research System) 是一個無人類干預、純 AI 驅動的端到端研究系統,能夠自動化地完成文獻調研、假設生成、代碼編寫、實驗執行、論文寫作等科研全流程,在 AI4AI 領域是一個重要的里程碑。
![]()
- 博客鏈接:https://analemma.ai/blog/introducing-fars/
人類是有極限的。尤其是在科研領域,門檻高,人才少,「反復造輪子」,「報喜不報憂」等等現象都讓研究成本飆升。
FARS 團隊認為,這些問題是由以人為中心的研究系統的固有特性帶來的。他們認為,研究系統的第一性原理,就是高效、可靠地拓展知識邊界。或許,這正是 AI 研究系統超越人類的強項。
一個理想的研究系統的輸出應該是一系列研究成果的集合,其中每個研究成果都包含兩部分:一個清晰的假設以及對該假設可靠的驗證結果。無論驗證結果如何,只要假設是有價值的,那么其驗證結果就構成了有意義的知識并值得被發表。
因此,他們將 FARS 設計成輸出短文形式的論文。其中每篇論文聚焦于單一的、邊界明確的貢獻,并報告負面結果,以此構成最小可組合的知識單元。
技術方案
做科研從來不是一件容易的事情。靈感,計劃,實驗,論文撰寫,每一步都必不可少。
為此,FARS 針對科研過程的每一個步驟都打造了對應的智能體,由 Ideation、Planning、Experiment、Writing 四個智能體模塊構成。從科研的本質出發打造了完整的多智能體系統。
這四個智能體由一個共享文件系統串聯在一起。文件系統同時承擔了工作空間和持久記憶功能。
![]()
FARS 方法架構示意圖
在所有環節中,靈感始終是科研最稀缺、也最難被復制的部分。一個好的研究方向,往往決定了一半以上的成功概率。
研究從 Ideation 智能體開始,根據預設研究方向進行自動不間斷地文獻調研和假設生成,每個假設在被生成且通過自動化評估后交由后續智能體依次處理,最終生成一篇完整的學術論文,科研流程第一次真正形成了閉環。
劇透警告!
根據相關資料和官方博客信息匯總,我們得以獲知,在這次直播部署中,FARS 的建議研究方向包括但不限于:來自可驗證獎勵的強化學習;前沿大語言模型的自動化評測;超越 Transformer 的模型架構創新;擴散語言模型;世界模型等等共九大研究方向
聽說,為了讓智能體系統全身心投入科研,順利地完成輸出 100 篇研究論文的高難度的挑戰,Analemma 為 FARS 系統準備了一個比肩頂級 AI 實驗室的算力和工具基礎設施配置。
團隊一次性投入了一個包含 160 張 GPU 的集群,并且包裝成了訓練和推理工具來供智能體調用。同時,團隊也為 FARS 提供了統一的調用端口,使得 FARS 能夠調用幾乎所有閉源和開源模型。
最后,FARS 的實驗過程將通過其自己的 Github 賬號實時提交,實時跟進科研進程,確保每一篇論文都可被復現。
![]()
- Github 鏈接:https://github.com/fars-analemma
最前沿的 AI 研究方向,大量的算力支持,近乎無限的工具,讓 AI 自己突破 AI 領域的研究,這一切都讓人無比期待。
揭秘日行跡:孫天祥的年輕團隊
介紹了這么多,我們明顯能感受到 Analemma 團隊對于科研與學術的熱情,以及團隊對于 AI 學術領域前瞻性的思維。
他們認為,像 FARS 這樣的系統應當被大規模公開部署,其生產的研究成果應在學術社區中進行廣泛傳播和評估。
實話說,我們十分好奇這個學術背景濃厚,一出場就能放大招的初創公司,到底是何方神圣。于是,我們對 Analemma 做了一些調研。
Analemma,中文名為日行跡。創始人兼 CEO 正是曾主導 MOSS 大模型研發的孫天祥博士。
![]()
孫天祥 X 主頁
相信大家對孫天祥并不十分陌生。他于 ICML、ICLR、ACL、EMNLP、NAACL 等國際頂級會議發表論文 20 余篇,被引用 5000 余次,曾獲世界人工智能大會云帆獎、字節跳動獎學金、復旦大學學術之星等榮譽,曾于 Musical.ly 創始人陽陸育創辦的初創公司 Zulution AI 擔任合伙人,現于上海創智學院擔任助理教授。
![]()
孫天祥 領英簡介
更加讓人驚訝的是,這一團隊居然如此年輕。據 Google Scholar 搜索結果顯示,日行跡研究團隊成員平均年齡不足 30 歲,其中多人為 MOSS 和 InternLM 大模型的核心貢獻者。
![]()
據公開信息顯示,上海日行跡智能科技有限公司已低調完成由高榕創投、紅杉中國、光源資本、奇績創壇、美團龍珠、嘉程資本、上海未來產業基金等參與的天使輪融資,融資額數千萬美元
對于公司首個亮相的 AI 研究系統 FARS,日行跡團隊雖然保有對首次公開直播大規模部署的未知結果的忐忑,但也難掩著對 FARS 系統光明未來的期望。團隊預測,FARS 的引用量將在 2026 年底超過它的所有創造者
相信這次直播項目之后,我們就能看到 AI4AI 科研系統,在現有資源下的能力上限。
或許,AI4AI 科研唯一的缺陷,就是無法執行需要人類參與的實驗了。如果真的能讓 AI 「租個人」來做實驗,世界又會變成什么樣子呢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.