網易首頁 > 網易號 > 正文申請入駐

上海交大團隊首創AI自我進化系統：讓人工智能加速自己的發展

2026-04-13 21:35:24　來源: 科技行者

北京舉報

分享至

回到2026年的春天，上海交通大學聯合SII實驗室和GAIR研究院的科學家們發布了一項令人震撼的研究成果。這項發表于arXiv預印本平臺（編號：arXiv:2603.29640v1）的研究，首次展示了AI系統如何通過自主學習和實驗來加速自身的發展進程。

在人工智能發展的歷史長河中，AI系統一直依賴人類科學家來設計新的架構、策劃訓練數據、改進學習算法。但現在，研究團隊提出了一個顛覆性的問題：AI能否自己設計和改進AI呢？他們開發的ASI-EVOLVE系統就像一個永不疲倦的AI科學家，能夠自主進行從假設提出到實驗驗證的完整科研循環。

這套系統的工作方式類似一個經驗豐富的廚師在不斷改進菜譜。當一位廚師要創造新菜品時，他會先回顧以往的烹飪知識和經驗，然后構思新的配料組合，接著進入廚房實際操作，最后品嘗結果并總結經驗。ASI-EVOLVE也遵循相似的流程：學習已有知識、設計新方案、執行實驗、分析結果，然后將經驗存儲起來指導下一輪改進。

研究團隊在三個關鍵領域驗證了這套系統的能力。首先是模型架構設計，系統自主發現了105種超越人類設計基準的新型注意力機制，最佳設計的性能提升達到0.97分，這個提升幅度是近期人類專家改進效果的三倍。其次是訓練數據優化，進化后的數據處理流程讓模型在各種測試中平均提升3.96分，在知識密集型任務中提升超過18分。最后是強化學習算法設計，發現的新算法在數學推理任務中顯著超越了現有最佳方法。

更令人驚訝的是，這套AI研發系統的應用范圍遠超AI領域本身。研究團隊將其應用到藥物分子與蛋白質相互作用預測這一生物醫學問題上，結果顯示AI設計的架構在冷啟動場景下取得了6.94分的顯著提升，證明了AI自主研發的成果可以推廣到其他科學領域。

一、從手工作坊到自動化工廠：AI研發面臨的挑戰

傳統的AI研發過程就像手工作坊里的工匠制作精美工藝品。每當科學家要設計新的AI模型時，他們需要憑借個人經驗和直覺，花費大量時間在浩如煙海的可能性中尋找最佳方案。這個過程不僅耗時費力，而且嚴重依賴研究者的專業水平和創造力。

考慮這樣一個場景：一位AI研究者想要改進語言模型的注意力機制。他首先需要閱讀大量相關論文，理解各種設計思路，然后憑借經驗提出新的想法，接著編寫復雜的代碼實現這個想法，運行可能需要數十個GPU小時的訓練實驗，最后分析結果判斷改進是否有效。整個過程可能需要數周甚至數月時間，而且很大程度上依賴于研究者的個人判斷。

更麻煩的是，即使一個研究團隊積累了豐富經驗，這些經驗往往難以系統化地傳承和利用。不同研究者的經驗是分散的，成功和失敗的案例缺乏結構化的記錄和分析。當面對新的研究問題時，團隊常常需要從零開始探索，無法充分利用過往的知識積累。

這種傳統模式還存在另一個根本性限制：人類能夠同時處理的假設數量和實驗規模都是有限的。一個研究團隊在同一時間內只能測試少數幾種設計方案，而AI系統的設計空間是極其龐大的。這就像用手工方式在巨大的迷宮中尋找出口，效率必然很低。

現有的一些自動化AI研發嘗試雖然取得了一定進展，但都存在明顯的局限性。有些系統專注于解決特定的、邊界清晰的優化問題，比如神經網絡架構搜索，但缺乏處理開放性研究問題的能力。有些系統能夠自動化研究過程的某些環節，比如實驗執行或結果分析，但無法完成從問題定義到解決方案驗證的完整循環。還有一些系統試圖模擬完整的科研流程，但只能處理相對簡單的任務，面對真正的AI研發挑戰時力不從心。

正是在這樣的背景下，上海交大團隊意識到需要一個根本性的突破。他們提出的核心問題是：能否構建一個系統，讓AI自己承擔起AI研發的重任，從而突破人類認知和時間的限制，實現真正的規模化、系統化AI研究？

二、AI科學家的誕生：ASI-EVOLVE系統架構

ASI-EVOLVE系統就像一個配備了完整實驗室的AI科學家，具備從文獻調研到實驗驗證的全套研發能力。整個系統圍繞一個核心循環運轉：學習-設計-實驗-分析，這個循環模仿了人類科學家進行研究的基本流程。

系統的第一個核心組件是研究員模塊，它扮演著AI科學家中負責創意和設計的角色。這個模塊的工作原理類似一位經驗豐富的研究者在查閱資料后提出新想法。當面臨一個研究任務時，研究員模塊首先會從知識庫中提取相關的背景信息和以往經驗，然后基于這些信息生成新的候選方案。系統支持兩種設計模式：完整代碼生成和差異化編輯。完整代碼生成就像從頭編寫一個全新的程序，而差異化編輯則像在現有程序基礎上進行局部修改，這種方式在處理大型代碼庫時更加高效。

工程師模塊負責將設計方案轉化為實際的實驗結果。它就像實驗室里的技術員，嚴格按照設計方案執行實驗并記錄數據。這個模塊最重要的特性是能夠處理長周期、高成本的實驗任務。為了提高效率，系統配備了多種優化機制：早期篩選功能可以通過快速測試過濾掉明顯有缺陷的方案，避免浪費計算資源在注定失敗的實驗上；可配置的時間限制確保實驗不會無限期運行下去；多種驗證機制保證實驗結果的可靠性。

分析師模塊是整個系統的智慧核心，負責從復雜的實驗結果中提煉出有價值的洞察。這個過程就像一位資深專家在仔細研究實驗數據后撰寫分析報告。在AI研發中，單個實驗往往會產生大量多維度的數據：訓練過程中的損失曲線、在各種測試基準上的表現、計算效率指標、錯誤日志等等。分析師模塊需要綜合所有這些信息，判斷實驗的成功程度，識別失敗的原因，并總結出指導后續實驗的經驗教訓。

認知庫是系統的知識儲備中心，相當于一個專門為AI研發整理的圖書館。與傳統的靜態資料庫不同，認知庫中存儲的是經過精心篩選和結構化處理的領域知識。這些知識來源于相關學術文獻、專家經驗和以往實驗的總結。當系統開始新的研究任務時，認知庫通過語義搜索技術找到最相關的知識條目，為研究員模塊提供靈感和指導。這種設計使得系統能夠站在前人的肩膀上開始研究，而不是盲目地從零探索。

數據庫模塊承擔著系統記憶的功能，記錄著每一輪實驗的完整歷程。這個數據庫不僅存儲原始的實驗數據，還保存著研究動機、設計思路、實驗結果和分析結論的完整記錄。更重要的是，數據庫支持多種智能采樣策略來選擇參考案例。這些策略包括基于置信區間上界的UCB1算法，它會優先選擇那些表現好但嘗試次數還不夠多的方案；隨機采樣策略保證了探索的多樣性；MAP-Elites島嶼算法則通過維護多個并行的進化分支來防止系統過早收斂到局部最優解。

整個系統的工作流程呈現出一種自然的節奏感。每一輪迭代都從學習階段開始，系統回顧相關知識和歷史經驗，就像人類研究者在開始新工作前先查閱文獻一樣。接著進入設計階段，基于積累的知識提出新的候選方案。然后是實驗階段，將設計方案付諸實踐，獲得客觀的實驗數據。最后是分析階段，深入分析實驗結果，總結經驗教訓，為下一輪迭代做準備。

這種循環式的工作模式使得系統具備了持續學習和改進的能力。每完成一輪迭代，系統的知識儲備就會增加一分，對問題的理解就會加深一層。隨著實驗輪數的增加，系統不僅能夠找到更好的解決方案，還能夠更高效地進行搜索，避免重復犯錯。

三、驗證之路：三大核心領域的突破性進展

為了證明ASI-EVOLVE系統的實際效果，研究團隊選擇了AI開發中最核心的三個領域進行驗證：模型架構設計、訓練數據處理和學習算法優化。這三個領域就像建造房屋時的地基、建材和施工工藝，是決定AI系統性能的根本要素。

在模型架構設計驗證中，研究團隊將重點放在了線性注意力機制的改進上。傳統的Transformer注意力機制雖然效果出色，但存在一個致命缺陷：計算復雜度隨輸入序列長度呈二次方增長，這就像處理的文檔越長，所需時間不只是成比例增加，而是呈爆炸式增長。線性注意力機制試圖解決這個問題，但在保持計算效率的同時維持模型能力一直是個難題。

ASI-EVOLVE系統接受這個挑戰后，開始了一場前所未有的大規模架構探索。系統首先從約150篇相關學術論文中提取知識，建立起對線性注意力機制的全面認知。然后在1773輪探索中生成了1350個候選架構，每個架構都是系統基于積累經驗設計的原創方案。

為了確保實驗的嚴謹性，團隊設計了三階段驗證流程。在探索階段，小規模模型快速驗證設計理念的可行性。在驗證階段，表現優異的架構被放大到中等規模進行更全面的測試。最終，頂尖架構會被擴展到大規模進行嚴格驗證。這個過程就像選拔優秀運動員：先進行初選篩除明顯不合格的候選者，然后進行復賽選出佼佼者，最后進行決賽確定最終優勝者。

實驗結果令人振奮。105個架構在驗證階段超越了人類設計的DeltaNet基準，最優秀的設計取得了0.97分的性能提升。這個數字看似不大，但在AI領域具有重要意義——它幾乎是近期人類專家手動改進效果的三倍。更重要的是，這種提升不僅在訓練數據上有效，在完全未見過的測試數據上同樣保持了優勢，證明了改進的普適性。

深入分析這些優秀架構，研究團隊發現了一個有趣的共同特征：它們都摒棄了固定的計算資源分配方式，轉而采用自適應的多尺度路由機制。這就像傳統方法是讓所有工人按照固定分工作業，而新方法則是根據具體任務動態調整人員配置，讓合適的人做合適的事。例如，PathGateFusionNet架構采用了層級化路由，先在本地處理和上下文處理之間分配計算預算，然后在上下文處理內部進一步細分為短程、長程和增量更新路徑。這種精細的資源管理使得模型能夠根據輸入內容的特點自適應地調整計算重點。

在數據處理驗證中，ASI-EVOLVE系統面臨的挑戰完全不同。現代AI模型的訓練需要海量數據，而這些數據往往來源復雜、質量參差不齊。就像一位廚師需要從各種來源采購食材，然后進行清洗、分揀、預處理，最終才能用于烹飪一樣，AI訓練數據也需要經過精心的策劃和處理。

系統需要為不同類別的數據設計專門的處理策略。每種數據都有其特有的質量問題：網頁數據可能包含HTML標簽和廣告內容，學術文獻可能存在格式不一致問題，社交媒體數據可能包含大量噪音信息。傳統上，這種策略設計完全依賴人類專家的經驗和判斷，是一個非常耗時且容易出錯的過程。

ASI-EVOLVE系統通過自動化這個過程展示了其強大能力。系統首先通過分析數據樣本識別各種質量問題，然后設計相應的處理策略，在樣本數據上測試效果，最后通過分析反饋不斷優化策略。這個過程就像訓練一個專業的數據質量檢查員，讓他逐漸學會識別和處理各種數據問題。

經過優化的數據處理流程效果顯著。使用處理后數據訓練的模型在平均基準測試中提升了3.96分，在知識密集型任務中的改進更加明顯：MMLU基準提升18.64分，CSQA提升18.80分，醫學問答MedQA提升13.48分。這些提升表明，高質量的數據確實是AI模型性能的關鍵基礎。

在算法優化驗證中，系統接受了設計新型強化學習算法的挑戰。強化學習是訓練AI系統進行復雜決策的重要技術，但現有算法在處理大型語言模型時仍存在諸多問題：訓練不穩定、收斂速度慢、對超參數敏感等。這些問題就像汽車發動機的各種小毛病，雖然不會導致完全無法使用，但會嚴重影響性能和可靠性。

ASI-EVOLVE系統從GRPO算法出發，通過300輪進化實驗探索算法改進的可能性。系統不僅要理解復雜的數學原理，還要能夠從多維度的訓練指標中判斷算法的優劣。這個任務的難度相當于要求系統不僅學會使用復雜的工具，還要能夠改進工具本身的設計。

最終，系統成功設計出了多個超越基準的算法變體。最優秀的算法在數學推理任務中表現出色：AMC32提升12.5分，AIME24提升11.67分，OlympiadBench提升5.04分。這些改進不是偶然的數值波動，而是源于算法設計上的創新突破。

以兩個代表性算法為例，研究團隊深入分析了系統的創新思路。第一個算法采用成對非對稱優化策略，它不再使用傳統的組平均值來計算優勢函數，而是通過比較每個樣本與組內其他樣本的表現來確定優勢。這種方法就像評價學生成績時不只看班級平均分，而是看每個學生相對于其他同學的表現。算法還引入了非對稱剪裁機制和高影響梯度丟棄技術，進一步提升了訓練的穩定性。

第二個算法采用預算約束動態半徑策略，它為每個訓練步驟設定總的更新預算，然后根據各部分的重要性動態分配這個預算。這種設計就像家庭理財時先確定總支出，然后根據各項支出的優先級合理分配資金。算法通過數學約束確保總的策略更新幅度始終在安全范圍內，從而避免訓練過程中的不穩定性。

四、能力邊界的探索：從圓形裝箱到藥物發現

為了更全面地評估ASI-EVOLVE系統的能力，研究團隊進行了一系列對比實驗和拓展驗證。這些實驗就像對一個新發明的工具進行各種測試，既要驗證它在標準任務上的表現，也要探索它在新領域的潛力。

圓形裝箱問題成為了一個重要的基準測試。這個問題要求在單位正方形內放置26個圓形，使得圓形半徑之和最大化，同時圓形之間不能重疊。雖然聽起來簡單，但這實際上是一個極其復雜的優化問題，需要在巨大的搜索空間中找到最優解。這個問題被多個進化計算框架采用作為標準測試，為不同系統的能力比較提供了公平的平臺。

ASI-EVOLVE在這個任務上的表現令人印象深刻。系統僅用17輪迭代就達到了2.63597的得分，這個速度明顯超越了其他框架。更重要的是，系統的最終得分2.635983與目前已知的最佳結果相當，證明了其在全局優化能力上的優秀表現。

通過與OpenEvolve和GEPA等代表性框架的詳細對比，研究團隊發現了ASI-EVOLVE的獨特優勢。OpenEvolve在整個運行過程中持續進化，但表現出較大的波動性，最終收斂到的解決方案質量有限。GEPA能夠達到相對較好的結果，收斂到2.630左右的得分范圍，體現了結構化進化設計的價值。而ASI-EVOLVE不僅能夠快速脫離冷啟動階段，還能在整個運行過程中持續穩定改進，最終可靠地達到最先進水平。

系統組件的作用機制通過仔細的消融實驗得到了驗證。當移除分析師模塊時，系統雖然仍能保持相對較高的起始性能（這歸功于認知庫提供的領域知識），但后續的持續改進能力明顯減弱。系統會進入長期的性能平臺期，難以實現進一步突破。這說明結構化的反饋分析對于長期進化至關重要。

當移除認知庫時，系統表現出明顯的冷啟動困難，早期改進緩慢且不穩定。但有趣的是，經過足夠長時間的自主探索后，系統仍然能夠逐漸積累經驗并最終達到較好的性能水平。這表明ASI-EVOLVE的核心進化機制具有真正的自主學習能力，即使在缺乏先驗知識的情況下也能通過試錯學習取得進展。

數據庫采樣策略的影響也得到了深入研究。MAP-Elites算法通過維護質量-多樣性檔案來防止過早收斂，鼓勵在解空間中進行廣泛探索。UCB1算法則基于置信區間上界進行選擇，平衡探索和利用。隨機采樣提供了基礎的對照基準。

實驗結果顯示，在配備了完善認知庫的情況下，UCB1策略表現最佳，能夠快速收斂到高質量解。這個結果看似違反直覺，因為UCB1的利用傾向可能導致過早收斂。但研究團隊分析認為，當系統已經具備良好的初始知識和結構化反饋時，多樣性保持機制的重要性相對降低，而價值導向的選擇反而能夠更高效地利用積累的經驗。

為了驗證ASI-EVOLVE的通用性，研究團隊將其應用到了完全不同的領域：藥物-靶標相互作用預測。這個生物醫學問題要求系統設計能夠準確預測藥物分子與蛋白質靶標之間結合可能性的模型。這個任務的挑戰在于需要同時處理兩種完全不同類型的數據：藥物的分子結構和蛋白質的序列信息，然后建模它們之間復雜的相互作用模式。

系統從約80篇相關論文中構建認知庫，學習圖神經網絡、注意力機制和藥物-靶標建模的專業知識。經過100多輪進化，系統成功設計出了性能優異的架構變體。在標準基準測試中，最佳架構相比基準模型取得了顯著改進：BindingDB開發集上AUROC提升1.91分，F1分數提升2.95分。

更重要的是，這些改進在冷啟動場景中表現更加出色。當模型需要預測涉及全新藥物或全新蛋白質的相互作用時（這在實際藥物發現中非常常見），AI設計的架構顯示出了強大的泛化能力：未見藥物場景下AUROC提升6.94分，未見蛋白質場景下提升3.56分，未見藥物和蛋白質的雙重冷啟動場景下提升4.36分。

深入分析最佳架構的設計特點，研究團隊發現了三個關鍵創新。第一個是Sinkhorn注意力機制，它基于最優傳輸理論設計，通過雙隨機約束確保注意力分配的平衡性，避免注意力崩塌問題。第二個是領域特定邊緣化策略，針對藥物分子子結構和蛋白質功能域的不同特性分別設計聚合方式，實現更好的組合建模。第三個是Top-k稀疏門控機制，通過學習選擇最相關的相互作用模式，降低不相關分子特征的干擾。

這些設計選擇不是隨意的技術堆疊，而是體現了對問題本質的深入理解。最優傳輸理論在生物分子結合建模中有堅實的理論基礎，組合推理符合藥物化學的基本原理，稀疏注意力則解決了分子特征復雜性帶來的噪音問題。

五、深入機制：系統如何實現持續進化

ASI-EVOLVE系統的成功不是偶然的，而是基于一系列精心設計的機制協同工作的結果。理解這些機制的工作原理，就像理解一臺精密儀器的內部構造，有助于我們把握系統的本質能力和適用邊界。

認知庫的構建和使用體現了系統從人類知識中學習的能力。這個知識庫不是簡單的文檔存儲，而是經過精心篩選和結構化處理的智慧精華。以線性注意力任務為例，150個知識條目覆蓋了幾何學原理、優化方法論、工程實踐指南和故障排除經驗四個主要類別。幾何學原理告訴系統理論上的最優解是什么樣的，優化方法論指導系統如何高效搜索解空間，工程實踐提供了實現細節的經驗，故障排除幫助系統避免常見陷阱。

知識的檢索和應用采用了語義搜索技術。當系統開始新的設計時，它不是隨機地從知識庫中提取信息，而是根據當前任務的特點和歷史經驗找到最相關的知識條目。這個過程就像一個經驗豐富的研究者在面對新問題時自然地想起相關的理論和經驗。隨著實驗的進行，知識的使用模式也會發生變化：早期階段主要依賴認知庫中的先驗知識，而后期則更多地利用系統自身積累的實驗經驗。

數據庫的設計反映了系統對經驗積累和利用的深刻理解。每個實驗節點不僅存儲了結果數據，還完整記錄了產生這個結果的整個思維過程：研究動機、設計理念、實現細節、實驗過程、結果分析和經驗總結。這種全面的記錄使得系統能夠從成功和失敗中同等程度地學習。

采樣策略的選擇體現了探索與利用之間的平衡藝術。UCB1算法通過置信區間上界的計算，既考慮了已知的性能表現，也考慮了不確定性帶來的潛在收益。當一個設計方案表現很好但嘗試次數不多時，它會獲得更高的選擇優先級，因為進一步探索可能帶來更大的驚喜。MAP-Elites算法則通過維護多個并行的進化分支，確保系統在不同的設計方向上都有所探索，避免過早地將所有注意力集中在單一的有希望的方向上。

分析師模塊的工作機制最為復雜，它需要從多維度的實驗數據中提煉出有價值的洞察。在神經架構設計任務中，單個實驗可能產生數十個不同的性能指標、完整的訓練動態曲線、內存使用情況、計算效率數據等。分析師需要綜合所有這些信息，不僅要判斷當前方案的優劣，還要識別改進的方向和潛在的問題。

這個分析過程采用了多層次的結構。首先是量化分析，通過統計方法分析各種數值指標的分布和趨勢。然后是模式識別，尋找不同指標之間的關聯關系和異常情況。最后是因果推理，嘗試理解觀察到的現象背后的原因機制。分析的結果被整理成結構化的報告，包含性能評估、問題診斷、改進建議等內容，為后續迭代提供明確的指導。

系統的進化動態呈現出有趣的階段性特征。在早期階段，認知庫中的先驗知識發揮主導作用，系統能夠快速達到相對較好的性能基線。這個階段的改進主要來自于對現有知識的有效利用和組合。隨著實驗的進行，系統開始積累任務特定的經驗，自主發現的模式逐漸增多。在后期階段，系統主要依賴自身的實驗歷史進行改進，能夠發現超越人類預設知識的創新解決方案。

不同任務類型對系統各組件的依賴程度也不相同。對于有豐富先驗知識的任務，認知庫的價值更加突出，能夠顯著加速收斂。對于探索性更強的任務，分析師模塊的作用更為關鍵，需要從復雜的實驗反饋中提取指導信息。對于需要長期持續改進的任務，數據庫的設計和采樣策略變得特別重要，決定了系統能否保持持續的進化動力。

六、展望未來：AI加速AI的廣闊前景

ASI-EVOLVE系統的成功驗證了AI自主研發的可行性，但這僅僅是一個開始。從更廣闊的視角來看，這項研究為AI領域的未來發展描繪了一幅激動人心的圖景。

當前的成果主要集中在AI開發的核心技術環節，但AI自主研發的潛在應用范圍遠不止于此。整個AI開發棧包含了從底層硬件優化、系統軟件設計、分布式訓練協調到上層應用開發的各個層面。每個層面都存在大量需要專業知識和經驗的優化問題，都有可能通過類似ASI-EVOLVE的系統來加速改進。

在基礎設施層面，AI系統可以自主優化計算資源的分配和調度，設計更高效的并行訓練策略，甚至參與硬件架構的改進設計。在算法層面，系統可以探索全新的學習范式，發現更好的優化算法，設計針對特定任務類型的專用架構。在應用層面，AI可以自主學習如何將通用能力適配到具體的行業問題，自動化模型部署和維護的整個流程。

這種全棧式的AI自主研發將帶來研發效率的根本性提升。傳統上需要人類專家數月完成的研發任務，可能在AI系統的幫助下縮短到數天甚至數小時。更重要的是，AI系統不會疲勞，可以7天24小時不間斷地進行探索和優化，其搜索規模和持續性都是人類團隊無法比擬的。

然而，這種變革也帶來了新的思考。當AI能夠自主設計和改進AI時，人類研究者的角色將如何演變？研究團隊認為，人類專家不會被替代，而是會從繁重的實現和調試工作中解放出來，專注于更高層次的問題定義和方向把握。人類的創造力、直覺和價值判斷仍然是不可替代的，AI自主研發系統更像是一個強大的助手，幫助人類專家實現更宏大的研究目標。

在實際應用中，AI自主研發也面臨著一些需要謹慎處理的挑戰。首先是可控性問題：如何確保AI系統的自主探索始終在預期的范圍內，不會產生不可預測的風險？其次是可解釋性問題：當AI設計的解決方案超越人類理解時，如何評估其安全性和可靠性？最后是公平性問題：AI自主研發的能力差異是否會加劇不同機構之間的技術差距？

這些挑戰的解決需要技術進步和制度創新的共同努力。在技術方面，需要開發更好的AI行為監控和控制機制，提升AI決策過程的透明度和可解釋性。在制度方面，需要建立相應的規范和標準，確保AI自主研發技術的負責任發展和應用。

從更長遠的角度看，AI自主研發可能催生科學研究方法的根本性變革。傳統的科研模式基于人類的認知能力和時間尺度，而AI系統能夠在更大的假設空間中進行搜索，在更短的時間內完成更多輪次的試驗驗證。這種能力差異可能導致全新的科學發現模式的出現，產生人類單獨研究難以企及的突破性成果。

藥物發現領域的驗證已經展示了這種可能性的一個早期例子。傳統的藥物設計需要化學家、生物學家、計算機專家等多領域專家的密切合作，耗時數年甚至數十年。而AI自主研發系統有潛力在數周內探索vast的分子設計空間，發現全新的藥物-靶標相互作用模式，極大加速新藥開發的進程。

ASI-EVOLVE的成功還為其他科學領域的自動化研究提供了有價值的參考。物理學中的材料設計、化學中的催化劑優化、生物學中的蛋白質工程等問題，都具有類似的特征：巨大的搜索空間、復雜的評估函數、需要大量專業知識的指導。這些領域都有可能通過類似的自主研發系統實現突破性進展。

說到底，ASI-EVOLVE所代表的不僅僅是一個技術工具的進步，更是科學研究范式的一次深刻變革。它展示了AI不僅可以應用科學知識解決問題，還可以自主產生新的科學知識，成為科學發現過程的積極參與者。這種轉變的深遠影響還需要時間來充分顯現，但可以確信的是，AI自主研發將成為推動科技進步的重要力量，為人類社會帶來前所未有的創新機遇。

研究團隊已將ASI-EVOLVE系統完全開源，這個決定體現了科學研究開放合作的精神，也為全球研究者提供了參與這一前沿技術發展的機會。通過開源社區的共同努力，這項技術有望得到更快的完善和推廣，早日造福更多的研究領域和實際應用。有興趣深入了解技術細節的讀者可以通過arXiv:2603.29640v1查詢完整論文，或訪問GitHub上的開源項目獲取系統代碼和文檔。

Q&A

Q1：ASI-EVOLVE系統是什么？

A：ASI-EVOLVE是由上海交大等機構開發的AI自主研發系統，它能夠像人類科學家一樣進行完整的研究循環：學習知識、設計方案、執行實驗、分析結果。系統通過認知庫存儲專業知識，用研究員模塊生成創新設計，通過工程師模塊執行實驗，用分析師模塊總結經驗，實現AI自己設計和改進AI的目標。

Q2：ASI-EVOLVE在哪些方面取得了突破？

A：系統在三個AI核心領域都實現了重大突破：在神經架構設計中發現了105個超越基準的新架構，最佳設計性能提升0.97分；在數據處理優化中實現平均3.96分提升，知識任務提升超過18分；在強化學習算法設計中，新算法在數學推理任務上比基準提升最高12.5分。系統還在藥物分子研究中取得6.94分的顯著改進。

Q3：這項技術會改變AI研發方式嗎？

A：會的，但不是完全取代人類。ASI-EVOLVE展示了AI可以承擔大部分繁重的實驗和優化工作，讓人類研究者從重復性勞動中解放出來，專注于更高層次的問題定義和方向把握。這種變化類似于從手工制造到自動化生產的轉變，大大提高效率的同時，人類的創造力和判斷力仍然不可替代。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.