![]()
導讀
2025年,人工智能在科學界的角色發(fā)生了決定性轉(zhuǎn)變,它已超越單純的“分析工具”,成為一個能主動作為的科研伙伴,能夠提出新穎假說、從頭設(shè)計全新分子,并以前所未有的精細度預測行星系統(tǒng)。
2025年,人工智能在藥物發(fā)現(xiàn)、氣候科學和材料工程等關(guān)鍵領(lǐng)域取得了突破性進展,大大加速科學發(fā)現(xiàn),由人工智能引領(lǐng)科學革命的浪潮已經(jīng)到來。
值得一提的是,中國雖然沒有選一例入選,但許多關(guān)鍵領(lǐng)域都接近行業(yè)領(lǐng)先水平。本文結(jié)合行業(yè)專家、ChatGPT、Gemini、Deepseek等模型的分析,對2025年最具代表性的研究案例進行分析總結(jié)。
深究科學|來源
01
BioEmu-1:模擬蛋白質(zhì)復雜構(gòu)象
BioEmu-1模型由微軟研究院AI for Science團隊開發(fā),今年發(fā)表在Science雜志上,團隊核心成員包括SarahLewis、TobiasHempel等。
BioEmu采用擴散模型架構(gòu),結(jié)合AlphaFold的Evoformer編碼器和二階積分采樣技術(shù)高效地從蛋白質(zhì)構(gòu)象分布中采樣,通過結(jié)合AlphaFold數(shù)據(jù)庫中的靜態(tài)結(jié)構(gòu)、超過200毫秒的分子動力學(MD)模擬數(shù)據(jù),以及50萬條蛋白穩(wěn)定性實驗數(shù)據(jù),訓練后能夠在單張GPU上每小時生成上千個獨立蛋白質(zhì)結(jié)構(gòu)。
![]()
![]()
BioEmu模型示意圖
BioEmu能模擬蛋白質(zhì)在功能過程中出現(xiàn)的關(guān)鍵結(jié)構(gòu)變化,如隱性口袋、局部解折疊和結(jié)構(gòu)域重排,模擬成功率分別達到70%、75%、80%。
BioEmu以前所未有的效率和精度模擬了蛋白質(zhì)的構(gòu)象變化,這為理解蛋白質(zhì)功能機制和加速藥物發(fā)現(xiàn)打開了新路徑。應用場景包括藥物研發(fā)、蛋白質(zhì)工程、結(jié)構(gòu)生物學等。
02
MatterGen:材料設(shè)計突破性工具
MatterGen是基于擴散模型的晶體材料生成模型,該模型由微軟研究院
團隊完成,并發(fā)表在Nature發(fā)表,團隊核心成員包括謝天等。
![]()
MatterGen是材料逆向設(shè)計的突破性工具,可大幅提升新型穩(wěn)定材料的生成效率與定向可控性。應用場景包括新型能源材料、功能材料設(shè)計等。
與現(xiàn)有生成模型相比,MatterGen生成的穩(wěn)定、獨特且新穎材料的比例提高了2.9倍,接近局部能量最小值程度提升了17.5倍。
在合成材料驗證中,模型生成的結(jié)構(gòu)與實際材料高度一致,并且模型能夠識別具有相同成分無序結(jié)構(gòu)的不同材料。
03
Aurora:精準預測大氣
Aurora是一款大氣預測模型,該模型由微軟研究院與劍橋大學等機構(gòu)聯(lián)合開發(fā),論文發(fā)在Nature雜志上,核心團隊成員包括Paris Perdikaris等。
Aurora模型基于超百萬小時天氣氣候模擬數(shù)據(jù)訓練,采用3D SwinTransformer與Perceiver編碼器解碼器架構(gòu),能處理多維度大氣變量,訓練周期僅4-8周,遠短于傳統(tǒng)基線模型的數(shù)年時長。
![]()
![]()
Aurora架構(gòu)示意圖
相較于最先進的數(shù)值預報系統(tǒng)IFS,Aurora計算速度提升約5000倍,且成本更低,其在空氣質(zhì)量、海浪、熱帶氣旋路徑及高分辨率天氣預報四大領(lǐng)域均達SOTA水平,如5天熱帶氣旋路徑預報全面超越7個業(yè)務預報中心。
Aurora可靈活微調(diào)適配多樣預測任務,可讓數(shù)據(jù)稀缺地區(qū)獲得精準氣象信息,可助力農(nóng)業(yè)、能源、災害應對等領(lǐng)域應對氣候變化挑戰(zhàn),為構(gòu)建全地球系統(tǒng)綜合模型奠定了基礎(chǔ)。
04
Quantum Echoes:量子物理模型
Quantum Echoes是一款基于超時序關(guān)聯(lián)器(OTOC)的量子算法,由谷歌Quantum AI團隊及其合作者開發(fā),論文于2025年10月發(fā)表于Nature雜志。
其核心原理是通過量子系統(tǒng)正向演化—擾動—反向演化的流程,借助相長干涉放大信號、抵消噪聲,將難測量的量子關(guān)聯(lián)轉(zhuǎn)化為可觀測的“量子回聲”,從而實現(xiàn)高靈敏度的系統(tǒng)結(jié)構(gòu)與動力學映射。
![]()
Quantum Echoes算法不僅在量子多體動力學模擬上比Frontier超級計算機快約13000倍(2小時完成經(jīng)典機3年任務),更首次達成可驗證、可復現(xiàn)的量子優(yōu)勢。在分子結(jié)構(gòu)測定實驗中,其結(jié)果與成熟技術(shù)高度一致。其應用覆蓋量子多體物理、材料科學、量子化學等領(lǐng)域,可為相關(guān)研究提供高效工具,并助力加速量子計算實用化進程。
05
RFdiffusion2:全新蛋白設(shè)計
RFdiffusion模型是華盛頓大學David Baker團隊開發(fā)的深度學習驅(qū)動的蛋白質(zhì)結(jié)構(gòu)從頭設(shè)計工具。2025年,基于該模型Baker團隊發(fā)了一系列高水平論文。
簡單來說,RFdiffusion2模型基于RoseTTAFold All-Atom架構(gòu),可自動推斷側(cè)鏈構(gòu)象與序列索引,高效生成蛋白支架,其核心優(yōu)勢在于可僅基于功能基團原子坐標設(shè)計酶,無需規(guī)定殘基順序或逆向旋轉(zhuǎn)異構(gòu)體枚舉,能直接適配無序列索引原子、部分配體等復雜活性位點需求。
![]()
RFdiffusion2蛋白質(zhì)設(shè)計示意圖
![]()
2025年,Baker團隊在Nature雜志的一項研究顯示其設(shè)計的抗體與流感血凝素、艱難梭菌毒素B等靶點結(jié)合構(gòu)象契合度高,CDR環(huán)設(shè)計達原子級精度,經(jīng)親和力成熟后可實現(xiàn)個位數(shù)納摩爾級結(jié)合強度。
![]()
另外,Baker團隊使用RFdiffusion從頭設(shè)計針對三指毒素(3FTx)蛇毒中和蛋白,獲得了具有顯著熱穩(wěn)定性、高親和力以及與計算模型近乎原子水平一致性的蛋白質(zhì),論文同樣發(fā)表于Nature雜志上。
RFdiffusion強大的功能使得其成為當前計算蛋白設(shè)計領(lǐng)域的核心工具之一。
06
Evo-2:基因組模型
Evo-2模型由來自 Arc研究所、斯坦福大學及NVIDIA等團隊聯(lián)合推出,核心成員包括Brian L. Hie、Patrick D. Hsu等,可廣泛應用于疾病基因組學、合成生物學等領(lǐng)域,助力臨床變異評級、基因組設(shè)計等任務。
![]()
Evo-2是一款兼顧預測與生成的基因組基礎(chǔ)模型,覆蓋原核、古菌等全生命域,具備單核苷酸分辨率,支持100萬bp超長上下文窗口。其核心能力突出,零樣本即可精準預測非編碼致病變異、BRCA1臨床變異等,還能生成高自然度基因組序列,自主習得外顯子-內(nèi)含子邊界等生物特征。
相較于同類模型,Evo-2數(shù)據(jù)覆蓋更全、架構(gòu)更高效,零樣本性能優(yōu)異且完全開源,大幅降低落地門檻。
07
DeepMind全自動實驗室
DeepMind Automated Labs是DeepMind公司提出的一項研究新范式和物理科研設(shè)施,它基于通用模型Gemini架構(gòu),由AI系統(tǒng)基于現(xiàn)有數(shù)據(jù)生成假設(shè)并負責實驗設(shè)計,機器人系統(tǒng)執(zhí)行實驗,機器學習模型分析結(jié)果以確定下一步流程。設(shè)施全流程自動化,可7×24小時運行。其中Gemini作為核心智能層,負責多模態(tài)理解、實驗規(guī)劃、代碼生成與多智能體協(xié)作。
![]()
DeepMind自動化實驗室旨在加速涉及復雜的化學和物理相互作用、需要大規(guī)模迭代實驗的新材料研發(fā)進程,特別是超導體和先進半導體材料。
人工智能系統(tǒng)則以規(guī)模化的方式執(zhí)行的新范式,并有望擴展到制造、藥物發(fā)現(xiàn)、能源優(yōu)化,甚至工業(yè)研發(fā)等任何依賴重復測試和優(yōu)化的領(lǐng)域。
08
MAGE:抗體全新設(shè)計范式
MAGE是首個無需模板即可設(shè)計多種靶標抗體的序列型蛋白質(zhì)語言模型,由Vanderbilt大學Ivelin S.Georgiev團隊提出并發(fā)表在今年的Cell雜志上。
![]()
MAGE基于十億級蛋白序列上預訓練的自回歸解碼器模型Progen2微調(diào),經(jīng)18507對抗體-抗原序列訓練,可僅輸入抗原序列,直接生成配對人源抗體的重鏈和輕鏈抗體可變區(qū)序列,且生成抗體具備多樣化序列特征與新型互補決定區(qū)序列。
![]()
MAGE模型示意圖
在MAGE模型生成的1000條抗體序列中,99.1% 通過結(jié)構(gòu)完整性與人源性篩選。與訓練集中最相似序列相比,重鏈平均差異 11.7 個殘基,輕鏈差異 1.4 個,這顯示其創(chuàng)新性。在針對新冠病毒抗體設(shè)計中,20種生成抗體中9種具結(jié)合特異性,1種中和效價優(yōu)于10納克/毫升。
MAGE為新興病原體快速響應提供可能,未來結(jié)合結(jié)構(gòu)預測等技術(shù),有望重塑抗體發(fā)現(xiàn)與疫苗設(shè)計范式。
09
AlphaEvolve:通用算法
AlphaEvolve是一款由Gemini系列大語言模型驅(qū)動的進化式編碼智能體,專注于通用算法的自主發(fā)現(xiàn)與迭代優(yōu)化,由Google Deepmind提出,預印本發(fā)表于arxiv平臺。
![]()
其核心依托Gemini Flash與Gemini Pro協(xié)同工作,前者拓展思路廣度,后者深挖優(yōu)化要點,結(jié)合自動化評估器與進化算法,實現(xiàn)“提示生成-程序創(chuàng)作-評估篩選-迭代進化”的全鏈路自主運行,確保解決方案的準確性與優(yōu)質(zhì)性。
![]()
AlphaEvolve工作流程
應用層面,AlphaEvolve已深度賦能谷歌計算生態(tài):優(yōu)化數(shù)據(jù)中心調(diào)度提升資源利用率,優(yōu)化芯片設(shè)計Verilog代碼,成果融入下一代TPU芯片;提升AI訓練效率,使Gemini核心矩陣運算提速23%,F(xiàn)lash Attention機制運算最高提速32.5%。
在學術(shù)領(lǐng)域,它突破4×4復矩陣乘法最優(yōu)解,為“接觸數(shù)問題”等50余個開放性數(shù)學問題提供解法,20%案例超越現(xiàn)有最優(yōu)解。AlphaEvolve突破單點函數(shù)局限進化完整代碼庫,為數(shù)學領(lǐng)域及計算實用場景提供了高性能算法解決方案。
未來,其通用架構(gòu)有望拓展至材料科學、藥物研發(fā)等領(lǐng)域,推動更多行業(yè)創(chuàng)新。
10
Future House:人工智能科研代理
Future House是由MIT博士山姆·羅德里格斯(Sam Rodriques)和安德魯·懷特(Andrew White)建立的一家多智能體代理平臺。
平臺核心為四款專業(yè)代理:Crow通用檢索,提供簡明學術(shù)答案;Falcon深耕文獻綜述,覆蓋多專業(yè)數(shù)據(jù)庫;Owl聚焦“前人是否做過X”的問題;Phoenix(實驗性)助力化學實驗規(guī)劃。另有一款尚未發(fā)布的專為實現(xiàn)生物學領(lǐng)域數(shù)據(jù)驅(qū)動的自動化發(fā)現(xiàn)而設(shè)計的智能體Finch。
這些平臺智能體基于其擁有240億參數(shù)的開源化學推理模型ether0模型。經(jīng)基準測試,前三者檢索精度與準確性優(yōu)于主流模型,且超越博士級研究人員。
![]()
不同模型搜索精度與準確性比較
未來,這一平臺應用場景包括可快速挖掘疾病機制、識別文獻矛盾、批判分析研究方法,還能通過API定制流程,助力蛋白靶點篩選與化學空間分析等,大幅加速科學發(fā)現(xiàn)進程。
簡而言之,2025年不僅有更好的模型,更是“科研伙伴”崛起的一年。像AlphaEvolve和谷歌最新科研智能體這樣的系統(tǒng),能夠識別藥物重定位候選者,并在數(shù)天內(nèi)預測抗菌素耐藥性,其工作成果可媲美人類團隊過去數(shù)年的努力。
隨著人工智能從工具轉(zhuǎn)變?yōu)楹献骰锇椋茖W方法本身正在被改寫——其進程加速了百倍,唯一的限制僅在于實驗室驗證的速度。
人工智能已深度參與科研過程的各個環(huán)節(jié),并將在今后仍會帶來一系列突破。
Deep Science預印本
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.