近日,師從新晉諾貝爾化學(xué)獎得主奧馬爾·亞吉(Omar M. Yaghi)、目前在美國加州大學(xué)伯克利分校讀博的榮自超,帶領(lǐng)一個跨國際的研究團(tuán)隊(duì),打造出名為AIRES (algorithmic iterative reticular synthesis)的機(jī)器學(xué)習(xí)指導(dǎo)的高通量實(shí)驗(yàn)平臺,在尋找一種名為沸石咪唑酯框架(ZIF)材料的晶體時,效率比隨機(jī)探索的方法提高了一倍,并將已知的單連接體鋅基 ZIF 材料庫直接擴(kuò)大三分之一,打破了領(lǐng)域內(nèi)長達(dá)十年的停滯。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
研究中,榮自超首先使用 8 種已報道的 ZIF 連接體分子與鋅離子反應(yīng),進(jìn)行了共計 2688 次結(jié)晶實(shí)驗(yàn)。其中,反應(yīng)條件(包括溫度,濃度,比例)從一個預(yù)先定義的反應(yīng)空間中均勻采樣,借此建立了一個包含成功與失敗數(shù)據(jù)的初始知識庫。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
然后,他挑選了 48 種全新的、從未被做成 ZIF 單晶的連接體分子作為探索目標(biāo):
在 AIRES 組中,機(jī)器學(xué)習(xí)模型指導(dǎo)實(shí)驗(yàn)進(jìn)程,僅用了大約 700 次實(shí)驗(yàn)就找到了 48 種新連接體中僅有的 10 種可形成 ZIF 單晶的連接體所對應(yīng)的結(jié)晶條件。該效率比隨機(jī)探索組提高了一倍。后者開展的是完全依靠運(yùn)氣的盲目嘗試,結(jié)果需要大約 1,400 次實(shí)驗(yàn)才能達(dá)成同樣的目標(biāo)。
這一對比不僅說明了 AIRES 擁有較高的效率,也表明在沸石咪唑酯框架這一看似已經(jīng)被高度探索的化學(xué)空間里,依然隱藏著許多等待發(fā)現(xiàn)的驚喜。在材料發(fā)現(xiàn)這一更宏觀的領(lǐng)域中,通過 AIRES 加速發(fā)現(xiàn)的新框架材料,可以幫助我們從空氣中收集飲用水、高效捕獲導(dǎo)致氣候變暖的二氧化碳,甚至用于制造更加清潔的能源。
榮自超告訴 DeepTech:“選擇 ZIFs 的原因主要有兩點(diǎn):首先其結(jié)晶窗口較小,這意味著隨機(jī)嘗試的效率低,需要花費(fèi)大量資源才能找到正確的結(jié)晶條件。而且,這一化學(xué)空間除了生成 ZIF 外,還可能出現(xiàn)金屬有機(jī)配合物分子等其他副產(chǎn)物晶體。其次,對于不同的有機(jī)連接體,其成功的 ZIF 結(jié)晶條件和最終生成的 ZIF 晶體結(jié)構(gòu)呈現(xiàn)出較強(qiáng)的多樣性,僅憑人的直覺很難捕捉不同反應(yīng)體系之間的關(guān)聯(lián)。因此,這對我們驗(yàn)證 AIRES 平臺的有效性是一個很好的挑戰(zhàn)。”
![]()
(來源:榮自超)
AIRES 的五個組成部分
AIRES 具備發(fā)現(xiàn)-學(xué)習(xí)-再發(fā)現(xiàn)的智能循環(huán),由五個部分組成。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
第一是自動化合成部分:這一部分主要包含一個液體分配機(jī)器人。它像一位精確的化學(xué)廚師,可以按照指令在不同的小型反應(yīng)容器中將金屬鹽、有機(jī)連接體和溶劑以不同的比例混合,,然后送入恒溫烘箱“烹飪”。
第二是圖像識別部分:反應(yīng)結(jié)束之后,高清自動光學(xué)顯微鏡會給每個反應(yīng)拍照。一個訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型會迅速地掃描這些照片,判斷里面是否長出合格的晶體。模型的識別依賴晶體的幾何形狀、顏色均勻度等特征,具有很高的晶體召回率,能夠幫助人們省去大量查看圖片的辛苦工作,尤其是在絕大多數(shù)結(jié)果都是失敗反應(yīng)的情況下,并能不遺漏包含合格晶體的照片。
第三是單晶 X 射線衍射:被上一步相中的候選晶體,會被送到衍射儀下進(jìn)行最終裁決。只有這里才能給出原子級別的精確結(jié)構(gòu),從而據(jù)此來判斷是否是想要的新型 ZIF 材料。
第四是數(shù)據(jù)庫管理:這一部分負(fù)責(zé)將已經(jīng)嘗試過的反應(yīng)信息(包括反應(yīng)物,反應(yīng)條件,反應(yīng)結(jié)果)進(jìn)行歸納整理。為了更好地定量不同連接體對反應(yīng)結(jié)果的影響,團(tuán)隊(duì)通過量子化學(xué)手段設(shè)計了與實(shí)際結(jié)晶物理化學(xué)過程息息相關(guān)的描述符。
第五是算法決策:這也是 AIRES 的靈魂。在它的內(nèi)部運(yùn)行著機(jī)器學(xué)習(xí)模型(比如隨機(jī)森林),這個模型可以從之前所有成功和失敗的數(shù)據(jù)中學(xué)習(xí),并能試圖找出什么樣的連接體分子特征和什么樣的反應(yīng)條件搭配,更有可能長出晶體。
AIRES 的目標(biāo)非常明確,那就是最大化地發(fā)現(xiàn)新晶體的數(shù)量。因此,算法總是最優(yōu)先建議實(shí)驗(yàn)?zāi)K去嘗試那個預(yù)測成功率最高的實(shí)驗(yàn)。為避免重復(fù)嘗試一些高度相似的成功結(jié)晶條件,一旦某個連接體成功生成了一個 ZIF 晶體,算法會及時將寶貴的實(shí)驗(yàn)資源用于探索其他尚未成功的連接體。
為了讓 AIRES 每次能夠執(zhí)行更多的批量實(shí)驗(yàn),團(tuán)隊(duì)還設(shè)計了更高級的批量選擇算法。它不會簡單地選擇前 N 個最有可能的候選,而是會考慮候選反應(yīng)們的條件結(jié)晶概率,基于此計算一批實(shí)驗(yàn)整體能夠帶來多少新的發(fā)現(xiàn)期望值,從而更高效地利用每次實(shí)驗(yàn)機(jī)會。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
什么是網(wǎng)格材料?為什么我們需要它們?
前面提到榮自超是亞吉的學(xué)生,亞吉課題組主要以研究網(wǎng)格材料而出名。以大家都熟悉的樂高積木為例,使用不同的形狀和顏色的積木,可以搭建出城堡、飛船或者任何其他能夠想象出來的結(jié)構(gòu)。榮自超和他所在團(tuán)隊(duì)也在做類似的事情,但是他們使用的是原子級別和分子級別的積木。
他們使用金屬原子比如鋅作為連接點(diǎn),使用有機(jī)分子作為“棍棒”,把它們按照精確的、重復(fù)的圖案連接起來,形成一種名為金屬有機(jī)框架的晶體材料。前面提到的沸石咪唑酯框架材料,便是這種材料的其中一類。
這些材料內(nèi)部充滿了納米級別的孔道和通道,就像是一個結(jié)構(gòu)極其精密的蜂巢,正是這些孔洞讓它們擁有了以下能力:
首先,它們可以作為吸附器,可以像海綿吸水一樣,有選擇性地抓住空氣中的水分子以用于干旱地區(qū)收集水資源,或者可以鎖住工業(yè)廢氣中的二氧化碳以用于減緩全球變暖。
其次,它們可以作為分子篩,其所擁有的不同大小的孔洞可以只讓特定的氣體或液體分子通過,從而用于分離混合物,比如提純天然氣等。
再次,它們可以作為微型反應(yīng)器,它們的孔洞可以作為“房間”,讓化學(xué)反應(yīng)在里面更高效、更清潔地警醒。
然而,要想真正讓這些能力發(fā)揮作用,就必須得到高質(zhì)量的晶體。這能保證框架材料內(nèi)部孔結(jié)構(gòu)的一致性和有序性。另一方面,通過單晶 X 射線衍射,我們能解析材料內(nèi)部每個原子的精確位置,也就是給晶體拍攝一張原子級別的三維高清照片,以便能夠理解它的結(jié)構(gòu),以及精準(zhǔn)預(yù)測和設(shè)計它的性能。
發(fā)現(xiàn) 10 種連接體,生成 7 種不同拓?fù)浣Y(jié)構(gòu)
通過 AIRES 發(fā)現(xiàn)的 10 種連接體,生成了 11 種全新的晶體,歸屬于 7 種不同的拓?fù)浣Y(jié)構(gòu)。有些新連接體在不同于已有文獻(xiàn)的溶劑中,形成了經(jīng)典的方鈉石型和方沸石型結(jié)構(gòu)。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
同時,更多的連接體帶來了全新的結(jié)構(gòu)。例如,在由 5-溴咪唑形成的 ZIF-A6 之中,展現(xiàn)出一種前所未有的雙層結(jié)構(gòu),兩層金屬節(jié)點(diǎn)被連接體進(jìn)行了共價橋聯(lián),而這在 ZIF 化學(xué)中也是一個全新的拓?fù)浣Y(jié)構(gòu)。
特別值得一提的是,5-溴咪唑和 4-氰基咪唑這兩種新的連接體分別形成了 crb 和 DFT 拓?fù)浣Y(jié)構(gòu)。而在過去,它們被認(rèn)為只能由最簡單的、沒有任何取代基的咪唑連接體形成。現(xiàn)在,帶有單個取代基的連接體也能搭建出這些結(jié)構(gòu),這刷新了人們對于 ZIF 結(jié)構(gòu)設(shè)計的認(rèn)知。
不僅如此,復(fù)雜的配位化學(xué)反應(yīng)還帶來了意外收獲。即 AIRES 還發(fā)現(xiàn)了四種連接體,它們沒有形成預(yù)期的三維 ZIF,而是形成了層狀 ZIF。在這些結(jié)構(gòu)中,溶劑分子等配角與連接體這一主角,針對金屬的配位點(diǎn)形成了競爭,從而形成了二維層狀結(jié)構(gòu),這說明 AIRES 的機(jī)器學(xué)習(xí)模型捕捉到了配位化學(xué)的一些基本規(guī)律。
參考資料:
相關(guān)論文 https://doi.org/10.1038/s44160-025-00939-9
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.