只做 63 次實(shí)驗(yàn),從 100 多萬(wàn)中可能的配方組合中,找到了最優(yōu)解。
這是清華大學(xué)教授羅三中和團(tuán)隊(duì)的最新成果,他們使用AI找到了一個(gè)高效的全新化學(xué)反應(yīng)寶藏。這個(gè)反應(yīng)可以使用鈷配合物和一種名為烯胺的中間體進(jìn)行巧妙結(jié)合,把生活中常見(jiàn)的醛類分子變成藥物或者材料中間體,事實(shí)上日常中的很多香料和氣味就來(lái)自于醛類分子。
羅三中告訴 DeepTech:“我們大概將發(fā)現(xiàn)時(shí)間從傳統(tǒng)可能需要的兩年縮短到了兩個(gè)月,將實(shí)驗(yàn)嘗試次數(shù)從通常可能需要超過(guò) 200 次縮減到了 63 次。”
更重要的是,AI 找到的最優(yōu)配方和人工找到的最優(yōu)配方幾乎完全不同。這就好比人類從東邊上山找到了一條路,而 AI 從西邊出發(fā)找到了另一條更快的捷徑。這說(shuō)明 AI 的思維方式確實(shí)能夠跳出人類的思維定式,發(fā)現(xiàn)那些被人類忽略的寶藏角落。
同時(shí),這一成果也展示了一種關(guān)于未來(lái)化學(xué)研究的強(qiáng)大新模式:即由人類專家提供想法和方向,AI 算法負(fù)責(zé)探索和優(yōu)化,兩者進(jìn)行強(qiáng)強(qiáng)聯(lián)合。這意味著人們開(kāi)發(fā)新藥、新材料和新能源的效率將能得到加快,化學(xué)的疆域也將變得更加廣闊。
![]()
圖 | 羅三中(來(lái)源:羅三中)
化學(xué)世界的尋寶路徑變遷:從憑經(jīng)驗(yàn)到憑算法
據(jù)了解,羅三中長(zhǎng)期從事物理有機(jī)化學(xué)研究,以發(fā)展仿生手性伯胺催化體系和推動(dòng)人工智能與催化研究融合著稱,其開(kāi)發(fā)的催化劑被國(guó)際同行稱為“羅催化劑”。
對(duì)于羅三中這樣的化學(xué)家來(lái)說(shuō),他們的目標(biāo)之一就是把簡(jiǎn)單的小分子底物,通過(guò)特定的連接方式,也就是化學(xué)反應(yīng),組裝成復(fù)雜且有用的大分子結(jié)構(gòu),比如能夠治病的藥物分子或者能讓屏幕發(fā)光的材料分子。這個(gè)過(guò)程需要用到一個(gè)工具箱,里面裝著催化劑、試劑、溶劑等各種工具,能夠幫助小分子底物以正確的方式進(jìn)行連接。
傳統(tǒng)方式是一個(gè)經(jīng)驗(yàn)豐富的手工大師。在過(guò)去,化學(xué)家要想找到一個(gè)新的化學(xué)反應(yīng),主要依靠化學(xué)直覺(jué)。這個(gè)過(guò)程就像在黑暗中摸索,非常依賴個(gè)人的經(jīng)驗(yàn)。有時(shí),一個(gè)微小的改變比如催化劑上某個(gè)原子的大小就會(huì)讓結(jié)果天差地別。面對(duì)成百上千種可能的工具組合(即化學(xué)反應(yīng)空間),即使是資深化學(xué)家也有可能漏掉隱藏的最優(yōu)組合。
而羅三中此次瞄準(zhǔn)的是一個(gè)特別復(fù)雜的組裝任務(wù):讓烯胺和一種高價(jià)態(tài)的金屬鈷配合物合作。這種合作模式在以前很少被實(shí)現(xiàn),因?yàn)檫@就像讓來(lái)自兩個(gè)不同種類的生物學(xué)會(huì)默契地配合一樣困難。
并且,羅三中團(tuán)隊(duì)面對(duì)的工具箱大得驚人:有 44 種可能的伯胺催化劑、20 種鈷催化劑、15 種氧化劑、14 種添加劑、10 種溶劑。簡(jiǎn)單算一下,這些工具的排列組合超過(guò)了 184.8 萬(wàn)種類。如果使用傳統(tǒng)方法一一嘗試,是一個(gè)絕對(duì)不可能的任務(wù)。
他告訴 DeepTech:“當(dāng)我們要?jiǎng)?chuàng)制物質(zhì),包括精細(xì)化學(xué)品、藥物、功能材料、高分子等物質(zhì),都離不開(kāi)形成新的化學(xué)鍵。人們把形成新化學(xué)鍵的模式稱為新反應(yīng)。通常,一類新反應(yīng)的出現(xiàn)會(huì)帶來(lái)合成這些分子的變革性進(jìn)步。”
因此,如何找到新反應(yīng)是有機(jī)合成化學(xué)的核心問(wèn)題,其背后是產(chǎn)值巨大的精細(xì)化學(xué)品產(chǎn)業(yè),這也是中國(guó)制造業(yè)的支柱性行業(yè)之一。所以,羅三中希望將傳統(tǒng)依賴試錯(cuò)的模式,轉(zhuǎn)變?yōu)橐粋€(gè)智能化、數(shù)據(jù)驅(qū)動(dòng)、自動(dòng)化的完整流程。這其中,如何用算法和數(shù)據(jù)加速是不可或缺的。
![]()
(來(lái)源:https://www.nature.com/articles/s44160-025-00944-y)
化學(xué)獵犬登場(chǎng):AI與人類的夢(mèng)幻聯(lián)動(dòng)
于是,羅三中團(tuán)隊(duì)請(qǐng)來(lái)了他們的超級(jí)助手,一種基于貝葉斯優(yōu)化算法的 AI 工具。在使用時(shí):
首先,要構(gòu)建反應(yīng)空間。該團(tuán)隊(duì)提出了一個(gè)巧妙的反應(yīng)設(shè)想:先是使用有機(jī)胺和醛反應(yīng)生成烯胺,然后讓鈷催化劑把烯胺氧化,借此生成一個(gè)活潑的中間體,最后這個(gè)中間體進(jìn)一步被氧化后就能和各種親核試劑比如醇進(jìn)行結(jié)合,從而得到目標(biāo)產(chǎn)物。基于這個(gè)設(shè)想,他們確定了上面提到的包含 184.8 萬(wàn)種可能的工具箱列表。
接著,他們進(jìn)行了第一輪的貝葉斯優(yōu)化。
AI 并不是一頭扎進(jìn)去亂找,而是利用 CVT 算法選擇了 5 個(gè)具有代表性的起始點(diǎn)進(jìn)行實(shí)驗(yàn)。拿到實(shí)驗(yàn)結(jié)果之后,算法模型就會(huì)進(jìn)行飛速學(xué)習(xí)。它能從這幾次嘗試中,推測(cè)出哪些區(qū)域更可能有寶藏,然后重點(diǎn)推薦下一批實(shí)驗(yàn)點(diǎn)。這時(shí),該團(tuán)隊(duì)就可以根據(jù) AI 推薦去做實(shí)驗(yàn),再把新結(jié)果反饋給它。
就這樣,通過(guò)人類實(shí)驗(yàn)和 AI 分析推薦,形成了一個(gè)高效的學(xué)習(xí)-探索循環(huán)。AI 就像一個(gè)永不疲倦的超級(jí)導(dǎo)航員,不斷地縮小搜索范圍。同時(shí),羅三中團(tuán)隊(duì)也會(huì)在此期間進(jìn)行介入,根據(jù)AI發(fā)現(xiàn)的一些線索例如某個(gè)氧化劑的特殊表現(xiàn),來(lái)動(dòng)態(tài)地調(diào)整工具箱,從而去掉一些希望不大的工具,同時(shí)也會(huì)加入一些新的候選者。這個(gè)過(guò)程讓搜索范圍從 184.8 萬(wàn)種,一步步縮小到 54.6 萬(wàn)種,再到 11.44 萬(wàn)種。
期間,僅僅經(jīng)過(guò) 63 次實(shí)驗(yàn),AI 就鎖定了一個(gè)完美的配方:使用特定的胺催化劑、鈷催化劑、以 N-氯代丁二酰亞胺為氧化劑,碳酸氫鉀為添加劑,在二氯甲烷溶劑中進(jìn)行反應(yīng)。通過(guò)這個(gè)配方得到了 57% 的產(chǎn)率和 90% 的對(duì)映選擇性,成功制造出了目標(biāo)分子。
另外,他們?cè)诹硪唤M實(shí)驗(yàn)里完全依靠自己的化學(xué)直覺(jué)和經(jīng)驗(yàn),期間也進(jìn)行了超過(guò) 200 次組合的實(shí)驗(yàn)篩選,最終也找到了一個(gè)不錯(cuò)的配方,但是效果略遜于 AI 找到的配方。
最后,他們還做了一些對(duì)比實(shí)驗(yàn)。
在第一個(gè)對(duì)比實(shí)驗(yàn)里,他們發(fā)現(xiàn)如果讓 AI 一開(kāi)始就學(xué)習(xí)人類專家篩選過(guò)的、比較好的數(shù)據(jù),AI 確實(shí)能夠更快地在這個(gè)優(yōu)勢(shì)區(qū)域里找到更好的點(diǎn),但是它也會(huì)被困在這個(gè)區(qū)域,失去了探索更廣闊未知世界的動(dòng)力。
在第二個(gè)對(duì)比實(shí)驗(yàn)里,他們讓 AI 從一個(gè)完全不同于前兩輪的區(qū)域開(kāi)始探索,它雖然沒(méi)有找到更好的配方,但卻意外發(fā)現(xiàn)了一條新路。在某些條件下,這一反應(yīng)甚至不需要之前認(rèn)為必須使用的堿。這說(shuō)明化學(xué)反應(yīng)的最優(yōu)組合可能不止一個(gè),可能有多個(gè)不同的配方組合都能達(dá)到好效果。
![]()
(來(lái)源:https://www.nature.com/articles/s44160-025-00944-y)
AI 配方和人類配方相差無(wú)幾
找到一個(gè)好配方,故事才完成了一半。羅三中團(tuán)隊(duì)還需要知道:這個(gè)新反應(yīng)的通用性到底有多高?它能組裝哪些不同形狀的小分子底物?
過(guò)去,在評(píng)估底物適用范圍的時(shí)候,人們一般會(huì)挑選一些看起來(lái)容易反應(yīng)的、結(jié)構(gòu)類似的分子來(lái)嘗試。但是,這可能會(huì)漏掉很多其他類型的分子,無(wú)法真正看清楚這個(gè)反應(yīng)的全貌。
這一次,該團(tuán)隊(duì)再次讓AI幫忙,使用上了聚類分析的方法。他們從市場(chǎng)上 6,000 多種含羥基的化合物中,篩選出 2,356 種結(jié)構(gòu)各異的候選者。這時(shí),AI 就像超級(jí)圖書(shū)管理員一樣,根據(jù)這些分子的結(jié)構(gòu)特性,把它們分成了13個(gè)不同的類別。
這時(shí),該團(tuán)隊(duì)要做的就是從每個(gè)類別中挑選幾個(gè)代表進(jìn)行實(shí)驗(yàn)。這樣一來(lái),只需做幾十次實(shí)驗(yàn),就能大致摸清楚這個(gè)反應(yīng)對(duì)于 2,356 種不同分子的適應(yīng)能力。這比隨機(jī)測(cè)試或者只測(cè)試少數(shù)幾種,要科學(xué)得多。
實(shí)驗(yàn)證明,這個(gè)新的鈷-烯胺催化系統(tǒng)就像是一個(gè)萬(wàn)能選手。
對(duì)于各種帶有取代基的苯甲醇,無(wú)論是帶供電子基團(tuán)還是吸電子基團(tuán),反應(yīng)效果都很好。簡(jiǎn)單的乙醇、長(zhǎng)鏈的烷基醇甚至一些結(jié)構(gòu)復(fù)雜的天然產(chǎn)物分子和藥物分子衍生物,都能順利地參加反應(yīng),并能達(dá)到高產(chǎn)率和高選擇性的產(chǎn)物。當(dāng)然,新的鈷-烯胺催化系統(tǒng)也有不擅長(zhǎng)的地方,比如對(duì)于一些酚類化合物和空間位阻特別大的醇,效果就不太理想,但是恰恰幫助該團(tuán)隊(duì)看清楚了這個(gè)反應(yīng)的邊界。
更有趣的是,利用 AI 優(yōu)化的配方和人類專家優(yōu)化的配方,在面對(duì)一大批各種樣式的小分子底物時(shí),前者和后者的表現(xiàn)各有千秋、旗鼓相當(dāng)。這說(shuō)明 AI 不僅可以找到新路徑,并且有著較高的可靠性和通用性。
![]()
(來(lái)源:https://www.nature.com/articles/s44160-025-00944-y)
以新原理做杠桿撬動(dòng)未知分子世界
那么,這個(gè)新反應(yīng)為何可以成功?為了弄清這一問(wèn)題,該團(tuán)隊(duì)又做了很多實(shí)驗(yàn)。結(jié)果發(fā)現(xiàn),如果去掉鈷催化劑、胺催化劑或氧化劑中的任何一個(gè),反應(yīng)就會(huì)完全停止,這說(shuō)明三者缺一不可。
他們還直接使用一種預(yù)先準(zhǔn)備好的具有氧化性的鈷化合物,來(lái)代替鈷催化劑和氧化劑,這時(shí)反應(yīng)竟然也能發(fā)生。這證明了鈷催化劑是引發(fā)后續(xù)反應(yīng)的關(guān)鍵氧化物種。
他們還在反應(yīng)體系中加入了一種名為 TEMPO 的自由基捕捉劑,結(jié)果反應(yīng)卻被抑制了,同時(shí)他們捕捉到了自由基中間體的加成產(chǎn)物,這證明反應(yīng)過(guò)程中確實(shí)有高活性自由基中間體的生成。
通過(guò)電化學(xué)和紫外可見(jiàn)光譜實(shí)驗(yàn),該團(tuán)隊(duì)親眼看到了鈷催化劑從烯胺/亞胺中間體那里獲得電子的過(guò)程。
綜合所有線索,他們描繪出了這個(gè)精巧的分子機(jī)理工作原理圖,期間最妙的地方在于,鈷催化劑不再只是一個(gè)旁觀者,而是直接參與了最關(guān)鍵的電子轉(zhuǎn)移,并與有機(jī)中間體形成了動(dòng)態(tài)的鈷-碳鍵,實(shí)現(xiàn)了真正意義上的協(xié)同催化。這就像兩個(gè)工人不再是各干各的,而是手拉手、步調(diào)一致地完成了一個(gè)高難度動(dòng)作。
羅三中總結(jié)稱,這次成果展示了一種 AI 加速新反應(yīng)發(fā)現(xiàn)的可行方法論;并且其催化的化學(xué)模式本身是全新的。這種模式有巨大的應(yīng)用潛力,可以用于合成藥物分子、高分子材料等,帶來(lái)物質(zhì)創(chuàng)造維度的創(chuàng)新。
他表示,“從化學(xué)角度來(lái)說(shuō),我們?cè)谶@個(gè)新反應(yīng)中操控了兩個(gè)壽命極短(毫秒級(jí)以下)的高活性物種,讓它們以可控的方式發(fā)生全新的轉(zhuǎn)化。而且,使用的催化劑體系非常廉價(jià):鈷是廉價(jià)金屬,有機(jī)胺催化劑分子量小、成本低,二者的結(jié)合實(shí)現(xiàn)了過(guò)去做不到的反應(yīng)。”。
![]()
(來(lái)源:https://www.nature.com/articles/s44160-025-00944-y)
當(dāng)然,這項(xiàng)研究的意義遠(yuǎn)遠(yuǎn)不止于發(fā)現(xiàn)了一個(gè)新的鈷-烯胺反應(yīng),更像是展示了一套可復(fù)用的工具箱,掀開(kāi)了未來(lái)化學(xué)研究的一角。
那就是,它證明人類設(shè)計(jì) +AI 探索的模式,可以極大加速新反應(yīng)的發(fā)現(xiàn)和優(yōu)化,讓科學(xué)家可以從繁瑣的試錯(cuò)中解放出來(lái),讓他們更有時(shí)間去思考真正前沿和根本的科學(xué)問(wèn)題。
同時(shí),AI 也讓上述過(guò)程變得更加系統(tǒng)、更加客觀和更加可量化。由此而發(fā)現(xiàn)的新反應(yīng)預(yù)計(jì)可被用于新藥研發(fā)、新材料創(chuàng)制、綠色化學(xué)等多領(lǐng)域。
正如羅三中所言:“未來(lái),我們將有可能去探索:能否用AI發(fā)現(xiàn)更多像點(diǎn)擊化學(xué)這樣具有變革性的新反應(yīng)?我們這項(xiàng)工作提供了一個(gè)起點(diǎn),后續(xù)希望更多研究者能將這類工具引入他們的工作。如能與自動(dòng)化實(shí)驗(yàn)結(jié)合,人的角色將主要是提供靈感和思想,而整個(gè)發(fā)現(xiàn)流程可以通過(guò)機(jī)器人、數(shù)據(jù)和算法來(lái)完成加速。”
這實(shí)際上是“AI for Science”在化學(xué)、尤其是有機(jī)合成領(lǐng)域的一個(gè)具體實(shí)踐范例。它也回應(yīng)了《科學(xué)》雜志提出的“未來(lái) 125 個(gè)重要科學(xué)問(wèn)題”之一:AI 如何改變化學(xué)研究,能否加速新反應(yīng)發(fā)現(xiàn)、創(chuàng)造性地設(shè)計(jì)合成路線。而羅三中團(tuán)隊(duì)則用本次研究給出了肯定的回答。
參考資料:
相關(guān)論文https://doi.org/10.1038/s44160-025-00944-y
運(yùn)營(yíng)/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.