原文發表于《科技導報》2025 年第21 期 《 AI能否成為化學知識的發現者? 》
人工智能(AI)正推動科學研究范式由“加速器”向“發現者”轉變。本文以中國科學技術大學“機器化學家”平臺的實踐為例,系統分析了AI在化學知識發現中的潛力與挑戰,探討了化學大模型、多模態數據融合及工業級智能實驗室如何推動未來科研范式的系統性重塑。
1 為什么AI可以成為化學知識的發現者?
當前AI的快速發展為科學研究帶來了深刻的范式變革。借助機器學習、知識圖譜和智能自動化平臺,科研人員正探索AI賦能的科學研究新路徑。國家層面的政策驅動為這一變革提供了制度支撐:2023年科技部啟動“AI for Science”專項,聚焦化學等基礎學科;2025年國家自然科學基金持續加大對“AI+基礎學科”交叉研究的支持。在此背景下,化學研究正加速邁向“人機協同、AI主導”的新范式。
在化學領域,面向化學的大模型成為新的研發熱點。例如,上海人工智能實驗室研發的 ChemLLM模型展示了高效處理復雜化學問題的能力。另外,在科學計算方向,大模型的理念也開始延伸到分子模擬與材料設計中。中國“深度建模”(DeepModeling)開源社區于2024年發起了OpenLAM計劃,最終目標是能自行提出科學假設并完成模擬和實驗設計。
中國科學技術大學江俊團隊通過構建具有“感知—決策—執行—學習”閉環能力的“機器化學家”平臺“小來”與“小臨”,聚焦在在分子合成、催化篩選、材料設計等領域的研發。這一效率躍遷背后,AI正從數據處理工具向“知識合作者”進化,但它能否突破人類認知邊界,成為獨立的化學知識發現者?
首先,AI作為輔助工具,可以幫助研究人員識別變量之間的潛在關聯性,并進一步挖掘其背后的知識結構,這是當前AI在科學領域最擅長的方向之一。在這個層面,AI通過對大規模實驗或計算數據的學習,為后續的理論分析與機制探索提供切入點。AI雖然可以為人類科學家指明研究重點與潛在規律,但是后續仍需依賴科研人員基于領域知識進行物理圖像或數學理論的構建與驗證。
2 AI能否勝任知識發現者?
AI在化學領域尚未產生真正顛覆性的原創理論,其背后主要有3方面的原因。
2.1 高質量數據匱乏
高質量的數據匱乏是AI發展的主要瓶頸之一,尤其缺乏失敗實驗的數據,導致訓練數據不完整并帶有明顯偏差。在化學大模型的構建中,常見的標簽大多仍依賴人工完成,而前提則是擁有原始的、結構清晰的數據。現階段AI尚未真正達到“集成人類智慧”的高度,其訓練數據主要來源于已發表的成功案例,尤其集中在反應合成路徑上。
此外,現有化學相關數據庫尚未實現全面開放。這類數據庫還普遍存在結構化不足的問題,難以滿足模型深層理解與泛化的需求。化學數據的多模態融合也面臨挑戰:文本(文獻)、圖譜(分子結構)、光譜(NMR/IR)等數據異構性強。
2.2 人類認知維度受限
人類對科學規律的理解,主要依賴于2種形式:一是數學公式,二是可視化圖像。但現實中,AI所學習到的規律往往位于高維特征空間。為了使這些高維規律為人類所理解,AI必須進行“降維處理”,但這種降維本身就會犧牲信息、扭曲原貌,僅保留可理解部分,并不能還原AI原本所掌握的全部知識結構。因此,推動AI與科學研究的融合,首要層次是人類要具備解析AI輸出的能力,并通過數學建模等手段將其轉化為可驗證的科學表達。
2.3 實驗驗證效率低下
目前,AI提出的假設和預測大多需要通過傳統實驗手段進行驗證,這種方法低效、耗時,一定程度上阻礙了AI科學假設的快速迭代和驗證。因此,當下急需發展具有快速響應和智能執行能力的“行動智能”系統,與AI的設計能力相匹配。
3 AI知識發現的可靠性、數據基礎與人機協同
3.1 AI發現的化學知識是否可靠?
深度模型往往基于大數據中隱含的統計相關性進行學習,而非建立在真實的因果推理基礎上。基于可解釋性算法的AI模型,能夠從復雜實驗數據中抽象出物理規律,建立具有預測能力的數學理論,為揭示科學機制、發現潛在法則提供了可行路徑。這種方法不僅提升了模型的可信度與可控性,也有望推動AI從“輔助工具”向“知識發現者”角色的根本躍遷。
3.2 如何獲取高質量的數據提升AI的智力?
針對化學數據稀缺、標注昂貴的問題,中國科學技術大學研究團隊提出了“理論大數據+實驗小數據”的融合策略:
一方面,通過高通量理論計算模擬生成大量數據用于模型預訓練;
另一方面,再用少量真實的實驗數據進行精調,有效提高模型的泛化能力與實際可用性。
在數據的可獲取性方面,中國的數據政策更具開放性,為化學大模型提供更廣泛的學習素材。此外,化學大模型通常面臨多模態數據的融合挑戰。2025年4月16日,上海人工智能實驗室發布并開源了通用多模態大模型“書生·萬象 3.0(InternVL3)”。該模型區別于傳統“語言模型+視覺插件”的后融合方式,使模型具備原生處理多模態輸入的能力。
3.3 人類如何適配AI快速發展的腳步?
隨著科學體系的持續膨脹,人類個體已難以掌握所有知識的細節。AI與人類的協作應基于雙重路徑:
一方面,人類必須通過數學與理論工具提升自身解析AI輸出的能力,建立可驗證的科學體系;
另一方面,應合理接受知識封裝機制,在必要時將AI模型作為可信賴的“黑箱工具”,從而將精力集中于更具創新性和突破性的科研任務。
4 AI重塑科研范式:基礎設施、應用賽道與探索邊界
4.1 工業級智能實驗室將怎樣重塑科研范式?
未來的實驗室將邁向工業級智能體集群協作體系,實現設備、流程、數據的全面標準化與智能化。在這一愿景下,自動化合成單元、高通量表征平臺、在線數據采集與分析系統將通過統一的操作系統與調度平臺聯接成“實驗工廠”。在更大尺度上,多平臺、多實驗室通過云端互聯形成“科研智能體網絡”。研究人員從大量繁瑣的重復性操作中解放出來,將更多時間投入到問題抽象、機理思考和結果解讀之中,科研活動從“體力密集型”向“智力驅動型”徹底轉變。
4.2 AI助力下,化學首先會在哪些賽道實現突破?
目前,AI在化學領域的典型應用包括分子設計、反應預測、催化劑篩選和合成路徑規劃等方向,并在多個研究環節取得了一系列具有突破性的成果。
從學科本身的發展邏輯出發,理論化學可能是最先全面受益于AI加持的領域。其次,配方篩選類問題也是AI較容易突破的方向,催化化學和合成化學是2個典型受益方向。在實際應用與商業化方面,藥物合成化學是當前AI最具產業潛力的方向之一,尤其是與蛋白質功能相關的研究領域。總體來看,與理論建模聯系緊密、結構變量有限的化學子領域,在當前AI發展的階段更容易取得實際突破。
4.3 科學探索的“偶然之美”還能出現嗎?
人工智能的現階段能力,應該更多聚焦于“立地”的方向,即將既有理論和知識體系轉化為可落地、可應用的科研成果。只有當AI擁有足夠“理解世界”的能力時,科學研究才可能從“實驗驗證”邁向“理論自洽與直接預測”的全新范式。
5 AI時代的化學人才與科研角色重構
5.1 AI時代,化學創新人才的成長路徑何在?
在授業和解惑方面,AI的能力在許多情境下已展現出明顯優勢。AI或許能發現上千個可行的公式與路徑,但真正具備判斷力的,仍是人類自身。在AI輔助科研日趨普遍的背景下,未來的研究人員將愈發“原子化”——每個人的研究風格、學術趣味和問題選擇將變得更加多元和個性化。
5.2 AI進入科學領域,會否讓研究生失業,甚至讓科學家無事可做?
AI進入科學領域所催生的“智能科學家”,其使命從來不是取代人類,而是賦能并增強科學家的能力。對于化學領域的青年研究者而言,更重要的不是“是否會被AI取代”,而是“如何與AI共同成長”,讓自己成為那個能駕馭智能工具、引導科研方向的人。
6 結語
人工智能正在深刻重塑化學研究范式。在新材料、新能源、生物醫藥等前沿領域,AI正成為驅動原創性突破的關鍵引擎。然而,這一變革仍處于早期階段,其進一步發展面臨很多挑戰。AI不應被神化或簡化,而應與人類智能協同互補。二者融合,將成為推動科學躍遷的重要力量。
本文作者:江俊、崔乘幸、黃文光
作者簡介:江俊,中國科學技術大學精準智能化學全國重點實驗室,化學與材料科學學院,河南省科學院智慧創制研究所,教授,研究方向為計算化學和人工智能化學。
文章來 源 : 江俊, 崔乘幸, 黃文光. AI能否成為化學知識的發現者?[J]. 科技導報, 2025, 43(21): 16?22 .
本文有刪改,
內容為【科技導報】公眾號原創,歡迎轉載
白名單回復后臺「轉載」
《科技導報》創刊于1980年,中國科協學術會刊,主要刊登科學前沿和技術熱點領域突破性的研究成果、權威性的科學評論、引領性的高端綜述,發表促進經濟社會發展、完善科技管理、優化科研環境、培育科學文化、促進科技創新和科技成果轉化的決策咨詢建議。常設欄目有院士卷首語、科技新聞、科技評論、專稿專題、綜述、論文、政策建議、科技人文等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.