![]()
2025年諾貝爾化學獎重磅揭曉,日本科學家北川進、澳大利亞科學家理查德·羅布森與美籍約旦科學家奧馬爾·亞吉因“開發金屬有機框架(MOF)材料的開創性貢獻”摘得桂冠。瑞典皇家科學院用“為化學創造了新空間”高度贊譽這一成就——三位先驅通過金屬離子“角點”與有機分子“梁柱”的精準組裝,構建出內部布滿規則空腔的晶態結構,既實現了材料性能的按需定制,更開創了“分子層面主動規劃空間”的全新化學研究范式。從羅布森首次搭建的“分子宮殿”,到北川進證實的氣體吸附柔性特征,再到亞吉合成的高溫穩定型MOF-5(幾克材料的內表面積堪比足球場),MOF材料已憑借超高比表面積、可設計孔道結構的核心優勢,在碳捕集、氣體儲存、沙漠取水、污染物降解等關鍵領域展現出改變世界的潛力,成為應對全球碳中和、資源短缺等重大挑戰的核心材料平臺。
![]()
金屬有機框架(例如 MOF-303 和 MOF-LA2-1)在水收集應用中表現出色。為了實現此類材料的網狀設計,準確預測具有化學準確性的吸附特性并充分考慮柔性至關重要。計算預測 MOFs 中的水吸附特性已成為標準做法,但當前方法缺乏設計新材料所需的預測能力。限制源于描述原子間勢的方式以及對框架柔性的考慮不足。在本文中,作者展示了一種獲得化學精確吸附等溫線的方法,該方法充分考慮了框架的柔性。該方法依賴于非常準確且經過有效訓練的機器學習勢和過渡矩陣蒙特卡羅模擬來考慮框架的靈活性。對于 MOF-303,只要使用準確基準的電子結構方法來訓練機器學習勢,并考慮局域和全局框架柔性,就可以獲得定量準確的吸附等溫線。通過對 MOF-333 和 MOF-LA2-1 的研究展示了更廣泛的適用性。分析 MOF 中的水密度分布可以深入了解決定等溫線形狀和起源的因素。最佳水收集器應具有中等吸附強度的初始吸附位點,以防止有害的低壓吸水。為了增加吸附容量,可以使用配體擴展策略,同時保持初始吸附位點,如 MOF-LA2-1 中所做的那樣。該方法可應用于其它客體分子和 MOFs,從而實現具有特定吸附性能的 MOFs 的未來設計
四大頂尖課程
01 機器學習輔助金屬有機框架(MOFs)智能設計
02 機器學習輔助催化劑設計
03 機器學習分子動力學
04 機器學習與第一性原理計算
一、機器學習輔助金屬有機框架(MOFs)智能設計
講師介紹
![]()
主講老師來自國內985.211雙一流高校!長期從事基于大數據和人工智能的環境毒理和智慧農業研究,發表論文50余篇,其中SCI論文44篇;以第一或通訊作者身份在Chem. Rev. 、Nat. Commun.、Environ. Sci. Technol.、Anal. Chem.等期刊發表論文20篇;主持國家自然科學基金面上項目和青年基金等項目6項;申請中國發明專利13件,其中授權4件
課程內容
第一天的課程以人工智能與材料科學的交匯為起點,聚焦AI for Science的革命性進展與MOF研究的歷史沿革。理論部分從2024年諾貝爾物理學獎引發的“AI科學時代”談起,系統介紹人工智能的基本原理、發展歷程與核心概念,闡述機器學習與深度學習的基本架構、典型流程與應用邏輯。隨后講解金屬有機框架(MOF)的基本結構組成、發展歷史及在氣體儲存、催化、藥物遞送等領域的研究熱點,強調AI在加速MOF發現與性能預測中的關鍵作用。實操部分涵蓋Python與Linux環境配置、MOF數據庫(CSD、CoRE-MOF、QMOF)使用、結構可視化與特征提取(Zeopp、Poreblazer、MOFid),幫助學員完成從“數據理解”到“初步分析”的過渡。
第一天:AI 與 MOF 的基礎認知與科學范式理論部分
? 人工智能的科學革命:從符號主義到深度學習的演進路徑
? AI 基本理論框架:監督學習、無監督學習、強化學習、生成模型的基本概念與應用領域
? 機器學習典型流程:數據預處理 → 特征工程 → 模型訓練 → 驗證與解釋
? 深度學習簡介:神經網絡結構、反向傳播算法、過擬合與泛化能力
? MOF 材料基礎知識:結構組成(有機配體–金屬節點–拓撲網絡)
? MOF 的發展歷程與研究熱點:從 MOF-5、ZIF-8 到多功能雜化框架
? MOF 在能源、環境與醫藥領域的應用:氣體儲存、CO? 捕集、污染物吸附、藥物緩釋、催化反應
? AI 與 MOF 的融合趨勢:從實驗發現到智能預測與自主設計
![]()
實操部分
? Linux 與 Python 科學計算環境搭建(Anaconda / Mamba)
? MOF 結構可視化與格式轉換(ASE、Avogadro)
? 數據集構建:從 CoRE-MOF、CSD、QMOF 數據庫篩選與清洗
? 特征提取:Zeopp、Poreblazer、MOFid 工具的使用? Python 實現 MOF 比表面積、孔徑分布、能量參數計算
![]()
第二天:傳統機器學習方法在MOF性質預測中的深入實踐
第二天聚焦傳統機器學習算法在MOF性質預測中的理論與實操應用。課程首先回顧機器學習在材料科學中的發展脈絡,介紹回歸、分類與聚類模型在MOF結構–性能關系建模中的核心思想。理論部分系統講解線性回歸、支持向量機(SVM)、隨機森林(RF)、梯度提升(XGBoost、LightGBM)等算法的基本原理與適用場景,結合MOF比表面積、吸附能、能帶結構等具體任務展示其建模流程與可解釋性分析方法。實操部分以CO?和CH?吸附預測為案例,帶領學員進行特征工程、模型訓練、參數優化與SHAP特征貢獻分析,掌握模型從構建到評估的完整過程。
? 機器學習在材料科學中的應用模式
? MOF 結構–性質關系的定量表征思路(QSAR/QSPR)
? 特征工程在 MOF 性質預測中的作用
? 常用算法解析:線性回歸(LR)、SVM、隨機森林(RF)、XGBoost、LightGBM、CatBoost
? 模型評估指標(R2、RMSE、MAE)及交叉驗證方法
? 案例研究:CO? / CH? 吸附等溫線預測、MOF 比表面積與能帶結構預測、SHAP 可解釋性分析
![]()
實操部分
? 構建 MOF 性質預測數據集(QMOF + CoRE-MOF)
? 使用 Python 實現 XGBoost/RF/SVM 模型訓練
? 參數優化與特征選擇(GridSearchCV、SHAP、Boruta)
? 可視化模型性能(學習曲線、誤差散點圖)
? 結果解釋與物理關聯分析
![]()
第三天:圖神經網絡(GNN)賦能MOF結構–性能建模
第三天進入課程核心模塊,聚焦圖神經網絡(Graph Neural Network, GNN)在MOF研究中的應用。理論部分首先介紹GNN的數學基礎與消息傳遞機制(Message Passing),闡釋如何將MOF的晶體結構轉化為原子–鍵圖表示,從而實現結構信息的高效編碼。課程進一步講解主流模型如CGCNN、MEGNet、ALIGNN、CrystalNN及MatGL的網絡架構、優勢與局限,并結合Nature Communications等高被引研究案例展示GNN在MOF吸附能與能帶預測中的表現。實操部分帶領學員使用PyTorch Geometric / DGL框架構建并訓練GNN模型,掌握從數據預處理、圖結構生成到模型訓練與注意力可視化的完整流程,幫助學員實現從“描述符思維”向“結構圖學習”的轉變。
第三天:圖神經網絡(GNN)與 MOF 結構–性能建模理論部分
? GNN 基礎:從分子圖到晶體圖表示
? 節點與邊特征的構建方式:化學鍵、配位環境、拓撲連通性
? 消息傳遞機制(Message Passing)與圖卷積操作(Graph Convolution)
? 主流 GNN 模型:CGCNN、MEGNet、ALIGNN、CrystalNN、MatGL
? GNN 在 MOF 建模中的優勢與挑戰? 案例研究:基于 GNN 的 MOF 能帶與吸附能預測
![]()
實操部分
? 使用 PyTorch Geometric / DGL 框架構建 GNN 模型
? 將 MOF 結構轉換為圖表示(節點–邊矩陣)
? 訓練 MEGNet 模型預測 CO? 吸附能
? 可視化注意力權重與結構貢獻區域(Attention Heatmap)
? 模型對比實驗:GNN vs XGBoost vs RF
第四天:生成模型與逆向MOF設計的前沿探索
第四天課程聚焦生成式人工智能(Generative AI)在MOF設計中的應用與創新。理論部分介紹變分自編碼器(VAE)、生成對抗網絡(GAN)和擴散模型(Diffusion Model)在材料設計中的基本原理與發展趨勢,闡述潛空間學習(Latent Space)與性能引導型生成(Property-guided Generation)的核心思想。重點講解MOF-VAE、MOF-Diffusion與MOFGen等代表性框架如何實現從性能目標到結構反向生成,并討論貝葉斯優化與強化學習在逆向設計中的融合策略。實操內容包括基于VAE的MOF潛空間映射、性能導向生成模型訓練、Diffusion模型微調與生成結構的穩定性驗證,幫助學員掌握“從屬性到結構”的AI反向設計路徑。
第四天:生成模型與逆向 MOF 設計理論部分
? 生成式 AI 在材料科學中的崛起(VAE、GAN、Diffusion)
? 潛空間(Latent Space)學習與結構生成機制
? MOF-VAE、MOF-Diffusion 與 MOFGen 框架介紹
? 性能引導型生成策略:從目標性質出發的反向設計
? 貝葉斯優化與強化學習在逆向設計中的結合
? 可合成性與穩定性判定:synthetic accessibility 指標? 案例研究:基于生成模型的 CO? 捕集 MOF 反向設計
![]()
實操部分
? 使用 MOF-VAE 實現結構潛空間映射與生成
? 構建目標導向生成模型(以甲烷吸附量為目標)
? 貝葉斯優化算法調控生成方向
? Diffusion 模型訓練與新結構篩選
? 使用 DFT / GCMC 驗證生成結構的能量與吸附性能
第五天:大語言模型(LLM)賦能MOF智能設計與自主發現
課程的最后一天聚焦大語言模型(Large Language Model, LLM)在MOF研究中的最新應用與發展方向。理論部分首先回顧從ChatGPT到MatGPT、ChemLLM的演化歷程,系統闡述大模型在科學知識建模、文本生成與跨模態推理中的潛能。課程進一步講解LLM在MOF領域的三大應用方向:文獻語義挖掘與自動摘要、語義驅動的結構篩選與性質預測、以及結合AutoML實現的自動化設計與分析。實操部分將帶領學員使用MatGPT與LangChain框架實現“文本→結構→性能預測”的智能閉環,探索如何構建自學習型MOF智能體,實現從知識理解到材料發現的自主創新過程,為AI賦能材料科學的未來奠定實踐基礎。
第五天:大語言模型(LLM)在 MOF 智能設計中的應用理論部分
? 大語言模型的崛起與科學研究新范式(ChatGPT → MatGPT → ChemLLM)
? LLM 在材料科學中的認知與生成能力:文本到結構、文本到實驗
? 材料知識圖譜與 LLM 的融合(MaterialsKG、MatGPT、MATTERverse)
? LLM 在 MOF 研究中的應用:文獻挖掘、語義篩選、AutoML 自動化分析
? 未來展望:多模態智能體(Multi-agent)助力自主材料發現
![]()
實操部分
? 使用 MatGPT 或 ChemLLM 生成 MOF 結構候選
? 文獻語料的自動標注與知識抽取(Python + LangChain)
? 實現“文本 → 結構 → 性質預測”全流程
? 利用 LLM 結合 AutoML 實現自適應 MOF 篩選
? 構建自學習型 MOF 智能體
二、機器學習輔助催化劑設計
授課講師
![]()
周老師來自全國重點大學、國家“985工程”、“211工程”重點高校,長期致力于機器學習在催化劑設計中的創新應用,尤其在深度學習、圖深度學習等前沿技術的催化材料探索中積累了豐富經驗。主講老師在該領域累計發表高水平論文70余篇。授課風格清晰生動,善于將抽象的理論與復雜的計算方法轉化為易于理解的知識點,幫助學員輕松把握核心內容。
課程內容
第一天上午
理論內容(約1小時):
1.機器學習在材料領域的前沿應用
2.機器學習催化劑設計的常用方法
3.機器學習輔助催化劑設計詳細應用
實操內容 (約1.5小時)
1.Python基礎:字符串,列表,字典,變量,if語句,循環,函數
2.Python科學數據處理:NumPy,Pandas,seaborn,Matplotlib,Scipy
![]()
案例:在AI For Science深刻重塑科研與產業運作邏輯的當下,機器學習已成為打破傳統研究邊界、催生創新解決方案的核心工具。本課程聚焦于幫助學員突破Python基礎應用的瓶頸,構建貼合科研數據建模與程序開發需求的核心編程能力,同時指導學員快速搭建穩定高效的開發與分析環境,為后續開展AI驅動的科學計算、數據挖掘與算法實現夯實基礎,助力學員真正躋身AI賦能科學創新的新陣營。
第一天下午
理論內容(約1小時):
1.sklearn基礎介紹
2.十大機器學習算法理論框架
3.線性回歸原理和正則化
4.機器學習中的監督學習
5.機器學習中的回歸、分類任務
實操內容(約2小時)
1. 線性回歸方法的實現與初步應用
2. L1和L2正則項的實現方式
3. 嶺回歸和Lasso回歸的示例操作
4. 線性回歸用于單原子合金篩選
![]()
案例:氧還原(ORR)反應和析氧(OER)反應是清潔能源轉化的關鍵反應,其反應動力學復雜,陰極的氧還原反應和析氧(OER)反應是實現清潔能源轉化的關鍵反應。近年來,雙金屬中心催化劑(DMSCs)因其原子利用率高、穩定性強、催化性能好等優點受到了廣泛的關注和研究。本研究目的是采用密度泛函理論(DFT)和機器學習(ML)相結合的方法,研究了吸附物在數百種潛在催化劑上的吸附自由能,旨在指導學院篩選出對ORR和OER具有高活性的催化劑。
第二天上午
理論內容(約1小時):
1. 邏輯回歸(LR)與交叉熵損失的內在聯系
2. K近鄰方法(KNN)原理
3. 神經網絡內部參數詳解
4. 支持向量機(SVM)中軟間隔和硬間隔的區別
實操內容(約1.5小時)
1.邏輯回歸用于分類任務
2.KNN方法用于回歸任務的實現
3.支持向量機用于回歸和分類任務
4.神經網絡方法用于CO2還原電催化劑的發現
![]()
案例:銅基合金催化劑在二氧化碳還原反應(CO2RR)領域得到了廣泛應用,這是因為其具有良好的選擇性和較低的過電位。本課程目的是指導學員設計機器學習模型。通過實施嚴格的特征選擇過程,并通過ML模型能夠成功且快速地預測 CO2RR 過程中關鍵中間體的吸附能,用于篩選出用于 CO2RR 的極具前景的二元合金。
第二天下午
項目實操(約-3.5小時):
1.機器學習方法設計高性能鋰硫電池電催化劑
2.機器學習數據集來源
3.機器學習中數據分析及數據清洗
4.機器學習中特征工程實現方式有那些
5.sklearn實現網格搜索和隨機搜索
6.機器學習中交叉驗證的基本原理和實現方式
![]()
案例:在鋰硫電池電催化劑的研發進程中,高效性能的突破始終依賴于對催化劑材料特性的精準調控--而單原子催化劑所具備的靈活組成、可調結構及可修飾吸附位點,恰好為滿足鋰硫電池的催化需求提供了關鍵支撐。本課程的核心目標,便是指導學員運用機器學習這一高效工具,構建起單原子催化劑的材料特性與鋰硫電池催化活性之間的定量關聯模型,進而縮短鋰硫電池電催化劑的研發周期,推動其性能優化與實際應用進程。
第三天上午
理論內容(約1小時):
1.決策樹
1.1決策樹的原理
1.2決策樹的分類決策方式
2.集成學習方法
2.1集成學習基本原理
2.2 bagging基本原理
2.3隨機森林方法
2.4 Boosting方法的基本原理及多種模型區別
實操內容(約1.5小時)
1.決策樹的模型實現及決策過程可視化
2.隨機森林的實現和應用
3.Xgboost、LightGBM的實現及網格搜索最優參數
![]()
案例:集成學習通過多層模型的組合與融合,在提升模型性能上有顯著優勢。在數據挖掘中,面對海量且復雜的數據,單一模型往往難以全面捕捉數據特征;而集成學習能結合弱學習器的性能,先讓各基礎模型從不同角度挖掘數據,再通過加權等方式融合結果,從而更全面地剖析機器學習的結果。本課程旨在指導學員利用集成學習的強大優勢,更高效快速的建立機器學習模型,以加速催化劑的發現。
第三天下午
項目實操(約2.5-3小時)
1.機器學習用于發現CO2RR催化劑
2.樹模型中的特征重要性分析
SHAP可解釋性分析在模型中的可解釋性
![]()
案例:近年來,結合高通量策略與機器學習的技術路徑,已成為加速潛在高性能催化劑發現的核心方向,受到領域內廣泛關注。機器學習結合高通量方法對大量候選體系進行快速篩選,從而精準定位高效二氧化碳還原催化劑。此外,通過SHAP可解釋性分析,還能深度挖掘影響二氧化碳還原催化劑活性、選擇性與穩定性的關鍵制備條件,為實驗制備提供明確指導,大幅提升高效二氧化碳還原催化劑的研發效率。
第四天上午
理論內容(約1小時):
無監督學習基礎
1.1 無監督學習適用場景
1.2 無監督學習核心算法--聚類:原理、典型方法與應用場景
1.3 無監督學習核心算法--降維:目標、常用技術與適用場景
材料與化學數據的特征工程技術
2.1 分子指紋:結構表示的構建方法
2.2 One-Hot 編碼:在材料/化學數據中的實現步驟
2.3 matminer 工具:材料特征編碼的優勢、核心功能與完整構建流程
實操訓練(約 1.5 小時)
3.1鳶尾花數據集:聚類模型搭建與結果分析
3.2 K-Means 聚類:算法實現調優與結果評估
3.3 T-SNE 降維:高維特征向量映射與降維后可視化分析
3.4 PCA 特征工程實戰:特征降維處理、二維映射繪制
3.5 層次聚類實戰:聚類樹構建、最佳聚類數確定與應用
![]()
案例:無監督學習旨在從無標簽數據中挖掘模式與結構,t-SNE作為其中重要的降維工具,專注于保留高維數據點間的局部結構。本課程將深入解析t-SNE的核心原理--通過概率分布衡量數據點間的相似性,借助優化KL散度實現降維,展現其在高維數據可視化中的強大作用,并通過代碼實操涵蓋數據加載、參數調優、降維及可視化等環節,幫助學員熟練掌握t-SNE在不同場景下的應用,從而更好地探索數據的潛在結構與模式。
第四天下午
項目實操(約2.5-3小時)
理論模塊(約 1 小時):深度學習與材料研發的核心關聯
1.深度學習基礎與技術核心:從數據驅動角度,解析神經網絡基本結構、梯度下降、反向傳播等訓練原理,點明其適配材料復雜數據的優勢
2.深度學習在材料領域的應用:聚焦 HER 電催化材料,簡述其在材料結構預測、催化活性回歸、失效分析等場景的應用,對比傳統實驗的效率優勢
3.材料適配的深度學習框架:針對材料數據類型,講解 CNN、RNN/LSTM、Transformer的核心架構與應用邏輯
實操模塊(約 2.5 小時):HER 電催化劑的深度學習研發實踐
1. PyTorch 工具鏈實操:完成環境配置、材料數據預處理
2. pymatgen 開放接口:調用Materials Project數據庫獲取 HER 電催化劑數據,完成清洗、格式轉換
3. matminer 特征工程:用其生成催化劑結構化特征,訓練機器學習模型
4. 深度學習模型開發:搭建 CNN、LSTM模型,調優后預測 HER 催化活性,篩選高活性催化劑
![]()
案例:近年來,高通量與機器學習相結合的策略在加速潛在新材料發現方面受到廣泛關注。為此,可設計一種直觀方法:檢索Materials Project數據庫并結合深度學習模型,再將其與HT方法耦合,以篩選高效的HER催化劑。
第五天上午
理論內容(約1小時):
1.圖深度學習理論基礎
2.圖深度學習應用實例及知識圖譜分析
3.知識圖譜與機器學習的聯系
實操內容(約1.5小時)
1. 圖結構構建及可視化
2. PyTorch Geometric基礎介紹
![]()
案例:近年來,在晶體性能預測領域,圖神經網絡(graph neural network,GNN)模型取得了顯著進展。GNN模型能夠有效從晶體結構中捕捉高維晶體特征,從而實現優異的性能預測效果。同時本課程將指導學員搭建圖深度學習開發環境,助力其順利構建圖結構并開展機器學習訓練。
第五天下午
項目實操(約3小時)
1.圖神經網絡模型基本概述及CGCNN代碼深度解讀應用
2.Neo4j構建二氧化碳還原圖反應網絡
3.知識圖譜構建、桑基圖和弦圖分析
4.圖神經網絡編碼后結構的T-SNE二維可視化
![]()
案例:本課程指導學生設計完成知識圖譜的構建,挖掘其隱性關聯信息,建立知識圖譜的推理能力;指導學員構建圖神經網絡,用于催化材料的高通量篩選,為AI加速材料設計提供新的思路。
三、機器學習分子動力學
授課講師
![]()
主講老師來自國內985高校!研究方向:計算材料學 高熵合金 研究主要從事AI4S,從事計算機和物化方面的叉研究師資產出:SCI一區一作2篇,SCI二區一作2篇,SCI一區和二區三作共一第二各一篇。熟悉機器學習算法,圖神經網絡,graphormer,uni-mol等,熟悉機器學習勢deepmd、nep、mace等, 在JCTC、JPCL、PCCP發表機器學習與材料相結合文章
課程內容
第一天、 第一性原理基礎、分子動力學原理和Python編程
1.理論內容
(1)科學研究的四范式
①從大數據時代到AI4SCIENCE時代,如Google DeepMind/微軟研究院/Meta FAIR等著名AI團隊的AI4SCIENCE工作介紹
(2)AI4SCIENCE時代的分子動力學模擬
① 分子模擬基本方法與發展歷史
② 量子化學中常見理論方法的分類與區別,DFT相關泛函的簡要介紹
③ 經驗力場與第一性原理方法的對比與區別
④ 機器學習力場方法的興起
2.實操內容
(1)Linux系統與超算服務器的常規操
① ls/ll/cd/cp/mv/cat/pwd/less/tail/mkdir/touch以及vim的常見操作
(2)python虛擬環境(Anaconda)的使用
① conda create/activate/deactivate/install/info/env等命令
(3)Python的集成開發環境(IDE)的介紹與基本使用
① Python的基本數據類型、函數、模塊
② Pycharm的常見用法與代碼調試,以及虛擬環境的配套
③ Pytorch的安裝和調用GPU訓練模型
(4)原子建模環境軟件ASE的使用
① 使用ASE對體系結構進行建模,得到cif文件
② ASE和VASP、GPAW等軟件結合使用
(5)分子模擬軟件介紹——LAMMPS的入門與使用
① 軟件發展趨勢與特點
② 大規模并行的原理:域分解算法介紹
③ 輸入文件的詳細解析與注意事項
4.相關勢函數和晶格常數的獲取渠道
5.分子模擬軌跡的后處理與分析:徑向分布函數與擴散系數
6.機器學習勢函數在LAMMPS中的使用
(6)量子化學計算軟件VASP的介紹與快速上手
① 軟件發展趨勢與特點
② 安裝與使用,以及贗勢文件的介紹與獲取
③ 使用VASPKIT軟件快速生成VASP的單點能或分子動力學模擬的輸入文件
④ 輸入文件的字段解釋與注意事項
⑤ 使用Python實現自動化提交任務與任務后處理
(4)案例:傳統力場方法與機器方法力場方法的對比
① 基于基于經驗力場方法,結合LAMMPS執行合金體系模擬;
② 基于機器學習力場方法,結合LAMMPS執行合金體模擬;
使用MDtraj等軟件進行模擬結果的后處理分析與Python高質量科研繪圖,包括:能量與力的預測曲線,徑向分布函數,鍵長鍵角二面角分布等。
![]()
Fig 1. Schematic Diagram of Spatiotemporal Scale Distribution and Cross-Scale Accuracy-Efficiency Trade-off of Multiscale Physical Models
第二天、機器學習力場的模型設計
1.理論內容
(1)機器學習與深度學習的快速入門
① 機器學習常見概念與分類
② 機器學習的發展歷史以及通用近似理論:
③ 解釋神經網絡對GPU的依賴
④ 神經元,反向梯度下降,損失函數,過/欠擬合,殘差連接等基本概念
⑤ ANN, CNN, RNN, TRANSFORMER,ResNet等經典深度神經網絡的基本框架的介紹與特點
⑥ 相關學習資源的推薦
⑦ Pytorch與Tensorflow的發展現狀
(2)科學領域的機器學習模型介紹
① AI模型在SCIENCE領域需要遵守的幾個物理約束/物理對稱性
② 高效描述局部環境方法的分類與特點
a.基于核方法或深度神經網絡方法
b.基于描述符或分子圖方法
③ 基于描述符的機器學習力場模型
④ 機器學習力場的開篇工作——HDNNPs(BPNN)模型詳解與發展
⑤ 國內生態最好的機器學習力場模型——DeePMD系列
a.DeePMD系列工作的詳解
b.DeePMD的發展和幾種描述符的介紹,特點與應用
c.DeePMD的壓縮原理與特點
d.DPGEN的工作原理
2.實操內容
① DeePMD的離線安裝與驗證測試
② DeePMD輸入文件詳解:與理論課的模型框架相對應地進行超參數設定的講解,及使用經驗
③ DeePMD的常見功能,包括訓練,重啟,凍結,壓縮和測試
④ DeePMD的常見問題與訓練過程的分析
⑤ 綜合使用LAMMPS和DeePMD, 執行高精度的分子動力學模擬
⑥ 分子模擬的數據后處理與分析
⑦ DPGEN軟件的安裝,介紹與工作流程
⑧ DPGEN軟件的輸入和輸出文件:param.json和machine.json文件的參數詳解
⑨ DPGEN軟件跨計算分區的提交任務示例;不同量化級別方法的示例
⑩ DPGEN軟件的常用命令與使用經驗,以及不同體系收斂的參考標準
![]()
Fig 2. The components of the DeePMD-kit package. The direction of the arrow indicates the dependency between the components. The blue box represents an optional component.
![]()
Fig 3. Flowchart of DP-GEN Active Learning (Active Learning Framework for Materials Simulation Based on Density Functional Theory).
第三天、圖神經網絡與等變模型
1.理論內容
(1)圖神經網絡、圖卷積網絡和消息傳遞神經網絡的發展與理解
① 圖神經網絡和MPNN消息傳遞神經網絡
② 具有不變性的消息傳遞神經網絡
③ 晶體圖卷積神經網絡CGCNN
④ 消息傳遞神經網絡的一般框架和組成
⑤ SchNet和DimeNet++等不變消息傳遞神經網絡的介紹
⑥ SchNet和DimeNet++的特點
⑦ DimeNet++中角度信息的引入——球諧基函數
⑧ 深入理解消息傳遞過程——圖卷積
(2)等變模型的理解
① 具有等變性的消息傳遞神經網絡
② 等變的概念
③ 等變性和不變性的區別
④ 理解等變性——群論的初步介紹
⑤ 等變消息傳遞神經網絡和不變等變消息傳遞神經網絡的對比
⑥ 常見的等變模型——PaiNN、NequIP和Allegro模型介紹
⑦ PaiNN——通過距離矩陣實現等變性
⑧ NequIP和Allegro——通過不可約表示實現等變性
2.實操內容
(1)以不變消息傳遞神經網絡SchNet為例,介紹SchNetPack的安裝和使用,包括:
①QM9數據集的準備
②使用QM9數據集訓練SchNet模型
③模型對體系能量和原子受力預測精度的評估
④將SchNet模型用于分子動力學模擬
⑤原子對徑向分布函數等性質的計算
(2)高精度、輕量化的PaiNN等變神經網絡
①PaiNN模型代碼的詳解
②PaiNN模型的訓練和使用
③SchNet和PaiNN模型的對比——精度
④切身體會不變性和等變性消息傳遞神經網絡的區別
(3)NequIP模型的安裝和使用,以及Nature Communications頂刊論文結果復現
①NequIP軟件包的安裝
②超參數的設置和介紹
③復現Nature Communications論文結果
(4)MACE模型的安裝和使用以及Nature Communications
①MACE代碼框架詳解
②MACE軟件的安裝和使用
③MACE和LAMMPS分子動力學軟件結合使用
④Nature Communications論文結果復現,
(5)Allegro模型的安裝和使用以及Nature Communications頂刊論文結果復現
①Allegro代碼框架詳解
②Allegro軟件的安裝和使用
③Allegro和LAMMPS分子動力學軟件結合使用
④Nature Communications論文結果復現,
![]()
Fig 4. Prediction and explanation of molecular energies with a deep tensor neural network.
![]()
Fig 5. The NequIP network architecture.
第四天、NEP勢函數訓練與金屬體系應用
1.理論內容
① NEP 勢函數核心特性:輕量、高效、金屬體系適配
② NEP機器學習勢函數訓練程序的輸入與輸出
③ NepTrain與NepTrain-kit軟件的介紹與簡單使用
④ NEP 在金屬模擬中的價值:解決傳統力場精度不足問題
⑤ NEP89 大模型:元素覆蓋范圍、泛化能力
⑥ DPA3通用原子大模型
2.實操內容
(1)NEP 數據集制備
a.從 DFT 計算結果(如 VASP OUTCAR)提取數據
b.數據集格式轉換;用 dpdata 制作微擾結構(增強數據多樣性)
(2)NEP 模型訓練
a.NEP 訓練程序安裝
b.輸入 / 輸出文件解析;模型訓練與收斂判斷(能量 / 力誤差標準)
(3)金屬體系模擬實踐
a.基于 NEP 模型的金屬模擬:拉伸測試(Al)、熔點預測(Cu)、壓縮實驗(Cu-Ni 合金)
b.后處理:Python 繪制應力-應變曲線、MSD、RDF 等科研圖表
![]()
Fig 6. Schematic architecture of NEP4 model and multi-loss evolutionary training algorithm.
四、機器學習與第一性原理計算
授課講師
![]()
主講老師來自國內985重點高校,擁有兩年海外留學經歷,計算物理和計算材料研究方向,參與多項國家自然科學基金面上項目。熟悉深度學習方法和第一性原理計算及相關軟件的使用,具有豐富的編程經驗,對深度學習方法應用于第一性原理計算有深入的研究和優秀的成果,在Physical Review Letters、Physical Review B等PR系列期刊和Journal of Physical Chemistry C等期刊上發表數篇論文。
課程內容
第一部分:第一性原理基礎和Python編程
1. 理論內容
(1) 課程引言
① 第一性原理計算的基本概念——從量子力學基本方程到材料性質的預測
② 深度學習在第一性原理計算中的應用和優勢
③ 課程內容安排
(2) 第一性原理計算基本理論
① 第一性原理計算的發展歷程——從薛定諤方程到密度泛函理論
② 密度泛函理論(DFT)——從波函數到電子密度
③ 交換關聯泛函的作用和平面波與平面波基組
(3) 第一性原理計算軟件
① Python編程語言介紹
② 常用的原子建模環境軟件——ASE和pymatgen
③ 常用的第一性原理計算軟件——VASP和GPAW
2. 上機實驗
(1) Linux系統的常用命令
① 命令行終端軟件——iTerm和Xshell
② ls/ll/cd/cp/mv/cat/pwd/less/tail/mkdir/touch等命令行操作
③ vim文本編輯
(2) Python環境管理軟件Anaconda的使用
① 使用Conda命令創建環境、安裝Python庫
② 使用Conda命令管理環境和環境的回溯
(3) Python編程語言基礎和集成開發環境(IDE)的介紹
① 數據類型、函數、類和對象、模塊
② Pycharm軟件的使用和常見用法
③ Jupyter Notebook的使用
(4) Python實戰
① 條件語句,循環語句等
② Numpy數學運算庫
③ Pandas數據分析庫
④ Matplotlib數據可視化
(5) 超算服務器和Slurm作業調度系統的使用
(6) 原子建模環境軟件ASE的使用
① ASE的常用功能
② 使用ASE對體系結構進行建模,得到cif文件
(7) 第一性原理計算軟件GPAW、VASP的使用
① GPAW的基本操作和輸入文件
② ASE和GPAW、VASP等軟件結合使用
③ 第一性原理計算軟件的參數設置和結果收斂性檢查
④ 以晶體材料為例,使用GPAW/VASP進行第一性原理計算
⑤ 體系能量、原子受力和極化等性質的計算
![]()
第二部分:深度學習在第一性原理計算中的應用——神經網絡勢函數(一)
1.課程內容
(1)深度學習基本理論
①人工神經網絡與萬能近似定理
②神經元的基本結構與功能
③常見的激活函數及其特點
④前向傳播與反向傳播的基本原理
(2)深度學習的發展歷程和優勢
![]()
①神經網絡的發展歷程:從全連接到深度學習大模型
②神經網絡的常見分類:FNN、CNN、RNN和GNN
③深度神經網絡入門——以ResNet殘差神經網絡為例
④常用的深度學習庫——Pytorch介紹
神經網絡勢函數
![]()
![]()
①從高斯核回歸到神經網絡勢函數
②神經網絡勢函數的基本假設——局域性假設和對稱性要求
③原子結構和周圍化學環境的表征
④BPNN描述符和DP深度神經網絡勢函數
![]()
![]()
(4)晶體材料簡介及其電子結構特點
①晶體的基本概念:布拉維格子、空間群和對稱性
②晶體材料的電子結構和態密度分析
2.上機實驗
(1)第一性原理計算軟件進階
①VASP/GPAW計算BaTiO3的電子能帶結構和態密度、電荷密度等性質
②第一性原理數據集的構造——AIMD從頭算分子動力學
③使用T-sne技術進行數據集的可視化
(2) Pytorch深度學習庫
①Pytorch的安裝和調用GPU訓練模型
②Pytorch的基本功能與模塊化設計
③使用Pytorch搭建簡單的神經網絡模型
④神經網絡的訓練流程
(3)深度學習項目實踐——ResNet殘差網絡用于手寫數字識別
①手寫數據集的準備
②ResNet模型的訓練、測試和評估
③深度學習模型訓練的超參數設置和調參
第三天:深度學習在第一性原理計算中的應用——神經網絡勢函數(二)
1.課程內容
(1)分子動力學模擬
①第一性原理分子動力學——從微觀到宏觀
②分子動力學的基本原理——牛頓運動方程
③牛頓運動方程的幾種數值求解方法
④統計力學系綜概念
⑤LAMMPS分子動力學軟件介紹
⑥神經網絡勢函數和LAMMPS的結合——機器學習分子動力學模擬
(2)從描述符到圖表示:圖神經網絡和MPNN消息傳遞神經網絡
①具有不變性的消息傳遞神經網絡
②晶體圖卷積神經網絡CGCNN
③消息傳遞神經網絡的一般框架和組成
![]()
![]()
(3)SchNet和DimeNet++等不變消息傳遞神經網絡的介紹
①SchNet和DimeNet++的特點
②DimeNet++中角度信息的引入——球諧基函數
③深入理解消息傳遞過程——圖卷積
④圖卷積和圖像卷積的區別
![]()
2.上機實驗
(1)LAMMPS分子動力學軟件
①LAMMPS軟件的輸入設置
②LAMMPS腳本編寫的基本語法
③LAMMPS軟件任務運行與結果分析
(2)DeePMD深勢模型的安裝和使用
①DeePMD的離線安裝與測試
②DeePMD模型的訓練和驗證
③使用DeePMD模型進行高效的分子動力學模擬
④數據的處理和分析
(3)GNN圖神經網絡用于處理圖結構數據——以SchNet為例
①晶體結構的圖結構抽象和數據表示
②圖神經網絡的輸入、特征處理與輸出
③從預測能量到預測力——神經網絡自動微分的妙用
第四天:深度學習在第一性原理計算中的應用——神經網絡勢函數(三)
1.課程內容
(1)從不變性到等變性——具有等變性的消息傳遞神經網絡
①等變的概念
②等變性和不變性的區別
③理解等變性——群論的初步介紹
④等變消息傳遞神經網絡和不變等變消息傳遞神經網絡的對比
![]()
(2)常見的等變模型——PaiNN、NequIP和Allegro模型
①PaiNN——通過距離矩陣實現等變性
②NequIP和Allegro——通過不可約表示實現等變性
③易于大規模并行的等變模型——Allegro
2.上機實驗
(1)SchNet消息傳遞神經網絡的安裝和使用
①QM9數據集的準備
②使用QM9數據集訓練SchNet模型
③模型對體系能量和原子受力預測精度的評估
④將SchNet模型用于分子動力學模擬
⑤原子對徑向分布函數等性質的計算
(2)高精度、輕量化的PaiNN等變神經網絡
①PaiNN模型代碼的詳解
②PaiNN模型的訓練和使用
③SchNet和PaiNN模型的精度對比
④體會不變性和等變性消息傳遞神經網絡的區別
(3)NequIP模型的安裝和使用,以及Nature Communications頂刊論文結果復現
①NequIP軟件包的安裝
②超參數的設置和介紹
③復現Nature Communications論文結果
![]()
第五天:深度學習在第一性原理計算中的應用——高階內容
1.課程內容
(1)在神經網絡勢函數模型中加入長程相互作用
①長程相互作用介紹
②使用神經網絡預測離子電荷
③基于離子電荷計算長程相互作用
(2)磁性材料的第一性原理計算和建模
①磁性材料的磁性自由度
②磁性材料的勢能面建模——從傳統哈密頓量模型到機器學習模型
③磁性機器學習勢能面建模的挑戰:數據集構造和模型搭建
利用神經網絡對密度泛函理論哈密頓量進行建模
![]()
①DeepH方法
②深度學習密度泛函微擾理論(DFPT)方法
![]()
(4)Attention is All You Need——Transformer模型
①Transformer原理講解
②Transformer架構在AI模型中的應用
(5)通用原子體系大模型——MACE框架
①原子簇展開(ACE)方法
②MACE架構介紹和改進
③MACE:MPNN和ACE方法的結合
2.上機實驗
(1)Allegro模型的安裝和使用以及Nature Communications頂刊論文結果復現
①Allegro代碼框架詳解
②Allegro軟件的安裝和使用
③Allegro和LAMMPS分子動力學軟件結合使用
④Nature Communications論文結果復現
![]()
(2)聲子譜的計算
①使用Phonopy軟件計算固體材料的聲子譜
②使用深度學習勢函數加速聲子譜的計算
③比較模擬結果和第一性原理計算結果
(3)Transformer模型和實戰
①Transformer的Pytorch實現
②Transformer對序列化數據建模和預測
(4)MACE實戰
①MACE超參數的講解
②MACE-MP-0模型的加載和微調
③MACE模型用于分子動力學模擬
授課時間
機器學習輔助金屬有機框架(MOFs)智能設計
2025.12.22 -2025.12.26 (19:00--22:00)
2025.12.29 -2025.12.31(19:00--22:00)
2026.01.04 (09:00-11:30--13:30-17:00)
機器學習輔助催化劑設計
2025.12.22 -2025.12.26 (19:00--22:00)
2025.12.29 -2025.12.31(19:00--22:00)
2026.01.04 (09:00-11:30--13:30-17:00)
機器學習分子動力學
2025.12.20--2025.12.21(09:00-11:30 13:30-17:00)
2025.12.22--2025.12.25(19:00--22:00)
機器學習第一性原理
2025.12.19(19:00-22:00)
2025.12.26(19:00-22:00)
2025.12.28 (09:00-11:30--13:30-17:00)
2026.01.09(19:00-22:00)
2026.01.10-2026.01.11(09:00-11:30--13:30-17:00)
2026.01.12(19:00-22:00)
課程費用
機器學習輔助金屬有機框架(MOFs)智能設計
機器學習輔助催化劑設計
機器學習分子動力學
機器學習第一性原理計算
每人每個班¥4980元 (含報名費、培訓費、資料費)
套餐價:
同時報名兩個課程 9880元(含報名費、培訓費、資料費)
報名福利:
報二送一(同時報名兩個班贈送一個學習課程,贈送課程可任選)
兩班同報:9880元
三班同報:13880元(可以四個班學習)
特惠福利:18880元(可免費學習一整年本單位舉辦的任意課程)
優惠:提前報名繳費學員可得300元優惠(僅限前15名)
報名費用可開具正規報銷發票及提供相關繳費證明、邀請函,可提前開具報銷發票、文件用于報銷
報名直播課程可贈送往期課程回放(報一贈一回放課、報二贈四回放課)
培訓特色及福利
1、課程特色--全面的課程技術應用、原理流程、實例聯系全貫穿
2、學習模式--理論知識與上機操作相結合,讓零基礎學員快速熟練掌握
3、課程服務答疑--主講老師將為您實際工作中遇到的問題提供專業解答
授課方式:通過騰訊會議線上直播,理論+實操的授課模式,老師手把手帶著操作,從零基礎開始講解,電子PPT和教程開課前一周提前發送給學員,所有培訓使用軟件都會發送給學員,有什么疑問采取開麥共享屏幕和微信群解疑,學員和老師交流、學員與學員交流,培訓完畢后老師長期解疑,培訓群不解散,往期培訓學員對于培訓質量和授課方式一致評價極高!
學員對于培訓給予高度評價
報名咨詢方式(請二維碼掃描下方微信)
微信:766728764
電子郵箱:m15238680799@163.com
電話:15238680799
引用本次參會學員的一句話:
發現真的是腳踏實地的同時 需要偶爾仰望星空 非常感謝各位對我們培訓的認可!祝愿各位心想事成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.