在人工智能驅動材料科學發展的浪潮中,傳統材料開發高度依賴試錯法,成本高昂且耗時漫長,而新興研究領域普遍面臨實驗數據極度匱乏的困境,這嚴重制約了AI在復雜材料體系中的應用。有機半導體領域尤其如此——共軛聚合物的光電性能不僅受分子結構影響,還強烈依賴于分子堆積和形貌等復雜因素。以有機電化學晶體管(OECT)為代表的新興材料體系,不僅實驗數據稀少,其物理機制的理解也尚不完善,構成了持久性的科學挑戰。相比之下,有機場效應晶體管(OFET)領域已有數十年的研究積累,理論框架成熟,實驗數據豐富,為知識遷移提供了理想的基礎。
針對這一難題,北京大學雷霆教授、莫凡洋副教授課題組提出了一種名為“物理知識支撐的遷移學習”(PKU-TL)的新方法,成功實現了在數據稀缺條件下對共軛聚合物性能的精準預測,并據此設計出高性能、超低電壓的n型有機電化學晶體管材料。該工作整合了物理信息模型構建、向新興系統的知識遷移以及實驗驗證三大模塊,不僅實現了對OECT關鍵性能指標(載流子遷移率μ、μC*和閾值電壓Vth)超過0.95的R2預測精度,還從中提煉出全新的材料設計知識,為數據驅動的新興材料開發提供了可推廣的范式。相關論文以“Transfer-learning guided design of high-performance conjugated polymers for low-voltage electrochemical transistors”為題,發表在Nature Communications上。
![]()
研究團隊首先從文獻中手動構建了OFET和OECT兩個數據庫,其中OFET數據庫包含837條數據,OECT數據庫僅有112條數據,凸顯了數據稀缺的現狀。針對OFET體系,研究者基于物理原理設計了17維特征向量,包括HOMO/LUMO能級、分子量(Mn)、多分散指數(PDI)、10維主鏈平面性指數以及3維側鏈描述符。其中,主鏈平面性通過?cos2φ?參數量化,該參數基于精細調優后的Uni-Mol模型對松弛勢能面的預測計算得出,其預測HOMO、LUMO和?cos2φ?的R2均超過0.9。利用XGBoost算法構建的OFET遷移率預測模型在電子和空穴遷移率預測上均取得了超過0.99的R2值。通過SHAP值進行的特征重要性分析表明,分子量(Mn)對載流子遷移率的影響最為顯著,其次是主鏈平面性以及HOMO/LUMO能級。這一發現強調了合成條件(尤其是分子量)在決定OFET聚合物性能中的關鍵作用,且分子量與器件性能并非簡單的線性關系。
![]()
圖1 | 以人為中心、數據驅動和PKU-TL驅動的材料開發范式比較。 a 以人為中心的材料開發范式:提出假設(分子結構或理論模型)。隨后進行實驗合成和測試。如果實驗結果未達到預期,分析原因,修正假設,然后再次通過實驗驗證假設,從而生成知識和材料。b 數據驅動的材料開發范式:首先,基于既有的理論研究進行實驗或密度泛函理論(DFT)特征選擇,或者直接采用可解釋性相對較低的分子指紋。隨后,利用大規模數據集和所選特征,開發性能預測模型。最后,對這些模型識別出的材料進行實驗合成和驗證,從而發現材料。c PKU-TL驅動的材料開發范式:首先,在具有大數據集的成熟研究領域構建基礎性能預測模型。接著,使用PKU-TL為數據有限的新興領域開發性能預測模型。這一過程產生了對材料設計的見解。基于模型的預測和合成專業知識,選擇候選分子進行實驗驗證,從而獲得新的聚合物材料。最后,將實驗結果納入小數據集,材料科學家對觀察到的分子特性的分析作為假設,用以改進小數據集預測模型。這種迭代方法提高了模型的準確性,并產生了更多關于聚合物設計的知識。
然而,將OFET模型直接用于OECT預測時,初始準確率顯著下降(R2約為0.6)。機理分析指出,這源于兩種器件工作模式的根本差異:OFET中電荷傳輸主要發生在靠近介電層的界面區域,是場效應摻雜;而OECT使用電解質取代介電層,通過柵極電壓驅動的離子滲透實現體相摻雜,因此其性能必須通過復合參數μC*來同時評估電荷傳輸和離子注入效率。盡管如此,兩者對聚合物電荷傳輸特性的共同依賴啟發了研究團隊的遷移學習策略——將OFET預測的遷移率作為具有物理可解釋性的輸入特征,用于OECT的建模。
![]()
圖2 | 我們的OFET遷移率預測模型的工作流程和性能。 a 典型OFET和OECT器件的器件結構比較。b 文庫生成和松弛勢能面(PES)掃描的預測。首先從文獻來源收集聚合物半導體構筑基元,隨后將其配對以生成候選聚合物分子文庫。從該文庫中隨機選擇2,836個分子進行二面角掃描,所得數據用于微調Uni-Mol模型,以預測HOMO、LUMO能級和松弛PES掃描。c OFET遷移率預測的特征工程和數據增強。考慮到聚合物重復單元中周期性的共價連接性,我們實現了滑動窗口采樣(窗口長度=11個單體,步長=1個片段,每條聚合物鏈的采樣頻率與其重復單元長度相對應)進行結構增強。d&e 基于五個XGBoost模型集成的OFET μh預測模型的性能及通過SHAP值分析的特征重要性分布。f&g 基于五個XGBoost模型集成的OFET μe預測模型的性能及通過SHAP值分析的特征重要性分布。SHAP值經過歸一化以表示每個特征的相對重要性。
在假設生成階段,團隊篩選了11個候選因子,包括經Uni-Mol校準的HOMO/LUMO能級、預測的OFET遷移率、構筑基元的平均能級、構筑基元間的平均能級差、能級方差以及反映π-π堆積能力的平均LOLIPOP值。通過訓練包含不同四特征組合的XGBoost模型并進行特征重要性分析,研究證實預測的OFET遷移率是化學空間中決定OECT性能的最關鍵因素。最終優化的五特征向量——包含預測的空穴/電子遷移率、HOMO、LUMO、構筑基元間平均HOMO差值和平均LUMO差值——使得OECT遷移率預測的R2超過0.94。進一步的統計分析顯示,OECT性能參數ln(μC)與ln μ之間存在清晰的線性關系,因此μC可基于遷移率預測得出。納入預測的OFET遷移率與HOMO/LUMO特征后,μC的預測精度R2超過0.95。值得注意的是,此前在OECT設計中被忽視的構筑基元能級差(ΔHOMO和ΔLUMO)被揭示為決定μC的關鍵因素。特征重要性分析表明,對于n型聚合物降低HOMO能級、對于p型聚合物提高HOMO能級,以及減小構筑基元間的能級差,均可提升μC*值。
![]()
圖3 | OECT性能預測模型的假設生成與性能。 a&d 分別針對μhC和μeC預測,在包含不同特征組合的四特征模型的三折交叉驗證中,R2超過0.6的模型比例。b&e 集成XGBoost模型在OECT數據集上預測μhC和μeC的性能。c 集成XGBoost模型在OECT數據集上預測p型聚合物Vth的性能,以及f 預測n型聚合物Vth的性能。g T2CNT-2FBT、T2CT-2FBT、T2C2FT-2FBT在中性態下的主鏈結構和構筑基元能級,h&i 三種聚合物帶正電三聚體的電荷分布比較。
為了驗證AI推導的設計規則,研究團隊對三種主鏈平面性相近但構筑基元能級差不同的聚合物進行了DFT計算。結果顯示,能級差最大的聚合物T2CNT-2FBT(ΔHOMO=1.86 eV)中,電荷和β-HOMO軌道主要定域在給體單元上,形成局域化的空穴極化子,限制了鏈內電荷傳輸;隨著能級差減小(T2CT-2FBT為1.77 eV,T2C2FT-2FBT為1.3 eV),自旋密度、電荷和β-HOMO軌道逐漸在整個主鏈上離域化。這種增強的極化子離域化有助于提高載流子遷移率,且在n型聚合物中同樣觀察到類似效應。因此,調控構筑基元能級差成為高性能OECT材料的新設計原則。利用同樣的方法,團隊還成功建立了對OECT閾值電壓(Vth)的預測模型,R2同樣超過0.95。
![]()
圖4 | 高性能OECT聚合物的篩選與實驗驗證。 a μhC和Vth的分布,展示了同時考慮μhC和Vth的高性能p型OECT分子。b μeC和Vth的分布,展示了n型OECT聚合物的實驗驗證。c 由不同片段構建的聚合物的μeC和Vth分布的平均值。d 由不同片段構建的聚合物的μeC*和Vth分布的平均值。圖中特殊符號表示綜合性能最佳的OECT聚合物構筑基元。紅色圈出的片段表示潛在的最佳構筑基元。五角星代表BDOPV及其衍生物。
利用訓練好的μC和Vth預測模型,研究團隊對包含超過24000種候選聚合物的庫進行了虛擬篩選。結果顯示,對于p型聚合物,含雜原子的芳香環構筑基元表現出最佳綜合性能,其中兩種聚合物的μhC超過1000 F cm?1 V?1 s?1且Vth接近0 V。對于n型聚合物,含有吸電子基團的大芳香族構筑基元最為有前景,其中BDOPV及其衍生物兼具低Vth和高μeC。鑒于n型聚合物合成更具挑戰性且需求更為迫切,團隊選取了兩種BDOPV聚合物(P1和P2)進行實驗驗證。實驗測得的Vth與預測值非常接近(接近0 V),但μeC的實驗值與預測值存在一定偏差。進一步分析發現,溶解后產生更粘稠溶液的聚合物(即分子量更高的聚合物)表現出更高的μeC*值。將Mn和PDI納入假設生成模型后,特征重要性分析表明,Mn和PDI在決定OECT性能方面甚至比HOMO/LUMO能級略為重要。基于這一發現,團隊合成了帶有吡啶環結構的BDOPV聚合物P3,以增強其在極性溶劑HFIP中的溶解性。P3展現出高達63.5 F cm?1 V?1 s?1的μeC*值和低至-0.08 V的超低Vth,其電子遷移率為0.48 cm2 V?1 s?1,體積電容為131.75 F/cm3。這一性能已超越人類專家在低電壓高性能n型OECT材料領域的已有成果。盡管預測值與實驗值之間存在一定差異,考慮到合成與器件制備條件的復雜性,該結果被認為是可接受的——預測模型反映的是材料在完全優化條件下的最高潛力,而實際實驗值受限于合成條件(如分子量、PDI、缺陷密度)等模型未捕獲的因素。
![]()
圖5 | 模型優化與實驗驗證。 a 在OECT μeC預測中,包含不同特征的四特征模型在三折交叉驗證中R2超過0.6的模型比例。b XGBoost模型在更新后的OECT數據集上預測μeC的性能。c P3的轉移特性曲線,d 輸出特性曲線,e 長期工作穩定性(P3在200次循環后的電流保持率為55.5%,采用了10?12 A的電流下限以最小化測量噪聲的影響,任何低于此閾值的測量值均被截斷為10?12 A),以及f P3的GIWAXS特性。g 已發表的n型OECT性能總結圖。單個性能數據點及其相應引文見補充表3。
通過本研究,PKU-TL框架建立了一套面向高性能OECT聚合物的設計原則層次體系。一方面,它驗證了經典設計準則——降低LUMO能級和增強主鏈平面性仍然是高效電子傳輸和穩定性的基礎。更為關鍵的是,它識別出一個此前被忽視的核心描述符:構筑基元間的平均能級差。最小化該能級差可促進極化子沿聚合物主鏈的均勻離域化,從而直接提升載流子遷移率,這一機制得到了DFT計算的證實。此外,綜合建模與實驗觀察表明,共軛聚合物的合成實現與缺陷控制與分子設計同等重要——高分子量和較少結構缺陷對器件性能均具有顯著影響。
該研究提出的PKU-TL框架為數據稀缺、物理機制復雜的新興材料體系提供了一種加速開發的通用方法。盡管共軛聚合物合成的復雜性目前尚無法實現全自動發現流程,但這項工作為邁向該目標奠定了堅實基礎。研究團隊認為,該方法可推廣至其他同樣受困于數據匱乏的材料復雜系統,并在加速新興領域材料開發方面展現出廣闊前景。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.