**LED、太陽(yáng)能電池、光電探測(cè)器和光子集成電路 (PIC) 等光電設(shè)備是現(xiàn)代通信、照明和能源轉(zhuǎn)換技術(shù)的核心。**這些設(shè)備的性能和效率在很大程度上取決于材料的光學(xué)特性,因此,深入理解這些特性對(duì)于推動(dòng)技術(shù)進(jìn)步和滿(mǎn)足日益增長(zhǎng)的科學(xué)及工業(yè)需求至關(guān)重要。為了應(yīng)對(duì)這一挑戰(zhàn),實(shí)驗(yàn)和計(jì)算領(lǐng)域的研究人員通過(guò)積極開(kāi)展高通量篩選工作,以尋找和開(kāi)發(fā)具有定制光學(xué)特性的新型材料。
然而傳統(tǒng)的獲取材料光學(xué)特性的實(shí)驗(yàn)技術(shù),如橢偏儀、紫外-可見(jiàn)光譜儀和傅立葉變換紅外光譜儀 (FTIR),雖然能夠提供精確的測(cè)量結(jié)果,但它們通常只適用于特定的波長(zhǎng)范圍,并且對(duì)樣品條件有嚴(yán)格的要求。這些限制使得這些技術(shù)在高通量材料篩選中的應(yīng)用受到了一定制約。
**為了解決這一問(wèn)題,研究人員轉(zhuǎn)向了基于密度泛函理論 (DFT) 的第一性原理計(jì)算。**與傳統(tǒng)實(shí)驗(yàn)技術(shù)相比,DFT 計(jì)算能夠覆蓋所有波長(zhǎng)范圍的光學(xué)光譜,提供了一種更為全面的分析手段。盡管 DFT 計(jì)算能力強(qiáng)大,但在預(yù)測(cè)晶體結(jié)構(gòu)的光學(xué)性質(zhì)時(shí),由于缺乏有效的原子嵌入,仍然面臨著一定的挑戰(zhàn)。
**針對(duì)于此,日本東北大學(xué) (Tohoku University) 和麻省理工學(xué)院 (MIT) 的研究人員推出了一種新型人工智能工具 GNNOpt,成功識(shí)別出 246 種太陽(yáng)能轉(zhuǎn)換效率超過(guò) 32% 的材料,**以及 296 種具有高量子權(quán)重的量子材料,極大地加速了能源和量子材料的發(fā)現(xiàn),為材料科學(xué)領(lǐng)域帶來(lái)了新的研究范式。
相關(guān)研究以「Universal Ensemble-Embedding Graph Neural Network for Direct Prediction of Optical Spectra from Crystal Structures」為題,發(fā)表在 Advanced Materials 上。
研究亮點(diǎn):
* GNNOpt 采用「集成嵌入」技術(shù),不僅能夠?qū)W習(xí)來(lái)自多種數(shù)據(jù)集的信息,還能夠直接從晶體結(jié)構(gòu)中精準(zhǔn)預(yù)測(cè)所有線(xiàn)性光學(xué)光譜
* 通過(guò)集成等變神經(jīng)網(wǎng)絡(luò),GNNOpt 利用 944 種材料組成的小型數(shù)據(jù)集實(shí)現(xiàn)了高質(zhì)量的預(yù)測(cè)
* GNNOpt 從未知材料中成功出了篩選 246 種太陽(yáng)能轉(zhuǎn)換效率超過(guò) 32% 的材料,以及包括 SiOs 在內(nèi)的 296 種具有高量子權(quán)重的量子材料
數(shù)據(jù)集:基于 944 種晶體材料的小樣本學(xué)習(xí)
**研究人員使用基于密度泛函理論 (DFT) 計(jì)算得出的 944 種晶體材料,對(duì) GNNOpt 模型進(jìn)行光譜預(yù)測(cè)。**這些數(shù)據(jù)庫(kù)是通過(guò) API 從 Materials Project 獲取得到的。而數(shù)據(jù)庫(kù)中的光譜數(shù)據(jù)通過(guò)獨(dú)立粒子近似 (IPA) 獲取,包含了頻率相關(guān)的介電函數(shù)及其對(duì)應(yīng)的吸收系數(shù)。
整個(gè)數(shù)據(jù)集按照 80%、10% 和 10% 的比例,被隨機(jī)分為訓(xùn)練集 (733 種材料)、驗(yàn)證集 (97 種材料) 和測(cè)試集 (110 種材料)。

訓(xùn)練集、驗(yàn)證集、測(cè)試集元素分布
GNNOpt 模型架構(gòu):在晶體結(jié)構(gòu)與頻率相關(guān)光學(xué)特性之間直接建立關(guān)系
GNNOpt 是一種基于圖神經(jīng)網(wǎng)絡(luò) (GNN) 的模型,采用「集成嵌入」技術(shù),能夠直接從晶體結(jié)構(gòu)中預(yù)測(cè)所有線(xiàn)性光學(xué)光譜。值得說(shuō)明的是,在訓(xùn)練 GNNOpt 模型之前,研究人員通過(guò)一系列實(shí)驗(yàn)證明了應(yīng)用克拉莫-克若尼關(guān)系式 (Kramers–Kronig relations) 能夠更好地預(yù)測(cè)光學(xué)光譜。
如下圖 a 所示,**GNNOpt 的唯一輸入值是晶體結(jié)構(gòu) (Crystal structure),而輸出值則是光譜,**具體包括復(fù)介電函數(shù) (Complex dielectric function)、吸收系數(shù) (Absorption coefficient)、復(fù)折射率 (Complex refractive index)、反折射率 (Reflectance)。
GNNOpt 模型的輸入與輸出示意圖
在圖 b 中,**晶體結(jié)構(gòu)中每種原子種類(lèi) (O、CI、TI) 的輸入特征采用獨(dú)熱編碼表示。**由于元素周期表中的所有元素都有原子質(zhì)量 (atomic mass, 用 x0 表示)、偶極子極化率 (dipole polarizability, 用 x1 表示) 和有效共價(jià)半徑 (effective covalent radius, x2 表示) 這 3 種特征,因此研究人員選擇這 3 個(gè)特征進(jìn)行集成嵌入。
集成嵌入的 3 種特征
研究人員通過(guò)引入自動(dòng)嵌入優(yōu)化的集成嵌入層,可在不修改神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的情況下提高模型預(yù)測(cè)精度,具體過(guò)程如下圖 c 所示。
首先,所有原子輸入特征通過(guò)集成嵌入層 (Ensemble embedding) 進(jìn)行自動(dòng)優(yōu)化。為了實(shí)現(xiàn)等變性,卷積濾波器由可學(xué)習(xí)的徑向函數(shù)和球諧函數(shù) (Spherical Harmonics) 組成。然后,將嵌入的特征通過(guò)一系列等變圖卷積 (Graph convolution) 和門(mén)限非線(xiàn)性層 (Gated nonlinear layers) 參數(shù)化為可輸入的參數(shù)。緊接著,參數(shù)結(jié)果被傳遞到包括激活和聚合操作的后處理層,用來(lái)生成預(yù)測(cè)的輸出光譜。最后,通過(guò)最小化預(yù)測(cè)光譜與真實(shí)光譜之間的均方誤差 (MSE) 損失函數(shù)來(lái)訓(xùn)練優(yōu)化 GNNOpt 權(quán)重。
GNNOpt 模型架構(gòu)示意圖
**為了深入了解晶體結(jié)構(gòu),研究人員對(duì) TlClO4 的晶胞 (unit cell) 結(jié)構(gòu)進(jìn)行了分析,如圖 d 所示。**其中圓形節(jié)點(diǎn)代表晶胞內(nèi)的原子,線(xiàn)條表示圖卷積層的信息傳遞方向。
TlClO4 的晶胞結(jié)構(gòu)
**圖 e 則展示了通用集成嵌入層的細(xì)節(jié),即使沒(méi)有任何神經(jīng)網(wǎng)絡(luò)模型的改變,它也是性能提高的關(guān)鍵因素。**對(duì)于每個(gè)原子,每個(gè)特征都獨(dú)立地嵌入其線(xiàn)性和活化層。然后,所有嵌入的特征通過(guò)可學(xué)習(xí)的混合概率 pi 進(jìn)行加權(quán)平均,其中 pi 通過(guò) ∑ipi = 1 進(jìn)行歸一化。
通用集成嵌入層細(xì)節(jié)展示
模型性能:GNNOpt 可識(shí)別出數(shù)百種太陽(yáng)能電池以及量子候選材料
為了測(cè)試 GNNOpt 模型的性能,研究人員使用 GNNOpt 識(shí)別太陽(yáng)能電池材料以及量子材料,成功識(shí)別出 246 種太陽(yáng)能電池材料,以及 296 種具有高量子權(quán)重的量子材料。
上述材料的詳細(xì)資料詳見(jiàn)附加信息:
https://go.hyper.ai/rVSS8
關(guān)注公眾號(hào),后臺(tái)回復(fù)「預(yù)測(cè)材料信息」獲取完整 PDF
GNNOpt 能夠從未知材料中篩選出 246 種太陽(yáng)能電池材料
在識(shí)別具有高性能能量轉(zhuǎn)換功能的潛在太陽(yáng)能電池材料方面,研究人員使用光譜有限最大效率 (Spectroscopic Limited Maximum Efficiency,SLME) 方法,對(duì)太陽(yáng)能電池的光電轉(zhuǎn)換效率進(jìn)行初步篩選和評(píng)估。
隨后,研究人員使用 GNNOpt 模型預(yù)測(cè)了 Materials Project 中 5,281 種未知晶體結(jié)構(gòu)的能量轉(zhuǎn)換效率 (η 值),需要說(shuō)明的是這些晶體結(jié)構(gòu)沒(méi)有真實(shí)的光譜數(shù)據(jù)。如下圖 a 所示,研究人員比較了測(cè)試集的預(yù)測(cè)效率與真實(shí)效率,結(jié)果顯示 R2 = 0.81,表明 GNNOpt 對(duì)太陽(yáng)能電池的光電轉(zhuǎn)換效率的預(yù)測(cè)準(zhǔn)確性較高。
測(cè)試集中由 GNNOpt 預(yù)測(cè)的效率 η 與由 DFT 計(jì)算獲得的真實(shí)效率 η 之間的對(duì)比
在圖 b 中,研究人員將在測(cè)試集中由 GNNOpt 預(yù)測(cè)效率 η 與由 DFT 獲得的真實(shí)效率 η 值,繪制成能量帶隙 (energy band gap,用 Eg 表示) 的函數(shù)關(guān)系圖。當(dāng) Eg 約為 1.3 eV 時(shí),η 的最大值約為 32%,這與 SQ 極限一致。然而, SLME 作為太陽(yáng)能電池材料的選擇參數(shù)比 SQ 極限更加嚴(yán)格,因?yàn)閷?duì)于具有相似帶隙的材料,SLME 顯示了 η 值在較寬范圍內(nèi)的變化,這表明吸收系數(shù) α(E) 對(duì) η 有著顯著的貢獻(xiàn)。
能量帶隙函數(shù)關(guān)系圖
此外,了解元素周期表中哪些元素對(duì)高效太陽(yáng)能電池材料的貢獻(xiàn)最大,可以為材料設(shè)計(jì)提供初步的指導(dǎo)。如圖 c 所示,**GNNOpt 模型預(yù)測(cè)出過(guò)渡金屬 (如 Tc、Rh、Pd、Pt、Cu、Ag、Au 和 Hg) 以及硫族元素 (如 S、Se 和 Te) 是太陽(yáng)能電池材料的主要組成元素。**這一結(jié)果與廣為人知的太陽(yáng)能電池材料一致,如富銅的黃銅礦 (Cu-rich chalcopyrite)、鉛基鈣鈦礦 (Pb-based perovskites) 或 CdTe。
根據(jù) SLME 對(duì)元素周期表進(jìn)行著色
為了驗(yàn)證 GNNOpt 模型對(duì)未知材料的 SLME 預(yù)測(cè)值,研究人員從最高 SLME 材料列表中選取了 3 個(gè)示例:LiZnP、SbSeI 和 BiTeI。需要說(shuō)明的是,這些材料不在 DFT 數(shù)據(jù)庫(kù)中。因此,研究人員對(duì)這些材料進(jìn)行了 DFT 計(jì)算,以確定這些材料的吸收系數(shù) α(E)。
結(jié)果如下圖 d 所示,DFT 計(jì)算的結(jié)果(用虛線(xiàn)表示)與 GNNOpt 預(yù)測(cè)的 α 值(用實(shí)線(xiàn)表示)高度吻合。這表明 GNNOpt 可以在大幅降低計(jì)算成本的情況下,成為一種有效的材料篩選工具。值得一提的是,對(duì)于大型數(shù)據(jù)庫(kù),可以將 GNNOpt 與遺傳算法 (GA) 結(jié)合使用,從而加速候選材料的搜索過(guò)程。
對(duì)于 3 種未知材料,GNNOpt 預(yù)測(cè)結(jié)果和 DFT 計(jì)算結(jié)果對(duì)比
GNNOpt 成功探測(cè)出包括 SiOs 在內(nèi)的 296 種量子材料
除了可以識(shí)別未知的、具有高性能能量轉(zhuǎn)換潛力的太陽(yáng)能電池材料,**GNNOpt 的另一個(gè)應(yīng)用是用于探測(cè)量子材料中的量子幾何 (quantum geometry) 和拓?fù)浣Y(jié)構(gòu) (topology)。**此前曾有學(xué)者表明,廣義量子權(quán)重這一概念可以從光譜中推導(dǎo)出來(lái),是衡量基態(tài)量子幾何和拓?fù)浣Y(jié)構(gòu)的直接指標(biāo)。量子權(quán)重 Kxx 是由反向頻率加權(quán)的 f-sum 規(guī)則修正而來(lái)。
* 量子權(quán)重 Kxx 是量子系統(tǒng)中一個(gè)與材料的光學(xué)和電子性質(zhì)相關(guān)的重要物理量,特別用來(lái)衡量其量子幾何和拓?fù)涮匦?。它描述了材料的量子幾何結(jié)構(gòu)與其光學(xué)性質(zhì)或電學(xué)性質(zhì)之間的關(guān)聯(lián)。
在圖 a 中,研究人員比較了測(cè)試集中以 h/e2 為單位的預(yù)測(cè) Kxx 和真實(shí) Kxx 的值。在 Kxx < 25 的范圍內(nèi),R2 = 0.73, 表明 GNNOpt 預(yù)測(cè)結(jié)果接近 DFT 計(jì)算的真實(shí)結(jié)果。
GNNOpt預(yù)測(cè)的Kxx和DFT計(jì)算的真實(shí)Kxx比較示意圖
因此,GNNOpt 被用來(lái)預(yù)測(cè) 5,281 種未知絕緣體材料的 Kxx 值,如圖 b 所示。為了簡(jiǎn)化分析,研究人員將著名的拓?fù)浣^緣體 Bi2Te3 的量子權(quán)重 Kxx = 28.87 作為分類(lèi)量子材料的閾值 (threshold),其中 Kxx > 28.87 的材料被視為高 Kxx 材料。
最終,研究人員確定了 297 種高 Kxx 材料。其中一些材料,如 ZrTe5 (Kxx = 33.90)、TaAs2 (Kxx = 37.66)、FeSi (Kxx = 48.74) 和 NbP (Kxx = 35.58) 等,已被確認(rèn)為具有反常霍爾效應(yīng) (anomalous hall effect)、巨磁阻效應(yīng) (large magnetoresistance)、拓?fù)滟M(fèi)米弧 (topological Fermi arcs) 和量子振蕩 (quantum oscillations) 現(xiàn)象的量子材料。
使用 GNNOpt 搜索具有高量子權(quán)重 Kxx 的量子材料
由于 SiOs 具有極高的量子權(quán)重 (Kxx = 46.52),且此前未被深入研究,因此研究人員對(duì) SiOs 進(jìn)行了額外的 DFT 計(jì)算,并分析了其電子能帶結(jié)構(gòu) (Electronic band structure)。如圖 c 所示,SiOs 在 Γ 點(diǎn)和 R 點(diǎn)分別存在三重費(fèi)米子 (Three-fold fermion) 和雙韋爾費(fèi)米子(Double-Weyl fermion)。
SiOs 電子能帶結(jié)構(gòu)
圖 d 則是研究人員使用最大局域化萬(wàn)尼爾函數(shù) (Wannier functions) 和格林函數(shù) (Green’s function) 方法計(jì)算了 SiOs (001) 表面的能帶結(jié)構(gòu),表明了 SiOs 的超量子特性。
SiOs 電子能帶結(jié)構(gòu)的表面
人工智能將重塑材料研發(fā)過(guò)程,材料會(huì)逆向生成
在材料科學(xué)的快速發(fā)展中,AI 技術(shù)正在引領(lǐng)著一場(chǎng)革命。此前,中國(guó)工程院院士干勇曾公開(kāi)表示,「人工智能將重塑材料研發(fā)過(guò)程,材料會(huì)逆向生成。」
首先,AI 在材料發(fā)現(xiàn)中的應(yīng)用尤為顯著。**2023 年 11 月底,谷歌旗下的 DeepMind 發(fā)布用于材料科學(xué)的 AI 強(qiáng)化學(xué)習(xí)模型 GNoME,**并通過(guò)該模型和高通量第一性原理 (DFT) 計(jì)算,尋找到了 38 萬(wàn)余個(gè)熱力學(xué)穩(wěn)定的晶體材料,極大加快了發(fā)現(xiàn)新材料的研究速度。
**微軟不甘其后,在 GNoME 模型發(fā)表數(shù)天后,發(fā)布了材料科學(xué)領(lǐng)域的人工智能生成模型 MatterGen,**可根據(jù)所需要的材料性質(zhì)按需預(yù)測(cè)新材料結(jié)構(gòu)。
**2024 年 1 月,微軟與美國(guó)能源部下屬的西北太平洋國(guó)家實(shí)驗(yàn)室 (PNNL) 合作,利用人工智能和高性能計(jì)算,從 3,200 萬(wàn)種無(wú)機(jī)材料中篩選出了一種全固態(tài)電解質(zhì)材料,**完成了從預(yù)測(cè)到實(shí)驗(yàn)的閉環(huán),該技術(shù)可助力下一代鋰離子電池材料研發(fā)。
此外,AI 也在材料性質(zhì)預(yù)測(cè)方面發(fā)揮著重要作用。通過(guò)機(jī)器學(xué)習(xí)模型,可以預(yù)測(cè)材料的電子結(jié)構(gòu)、力學(xué)性質(zhì)等,從而優(yōu)化材料設(shè)計(jì)。例如,**北京大學(xué)工學(xué)院研究員陳默涵開(kāi)發(fā)的國(guó)產(chǎn)開(kāi)源密度泛函理論軟件 ABACUS,**結(jié)合 AI 輔助的交換關(guān)聯(lián)泛函方法 DeePKS,克服了 DFT 計(jì)算在精度和效率上的兩難問(wèn)題,實(shí)現(xiàn)了高效率的雜化泛函精度計(jì)算。
AI 在材料科學(xué)領(lǐng)域的應(yīng)用遠(yuǎn)不只此,在落地層面也涌現(xiàn)出諸如 Green Dynamics、CuspAl、DeepVerse 等致力于將 AI 運(yùn)用于新材料領(lǐng)域的公司。隨著技術(shù)的不斷發(fā)展,AI 或?qū)⒃诓牧峡茖W(xué)領(lǐng)域迸發(fā)出無(wú)限的力量!