今天给大家介绍的是美国南卡罗来纳大学的Jianjun Hu等人发表在CrystEngComm上的一篇文章“Contact map based crystal structure prediction using global optimization”。目前,全局优化算法与第一性原理自由能计算相结合,以预测晶体组成或晶体结构。这些方法虽然可以在搜索过程中利用某些晶体模式,但它们却不利用晶体结构中所体现的原子构型的隐式规则和约束。在这里,作者提出了一种基于全局优化的算法,CMCrystal,基于原子接触图的对晶体结构进行重构。实验表明,给定某些晶体材料的原子接触图,重建晶体结构是可行的,但要实现其他材料的成功重建,需要更多的几何或物理化学约束。

一、研究背景
在标准晶体结构预测(CSP)问题中,必须在给定压力-温度条件、给定化学成分的情况下找到自由能最低的晶体结构。对于化学物质的晶体结构,可以使用第一性原理计算或机器学习模型来预测许多物理化学特性,因为较低的自由能对应于原子更稳定的排列。有效的搜索算法可以生成低自由能的各种化学有效的候选组成,但是,这些基于全局自由能搜索的算法有一个主要障碍,它们只适用于相对简单的晶体,并且依赖于昂贵的自由能DFT计算。在这篇文章中,作者探索了如何利用全局优化算法,基于空间群的给定成分组合和原子接触图来重构给定成分组合的原子配置。其思想是,利用晶体结构中存在的原子相互作用分布和其他几何图型或基序来预测原子接触图。
二、材料与方法
2.1 基于knowledge-rich的接触图的CSP
周期性晶体结构可以用晶格常数a、b、c以及空间群的角α、β和γ来表示,且其具有唯一的Wyckoff位置坐标,作者使用vesta软件使用的阈值来定义接触图中原子的阈值。接触图可以捕捉晶胞中原子之间的相互作用,这是通过原子对在其他晶体材料结构中的相互作用来预测的。在这里,作者假设已经得到了真实的原子接触图,研究全局优化算法是否可以通过接触图的原子坐标来重建晶体结构。

图1 晶体材料的cif和图形表示
优化问题是如何搜索适当的Wyckoff位置原子坐标,以便在由空间群指定的对称操作之后,所产生的晶体结构将具有相同的接触图矩阵。这里虽然只将接触图信息用作优化目标,但其他原子相互作用信息,如在一些原子对之间的距离限制或优先邻域关系也可以添加为全局搜索中的约束条件。
2.2 使用全局优化进行接触图的CSP
作者采用全局优化算法通过最大化预测的晶体结构接触图与实际的晶体结构接触图之间的匹配来搜索坐标。首先使用ICSD、databases和OQMD等数据库中现有的无机材料样本训练三个预测模型,分别为空间群预测器、晶格常数预测器和接触图预测器;然后对这些信息使用一个全局优化算法来搜索原子坐标,从而使预测的晶体结构接触图尽可能地匹配实际的接触图;最后,将这些结构进行基于最小化自由能的DFT弛豫或细化,以生成最终的结构预测。

图2 基于接触图的晶体结构预测的CMCrysta算法
在这项工作中,作者探索了如何使用全局优化算法来搜索在给定的接触图的原子坐标,将六种最先进的全局优化算法应用于不同的问题实例来评估和比较它们的性能。这六种全局优化算法分别为遗传算法、差分进化算法、粒子群优化算法、贝叶斯优化算法、协方差矩阵自适应-演化策略算法、基于RBF模型的优化算法。
2.3 目标功能及评价标准
将基于接触映射的结构重构的目标函数定义为骰子系数

A是预测的接触图矩阵,B是给定成分的真实接触图矩阵,骰系数基本上测量两个矩阵样本的重叠,值从0到1, 1表示完全重叠。
为了评估不同算法的重构性能,可以将骰子系数作为一个评估准则,但它并不能表明预测结构与真实目标结构之间的最终结构相似性,为了解决这个问题,作者定义了均方根距离和绝对平均误差两个标准。


三、实验设置
作者选择目标晶体结构作为测试用例,以评估基于接触图的晶体结构重建算法。在这里,独立原子位点的数量是2和3对应6和9个优化变量,空间群数的范围从4到61,对应于三斜、单斜和正交结构。

表1. 目标晶体结构的设计
四、结果分析
4.1 基于接触图的晶体结构的成功预测

表2 遗传算法在接触图预测精度方面的性能
为了评估的晶体结构预测CMCrystal方法,将其应用于选定的11个目标结构,独立原子数量从6到16不等。11个目标结构中有9个的接触预测精度达到100%,证明了利用接触图作为目标从随机原子坐标中寻找目标结构的有效性。表2还显示了预测结构与目标结构相比的RMSD和MAE,这两者都是根据独立原子位点的分数坐标计算出来的。

图3 由CMCrystal预测的晶体结构与真实的目标结构
图3显示了B4N4、Bi4Se4和Co4As8的预测结构与目标结构,对于B4N4和Bi4Se4接触图精度达到100%,预测结构非常接近目标结构;Co4As8的目标结构的接触图精度较低,其值为92.3%。
4.2 不同算法的性能比较

图4 不同算法在四种目标结构上的接触图预测精度方面的性能比较
图4显示了六种算法的性能。对于Bi4Se4和B4N4的简单情况,所有的算法都达到了100%的预测精度;对于复杂的Ni8P8,只有DE算法达到100%的精度,而PSO和BO落后的最多;对于最复杂的目标Co4As8,没有任何算法达到100%的精度,而GA、DE、CMA-ES和RBFOpt都达到92%的精度。

图5 四种目标结构上接触图预测均方根距离(RMSD)的不同算法的性能比较。
从图5中可以发现,B4N4和Co4As8的CMA-ES均达到了最好的RMSD性能;对于Bi4Se4晶体,GA取得了最佳结果,RMSD为0.12;对于Ni8P8晶体,RBFOpt取得了最佳结果,RMSD为0.19。值得注意的是,作者的研究中的目标函数只包含拓扑信息,即接触图,因此,具有更好的接触图精度的算法并不一定具有更好的RMSD性能。
4.3 影响优化难度的因素
从广泛的实验中,发现有几个因素影响晶体结构预测性能,如独立原子点的数量、单元中的原子数量、空间群、键的数量/拓扑约束条件等,这里主要研究独立原子位点的数量和空间群这两个因素如何影响CMA-ES算法的晶体结构重建。

表3 预测性能与原子位点数量和空间群的关系

图6 基于空间群和原子位点数量的问题分析
五、结论
作者基于空间群对称性和原子接触图,建立了一个晶体结构预测的重构问题,并应用了最先进的全局优化算法来解决该问题。实验表明,全局优化算法可以利用空间群和化学计量法来优化原子的坐标,重建未知材料的晶体结构。
参考文献
Jianjun Hu, Wenhui Yang, Rongzhi Dong, Yuxin Li, Xiang Li, Shaobo Li ,Edirisuriya M. D. Siriwardane,Contact map based crystal structure prediction using global optimization, CrystEngComm, 2021,23, 1765-1776, https://doi.org/10.1039/D0CE01714K