分享
机器学习加速理论晶体结构预测研究进展_罗啸山.pdf
下载文档

ID:493825

大小:1.06MB

页数:9页

格式:PDF

时间:2023-04-05

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
机器 学习 加速 理论 晶体结构 预测 研究进展 罗啸山
第 51 卷第 2 期 2023 年 2 月 硅 酸 盐 学 报 Vol.51,No.2 February,2023 JOURNAL OF THE CHINESE CERAMIC SOCIETY http:/ DOI:10.14062/j.issn.0454-5648.20220835 机器学习加速理论晶体结构预测研究进展 罗啸山1,2,王振雨2,3,高朋越1,2,张 微2,吕 健1,2,王彦超1,2(1.吉林大学,超硬材料国家重点实验室,长春 130012;2.吉林大学,计算方法与软件国际中心,长春 130012;3.吉林大学,未来科学国际合作联合实验室,长春 130012)摘 要:理论晶体结构预测可以在给定化学组分的条件下确定材料的晶体结构,已成为材料科学研究的重要工具。然而,该方法一直面临计算成本高的瓶颈问题。近年来,新兴机器学习方法在传统科学计算上展现了广阔的应用前景,逐渐被引入到晶体结构预测领域。本文主要讨论机器学习方法在理论晶体结构预测领域的最新研究进展,分别从加速晶体结构的能量计算和势能面的探索两个方面介绍领域的最新成果,并对未来研究可能的发展提出抛砖引玉的见解。关键词:机器学习;晶体结构预测;机器学习势;生成模型 中图分类号:O469 文献标志码:A 文章编号:04545648(2023)02055209 网络出版时间:20230117 Review on Machine Learning Accelerated Crystal Structure Prediction LUO Xiaoshan1,2,WANG Zhenyu2,3,GAO Pengyue1,2,ZHANG Wei2,LV Jian1,2,WANG Yanchao1,2(1.State Key Laboratory of Superhard Materials,College of Physics,Jilin University,Changchun 130012,China;2.International Center of Computational Method and Software,College of Physics,Jilin University,Changchun 130012,China;3.International Center of Future Science,Jilin University,Changchun 130012,China)Abstract:Crystal structure prediction is a powerful theoretical simulation tool,which can determine the crystal structure of materials with the given information of chemical composition.However,its application is severely limited due to the highly computational cost.In recent years,the state-of-art machine learning methods reveal a promising prospect in accelerating the conventional scientific computing,thus introducing the methods into the crystal structure prediction.This review briefly introduced recent progress on the application of machine learning for the crystal structure prediction.Two aspects were discussed,i.e.,accelerating the energy evaluation and enhancing the potential energy surface sampling.In addition,some insights into the future development in this aspect were also suggested.Keywords:machine learning;crystal structure prediction;machine learning potential;generative model 凝聚态物质的微观原子排列方式,即晶体结构,直接决定了其宏观物理和化学性质。因此,确定材料的晶体结构一直是物理、化学和材料等物质科学研究领域的焦点课题。在仅给定材料化学组分的条件下,通过理论模拟预测材料的晶体结构被称为理论结构预测。理论结构预测不仅可以与实验相辅相成共同确定材料的结构,而且还可以先于实验,经济、高效的开展新材料设计,加速新材料的研发。物质的结构与其能量构成了高维空间中的一个超曲面,被称为势能面(PES)。根据能量最低原理,凝聚态物质最可能存在的稳定结构是其 Gibbs 自由能最低的结构,因此理论结构预测的目标是确定势能面上的最低点所对应的结构。一方面由于物质体系的微观行为由其多电子 Schrodinger 方程决定,而 收稿日期:20221014。修订日期:20221113。基金项目:国家自然科学基金(91961204,12034009,11974134,11904129);吉 林 省 教 育 厅 科 学 技 术 研 究 项 目(JJKH20211042KJ)。第一作者:罗啸山(1998),男,博士研究生。通信作者:张 微(1979),女,博士,副教授。Received date:20221014.Revised date:20221113.First author:LUO Xiaoshan(1998),male,Doctoral candidate.Email: Correspond author:ZHANG Wei(1984),female,Ph.D.,Associate Professor.Email:zhangw_ 综 合 评 述 第 51 卷第 2 期 罗啸山 等:机器学习加速理论晶体结构预测研究进展 553 其解的解析形式未知,故无法解析地表达势能面。另一方面势能面具有高维度与多能谷的复杂特性,其维度和能谷数分别随体系原子数增加而线性和指数增加12。对于 1 个原子数为 N 的周期性晶体体系,其势能面的维度为 3N+3(忽略元素种类)。以55 原子的 LJ 团簇体系为例,势能面能谷的数目估计达到 1021个3,遍历势能面上所有的极小值点是一项几乎不可能完成的任务。理论结构预测要在如此庞大的结构群中确定能量最低的结构,属于典型的非确定性多项式(NP-hard)难题,因此需要发展针对性的数值求解手段。多年来,科学家们一直致力于解决晶体结构预测这一理论难题,通过引入 Monte-Carlo、分子动力学和全局优化算法等,先后发展了多种有效的晶体结构预测方法,其中具有代表性的方法包括:基于蒙特卡洛算法或分子动力学的模拟退火方法、盆地跳跃方法、极小值跳跃方法、巨动力学方法,基于遗传算法的 USPEX45方法,基于群体智能算法的CALYPSO67方 法,和 纯 随 机 搜 索 方 法AIRSS89等。这些方法在材料结构研究中发挥重要作用,取得了系列重要的研究成果。例如,发现了绝缘相的钠具有双六角密排结构10、成功预测了锂的半导体相结构11、预言了系列笼型富氢化合物超导体 CaH612和 LaH1013等。虽然理论结构预测方法在材料结构研究中发挥了重要作用,但随着体系尺寸的增加,材料势能面的复杂度显著增加(维度线性增加、极小值数目以指数形式增加)。此外,基于第一性原理方法的结构能量计算成本一般与晶胞内的电子数目呈 3 次指数增加关系。因此,理论结构预测方法在处理较大的体系(如晶胞内原子数大于 50)时常面临着计算效率下降甚至难以搜索到基态结构的问题。为实现更加准确高效的复杂体系结构预测,现有方法还面临着双重难题:势能面高效探索问题和结构的高效计算问题。近年来,随着计算机软硬件水平的提高和基本数值算法的完善,机器学习作为人工智能领域的一个重要分支快速发展,在分类、回归和预测能力上得到了质的飞越,被广泛应用在自然语言处理、计算机视觉、语音识别、机器翻译、自动驾驶等现代科学技术的各个领域。在物理、化学和材料科学领域,机器学习方法也被用于加速材料性质计算14、逆向结构设计15等物质科学领域的研究中,成为加速传统计算的重要工具。机器学习方法也进一步被引入到了结构预测领域,为解决结构预测的上述2 个关键问题带来了新的途径。目前关于结构预测方法1617、机器学习势方法1819、晶体结构生成模型方法2021等已有数篇综述文章。本文将围绕机器学习方法在结构预测中的应用展开讨论。在第 1部分监督学习加速能量计算中,首先对机器学习势函数的发展及应用做简要概括,其次对目前机器学习势函数加速结构预测的研究进行归纳讨论。在第2部分无监督学习加速势能面探索中,首先简要介绍无监督生成模型,其次根据应用生成模型生成晶体结构时如何以数值形式表示结构的不同方法,分别加以讨论。最后在第 3 部分对机器学习方法在应用于理论结构预测领域时面临的挑战与前景作出总结。1 监督学习加速能量计算 1.1 机器学习势构建 基于密度泛函理论(DFT)2223的第一性原理计算可以较为准确的描述材料体系的能量与电子性质,是目前材料模拟的重要工具。然而其计算量随体系中电子数的增加呈 3 次方增长,在处理大体系时计算成本昂贵。为了解决大体系结构计算问题,科学家们提出的办法之一是构造原子间相互作用模型,也被称为经验势函数或经验力场。经验势函数采用基于物理直觉的表达式,通过对已知数据拟合,获得研究体系的解析势形式函数,如 Lennard-Jones 势24、Buckingham 势25、Stillinger-Weber势26及 EAM 势27等。这些经验势都已被成功应用于大体系、长时间的模拟,并取得了不错的成果28。然而由于采用人为给定的解析表达形式,经验势函数通常只能准确描述特定的原子成键环境,当研究体系的原子成键环境发生显著改变时,势函数的精度会严重下降。监督学习是学习构建输入与输出之间的关系,通常是估计以给定输入为条件的输出的条件概率。将机器学习监督学习引入材料模拟领域的一个重要发展方向是学习物质势能面,进而构造原子间相互作用势函数,这种势函数通常被称为机器学习势(MLP)。相较于经验势函数,机器学习势不依赖于任何函数形式上的假设,仅依据大量的第一性原理计算数据,利用监督学习算法,来构建原子环境与能量之间的关系,从而实现对新原子环境的能量和原子受力的预测。实践表明,机器学习势具有与第一性原理方法接近的精度、554 硅酸盐学报 J Chin Ceram Soc,2023,51(2):552560 2023 年 且计算效率有几个数量级的提升2931,同时可移植性明显优于经验势函数,是克服第一性原理 计算量瓶颈的重要手段。值得注意的是,机器学习势的可移植性严重依赖于数据集所覆盖的构型空间。1995年Blank等32提出了利用神经网络构建势函数的学术思想,随后大量的机器学习势方法开始涌现。2007 年 Behler 和 Parrinello33提出将体系的总能表达为单原子能量的和的方式:()iiiE=d (1)其中:E 代表体系的总能量;i为体系中每个原子i 的能量;id为描述原子成键环境的特征向量(描述符),id与i的映射关系由机器学习模型给出。通 常认为原子成键环境的依赖是局域的,因此这种表达方式可以看作考虑一定截断半径以内的相互作用,而忽略了截断半径以外的长程相互作用。另外,将体系总能分解为单原子能量的和,使得势函数能够处理不同尺寸的体系。此后

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开