近日,南京大学物理学院孙建教授、王慧田教授、邢定钰院士等人,发表了关于他们自主开发的机器学习与图论辅助的晶体结构搜索软件MAGUS的方法性长文章,详细阐述了MAGUS背后的技术细节,总结了一些应用的实例,展示了它与传统方法相比的优势。目前,MAGUS程序可以在三维晶体、二维晶体、分子晶体、表面、受限空间等体系中进行定组分和变组分的搜索,在行星内部物质、超硬、超导、高能量密度等功能材料设计和高压下的物性调控等领域有很多成功的应用。
晶体结构对材料的性质有决定性的影响,有关于结构的研究往往是材料研究的起点。晶体结构预测是一种在特定条件下只根据系统化学组分来寻找稳定或亚稳态结构的方法,它正成为发现新材料和探索相空间的有效工具。使用晶体结构预测方法可以帮助实验确定结构,或是根据需要设计特定的结构反过来指导实验合成,大大减少实验成本,因此具有十分重要的科学意义。然而,目前的大多晶体的结构预测仍局限于较小的体系,对于大体系的结构搜索仍然非常困难,这个困难主要来自于两个方面:一是使用第一性计算进行结构优化的成本随着原子数量的增加呈立方增加;二是势能面上局部极小值的数量随着自由度的增加呈指数增加。孙建教授课题组基于他们以前的一些工作,如在遗传中使用贝叶斯优化挑选结构(Science Bulletin 63, 817 (2018));可在小训练集中表现更好的机器学习力场(J. Chem. Phys. 150, 244110 (2019));使用图论判断晶体维度(npj Comput Mater 6, 143 (2020))等,运用机器学习和图论试图缓解上述两个方面的困难。
对于DFT结构优化耗时长的困难,他们使用机器学习力场来进行加速。他们在生成随机结构后,随机选择其中一些结构进行DFT单点能计算能量、力和应力构建训练集,并训练得到初始的机器学习力场。在接下来的搜索过程中,使用机器学习力场结构优化来替代耗时最长的DFT结构优化。在优化过程中,记录那些外推的结构,如果外推程度超过了规定的阈值,则执行DFT自洽计算,并加入训练集重新训练,修正原有的机器学习势函数,直到不再遇到外推的结构,机器学习可用于优化所有构型。由于机器学习力场带来的误差,在搜索结束后可根据需要再使用第一性计算进行校准。
图1:(a)传统结构搜索流程 (b)加入了机器学习力场后的结构搜索流程。
对于大体系构型空间复杂的困难,他们使用图论来减少搜索空间的维度。进化算法的一个重要理念是,父代中的优秀“基因”应该在后代中保留。对于晶体结构来说,“基因”代表着局部的结构基元。这些优秀的结构基元在分子晶体搜索中可以是分子,但对于普通的晶体来说并不容易判断。他们将周期性晶体结构抽象为一个图,并使用社区检测算法来完成这项工作。如一个扩展的α-硼结构,转化为商图并应用社区检测算法后提取出的0维基元,正是硼的二十面体。将其在后续的遗传操作中保持不变,自由度就可从36下降为6,搜索空间显著减小。这个方法简单说来就是在结构演化开始之前用图论的方法将结构中连接比较紧密的结构基元找出来,并以这些结构基元为单元进行结构演化,从而降低搜索空间的维度。
图2:通过社区分解算法分解α硼。
在后续的测试中,他们发现机器学习方法可以减少约两个数量级的自洽计算,而图论可以帮助减少30%搜索到目标结构所需要访问的结构数。利用MAGUS方法,孙建教授团队已在行星科学、超硬材料、高能量密度材料、超导材料等领域获得了一系列重要成果。如预言了巨行星内部一系列氦化合物及其新物态【Nat. Phys. 15, 1065 (2019); PRX 10, 021007 (2020); NSR 7, 1540 (2020)】;预言了可在海王星核心及大质量系外行星内稳定存在的混合配位二氧化硅高压相【PRL 126, 035701 (2021)】;预言了巨行星核幔边界超离子态二氧化硅水合物与二氧化镁水合物,为巨行星磁场和亮度异常提供了新的解释【PRL 128, 035702 (2022); Nat. Commun. 14, 1165 (2023)】;预言目前最硬的过渡金属氮化物并被实验合成【PRL 126, 065702 (2021)】;预言兼有超导和超离子特性的锂铝合金【PRL 129, 246403 (2022)】等。
图3:MAGUS的一些代表性成果。(a) 巨行星内部的氦-水化合物 ; (b) 二氧化硅混合配位高压相; (c) 二氧化硅-水化合物 ; (d) 超硬的WN6化合物; (e) 碳纳米管中的氮纳米管 (f) 可剥离出层状超导T-graphene的C4K化合物。
相关研究成果以“MAGUS: machine learning and graph theory assisted universal structure searcher”为题,发表在《国家科学评论》上,【National Science Review 10, nwad128 (2023), DOI: https://doi.org/10.1093/nsr/nwad128】。南京大学物理学院孙建教授课题组博士生王俊杰、高豪(已毕业)、韩瑜为文章共同第一作者,孙建教授为通讯作者,物理学院邢定钰院士和王慧田教授深入指导,孙建教授课题组博士生丁驰,潘书宁,王勇,贾秋涵等人共同参与了研究。该项研究得到了南京人工微结构科学与技术协同创新中心、固体微结构物理国家重点实验室的支持,得到了科技部重点研发计划、国家自然科学基金委杰出青年基金、中央高校基本业务费、南京大学卓越研究计划等经费的资助。相关计算工作主要在南京微结构协同创新中心高性能计算中心、南京大学高性能计算中心等超级计算机上进行。(王俊杰)
文章链接:
Junjie Wang, Hao Gao, Yu Han, Chi Ding, Shuning Pan, Yong Wang, Qiuhan Jia, Hui-Tian Wang, Dingyu Xing, Jian Sun, MAGUS: machine learning and graph theory assisted universal structure searcher. National Science Review 10, nwad128 (2023).
https://academic.oup.com/nsr/article/10/7/nwad128/7157143
MAGUS (https://gitlab.com/bigd4/magus)是一款由南京大学孙建教授课题组自主开发的机器学习与图论辅助的晶体结构搜索软件,用Python和C++编写。支持三维,二维晶体,分子晶体,表面重构,团簇,受限空间等体系的定组分和变组分搜索;支持VASP,CASTEP,ORCA,MTP,NEP,DeepMD,gulp,lammps,XTB,ASE等接口,便于扩展。MAGUS已被用于研究多个体系,设计的新材料被实验合成,发表了多篇高水平学术论文(包括Nat. Phys./NC/PRL/PRX/NSR等)。(https://gitlab.com/bigd4/magus/-/wikis/home/Publications) MAGUS对非盈利性质的学术研究免费开放,目前在国内外已有注册用户300余人,感兴趣的同行可通过以下链接注册下载:https://www.wjx.top/vm/m5eWS0X.aspx