《Nature》子刊：一种基于贝叶斯深度学习的晶体结构识别方法！

由于具有识别复杂模式的能力，神经网络可以推动材料科学数据分析的范式转变。在此，来自德国马克斯普朗克学会弗里茨哈伯协会的Andreas Leitherer等研究者，介绍了一种基于贝叶斯深度学习的晶体结构识别方法——ARISE。相关论文以题为“Robust recognition and exploratory analysis of crystal structures via Bayesian deep learning”发表在Nature Communications上。

论文链接：

https://www.nature.com/articles/s41467-021-26511-5

识别给定材料的晶体结构，对于理解和预测其物理性质是很重要的。例如，工业钢的硬度受到晶界原子组成的强烈影响，这已经在许多理论和实验研究中得到了研究。除了块状材料，二维和一维系统还具有深远的技术应用，如太阳能存储、DNA测序、癌症治疗，甚至太空探索等。要描述给定材料的晶体结构，可以指定一个对称标记，例如空间群。更一般地，人们可能希望在已知系统列表中，找到最相似的结构。这些所谓的结构类别，是通过化学计量学、空间群、单元中原子的数量和单元中原子的位置(威科夫位置)来确定的。

从实验和计算研究中，晶体结构自动识别的方法，需要分析晶体结构的不断增长的几何信息。数以百万计的晶体结构和计算性质，可在大型计算数据库中获得，如新材料发现(NOMAD)实验室、AFLOW、开放量子材料数据库(OQMD)、材料项目或专门用于2D材料的存储库等。在扫描透射电子显微镜(STEM)中，可以从特定系统(如石墨烯)的原子分辨率图像重建原子位置。原子探针层析成像(APT)和原子电子层析成像(AET)实验，提供了原子的三维位置。

然而，由于实验限制和重构误差，大量的噪声水平存在于原子位置，例如，扭曲超出了可以用物理效应解释的水平，或者，在APT的情况下，大量丢失的原子(至少20%，由于有限的探测器效率)。晶体结构识别方案，应该能够对大量的结构类别进行分类，同时对理论或实验来源的不准确性和物理驱动偏离理想晶体对称(例如，空位或热振动)具有健壮性。由于数据量很大，分类应该是全自动的，并且独立于人工选择公差参数(量化偏离理想参考结构的偏差)。

目前的方法要么基于空间群对称，要么基于局部结构。对于基于空间组的方法(著名的例子是Spglib和AFLOW-SYM)，允许的对称操作直接从原子位置计算来推断空间群标签。对于基于局部结构的方法，每个原子的局部原子邻域被分类为一个预定义的参考结构列表。这些方法的例子，有共近邻分析(CNA)、自适应共近邻分析(a-CNA)、键角分析(BAA)和多面体模板匹配(PTM)。空间群方法，可以处理所有空间群，但对噪声敏感，而局部结构方法可以相当稳健，但只处理少数结构类。此外，现有的结构识别方案都不能识别复杂的纳米结构，如纳米管。

为了改进当前的技术状态，研究者以深度学习的最新进展为基础。深度学习是机器学习的一个子领域，在许多情况下都能产生突破性的结果，例如图像和语音识别。遗憾的是，此前使用机器学习和神经网络(NNs)进行晶体结构识别的工作并没有超出少数结构类，同时显示出鲁棒性。

在这里，研究者提出了一个鲁棒的、阈值无关的晶体结构识别框架(基于人工智能的结构评估，简称ARISE)，用于对包括块状、2D和1D材料的108种不同结构类别进行了分类。使用贝叶斯神经网络，即，一个最近发展的神经网络家族，不仅产生分类，而且还产生不确定性估计。这允许量化预测的不确定性，但也可以量化材料的晶体秩序程度。本文对该算法的性能进行了比较，并将其应用于各种计算和实验原子结构中。晶体表征和隐藏模式的识别是使用监督学习以及对ARISE的内部表征的无监督分析(通过聚类和降维)来完成的。

图1 单晶和多晶表征框架的示意图概述。

图2 合成多晶的分析。

图3 利用ARISE和SPM分析HAADF和HRTEM图像。

图4 原子电子层析成像数据分析。

在此，研究者采用贝叶斯深度学习实现了一个灵活的，鲁棒的，和阈值无关的晶体分类模型，称之为ARISE。这种方法从计算和实验中正确地分类了一组全面而多样的晶体结构，包括多晶体系(通过跨模式匹配)。给定一个未知的结构，该网络会自动在108个可能的类别中分配最相似的原型(并量化相似性!)，即使对受过训练的材料科学家来说，这也是一项非常复杂的任务，特别是在复杂且可能有缺陷的3D结构的情况下。ARISE仅在理想合成系统上训练，在STEM和AET实验中正确识别晶体结构，具有较强的泛化能力。贝叶斯深度学习模型提供了分类概率，在与标准神经网络的方差下，允许通过互信息量化预测的不确定性。（文：水生）

本文来自微信公众号“材料科学与工程”。欢迎转载请联系，未经许可谢绝转载至其他网站。

推荐阅读：

欢迎微信后台回复“应聘编辑”加入我们

实用！ Origin软件使用经典问题集锦

免费下载：18款超实用软件轻松搞科研

合作投稿点击此处

Er1gF7PbJUGeb2rznpW3zw==.jpg

欢迎留言，分享观点。点亮在看👇

《Nature》子刊：一种基于贝叶斯深度学习的晶体结构识别方法！

实用！ (adsbygoogle = window.adsbygoogle || []).push({}); Origin软件使用经典问题集锦

免费下载：18款超实用软件轻松搞科研

实用！ Origin软件使用经典问题集锦