Py学习  »  机器学习算法

《Nature》子刊:一种基于贝叶斯深度学习的晶体结构识别方法!

材料科学与工程 • 2 年前 • 374 次点击  


















































































































































































































































































































































































































































































































































































由于具有识别复杂模式的能力,神经网络可以推动材料科学数据分析的范式转变。在此,来自德国马克斯普朗克学会弗里茨哈伯协会的Andreas Leitherer等研究者,介绍了一种基于贝叶斯深度学习的晶体结构识别方法——ARISE。相关论文以题为“Robust recognition and exploratory analysis of crystal structures via Bayesian deep learning”发表在Nature Communications上。

论文链接:
https://www.nature.com/articles/s41467-021-26511-5


识别给定材料的晶体结构,对于理解和预测其物理性质是很重要的。例如,工业钢的硬度受到晶界原子组成的强烈影响,这已经在许多理论和实验研究中得到了研究。除了块状材料,二维和一维系统还具有深远的技术应用,如太阳能存储、DNA测序、癌症治疗,甚至太空探索等。要描述给定材料的晶体结构,可以指定一个对称标记,例如空间群。更一般地,人们可能希望在已知系统列表中,找到最相似的结构。这些所谓的结构类别,是通过化学计量学、空间群、单元中原子的数量和单元中原子的位置(威科夫位置)来确定的。

从实验和计算研究中,晶体结构自动识别的方法,需要分析晶体结构的不断增长的几何信息。数以百万计的晶体结构和计算性质,可在大型计算数据库中获得,如新材料发现(NOMAD)实验室、AFLOW、开放量子材料数据库(OQMD)、材料项目或专门用于2D材料的存储库等。在扫描透射电子显微镜(STEM)中,可以从特定系统(如石墨烯)的原子分辨率图像重建原子位置。原子探针层析成像(APT)和原子电子层析成像(AET)实验,提供了原子的三维位置。

然而,由于实验限制和重构误差,大量的噪声水平存在于原子位置,例如,扭曲超出了可以用物理效应解释的水平,或者,在APT的情况下,大量丢失的原子(至少20%,由于有限的探测器效率)。晶体结构识别方案,应该能够对大量的结构类别进行分类,同时对理论或实验来源的不准确性和物理驱动偏离理想晶体对称(例如,空位或热振动)具有健壮性。由于数据量很大,分类应该是全自动的,并且独立于人工选择公差参数(量化偏离理想参考结构的偏差)

目前的方法要么基于空间群对称,要么基于局部结构。对于基于空间组的方法(著名的例子是SpglibAFLOW-SYM),允许的对称操作直接从原子位置计算来推断空间群标签。对于基于局部结构的方法,每个原子的局部原子邻域被分类为一个预定义的参考结构列表。这些方法的例子,有共近邻分析(CNA)、自适应共近邻分析(a-CNA)、键角分析(BAA)和多面体模板匹配(PTM)。空间群方法,可以处理所有空间群,但对噪声敏感,而局部结构方法可以相当稳健,但只处理少数结构类。此外,现有的结构识别方案都不能识别复杂的纳米结构,如纳米管。

为了改进当前的技术状态,研究者以深度学习的最新进展为基础。深度学习是机器学习的一个子领域,在许多情况下都能产生突破性的结果,例如图像和语音识别。遗憾的是,此前使用机器学习和神经网络(NNs)进行晶体结构识别的工作并没有超出少数结构类,同时显示出鲁棒性。

在这里,研究者提出了一个鲁棒的、阈值无关的晶体结构识别框架(基于人工智能的结构评估,简称ARISE),用于对包括块状、2D和1D材料的108种不同结构类别进行了分类。使用贝叶斯神经网络,即,一个最近发展的神经网络家族,不仅产生分类,而且还产生不确定性估计。这允许量化预测的不确定性,但也可以量化材料的晶体秩序程度。本文对该算法的性能进行了比较,并将其应用于各种计算和实验原子结构中。晶体表征和隐藏模式的识别是使用监督学习以及对ARISE的内部表征的无监督分析(通过聚类和降维)来完成的。

图1 单晶和多晶表征框架的示意图概述。

图2 合成多晶的分析。

图3 利用ARISE和SPM分析HAADF和HRTEM图像。

图4 原子电子层析成像数据分析。

在此,研究者采用贝叶斯深度学习实现了一个灵活的,鲁棒的,和阈值无关的晶体分类模型,称之为ARISE。这种方法从计算和实验中正确地分类了一组全面而多样的晶体结构,包括多晶体系(通过跨模式匹配)。给定一个未知的结构,该网络会自动在108个可能的类别中分配最相似的原型(并量化相似性!),即使对受过训练的材料科学家来说,这也是一项非常复杂的任务,特别是在复杂且可能有缺陷的3D结构的情况下。ARISE仅在理想合成系统上训练,在STEM和AET实验中正确识别晶体结构,具有较强的泛化能力。贝叶斯深度学习模型提供了分类概率,在与标准神经网络的方差下,允许通过互信息量化预测的不确定性。文:水生

本文来自微信公众号“材料科学与工程”。欢迎转载请联系,未经许可谢绝转载至其他网站。

推荐阅读:
欢迎微信后台回复“应聘编辑”加入我们

实用! Origin软件使用经典问题集锦

免费下载:18款超实用软件轻松搞科研

合作 投稿 点击此处

欢迎留言,分享观点。点亮在看👇

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/124489
 
374 次点击