社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

《Nature》子刊:一种基于贝叶斯深度学习的晶体结构识别方法!

材料科学与工程 • 3 年前 • 548 次点击  


















































































































































































































































































































































































































































































































































































由于具有识别复杂模式的能力,神经网络可以推动材料科学数据分析的范式转变。在此,来自德国马克斯普朗克学会弗里茨哈伯协会的Andreas Leitherer等研究者,介绍了一种基于贝叶斯深度学习的晶体结构识别方法——ARISE。相关论文以题为“Robust recognition and exploratory analysis of crystal structures via Bayesian deep learning”发表在Nature Communications上。

论文链接:
https://www.nature.com/articles/s41467-021-26511-5


识别给定材料的晶体结构,对于理解和预测其物理性质是很重要的。例如,工业钢的硬度受到晶界原子组成的强烈影响,这已经在许多理论和实验研究中得到了研究。除了块状材料,二维和一维系统还具有深远的技术应用,如太阳能存储、DNA测序、癌症治疗,甚至太空探索等。要描述给定材料的晶体结构,可以指定一个对称标记,例如空间群。更一般地,人们可能希望在已知系统列表中,找到最相似的结构。这些所谓的结构类别,是通过化学计量学、空间群、单元中原子的数量和单元中原子的位置(威科夫位置)来确定的。

从实验和计算研究中,晶体结构自动识别的方法,需要分析晶体结构的不断增长的几何信息。数以百万计的晶体结构和计算性质,可在大型计算数据库中获得,如新材料发现(NOMAD)实验室、AFLOW、开放量子材料数据库(OQMD)、材料项目或专门用于2D材料的存储库等。在扫描透射电子显微镜(STEM)中,可以从特定系统(如石墨烯)的原子分辨率图像重建原子位置。原子探针层析成像(APT)和原子电子层析成像(AET)实验,提供了原子的三维位置。

然而,由于实验限制和重构误差,大量的噪声水平存在于原子位置,例如,扭曲超出了可以用物理效应解释的水平,或者,在APT的情况下,大量丢失的原子(至少20%,由于有限的探测器效率)。晶体结构识别方案,应该能够对大量的结构类别进行分类,同时对理论或实验来源的不准确性和物理驱动偏离理想晶体对称(例如,空位或热振动)具有健壮性。由于数据量很大,分类应该是全自动的,并且独立于人工选择公差参数(量化偏离理想参考结构的偏差)

目前的方法要么基于空间群对称,要么基于局部结构。对于基于空间组的方法(著名的例子是SpglibAFLOW-SYM),允许的对称操作直接从原子位置计算来推断空间群标签。对于基于局部结构的方法,每个原子的局部原子邻域被分类为一个预定义的参考结构列表。这些方法的例子,有共近邻分析(CNA)、自适应共近邻分析(a-CNA)、键角分析(BAA)和多面体模板匹配(PTM)。空间群方法,可以处理所有空间群,但对噪声敏感,而局部结构方法可以相当稳健,但只处理少数结构类。此外,现有的结构识别方案都不能识别复杂的纳米结构,如纳米管。

为了改进当前的技术状态,研究者以深度学习的最新进展为基础。深度学习是机器学习的一个子领域,在许多情况下都能产生突破性的结果,例如图像和语音识别。遗憾的是,此前使用机器学习和神经网络(NNs)进行晶体结构识别的工作并没有超出少数结构类,同时显示出鲁棒性。

在这里,研究者提出了一个鲁棒的、阈值无关的晶体结构识别框架(基于人工智能的结构评估,简称ARISE),用于对包括块状、2D和1D材料的108种不同结构类别进行了分类。使用贝叶斯神经网络,即,一个最近发展的神经网络家族,不仅产生分类,而且还产生不确定性估计。这允许量化预测的不确定性,但也可以量化材料的晶体秩序程度。本文对该算法的性能进行了比较,并将其应用于各种计算和实验原子结构中。晶体表征和隐藏模式的识别是使用监督学习以及对ARISE的内部表征的无监督分析(通过聚类和降维)来完成的。

图1 单晶和多晶表征框架的示意图概述。

图2 合成多晶的分析。

图3 利用ARISE和SPM分析HAADF和HRTEM图像。

图4 原子电子层析成像数据分析。

在此,研究者采用贝叶斯深度学习实现了一个灵活的,鲁棒的,和阈值无关的晶体分类模型,称之为ARISE。这种方法从计算和实验中正确地分类了一组全面而多样的晶体结构,包括多晶体系(通过跨模式匹配)。给定一个未知的结构,该网络会自动在108个可能的类别中分配最相似的原型(并量化相似性!),即使对受过训练的材料科学家来说,这也是一项非常复杂的任务,特别是在复杂且可能有缺陷的3D结构的情况下。ARISE仅在理想合成系统上训练,在STEM和AET实验中正确识别晶体结构,具有较强的泛化能力。贝叶斯深度学习模型提供了分类概率,在与标准神经网络的方差下,允许通过互信息量化预测的不确定性。文:水生

本文来自微信公众号“材料科学与工程”。欢迎转载请联系,未经许可谢绝转载至其他网站。

推荐阅读:
欢迎微信后台回复“应聘编辑”加入我们

实用!Origin软件使用经典问题集锦

免费下载: 18款超实用软件轻松搞科研

合作 投稿 点击此处

欢迎留言,分享观点。点亮在看👇

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/124489
 
548 次点击