Python社区  »  机器学习算法

马普所Dierk Raabe最新《Science》: 机器学习高熵合金设计!

材料科学与工程 • 1 月前 • 62 次点击  
















































































































































































































































































































































































































































































































































































大数据促进了人工智能和机器学习的发展,但也带来了新的挑战。在诸多领域,大数据的获得异常困难,譬如材料设计领域,由于实验成本高,数据集通常小而离散。如何利用机器学习基于这些小数据集设计新材料,不仅是人工智能领域面对的新问题,也是材料设计领域发展的新方向。高熵合金是近年来提出的合金设计新思路。与传统合金相比,这种合金含有多个主族元素,比如最开始被广泛研究的FeNiCrCoMn高熵合金含有五个等比例的过渡族元素。经过近20年的研究,高熵合金被报道具有实现多种多样优良性能结合的潜力,例如软磁性能和力学性能、热膨胀性能和抗腐蚀性能等。因此,针对某些特定的服役环境,高熵合金具有极大的应用前景。然而,高熵合金的设计难点在于其成分区间非常大。如果我们考虑元素周期表中最常用的元素去设计一个五元高熵合金,将会产生 1050 种可能的合金成分。因此,传统的合金设计方法已经无法加速高熵合金的发展。

针对这个问题,近日德国马普所钢铁研究所的研究人员与多个研究团队合作,提出了一种新的基于机器学习的高熵合金设计方法,极大地提高了高熵合金的设计效率,并成功地设计了多种新型高熵因瓦合金。马普钢铁研究所饶梓元博士为第一作者,韦业博士和Dierk Raabe教授为共同通讯作者。共同合作单位和合作人包括英国剑桥大学童博彦博士,瑞典皇家理工学院Stafan Bauer教授,德国达姆斯塔特工业大学张洪彬教授、谢瑞文博士,中国东南大学陈耀教授和中南大学李志明教授等。

论文链接:
https://www.science.org/doi/10.1126/science.abo4940


图 1. 基于主动学习的高熵合金设计框架。此框架集成了机器学习模型、第一性原理计算、热力学模拟和实验。首先,该框架生成新的合金成分,由两个主要步骤组成:i) 用于成分生成的自动编码器。ii) 用于成分选择的随机抽样。其次,该框架进一步对成分进行处理,包括两个由多层感知器和梯度提升决策树组成的集成模型。在最后一步,通过基于排名的策略选择最有希望的合金组合。排名前三的合金成分通过实验测量并反馈到数据库。重复迭代,直到发现性能达到预期标准的因瓦合金。

该文章的核心主动学习框架包括三个主要步骤:目标成分组合生成、成分性能的预测和实验反馈(图 1)。首先,该研究团队开发了一种基于生成模型的高熵合金设计 (HEA-GAD) 方法。HEA-GAD 采用生成模型、数学建模和采样来对潜在的因瓦合金进行大规模搜索。生成模型学习了高维数据的有效表示,它不仅提供了直观的数据视觉表示,而且还将高维设计空间中的搜索转换为低维,极大的增加了搜索效率。随后,HEA-GAD 利用高斯混合模型和马尔可夫链蒙特卡罗采样对潜在表示生成的因瓦成分进行大规模搜索。其次,研究团队使用两阶段集成回归模型 (TERM) 来进一步研究 HEA-GAD 生成的合金成分的热膨胀性能。第一阶段涉及基于组合的回归模型,旨在快速和大规模的成分组合推理。然后,筛选来自 HEA-GAD 模型的热膨胀系数可能较低的前约 1,000 个结果并进入第二阶段模型,其中第一性原理和热力学计算作为输入的一部分。最后,通过物理性能测量系统实验确定前 3 种选定候选材料的热膨胀系数值。然后,这些实验结果为下一次主动学习迭代增加训练数据库。

图 2. 主动学习循环中 6 次迭代后的结果分析。 (A) 和 (B) 合金发现过程在理想和现实世界中的对比。 (C) 和 (D) Cr 和 Cu 元素在数据集中的分布直方图。Cr 直方图具有各种浓度(从 0 到 20%)。相比之下,绝大多数(超过 95%)的组合物的铜浓度为零。作为组成变化的最低已知热膨胀系数绘制为实线,而虚线表示未知数。灰色箭头说明了 HEA-GAD-TERM 的发现路径。 (E) FeNiCoCr 和 FeNiCoCrCu高熵合金的预测和实验热膨胀系数。 (F) 主动学习的误差变化图。误差的减小来自于自然的学习过程。 (G) 和 (I) A2 合金的 EBSD 相分布和晶界分布图。 (H) 和 (J) A3 合金的 EBSD 相分布和晶界分布图。 (K) 和 (L) A2 合金中晶格常数随温度的变化。

论文阐述了在两种情况下合金的发现过程(图 2A-B)。在理想情况下,成分-热膨胀系数曲线是简单且凸的,这意味着这种特定关系很容易学习并且“永远不会忘记”。即使存在一个小数据集,也可以很容易地找到全局最大值,而不管它们的初始起点如何:路径 1 和路径 2 都可以通向因瓦点。然而,在现实中,由于复杂的潜在成分-属性关系,最低的热膨胀系数的曲线是高度非线性的,并且成分分布在很大程度上仍然未知。文章提供了当前数据集中 Cr 和 Cu 的浓度直方图(图 2C-D)和观察到的最低 TEC 曲线来说明两个 HEA 中的发现路径。文章展示了 FeNiCoCr 和 FeNiCoCrCu高熵合金的测量和预测的热膨胀系数值(图 2E)和平均绝对百分比误差(MAPE)(实验和预测之间)与实验迭代(图 2F)。为了揭示这些特性背后的物理起源,文章展示了 A2 和 A3 合金的实验和第一性原理分析(图 2G-L)。可以看到 A2 和 A3 合金分别具有单相 bcc 和 fcc 结构(图 2G-J)。相干势近似 (CPA) 模拟中的部分无序局部矩模型表明,与 fcc A3 合金相比,bcc A2 合金在 950 K 附近具有较高的居里温度,晶格参数 a 呈现出略微上升的趋势。第一性原理计算表明,如果 A2 合金可以稳定在其 fcc 相状态,也可以实现因瓦效应(图 2K-L,红色点划线)。

总结与展望:

了解成分-性能关系背后的基本物理特性是合金设计的关键任务,对于成分复杂的材料而言,这项任务尤其具有挑战性。原则上,具有有趣特征的高熵合金可以隐藏在几乎无限且未经探索的成分空间中,这种情况使合金设计面临最艰难的考验。因此,来自马普所的科学家们联合多个研究团队共同开发了具有普适性的主动学习框架,通过结合生成模型、回归集成、物理驱动的学习和实验,展示了该框架在高熵因瓦合金的组合设计方向的应用,并基于非常少的实验数据证明了其在设计高熵合金方面的能力。整个工作流程只需要几个月的时间,而传统的合金设计方法可能需要数年和更多的实验。该研究团队成员期望未来此方法可以在高熵合金设计中同时优化多个性能,并能够应用到其它结构和功能材料的设计和优化中。

*感谢论文作者团队对本文的大力支持。

推荐阅读:
欢迎微信后台回复“应聘编辑”加入我们

实用!Origin软件使用经典问题集锦

免费下载:18款超实用软件轻松搞科研

合作 投稿 点击此处

欢迎留言,分享观点。点亮在看

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/147962
 
62 次点击  
分享到微博