社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

西北工业大学王锦程教授课题组:基于机器学习的超强马氏体不锈钢全局搜索策略

研之成理 • 2 年前 • 442 次点击  


▲第一作者:虎小兵(在读博士)    
通讯作者:王锦程教授    
通讯单位:西北工业大学凝固国家重点实验室   
论文DOI:10.1002/adts.202100411  

01

全文速览


机器学习指导实验以最小化时间和经济成本的方式来设计新合金是材料领域的一个热门的且具有挑战性的课题。王锦程教授团队提出了一种结合机器学习和自适应采样的智能合金设计策略,并成功地应用于马氏体不锈钢的实例中。仅用9步迭代实验就实现了设计空间内最高硬度合金的成功搜索,并在全局范围内建立了材料成分与硬度之间的可靠关系。该策略具有灵活性、可靠性和高效性优势,并可推广应用于其他材料的实验设计。

02

背景介绍


A. 传统合金设计方法的缺陷
设计具有优异力学性能的新合金的困难性在于各种化学成分、微观结构和其他物理性能之间可能存在复杂的相互作用,传统的试错法依赖于低效和尝试性的实验,造成了过多不必要的时间和经济投入。利用物理模型来筛选和指导合金设计虽然为合金设计问题提供了许多低成本的理论方案,但低精度和有限的应用范围仍然制约着这些方法的广泛使用。因此,有必要制定新的策略来加速合金设计过程,该策略要求具有低成本、高精度和强的泛化能力等特点。

近年来,机器学习为上述问题提供了一个智能化的解决方案。王锦程教授团队先前的工作(Acta Mater. 2020, 182, 278)采用人工神经网络学习材料化学成分和热力学相含量之间数据规律,成功设计出具有高强塑形结合的高熵合金,该设计思路也在预测材料屈服强度方面取得了成功的应用(J. Mater. Sci. Technol. 2021, 69, 156)。然而,这种设计策略并没有实验反馈,所得的机器学习模型并不具备外推预测能力,所得到的设计合金也是次优的。另外一种有趣的设计思路是借助一些优化算法(如遗传算法)在给的的设计空间内直接搜索,遗憾的是,这种方案忽略了预测的不确定性,很容易陷入局部最优(Comput. Mater. Sci. 2018, 155, 331)。王锦程教授团队针对以上问题还做了不同的尝试(Mater. Des. 2021, 201, 109497),创新性的引入从微观组织图片中提取的统计信息,很明显的提高了预测精度,但由于引入了过多的复杂性,该策略在合金设计方面尚没有成功应用。

B. 自适应搜索方法的优缺点
西安交通大学薛德帧教授团队提出一种结合自适应搜索方法的机器学习策略,同时考虑了模型预测的不确定性和实验反馈,证实了该方法在合金设计领域巨大的应用潜力,但通过该方法来获取全局最优解可能需要较高的实验代价。更有趣的是,该策略推荐的实验合金总是偏聚在成分空间的“优势区域”(高的力学性能),导致不平衡的数据分布,从而限制预测模型在整个设计空间内的可靠性。日本国立材料科学研究所的Tamura团队针对全局可靠预测的目标,选择仅考虑不确定性来指导实验。然而,数百次迭代实验的代价却无法避免。从另外一个极端考虑,如果仅选择预测的最佳合金,只能获得少量有价值的数据。总之,自适应搜索方法具备强大的外推设计能力,确实可以为发现新材料提供新的机会。然而,在全局范围内以最小的实验成本实现精确预测和发现最优解的挑战仍是一项挑战性的任务。

03

研究出发点


给定一个较小的稀疏数据集,机器学习预测的不确定性通常在远离已知样本点的位置较大,在靠近已知样本点的位置附近较小。因此,通过自适应搜索策略在短期迭代中,可能指向局部最优(大的不确定性,小的预测值),也可能指向全局最优(小的不确定性,大的预测值)的突出位置。因此,王锦程教授团队设想在自适应采样之前,先尝试均衡机器学习模型在设计空间内预测的不确定性,而后迫使采样点快速靠近全局最优解。以此为动机,王锦程教授团队提出了一个面向全局的搜索策略,并以在设计空间内发现最高硬度的马氏体不锈钢、获取全局预测可靠的机器学习模型为目标展开研究。

04

图文解析


王锦程教授团队提出的搜索策略包含了:训练集创建机器学习模型训练设计空间内未探索合金预测自适应抽样实验测试反馈更新等主要步骤。在自适应抽样环节考虑了首先利用均衡设计空间内预测不确定性,然后通过迭代减少整体优化期望值。最终目标是搜索到设计空间内的最优解和建立全局范围内预测可靠的机器学习模型。

▲图1 面向全局搜索策略示意图
 
前6步迭代实验测量的硬度值分布范围较广,不确定性频率分布曲线快速收敛,说明了搜索策略在均衡预测不确定性方面的可行性。后3步迭代实验测量的硬度值集中在高硬度区,特别是最后一步实验所得的3个合金成分几乎一致,不确定性曲线无明显变化,说明了机器学习模型在全局最优解附近探索。预测误差曲线最后接近于0表明迭代优化的机器学习模型精度已饱和,能够在全局范围内提供可靠的预测。

▲图2 (a) 迭代设计合金硬度的实验测量值;(b) 预测不确定性的高斯拟合频率密度曲线变化;(c) 预测值与实验值间的平均绝对误差变化;(d) Ni含量为1 wt%的1592合金的预测硬度(大于52.9 HRC);(e) Co和Mo含量的变化对Ni为1 wt%、Cr为12 wt%合金的预测硬度的影响
 
在迭代推荐的合金和在全局范围内随机选取的验证合金上,实验测试结果与模型预测结果的对比进一步证明王锦程教授团队提出的搜索策略实现了快速发现全局最优解、建立全局预测高精度机器学习模型的目标。

 
▲图3 设计合金的实验测量硬度和机器学习预测硬度比较

05

总结与展望


王锦程教授团队开发了一种面向全局设计空间的合金搜索策略。以马氏体不锈钢为例,通过特征工程发现合金元素Ni、Cr、Co和Mo对硬度有重要影响,并以此建立了科学的设计空间。该策略成功推荐了27种新的马氏体不锈钢进行实验测试,其中1/3的钢的硬度高于训练集的最大值。此外,发现超硬钢(硬度>55HRC)总是分布在一个小的区域(Ni: ~1wt%,Cr: 12-12.5wt%,Co: ~18wt%,Mo: 5-6wt%),并成功发现了硬度最高的合金(56 HRC),证明了该策略在设计空间中的全局可靠性。当给定更大的成分空间或面对其他材料时,该策略也可以胜任数据收集、材料知识挖掘和新合金设计的科学任务。

06

参考文献


[1]. X. Hu, J. Zhao, J. Wang, et al., Adv. Theory Simul., 2022, 5: 2100411.
[2]. Q. Wu, X. Hu, J. Wang, et al., Acta Mater. 2020182, 278.
[3]. T. Zheng, X. Hu, F. He, et al., J. Mater. Sci. Technol. 202169, 156.
[4]. X. Hu, J. Wang, Y. Gu, et al., Comput. Mater. Sci. 2018155, 331.
[5]. X. Hu, J. Li, J. Wang, et al., Mater. Des. 2021201, 109497.

07

课题组介绍


微观组织计算及合金设计课题组以凝固技术国家重点实验室和金属高性能增材制造与创新设计工业和信息化部重点实验室为依托,长期开展材料多尺度模拟计算、材料基因工程与合金设计、高熵合金及增材制造等方面的基础研究工作。课题组现有教授4人、副教授3人,在读研究生50余人,已发展成为研究方向明确、学术气氛浓厚、科研条件完善、富有创新性和凝聚力的学术团队。课题组近年来先后承担国家重点研发计划、973计划、国家自然科学基金、基础加强等国家及省部级科研项目30余项,发表SCI论文200余篇,其中中科院1区论文70余篇,授权发明专利12项,获省部级科学奖励2项。

原文链接:
https://onlinelibrary.wiley.com/doi/10.1002/adts.202100411

1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。 
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/132476
 
442 次点击