Py学习  »  机器学习算法

华东理工大学ACS Catalysis :反应热力学约束下的机器学习框架革新多元金属催化剂设计

研之成理 • 4 月前 • 257 次点击  
▲第一作者:谭桢枫,朱远明
通讯作者:胡军,钱锋  
通讯单位:华东理工大学
论文DOI10.1021/acscatal.5c07191(点击文末「阅读原文」,直达链接)

全文速览
本研究创新性构建反应热力学约束下的机器学习框架,为高性能多元金属催化剂的设计优选与创新发现提供全新解决方案通过归一化方法重新定义元素物理化学性质,充分利用活性金属的元素特征与性质特征优势不仅能实现精准预测,还能推导各特征参数的 取值区间开发了基于遗传算法的多目标优化器,用于多金属催化剂组成的逆向设计相关研究以逆水煤气反应RWGS为模型反应展开将明确的热力学约束纳入机器学习模型,并结合实验验证结果进行模型自修正机器学习框架成功实现了对训练数据集内催化剂的精准重构、数据集外全新催化剂的有效发现充分验证了框架的可靠性与实用性。


背景介绍
快速发展的机器学习方法通过将深度训练与优化算法相结合,在探索发现复杂 金属催化剂方面展现出巨大潜力。为了使机器学习催化剂结构具有底层逻辑的可解释性,现有模型大多通过高通量量子化学计算构建。然而,对预定义反应路径的依赖以及催化剂的理想化处理,使得数据生成在应对多样化反应的复杂性方面受到限制。相比之下,高通量实验数据能提供催化剂的结构参数和反应性能的关系,展现出更广泛的适用性,但面临固有的可解释性局限。因此,将催化剂的实验性能与可解释的物理化学特征描述符相关联,并使用机器学习模型来理解催化剂结构、潜在机理及反应性能之间复杂的相互作用仍面临极大的挑战。

本文亮点
1特征处理与约束引入双管齐下:用归一化方法,充分挖掘活性金属元素特征与性质特征的双重价值有效提升特征参数的优化效率;并在机器学习模型中引入了明确的反应热力学约束,为后续可靠预测与设计提供理论基础

2逆向设计工具实现性能突破: 开发了一种基于遗传算法的多目标优化器,用于催化剂组成的设计工程。通过该优化器获得了一系列接近热力学平衡的高性能催化剂,为多元金属催化剂高效设计提供全新工具

3特征 - 性能关联提供明确指导:通过元素特征-催化性能的系统分析,精准确定各特征参数的优化数值区间与机器自学习最终获得的高性能催化剂的实验结果高度吻合,充分证明了分析结果的可靠性与指导意义

图文解析
(一)特征筛选与模型优化:奠定精准预测基础
对于归一化后的18特征,使用五种不同的特征分析方法进行分析并依据其被选中的次数进行排序以确定最终使用的特征描述符 (1a) ,最终确定的输入特征通过皮尔逊相关性检验确定了其独立性 (1b)

1 (a依据特征被选中的次数对归一化特征进行排序 (b最终确定的20个特征的皮尔逊相关矩阵

分别使用极端梯度提升 (XGB)随机森林 (RF)以及K最近邻等模型对RWGS反应的目标属性CO产率和CO2转化率进行了训练,并使用网格搜索以获取最优模型参数,如图2所示。总体而言,XGB模型在优化前后针对CO 2转化率和CO产率目标都获得了最高精度 (测试集R20.963)为进一步验证模型的泛化能力防止可能的数据泄露问题,采用论文策略在独立验证集上对XGB模型进行了评估尽管准确率有所下降 (测试集R20.813)其精度足以预测催化剂性能进一步通过定义模型覆盖函数将反应热力学约束条件融入优化后的机器学习模型,指导实际预测工作。

2 针对CO 产率目标的模型性能:初始预测性能, (a) 极端梯度提升 (XGB)(b) 随机森林 (RF)(c) K最近邻 (KNN);经网格搜索优化后的预测性能,(d) XGB(e) RF(f) KNN

(二)特征重要性解析:揭示性能影响关键因素
为评估20归一化处理的输入特征 CO产率目标的重要性阐明特征-性能之间的内在关系,我们进行了SHAP分析 (3)。正如预期,排名最高的特征属于实验条件,特别是反应温度和H2/CO2比,两者对CO产率的贡献度超过48%。此外,载体重量百分比WS1 (对应于总活性金属负载量M_Total位列第三)对于被选择的八个活性金属特征其重要性排序为:OxF_ECo_E> ELE> OxB_G> CA_EDensity> ELA> Co_R 使用SHAP预测值的散点图结合 LOWESS趋势线与多项式拟合,直观地阐明了各单项特征对CO产率的影响 (3c-k)。为了进一步为合理选择活性金属及利用ML模型进行其组成的设计工程提供指导,还进一步量化并总结了各活性金属归一化特征的推荐取值范围及可能的原因

3 产率模型的SHAP摘要图(a)与依赖图(b);八个归一化特征的趋势拟合图:(c) 总金属负载量,(d)最稳定金属氧化物形成能,(e)金属内聚能,(f)电负性 ,(g)最稳定金属氧化物能带带隙(h)纯金属表面的CO2吸附能,(i)金属密度,(j)电子亲和能,(k)共价半径。

(三)多目标优化器开发:实现催化剂逆向设计
针对催化剂组成直接反向求解难度大的问题,将其抽象为一个多目标优化问题,由下式表达:

基于此,开发了基于遗传算法的多目标优化系统于求解催化剂组成该系统包含三个模块:数据修正、算法求解与优化 (4)

1. 数据构建:8个归一化特征,输入m种金属时构建物性矩阵B此外,初始数据集中还纳入了包括7个实验条件和4个载体条件在内的11个特征均设推荐取值范围),形成完整的输入数据集

2.组合生成:根据多金属催化剂所需的活性金属数量n,生成可能的独立组合以供求解

3.约束优化:在算法求解过程中,当单个金属负载量和总金属负载量被显式约束于其最优区间时,通过优化器从超过1600万种可能组合中筛选通过比例系数k实现目标函数P与误差函数ε之间数量级差异的平衡最终求解金属催化剂的最优组成。

4包含三个模块的多目标优化器:数据校正(绿色)、算法求解(蓝色)和优化(黄色)。

(四)实验验证与模型自校正:确保框架可靠性
机器学习模型的可靠性通过实验得到进一步确认,该验证过程首先通过两轮自校正循环以扩展数据资源和模型校正。在第一轮自校正中,随机选择常见过渡金属合成一系列三元金属催化剂进行测试以获得相应性能数据,这些数据被纳入模型再训练。基于第一轮自校正后模型,合成了十种催化剂用于评估ML模型的准确性,绝大多数实验结果与模型预测高度吻合 (5a),这些数据也被全部纳入模型再训练经过两轮自校正后,ML系统地识别出一系列性能更优的三元金属催化剂组成。从中随机选取了3组成进行实验验证,其CO产率接近平衡 (5b)值得一提的是,这些衍生出的高性能催化剂中活性金属的归一化特征值均与SHAP分析所推荐的数值范围高度吻合,从而验证了基于此ML 框架的SHAP分析的准确性。此外,还进一步证明模型对不同实验条件下催化剂性能变化预测能力 (5c-d)

5机器学习模型在第一轮自校正后对催化剂CO产率的预测值与实验对比 (a),第二次自校正后对三种最优催化剂CO产率的预测值与实验对比(b);催化剂12.71Cu−2.62Fe−1.29Zn/γ-Al2O3在不同温度 (c)及不同H2/CO2 (d)条件下的实验CO产率与预测产率对比。

总结与展望
本研究开发了一个兼具高可解释性与外推能力的催化剂机器学习框架,RWGS为模型反应,通过内置其反应热力学约束指导,获得了接近反应平衡极限的高性能多元金属催化剂。具体而言,采用归一化方法以综合利用活性金属元素特征与性质特征的双重优势。通过整合活性金属、催化剂载体及实验操作条件共20个特征构建了机器学习模型,并实现了对CO2转化率与CO产率的精准预测。SHAP分析确定各特征的重要性排序,其中最稳定金属氧化物形成能与金属内聚能是活性金属最关键的特征,而反应温度与H2/CO2比例则在实验条件中起重要作用。在明确热力学平衡约束的强化下,基于遗传算法的多目标优化器成功实现了对数据集内外三元金属催化剂组成的 逆向设计工程。该机器学习框架的可靠性与外推能力得到了实验验证。在经过两轮基于实验验证数据的自校正后,这一主动式机器学习框架提供了多种不同的三元金属催化剂,实验证实接近了反应条件下的平衡极限

该研究构建的机器学习框架,集理论指导、精准预测、合理解释与实验验证于一体,通过热力学约束强化、归一化特征处理、遗传算法优化等创新手段,成功实现三大突破:一是解决传统模型可解释性与泛化能力难以兼顾的问题;二是实现数据集内外催化剂的精准重构与全新发现;三是提供从特征分析到组成设计的全链条解决方案。该框架可进一步拓展至其他多相催化反应体系,为催化剂研究提供了具有广阔前景的新范式。

研理云服务器

业务介绍

研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。

 ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。

 ● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
 ● 公司服务器应用工程师具有量子化学第一性原理分子动力学等相关学科研究背景。
 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
 ● 可参与招投标。
产品特色
  ● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。
  ● 一体化软件服务:根据需求发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用
  ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
  ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询  
 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。



扫码添加客服微信

1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/191577