社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
机器学习学术速递[5.20]
机器学习学术速递[5.21]
机器学习学术速递[5.18]
机器学习学术速递[5.22]
AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT...
一封律师函引发的GitHub风暴:拓竹为何惹毛了全球极客?
2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
GitHub帝国崩塌前夜:源码泄露、18年老粉决裂,微软失去1.5亿开发者
从《2025百家号AIGC创作者生态白皮书》,看懂内容工业化时代的加速到来
关注
Py学习
»
机器学习算法
华东理工大学ACS Catalysis :反应热力学约束下的机器学习框架革新多元金属催化剂设计
研之成理
• 4 月前 • 257 次点击
▲第一作者:
谭桢枫,朱远明
通讯作者:
胡军,
钱锋
通讯单位:
华东理工大学
论文
DOI
:
10.1021/acscatal.5c07191(点击文末「阅读原文」,直达链接)
全文速览
本研究
创新性构建反应热力学约束下的机器学习框架,为高性能多元金属催化剂的设计优选与创新发现提供全新解决方案
。
通过归一化方法重新定义元素物理化学性质,充分利用活性金属的元素特征与
性质
特征优势
,
不仅能实现精准预测,还能推导各
特征
参数的
优
化
取值区间
;
开发了基于遗传算法的多目标优化器,用于多
元
金属催化剂组成的逆向设计
;
相关研究
以逆水煤气反应
(
RWGS
)
为模型反应
展开
,
将明确的热力学约束纳入机器学习模型,并结合实验验证结果进行
模型
自修正
。
该
机器学习框架
成功实现了对训练数据集内催化剂的精准
重构、
数据集外
全新催化剂
的有效
发现
,
充分验证了框架的可靠性与实用性。
背景介绍
快速发展的机器学习方法通过将深度训练与优化算法
相结合,在
探索
发现复杂
多
元
金属
催化剂方面展现出
巨大潜力
。为了使机器学习
对
催化剂
结构
具有底层逻辑的
可解释性,现有
模型
大多通过高通量量子化学计算构建。然而,对预定
义反应
路径的依赖以及催化剂的理想化处理,使得数据生成在应对多样化反应的复杂性方面受到限制。相比之下,高通量实验数据能
提供
催化剂的结构参数和反应性能
的关系
,展现出更广泛的适用性,但面临固有的可解释性局限。因此,将催化剂的实验性能与可解释的物理化学特征描述符相关联
,并
使用
机器学习模型
来理解
催化剂结构、潜在机理及反应性能之间复杂的相互作用
仍面临极大的挑战。
本文亮点
1
.
特征处理与约束引入双管齐下:
采
用归一化方法,
充分
挖掘
活性金属元素特征与
性质
特征的双重
价值
,
有效提升特征参数的优化效率;
并在
机器学习
模型中引入了明确的
反应
热力学约束
,为后续可靠预测与设计
提供
理论基础
。
2
.
逆向设计工具实现性能突破:
开发了一种基于遗传算法的多目标优化器,用于催化剂组成的
逆
向
设计
工程
。通过该优化器
获得了一系列接近热力学平衡的高性能催化剂
,为
多元金属
催化剂高效设计提供全新工具
。
3
.
特征
-
性能关联提供明确指导:
通过
元素
特征
-
催化性能
的系统
分析
,精准确定各
特征
参数的优化数值
区间
,
与机器自学习最终获得的
高性能催化剂的
实验结果
高度吻合
,充分证明了分析结果的可靠性与指导意义
。
图文解析
(一)特征筛选与模型优化:奠定精准预测基础
对于归一化后的
18
个
特征
,使用五种不同的特征
分析
方法
进行分析并依据其被选中的次数进行排序以确定最终使用的特征描述符
(
图
1
a
)
,最终确定的输入特征通过
皮尔逊相关
性检验确定了其独立性
(
图
1
b
)
。
图
1
(
a
)
依据特征被选中的次数对归一化特征进行排序
(
b
)
最终确定的
20
个特征的皮尔逊相关矩阵
分别使用
极端梯度提升
(
XGB)
、
随机森林
(RF)
以及
K
最近邻等
模型对
RWGS
反应的目标属性
CO
产率和
CO
2
转化率进行了
训练,并使用
网格搜索
以获取最优
模型参数,如图
2
所示。总体而言,
X
GB
模型在优化前后
针对
C
O
2
转化率和
C
O
产率目标都获得了最高精度
(
测试集
R
2
为
0
.963)
。
为进一步
验证
模型的泛化能力
并
防止
可能的
数据泄露
问题,
采用
留
一
论文
策略
在独立验证集上对
X
GB
模型
进行了
再
评估
,
尽管
准确率有所下降
(
测试集
R
2
为
0.813
)
,
其精度足以
预测催化剂
性能
。
进一步
,
通过定义模型覆盖函数将反应
热力学约束条件融入
优化后的机器学习模型,
并
指导实际预测工作。
图
2
针对
CO
产率目标的
模型
性能:初始预测
性能
,
(
a
)
极端梯度提升
(
XGB
)
、
(
b
)
随机森林
(
RF
)
、
(
c
)
K
最近邻
(
KNN
)
;经
网格搜索优化后的预测性能,
(
d
)
XGB
、
(
e
)
RF
和
(
f
)
KNN
。
(二)特征重要性解析:揭示性能影响关键因素
为评估
20
个
归一化处理的
输入
特征
对
CO
产率
目标的
重要性
并
阐明
特征
-
性能之间的内在关系,我们进行了
SHAP
分析
(
图
3
)
。正如预期,排名最高的特征属于实验条件,特别是反应温度和
H
2
/CO
2
比,两者对
CO
产率的贡献度超过
48%
。此外,载体重量百分比
W
S
1
(
对应于总
活性金属负载量
M_T
otal
位列第三
)
。
对于被选择的八个活性金属特征
,
其重要性排序为:
OxF_E
>
Co_E
>
ELE
>
OxB_G
>
CA_E
>
Density
>
ELA
>
Co_R
。
使用
SHAP
预测值的散点图结合
LOWESS
趋势线与多项式拟合,直观地阐明了各单项特征对
CO
产率的影响
(
图
3c
-
k
)
。为了进一步为合理选择活性金属及利用
ML
模型进行其组成的
逆
向
设计
工程提供指导,
还进一步
量化并总结了各活性金属归一化特征的推荐取值范围
及可能的原因
。
图
3
产率模型的
SHAP
摘要图
(
a
)
与依赖图
(
b
);
八个
归一化
特征的
趋势拟合图
:
(
c)
总金属负载量
,
(
d
)
最稳定金属氧化物形成能
,
(
e
)
金属内聚能
,
(
f
)
电负性
,
(
g
)
最稳定金属氧化物
能带
带隙
,
(
h
)
纯金属表面的
CO
2
吸附能
,
(
i
)金属密度
,
(
j
)
电子亲和能
,
(
k
)
共价半径。
(三)多目标优化器开发:实现催化剂逆向设计
针对催化剂组成直接反向求解难度大的问题,
将其抽象为一个多目标优化问题,由
下式表达:
基于此,开发了基于遗传算法的
多目标
优化系统
用
于求解催化剂组成
,
该系统
包含三个模块:数据修正、算法求解与优化
(
图
4
)
。
1.
数据构建:
对
8
个归一化特征,输入
m
种金属时构建物性矩阵
B
。
此外,初始数据集中还纳入了包括
7
个实验条件和
4
个载体条件在内的
11
个特征
(
均设
为
推荐
取值
范围
),形成完整的输入数据集
。
2.
组合生成:
根据多金属催化剂所需的活性金属数量
n
,生成
种
可能的独立组合
以供求解
。
3.
约束优化:
在算法求解过程中,当单个金属负载量和总金属负载
量被显式
约束于其最优区间时,通过优化器从超过
1600
万种
可能
组合
中筛选
,
并
通过比例系数
k
以
实现目标函数
P
与误差函数
ε
之间数量级差异的平衡
,
最终求解
出
金属催化剂的最优组成。
图
4
包含三个模块的多目标优化器:数据校正(绿色)、算法求解(蓝色)和优化(黄色)。
(四)实验验证与模型自校正:确保框架可靠性
机器学习模型的可靠性通过实验得到进一步确认,该
验证
过程
首先
通过两轮自校正
循环以扩展
数据资源
和模型校正
。在第一轮自校正中
,随机选择
常见过渡金属
合成一系列三元金属催化剂
进行测试
以获得相应性能
数据
,这些数据被纳入模型再训练。
基于第一轮自校正后
模型
,合成了十种催化剂用于评估
ML
模型的准确性,绝大多数实验结果与模型预测高度吻合
(
图
5a
)
,这些数据也被全部
纳入模型再训练
。
经过
两轮
自校正后,
ML
系统地识别出一系列性能更优的三元金属催化剂组成。从中
随机
选取了
3
个
组成
进行实验验证
,其
CO
产率接近平衡
(
图
5b
)
。
值得一提的是,这些衍生出的高性能催化剂中活性金属的
归一化
特征值均与
SHAP
分析所推荐的数值范围高度吻合,从而验证了基于此
ML
框架的
SHAP
分析的准确性。
此外,还进一步
证明
了
模型对
不同
实验条件
下催化剂性能变化
的
预测能力
(
图
5c
-
d
)
。
图
5
机器学习模型在
第一轮
自校正后对催化剂
CO
产率的预测值与实验
值
对比
(
a
)
,第二次自校正后对三种最优催化剂
CO
产率的预测值与实验
值
对比
(
b
)
;
催化剂
12.71Cu−2.62Fe−1.29Zn/γ-Al
2
O
3
在不同温度
(
c
)
及不同
H
2
/
CO
2
比
(
d
)
条件下的实验
C
O
产率
与预测产率对比。
总结与展望
本研究
开发了一个兼具高可解释性与外推能力的
催化剂
机器学习框架,
以
RWGS
为模型
反应
,通过
内置
其反应
热力学
约束
指导,
获得了接近反应平衡极限的高性能多元金属
催化剂。具体而言,采用归一化方法
以综合利用活性金属元素特征与性质特征的双重优势
。通过整合活性金属、催化剂载体及实验操作条件共
20
个特征构建了机器学习
模型
,并实现了对
CO
2
转化率与
CO
产率的
精准
预测。
SHAP
分析
确定
了
各特征
的重要性
排序
,其中最稳定金属氧化物形成能与金属内聚能是活性金属最关键的特征,而反应温度与
H
2
/CO
2
比例则在实验
条件
中起重要作用。在明确热力学平衡约束的强化下,
基于遗传算法的多目标优化
器成功
实现了对数据集内外三元金属催化剂组成的
逆向设计
工程。该机器学习框架的可靠性与外推能力得到了实验验证。在经过两轮基于实验验证数据的自校正后,这一主动式机
器学习框架提供了多种不同的三元金属催化剂,
实验证实
接近
了反应
条件下的
平衡极限
。
该研究构建的机器学习框架,
集理论
指导、精准预测、合理解释与实验验证于一体,通过热力学约束强化、归一化特征处理、遗传算法优化等创新手段,成功实现三大突破:一是解决传统模型可解释性与泛化能力难以兼顾的问题;二是实现数据集内外催化剂的精准重构与全新发现;三是提供从特征分析到组成设计的全链条解决方案。该框架可进一步拓展至其他多相催化反应体系
,为催化剂研究提供了具有广阔前景的新范式。
研理云服务器
业务介绍
研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。
● 配置多样(单台塔式、两台塔式、
多台机架式
),按需定制,质量可靠,性价比高。
● 目前已经为全国
100 多个课题组
提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
● 公司服务器应用工程师具有
量子化学
、
第一性原理
、
分子动力学
等相关学科研究背景。
● 公司与多位化学、材料领域
理论计算方向专家长期合作
,一起探索最优服务器软硬件配置和部署。
● 可参与招投标。
产品特色
● 定制化硬件配置:
提供
售前实例测试
,为您提供最合适的硬件配置方案。
● 一体化软件服务:
根据需求
,
发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现
开机即用
。
● 完善的售后服务
:为每位客户建立
专属服务群
,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
● 已购买客户咨询
:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供
真实案例咨询
。
●
赠送课程学习机会:
可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。
扫码添加客服微信
相
关
推
荐
1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/191577
登录后回复