Py学习  »  机器学习算法

Nature Materials:深度学习跨材料发现 OER 催化剂

AI-电化学家 • 4 天前 • 9 次点击  
AI-电化学家
文章网页标题截图

本文构建 crossbreeding neural network(CBNN),将碳载单原子催化剂与体相钙钛矿氧化物两个实验数据域连接起来,用共享共描述符预测此前未训练过的 钙钛矿氧化物负载单原子催化剂 的 OER 活性,并通过合成验证筛选得到跨材料组表现最优的 MM/CPCF 催化剂。

题目:Cross-material catalyst discovery via deep learning

DOI:10.1038/s41563-026-02622-6

通讯作者:Taeghwan Hyeon

01

研究亮点

RESEARCH HIGHLIGHTS

· · ·

这项工作面对的是催化剂机器学习中的一个关键限制:已有模型多在单一材料家族内训练和预测,难以把不同材料类型中的经验迁移到新体系。作者提出并验证了 跨材料数据融合的 CBNN 框架,将碳载单原子催化剂和钙钛矿氧化物的 OER 实验数据统一到同一模型中,并通过统计分析、相关性分析和 NLP 自动筛选出氧化态、离子半径、价层 d 电子数、电负性和配位数五个共描述符。进一步地,模型在未训练的 SACs on perovskite oxides 体系中预测出活性趋势,并指导合成 MM/CPCF,实现 349 mV 的本征 OER 过电位。该工作的重要性不只在于找到一个高活性催化剂,更在于证明 实验数据驱动的跨材料迁移学习可以形成可实验验证的催化剂发现路径

02

图文解析

FIGURE ANALYSIS

· · ·

Figure 1

图1 | CBNN 跨材料催化剂发现框架

图1展示了 CBNN 的总体思想:将两个看似不同的实验数据集纳入同一学习框架,再预测一个此前未直接训练的新材料组。图1a中,训练数据来自两类碱性 OER 催化体系:一类是碳载单原子催化剂,代表表面位点工程;另一类是体相钙钛矿氧化物,代表体相组成和晶体结构调控。模型的目标不是在原有材料组内插值,而是预测二者组合后的 SACs on perovskite oxides。图1b给出模型结构:左侧表面模型用图像输入描述单原子位点,右侧体相模型用图结构输入描述钙钛矿晶体,两支网络输出后拼接形成统一表征。图1c说明预测空间由 7 种金属单原子(Cr、Mn、Mo、Ru、Rh、W、Re)和两种钙钛矿载体(CPCF 与 LaCoO3)组成,共 14 个单金属候选。该图的核心意义在于把“表面单原子”和“体相钙钛矿”两种催化设计语言放入同一个可训练模型中。

Figure 2

图2 | 共描述符筛选与跨材料联合训练效果

图2回答模型为什么能跨材料迁移。图2a显示作者用三个步骤筛选共描述符:先做统计独立性测试,排除高度耦合特征;再用与 OER 过电位的相关性分析筛选活性相关特征;最后用 NLP 判断文献语料中各描述符与“catalytic activity”或“overpotential”的语义接近程度。三个过程最终收敛到五个关键共描述符:oxidation state、ionic radius、ionic d electrons、electronegativity 和 coordination number。图2b比较不同训练策略和描述符组合。使用关键共描述符并联合训练两个材料组时,模型相关系数达到 0.931,RMSE 为 0.040 V;若使用被丢弃描述符,性能明显下降。图2c展示预测值与实验值的相关性,SACs on carbon 和 perovskite oxides 两个数据域可以被同一模型较好拟合。这说明跨材料学习并不是简单把数据拼起来,而是依赖化学上有意义、在不同材料家族中都能表达活性差异的共描述符。

Figure 3

图3 | 单金属 SACs on perovskite oxides 的结构验证与预测排序

图3验证模型预测是否能对应真实实验。图3a-c用球差校正 STEM 观察 Mo/CPCF 与 Rh/LaCoO3,红圈标出位于规则晶格之外或扰动晶格周期性的单原子,证明低温合成主要是在氧化物表面锚定单原子而不是进入体相晶格。图3b-d通过 Mo、Rh K-edge EXAFS 拟合进一步确认单原子配位环境。图3e比较实验排序和 ML 预测排序,模型能够捕捉单金属候选活性的大体趋势:CPCF 载体上的 Mo、W、Rh 等位于高活性区域,而 LaCoO3 载体上候选整体更靠后。图3f-g分别给出 CPCF 与 LaCoO3 体系中实验过电位与预测值的相关性,图3h则展示 14 个催化剂的 OER 极化曲线。 该图把模型预测从计算排序推进到实际合成和电化学测试,构成全文最关键的实验闭环之一。

Figure 4

图4 | MM/CPCF 跨越三个材料组的最优 OER 表现

图4展示模型从单金属候选进一步扩展到多金属单原子组合后的结果。作者在固定总负载量 0.5 wt% 的条件下筛选 8008 个多金属 SAC 候选,最终预测得到 W、Mo、Ru、Rh 四种单原子共锚定在 CPCF 上的 MM/CPCF。图4a将 MM/CPCF 与既有钙钛矿氧化物数据集比较,MM/CPCF 位于最低过电位端。图4b进一步把 MM/CPCF 与碳载 SAC 数据集比较,其 TOF 表现优于训练集中单原子催化剂;图4c则显示 MM/CPCF 也优于本文合成的 14 个 SACs on perovskite oxides。实验中 MM/CPCF 在 10 mA cm-2oxide 下本征 OER 过电位为 349 mV,并可在 100 mA cm-2disk 下稳定运行 120 h。这一图说明 CBNN 并非只做相似材料排序,而是确实帮助作者走出原训练数据边界,找到跨材料组更优的候选。

Figure 5

图5 | 可解释机器学习揭示活性来源

图5尝试解释模型为什么认为某些单原子组合更优。图5a给出五个关键共描述符的重要性,其中离子半径和氧化态贡献最高,说明模型特别依赖能够同时反映局部结构和电子状态的描述符。图5b借鉴图像任务中的 activation map,把催化剂表面图像中每个像素对过电位预测的梯度响应转化为活性贡献。图5c显示不同单金属锚定在 CPCF 后,对 B-site Co、B-site Fe 和邻近氧位的 activation values 影响不同;Mo 和 W 附近出现更强负向变化,对应更低预测过电位。图5d进一步比较 W、Mo、Ru、Rh 的单金属、双金属、三金属和四金属组合,多金属组合使活性位 activation values 继续负移,说明模型捕捉到了组合协同效应。该图的价值在于把模型输出从“黑箱排序”转化为对局部表面环境和描述符贡献的可视化解释。

03

对我们的启发

INSPIRATION

· · ·

对我们而言,这篇文章最值得借鉴的是“问题转译”方式。作者没有直接追求一个更复杂的深度学习模型,而是先判断催化剂发现中的关键瓶颈:不同材料家族之间缺乏可迁移的共同语言。随后,他们用共描述符把表面单原子位点和体相钙钛矿氧化物统一起来,再用实验合成验证模型预测。这提示我们,在使用 AI 做电化学或催化研究时,真正重要的不是模型名词,而是能否把材料化学问题转化为跨体系可比较、可验证的表征方式

这项工作也提醒我们,AI 预测要走向科研可信度,需要建立“数据来源-描述符选择-模型训练-实验验证-可解释分析”的完整链条。后续我们如果做局部电化学、界面催化或多组分材料筛选,可以重点思考哪些描述符能够同时连接结构、电子态和反应性能,并结合原位/局部表征去验证模型提出的活性位假设,而不是只把 AI 作为排序工具使用。

04

结论与展望

CONCLUSION

· · ·

总体来看,本文解决的核心问题是如何跨越单一材料家族的限制,将不同实验数据域中的催化知识迁移到新的 OER 催化体系。作者通过 CBNN 和五个共描述符,把碳载 SAC 与体相钙钛矿氧化物连接起来,并成功预测、合成和验证了 SACs on perovskite oxides 以及多金属 MM/CPCF。

该工作对催化剂发现的启发在于,材料机器学习可以从“已知体系内拟合”走向“跨材料空间外推”,但前提是数据质量、评价条件和描述符设计足够可靠。后续值得关注的问题包括:如何纳入更多反应体系和操作条件,如何处理不同实验室数据之间的系统误差,如何把主动学习与自动实验结合,以及如何把模型解释结果进一步转化为可直接验证的界面结构假设。

版权:推送内容仅供学习交流分享使用,版权归论文作者和单位所有,文章内容仅代表本公众号观点,欢迎批评指正,如有侵权请联系后台删除或修改,感谢支持!

投稿:非常欢迎各位老师在公众号上介绍课题组最新或经典研究成果!后台联系即可。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/197273