Py学习  »  机器学习算法

哈尔滨工业大学刘杨团队:通过机器学习和密度泛函理论加速硝酸盐还原单原子催化剂的发现

研之成理 • 2 周前 • 57 次点击  


前言

近日,哈尔滨工业大学刘杨团队在《Chinese Chemical Letters》上发表了题为“Accelerating the discovery of single-atom catalysts for nitrate reduction via machine learning and DFT”的研究论文(DOI:10.1016/j.cclet.2026.112734)。本研究结合机器学习与第一性原理计算,构建多目标预测模型,实现了石墨烯负载单原子催化剂的高效筛选,从大量候选中识别出性能优异的催化剂(如VN3B1)。同时,通过符号回归方法建立了具有良好泛化能力的催化描述符,揭示了活性位点与配位环境的协同作用,为加速复杂电催化反应中催化剂设计与筛选提供了有效方法。


研究思路

本论文围绕NO3RR催化剂筛选效率低和构效关系不清晰的问题,构建了基于第一性原理计算与机器学习相结合的NO3RR单原子催化剂高通量筛选框架。首先,通过文献调研与第一性原理计算建立高质量数据集,并结合电子结构特征与化学直觉筛选关键特征,构建多种机器学习模型实现对NO3RR关键反应步骤的高精度预测,从而对未探索的单原子催化剂进行快速筛选。其次,选取代表性优异催化剂VN3B1,基于DFT计算系统研究其反应路径、活性与选择性,并结合溶剂效应与电极电位评估其在实际电催化环境中的反应行为,同时验证了结构稳定性。最后,借助SHAP方法解析关键特征对催化性能的贡献,并通过SISSO符号回归构建可解释的催化活性描述符,揭示金属活性位点与配位环境的协同作用机制,建立催化剂结构与性能之间的定量构效关系,实现NO3RR催化剂的高效设计与精准预测。


论文标题截图


Twitter关注超两万


图文导读

图1. (a)机器学习筛选与描述符构建框架;(b)用于评估NO3RR中催化性能的关键目标性质;(c)所选过渡金属元素;(d)石墨烯负载催化剂结构示意图

本研究的机器学习工作流程包括目标性质数据集的构建、相关特征的筛选、机器学习模型的训练以及通过符号回归开发可解释描述符等步骤(图1a)。硝酸盐还原为NH3的过程较为复杂,为简化计算流程并高效筛选潜在优异催化剂,本研究选取三个关键反应步骤作为目标性质来源(图1b)。数据集来源于两个主要部分,主要包含25种过渡金属(图1c),一部分数据来自文献中报道的二维材料负载单原子催化剂的DFT计算结果,另一部分数据来源于本研究的第一性原理计算,主要为负载在石墨烯基底上、具有不同异质原子掺杂配位环境的模型(图1d)。

图2.  GBR模型对(a)ΔG(*NO3)、(b)ΔG(*NO→*NOH)和(c)ΔG(*NH2→*NH3)的训练结果。其中,蓝色和红色圆点分别表示训练集和测试集数据,黑色虚线表示机器学习预测结果与DFT计算结果的理想一致关系

不同的机器学习算法基于各自不同的假设、数学原理和模型结构,在处理同一数据集时可能表现出显著差异。通过对比分析可以筛选出最契合数据特征的模型。在本研究中,选取了五种机器学习算法:线性回归(LR)、决策树回归(DTR)、K近邻回归(KNN)、支持向量回归(SVR)以及梯度提升回归(GBR)。对于三个目标性质的预测任务,GBR模型均表现出最优性能。如图2a-c所示,三个目标性质在训练集上的评分均超过0.9,在测试集上的评分均超过0.85。这主要得益于GBR模型基于残差的迭代优化能力以及集成学习带来的抗噪声特性。

图3 . VN3B1上NO3RR生成(a)NH3以及(b)NO、NO2和N2的吉布斯自由能变化

基于三个关键反应步骤训练的机器学习模型成功快速筛选出30种具有潜力的催化剂候选。为避免遗漏其他可能的决速步并更准确评估NO3RR活性,仍需进行完整反应路径的DFT计算,选取VN3B 1作为代表催化剂进行深入研究。图3a展示了VN3B1上NO3RR反应的自由能图及中间体结构。在逐步加氢过程中,*NO3→*NO3H、*NO2→*NO2H、*NO→*NOH以及*NH2→*NH3步骤的吉布斯自由能分别仅略有上升,其余步骤均表现为自发的负自由能变化。VN3B1促进NO3RR生成NH3的整体限制电位为−0.28 V,表明其具有优异的催化活性。图3b给出了NO3RR可能生成副产物的吉布斯自由能变化。其中,生成N2的限制电位为−1.30 V,远低于VN3B1生成NH3所需的整体限制电位,表明NH3生成路径在热力学上更具优势。此外,NO2和NO的脱附能分别高达2.51 eV和2.42 eV,说明与催化剂表面结合较强,不易脱附形成主要产物。同时进一步从动力学角度分析了关键竞争路径的能垒差异,并对结构稳定性进行了验证。

图4.  SISSO预测值与DFT计算值之间的线性相关性对比图:(a)ΔG(*NO3);(b)ΔG(*NO→*NOH);(c)ΔG(*NH2→*NH3)

通过可解释机器学习方法揭示了影响NO3RR催化性能的关键特征,并构建了具有物理意义的催化活性描述符。基于SISSO方法分别构建了ΔG(*NO3)、ΔG(*NO→*NOH)和ΔG(*NH2→*NH3)的描述符。通过与DFT计算结果对比,对所提出描述符进行了验证。如图4所示,各目标性质在训练集上的预测精度约为0.85,表明所构建的描述符具有较为可靠的预测能力。此外,验证集中大多数数据点均分布在红色参考线附近,说明这些描述符具有一定的泛化性能。基于SISSO构建的描述符不仅识别了影响NO3RR催化性能的关键物理化学特征,还揭示了金属活性位点与其周围化学环境的协同作用,从而建立了更为准确的构效关系。


小结

本研究提出了一种用于硝酸盐还原制氨高效催化剂开发的策略:通过机器学习驱动的初步筛选和基于密度泛函理论的深入研究,实现对催化剂的高效筛选。构建了三个基于梯度提升回归的机器学习模型,用于NO3RR多目标性能预测。从431个单原子催化剂候选中成功筛选出30个潜在优异催化剂,其中VN3B1具有优异的NO3RR性能,其限制电位为−0.28 V。进一步利用SISSO符号回归方法构建了具有物理可解释性的NO3RR描述符,该描述符表现出良好的预测能力与泛化性能,为高效NO3RR催化剂的快速发现提供了有力工具。通过结合机器学习与第一性原理计算的互补优势,本研究所提出的方法为多种复杂化学反应体系中高性能催化剂的加速开发提供了重要参考。

本研究成果得到了国家自然科学基金(项目编号:U25A20365)的支持


通讯作者介绍

通讯作者个人简介:刘杨,哈尔滨工业大学化工与化学学院副研究员,博士生导师。主要研究方向:人工智能化学,环境典型污染物降解和去除机制的理论和实验研究,姜-泰勒效应的理论发展及其应用,激发态化学和光化学反应机理的理论研究。主持多项国家自然科学基金项目,发表学术论文60余篇。


第一作者介绍

第一作者个人简介:廖海源,哈尔滨工业大学化工与化学学院硕士研究生,主要从事机器学习与理论计算化学相关研究,聚焦于催化材料的高通量筛选和电催化反应机理。获得全国首届化工AI大赛三等奖。


文献信息

原文链接:https://doi.org/10.1016/j.cclet.2026.112734



研理云服务器


业务介绍

研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。

 ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。

 ● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
 ● 公司服务器应用工程师具有量子化学第一性原理分子动力学等相关学科研究背景。
 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
 ● 可参与招投标。
产品特色
  ● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。
  ● 一体化软件服务:根据需求发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用
  ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
  ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询  
 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。



扫码添加客服微信

1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。


点击“阅读原文”跳转至原文界面

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/196081