社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

乔世璋课题组JACS:机器学习大数据分析揭示C–C电催化偶联机理

研之成理 • 9 月前 • 395 次点击  

共同第一作者:李昊博,李昕宇,王鹏棠

通讯作者:乔世璋

通讯单位:阿德莱德大学

论文DOI:10.1021/jacs.4c09079 (点击文末「阅读原文」,直达链接)



  


全文速览
碳碳(C-C)偶联反应步是电催化CO2还原生成绿色化学品的必经步骤。然而由于催化反应网络的复杂性,其内在反应机理和催化剂材料设计的方向目前仍存在争议。本工作率先从全局的视角建立了一个涵盖所有C-C偶联前体和催化活性位点组成的综合数据集,通过大数据分析来探索反应机理和筛选催化剂。针对C-C偶联反应前后的中间体结构的各种复杂的吸附构型,专门开发了二维-三维集成(2D-3D ensemble)的机器学习策略,其可以快速而准确地扩展量子化学计算数据,获取大数据集。大数据分析揭示:1)与对称偶联相比,不对称偶联机理更优,其中最佳路径为CH或CH2与CHO偶联;2)Cu基催化剂的C-C偶联选择性可以通过AgNb双金属掺杂来进一步提高。实验证实了CuAgNb催化剂对C-C偶联反应的提升作用,这很好地证明了这种机器学习加速的量子化学计算方法生成的大数据集的实用性。将大数据分析的思路应用于解决催化反应机理和催化剂成分组成的复杂性问题,将为加速催化剂研究树立新的范式。



  


背景介绍
在CO2电催化过程中,C-C偶联是生成多碳(C2+)产物的必要过程。然而,目前占主导地位的 Cu 基电催化剂的效率仍然存在问题。由于对反应机理的了解有限,设计高活性和高效率的催化剂具有挑战性。实验技术面临固有的局限性,尤其是难以通过原位表征手段将同一体系内所有可能的反应机理同时进行比较。这导致了关于反应机理的实验报道各不相同,包括CO-CO和CHO-CHO对称偶联机理,以及CO-COH,CO-CHO,CO-CH,CO-CH3,COH-CHO 等不对称偶联机理。此外,在催化剂材料选择方面也出现了完全不同的方向和思路。为提高Cu基催化剂C2+产物的选择性,有的工作提出掺入Ag,Au等后过渡金属,有的掺入Zr和镧系元素等前过渡金属,有的掺入主族元素如 Al,Ga和Bi。因此,仍然缺乏对构效关系的系统性比较和理解

理论研究可以通过同时考虑同一体系内的完整反应网络和活性位点组成,从全局角度解决这一问题,从而为实验提供有价值的指导。然而,构建全面的大数据集需要大量的计算,而 机器学习能够显著加快密度泛函理论(DFT)等量子化学计算方法的效率,使大数据分析应用于电催化反应成为可能。尽管如此,目前机器学习驱动的计算筛选研究严重依赖于反应中间体的吸附能之间的线性关系,通常采用某些中间体的吸附能作为描述符。因此,该常规方法主要用于机理相对简单的反应,例如CO2活化以及氧还原反应等,而推广到具有复杂机理的反应(如C-C偶联)仍面临挑战。另外,虽然这些线性关系/描述符的已实现一定的成功预测能力,但推导过程的原始数据量通常只有几十个数据点,这为迁移到更复杂的反应体系时带来了可靠性问题。为了从复杂的反应过程中捕获重要信息,一些研究小组提出将数据驱动方法集成到化学反应网络的研究中,然而,这些想法在电催化领域的实际应用仍然很少。


  


本文亮点
本工作将大数据分析的思路融入到复杂的C-C偶联反应电催化剂的计算筛选中。建立了一个超过45,000个吸附能数据点的大数据集,涵盖了六种前体物种的所有可能的偶联组合,以及27种过渡金属排列组合的Cu基活性位点上的所有吸附构型。使用迭代采样和二维-三维集成机器学习技术,将初始的2500个DFT计算数据扩大20倍。大数据分析显示了偶联前后吸附物种之间的吸附能线性关系,揭示不对称偶联机理优于对称偶联,表明了Cu基催化剂C-C 偶联性能最优的原因,并预测通过活性位点掺杂工程可进一步提高其C-C 偶联性能。重要的是,实验上证实了大数据分析最佳的CuAgNb电催化剂具有优异的C-C偶联反应性能,这直接验证了大数据分析方法在理解复杂反应网络机理和设计新型催化剂方面的实用性。


  


图文解析
大数据集构建
C-C偶联大数据集包括偶联前的六种可能的C1前体,即CO、COH、CHO、CH、CH2和CH3,以及由这些前体组合得到的六种对称偶联和15种不对称偶联的C2产物。考虑到不同的吸附位点,共121种吸附构型。由于 Cu 在 C-C 偶联中的重要作用,所有三原子吸附位都由一个 Cu 原子和另外两个过渡金属原子组成,共378种ABCu(A、B=过渡金属)活性位。这些吸附构型与活性位组合产生包含 45,738 个吸附能的大数据集。

针对此大数据集开发了一种迭代采样的方法,即随机采样一个子集(最接近Cu的3d金属),并依次增加其他两个子集(4d和5d金属),以确保对整个数据集进行合理分布地采样。采样得到的2500个结构用于DFT计算吸附能,然后将其用于机器学习预测以生成整个数据集。这种方法平衡了计算量和准确性,保证了所有金属类别的纳入,并允许在整个 DFT 计算和机器学习过程中进行动态调整。

Figure 1Construction and sampling of big data set for C–C coupling. The adsorption data set of 45,738 data is from combination of 121 adsorption structures and 378 substrates. 121 adsorption structures result from 21 coupling combinations of six precursors. These structures exhibit varying adsorption configurations, with options of 1, 3, or 6 adsorption sites. 378 adsorption substrates utilize ABCu triatom active sites with 27 metal replacements for A and B. Iterative sampling is used to get the training-set for machine-learning (ML). Three rounds of random sampling based on 3d, 4d, and 5d metals. Metals, large spheres; C, gray small spheres; O, red small spheres; and H, white small spheres.

机器学习模型开发
为了保证 C–C 偶联大数据集的质量,提高机器学习预测的准确性,开发了一种面向应用的二维-三维集成策略。图神经网络 (GNN) 模型因可以反映原子结构的特征而广泛用于吸附能预测,主要分为二维和三维GNN模型。在二维GNN模型中,信息传递过程仅从与中心原子直接结合的原子收集信息。这种方法考虑了与相邻原子的连接情况,但没有考虑这些原子之间的实际空间排列或距离,因此缺乏三维结构信息。相比之下,三维GNN整合了原子之间的三维空间距离和角度信息。这可以更准确而详细地表示几何构型。然而,它对结构变化很敏感,在预测与初始结构有显著偏差的弛豫结构时不够稳定。

二维-三维集成策略通过结合表现最佳的二维和三维模型来解决这一问题。将整个数据集被随机分成五个部分,两种机器学习模型分别执行两次训练和验证操作。这种集成方法能够结合两种机器学习算法的优势,有效地克服两种算法的局限性,从而达到更好的预测结果。具体来说,三维GNN模型中DimeNet++算法最准确,二维GNN模型中,图卷积网络(GCN)算法最准确。因此,将DimeNet++和GCN集成可以进一步得到更准确的结果,从而满足实际使用需求。

Figure 2Development of the 2D–3D ensemble model for C–C coupling big data set prediction. (a) Schematic diagram for 2D and 3D message passing GNN models. (b) Schematic for establishing 2D–3D ensemble for DimeNet++ algorithm and GCN algorithm. (c) In comparing DFT computation [Ead(DFT)] and ML [Ead(ML)] prediction data sets, DimeNet++ exhibits superior performance among the 3D atomic positions method, while GCN exhibits best performance among the 2D connectivity graph. By combining DimeNet++ and GCN through a 2D–3D ensemble approach, more accurate prediction of adsorption energy is achieved, surpassing mean absolute error (MAE) and root mean squared error (RMSE) values of individual algorithms.

大数据集中的线性关系
中间体吸附能之间的线性关系是催化理论的一个重要方面,这能够大大简化了计算量,使其广泛应用于催化剂筛选中。然而,在数据有限的情况下,得到的线性相关性可能较弱,降低了结论的可靠性。在不同金属表面,偶联前驱体之间的线性相关性普遍较弱,R2值大多小于0.7。此外,由于C2物种的尺寸较大,导致计算复杂度增加,因此相关研究有限。

本工作的吸附能大数据集解决了这一问题,因为大数据分析给出的线性相关性结论更加可靠。C1偶联前体在ABCu位点上的吸附能之间存在很强的线性相关性,R2通常大于0.8。前体和C2偶联产物之间的R2系数也很高,仅物理吸附的CH3–CH3除外。由于 C–C 偶联前后中间体的吸附能之间存在高度的线性相关性,可通过分析吸附能来评估偶联反应的难易程度。

Figure 3Linear relationship for adsorption energy before and following C–C coupling. Coefficient of linear relationship (R2) between adsorption energy of C–C coupling (a,d) precursors on metals, (b,e) precursors on ABCu sites, and (c,f) precursors vs products on ABCu sites. Intersection of CO (horizontal axis) and CH3 (vertical axis) is the correlation between Ead(CO) vs Ead(CO–CH3), while the intersection of CO (vertical axis) and CH3 (horizontal axis) is the correlation between Ead(CH3) vs Ead(CO–CH3).

Cu在大数据集中的位置
为将大数据集与实验进行对标,引入了偶联能(coupling energy)的概念,表示偶联前后的能量差。鉴于吸附能之间建立的强线性相关性,可得知吸附能和偶联能之间也是强线性相关性。此外,C-C偶联的动力学能垒也与偶联能线性相关,表明偶联能可用作C-C偶联反应活性的描述符。

将吸附能与偶联能作图发现,吸附能越负,偶联能越正,反之亦然。这就解释了为什么C-C偶联反应在实验中难以实现。因为吸附能和偶联能是跷跷板关系,一端难以获得前体,另一端难以进行偶联反应。有趣的是,Cu刚好位于跷跷板的中间,这证明Cu表现出平衡的形成前体和促进C-C键偶联的能力,使其成为C-C偶联的最佳催化剂。这一结果与实验事实高度吻合,证实了大数据集能够与实验对标。

Figure 4Relationship between adsorption energy and coupling energy. (a) Relationship between adsorption energy (Ead) for CO (horizontal axis), Ead for the other coupling precursors (vertical axis), and coupling energy (Ecplg) for CO with these precursors (presented by color) for the big data. The arrow indicates position of pure Cu site (where A and B in ABCu are equal to Cu). (b) Relationship between Ecplg and the C–C coupling activation barrier (Ea) for CO with the six precursors. The black dashed line indicates the linear fit.

反应机理分析
通过比较对称偶联(黑色虚线)和不对称偶联(彩色数据点)可发现,不对称偶联比其对称偶联更容易发生。还可以通过分析不同前体的偶联能来确定最佳的 C–C 偶联反应机理。大数据分析表明,CO倾向于与CH和CH3偶联,COH和CHO倾向于与CH和CH 2偶联,CH倾向于与CHO和CH2偶联,CH倾向于与CH和CHO偶联,CH2倾向于与CH和 CHO偶联,CH3倾向于与CH、CH2和CHO偶联。因此,CHO–CH和CHO–CH2机理被确定为最有利的途径。鉴于并非所有偶联中间体都易于在实验中检测到,对该机理的理论研究结果显得尤为重要。

Figure 5Comparison of precursor coupling with itself and other precursors. Relationship between coupling energy (Ecplg) of a precursor coupling to itself (shown by black dashed-line, representing symmetric coupling) and to other precursors (shown by colored data points, with different colors distinguishing precursor R, indicating asymmetric coupling) for the big data set.

Cu的性能能否进一步提高
大数据分析也可以直接用于筛选催化剂。潜在的更好的C-C偶联催化剂竞争者需要 (1) 偶联能低,最好是负值;(2) 偶联前体易于吸附,最好比在Cu上更容易;(3) 偶联前体易于形成,最好是放热过程;(4)CO 的吸附能在Cu的±0.1 eV范围内,以确保CO2还原的选择性,并防止生成H2副反应的发生。

根据上述四条标准,确定了 11 种具有实用前景的催化剂组合物 CuAlNb、CuZr、CuAuHf、CuMnW、CuAgNb、CuHfRh、CuTi、CuRuTi、CuAlV、CuIrV 和 CuPtV,与Cu相比,它们在C–C偶联方面具有潜在的优越性能。DFT计算的这11种催化剂上从CO到C2物种的整个过程的自由能图显示,从C1到C2物种的转化步很容易发生,从根本上解释了它们在理论上的高C2选择性。

Figure 6Experimental validation of big data predicted C–C coupling catalyst. (a) Screening for the big data. Through four screening criteria, 11 site structures that are the closest to Cu and expected to outperform Cu in C–C coupling performance were identified from the pool of 378 site structures. (b) Reaction network illustrating formation of CHO, CH, and CH2 precursors starting from CO that is necessary for coupling of CHO–CH and CHO–CH2 reactions. (c) Free energy diagram for CO to generate C–C coupling products CHO–CH or CHO–CH2 on CuAgNb site. The optimal pathway is marked in red. (d) High-angle annular dark-field scanning transmission electron microscopy image and corresponding elemental mapping images of synthesized ternary CuAgNb catalyst. (e) Faradaic efficiency (FE) for C1 (blue-color) and C2+ (red) products on Cu, CuAg, and CuAgNb catalysts under selected current density. (f) FE for different products on CuAgNb catalysts.

实验验证
对大数据预测的CuAgNb催化剂进行了实验验证。实验表征证实了所合成的催化剂中Cu、Ag和Nb元素的存在。在选定的电流密度条件下,与Cu、CuAg催化剂相比,CuAgNb催化剂表现出更高的C2+和更低的C1法拉第效率(FE)。对产物的进一步分析证实了CuAgNb催化剂的性能非常显著,特别是因为其表现出低CO产率和显著提高的C2H4和乙醇产率,使得该催化剂在生产高附加值C2产品方面具有实际应用前景。这很好地证实了理论预测。



  


总结与展望
本工作利用机器学习在扩展数据集方面的显著优势,建立了一个广泛的大数据集,以揭示复杂的C–C电催化偶联反应机理,从而实现大数据分析方法在电催化中的应用。该大数据集涵盖了 Cu 基催化剂的各种反应前体、偶联机理和活性位点组成,对于理解反应机理、建立催化剂组分与偶联反应之间的构效关系以及筛选催化剂具有重要的价值。大数据分析不仅增进了理论理解,还为实验提供了成功的指导和预测。


这项工作标志着电催化剂的理论研究进入了大数据时代。大数据分析方法将会扩展到更广泛的理论和实验研究中,解决更复杂的催化剂组分和更复杂的反应机理。



  


参考文献
[1] Li, H.; Jiao, Y.; Davey, K.; Qiao, S.-Z. Data-driven machine learning for understanding surface structures of heterogeneous catalysts. Angew. Chem. Int. Ed. 202362, e202216383.  DOI: 10.1002/anie.202216383
[2] Li, H.; Jiang, Y.; Li, X.; Davey, K.; Zheng, Y.; Qiao, S.-Z.C2+ selectivity for CO2 electroreduction on oxidized Cu-based catalysts. J. Am. Chem. Soc. 2023, 145, 14335-14344. DOI: 10.1021/jacs.3c03022



  


作者介绍
乔世璋,现任澳大利亚科学院院士,澳大利亚阿德莱德大学化工与材料学院纳米技术首席教授,能源与催化材料中心(Centre for Materials in Energy and Catalysis)主任,主要从事新能源技术纳米材料领域的研究,包括电池、电催化、光催化等。作为通讯联系人,在 Nature、Nature Energy、Nature Nanotechnology、Nature Synthesis、Nature Communications、Journal of American Chemical Society、Angewandte Chemie-International Edition、Advanced Materials 等国际顶级期刊发表学术论文600余篇,引用132410次,h指数为185。

乔世璋教授已获得多项重要奖励与荣誉,包括2021年南澳年度科学家奖、 2017年澳大利亚研究理事会桂冠学者(ARC Australian Laureate Fellow)、2016年埃克森美孚奖、2013年美国化学学会能源与燃料部新兴研究者奖以及澳大利亚研究理事会杰出研究者奖(DORA)。乔教授是国际化学工程师学会会士、澳大利亚皇家化学会会士、英国皇家化学会会士等。他是科睿唯安(Clarivate Analytics/ 汤姆森路透(Thomson Reuters)化学、材料科学和环境与生态三个领域的高被引科学家,现任国际刊物英国皇家化学会杂志EES Catalysis的主编,曾任Journal of Materials Chemistry A副主编。


  


研理云服务器

业务介绍

研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。

   ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。

 ● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
 ● 公司服务器应用工程师具有量子化学第一性原理分子动力学等相关学科研究背景。
 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
 ● 可参与招投标。
产品特色
  ● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。
  ● 一体化软件服务:根据需求发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用
  ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
  ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询  
 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。



扫码添加客服微信


1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173119
 
395 次点击