在大型数据集中,机器学习技术已经成为识别复杂模式和相关性的有用工具,例如,将催化剂性能与其物理化学性质相关联。在多相催化领域,机器学习模型大多是使用高通量量子化学计算开发的,只有少数案例研究,提升了实验验证的催化剂。这种有限实践,是因为在计算研究过程中,利用简化的催化剂结构和缺少全面的实验数据集。
近日,西班牙加泰罗尼亚能源研究所联合加拿大多伦多大学等,在Nature Reviews Chemistry上发表综述文章,将整合高通量方法和机器学习的研究汇集在一起,以促进固体多相催化的发展,同时利用实验和计算数据。
基于模型输入和输出的描述符,系统地分析了多相催化领域的趋势。所研究的材料、装置或反应;数据集大小等。还报告无量纲R2值的模型,比较了基于上述模型的性能。
Developing machine learning for heterogeneous catalysis with experimental and computational data.图1:在多相催化中,机器学习方法的应用概述。
图2:在多相催化的机器学习研究中,研究发现的实验和计算数据集等文献计量分析。
图3:基于拟合优度R2的机器学习模型比较。
该项综述,系统分析了机器学习(ML)在异相催化领域的突破性应用。整合了71项计算数据和51项实验数据的研究,发现ML模型通过融合高通量计算模拟(如密度泛函理论)与自动化实验(如组合化学筛选),显著加速了催化剂设计。例如,在电解水反应中,主动学习策略将催化剂筛选效率提升20倍;Ru-Cr-Ti氧化物等新型材料通过ML预测被成功合成并验证。尽管ML在预测吸附能、反应速率等方面展现出高精度(部分模型R²>0.9),但数据稀缺和可重复性仍是挑战。未来,人机协作与标准化数据库将推动催化科学迈向智能化时代。
所用材料:
计算数据:基于DFT的吸附能、活化能数据集(如Open Catalyst、Materials Project数据库)。
实验数据:高通量实验平台(如并行反应器-质谱联用系统)生成的12,708个甲烷氧化耦合数据点。
实验过程:
ML模型(如贝叶斯优化、图神经网络)预测候选材料。
自动化合成系统(如喷墨打印、物理气相沉积)制备材料。
机器人平台表征性能(如光电流、荧光指示剂监测活性)。
高通量筛选:采用扫描微滴池(Scanning Droplet Cell)在组合材料库(如5,456种(Fe-Co-Ni-Ti)Oₓ样品)中快速测试电催化活性。
主动学习循环:
验证流程:最优材料(如Ru₀.₆Cr₀.₂Ti₀.₂O₂)经DFT模拟与实验测试双重验证。
该研究奠定了机器学习ML在催化材料设计中的核心地位,通过融合多源数据与智能算法,为清洁能源(如水分解)、碳捕集等关键反应的催化剂开发开辟了新范式。
文献链接
Bozal-Ginesta, C., Pablo-García, S., Choi, C. et al. Developing machine learning for heterogeneous catalysis with experimental and computational data. Nat Rev Chem (2025). https://doi.org/10.1038/s41570-025-00740-4声明:仅代表译者观点,如有不科学之处,请在下方留言指正!