Py学习  »  机器学习算法

华东师范大学潘丽坤教授团队EST|机器学习(ML)加速共价有机框架(COFs)在环境与能源应用中的发现

生态环境科学 • 3 月前 • 113 次点击  

文章信息

第一作者:王昊

通讯作者:玄晓阳,王锴,潘丽坤

通讯单位:华东师范大学

https://doi.org/10.1021/acs.est.5c00390

亮点

• 系统总结MLCOFs材料筛选、结构设计、性能预测等方面的应用,涵盖CO₂捕集、CH₄储存、气体分离和催化等多个方向。

• 展示多种经典与前沿ML算法在不同任务中的表现。

• 深入讨论当前面临的挑战,如数据稀缺、特征工程复杂、模型可解释性差等,并针对每一问题提出改进方向,为后续研究提供了明确指引。

研究背景

作为一种通过预设计有机配体间的共价键连接而形成的新型多孔晶体材料,COFs自2005年Yaghi等人首次合成以来便引起了广泛关注。COFs具有高比表面积、可调节的结构功能空间和孔径,使其在吸附与分离、催化、传感和能源储存等多个领域中展现出广阔应用前景。随着现代工业对高性能材料需求的不断上升,实现对材料结构与性能的精确控制已成为亟待解决的问题。传统的材料研究方法主要依赖人工实验,通过“假设-验证”的迭代过程逐步接近目标材料。然而,这种方法不仅耗时费力,效率也较低。尤其是在COFs研究中,配体种类繁多且组合多样,单靠大量重复实验来筛选理想配体及其组合在实践中是不现实的。

近年来,随着计算机科学与数据科学的迅速发展,基于分子模拟的高通量筛选方法逐渐成为新材料探索的有力工具。COFs具有结构组成规律性强、结构单元类型丰富的特点,使得通过高通量计算方法可程序化地生成大量潜在结构。然而,随着COFs数量的迅速增长,即使是高通量分子模拟方法也逐渐难以应对,计算资源与时间成本成为限制其应用的瓶颈。在此背景下,ML作为一种无需明确编程即可让计算机自主学习的人工智能方法,正迅速崛起,并在材料研究中受到广泛关注。ML不仅擅长处理大规模数据集,还能有效建立材料的物理化学特性与性能之间的关联关系,从而构建出可靠的预测模型,实现对材料性能的快速、高效、精准预测。更重要的是,ML能够深入挖掘材料之间隐藏的模式与趋势,揭示其潜在的结构-性能关系,从而突破传统试错路径,加快新材料的设计进程,同时节省时间和成本。

除了从现有数据库中筛选具有特定功能的材料外,那些尚未在实验中制备、但被预测具有优异性能的材料结构,也可以通过高通量计算与ML等数据分析技术相结合加以预测。这种被称为“材料基因组学方法”的研究范式,已成为材料科学中的新兴方向。研究人员可借此在实验前自动且快速地生成并筛选潜在材料结构,有效克服传统实验与高通量计算耗时过长的局限。近年来,ML已广泛应用于多个材料领域,例如碳材料、金属有机框架、锂离子电池材料以及催化材料,并凭借其优势在COFs研究中表现出越来越显著的作用。大量的数据、方法与模型不断涌现,解决了许多传统方法和人类分析难以处理的复杂问题。因此,系统梳理ML在COFs研究中的最新进展显得尤为必要,但目前仍较为缺乏。这综述不仅可以整合已有研究成果,还能为未来研究指明方向,助力COF材料在机器学习辅助下持续取得突破与创新。

本研究总结了ML在COFs筛选、设计、优化与性能预测中的作用,这些工作基于传统实验与高通量计算筛选方法开展。同时,文章重点强调了ML与COFs在CO₂捕集、CH₄储存、气体分离及催化等领域的典型应用。此外,文章还指出了当前ML在COFs研究中面临的主要挑战,并对未来的发展方向进行了展望。

图文导读

摘要图

图1 ML在环境和能源应用中的工作流程

图2 (a)筛选最佳碳捕获表现COF的工作流程。五个不同目标的不同子集的ML预测散点图:(b)293 K和10 bar下CO₂的吸附,(c)293 K及0.1 bar下CO₂中的解吸,(d)293 K与10 bar下N₂中的吸附,以及(e)CO₂工作容量和(f)理想CO₂/N₂选择性。

图3 比较(a和b)CatBoost和(c和d)XGBoost模型的预测结果。(e)使用SHAP方法进行特征重要分析。(f)IL负载比、SHAP和TSN值之间的相关性。

小结

随着大数据时代的到来,ML的潜力愈发受到重视,这为COFs的发展提供了更多可能性。本综述总结了ML辅助COFs研究在多个领域的应用,包括CO₂捕集、CH₄储存、气体分离和催化等。目前,ML已成为探索COFs领域的重要工具。结合分子模拟和密度泛函理论等方法,ML不仅能够揭示传统技术难以察觉的结构-性能关联,还在COFs研究领域中发挥了深远影响。目前,ML在COFs研究中的应用仍处于快速增长阶段,展现出巨大潜力,但仍存在一些挑战:1)数据集的稀缺性与质量问题;2)特征工程的复杂性;3)高昂的计算成本;4)多目标优化的挑战;5)模型可解释性有限;6)实验验证的困难。

总体而言,ML在COFs领域的发展前景极为广阔。COFs凭借其精确的结构可控性和多样化的应用潜力,为ML算法提供了丰富的探索空间。因此本文梳理了ML在不同应用方向上指导COFs设计的实例,旨在为后续研究提供借鉴与启发。随着ML方法的不断演进,其与COFs研究的深度融合,将为材料设计与工程创新注入新的活力,助力探索更多前沿领域与应用可能。

作者介绍


王昊,华东师范大学物理与电子科学学院博士研究生,导师为潘丽坤教授,主要研究方向为机器学习和深度学习在新能源材料和器件设计中的应用。以第一作者身份在Environ. Sci. Technol.Coord. Chem. Rev.Chem. Eng. J.SmallMater. Horiz.等期刊上发表SCI论文8篇,其中ESI高被引论文2篇。曾获博士研究生国家奖学金,华东师范大学优秀学生等荣誉。

 

潘丽坤,华东师范大学物理与电子科学学院、上海市磁共振重点实验室教授、博导。科睿唯安全球高被引科学家,爱思唯尔中国高被引学者,斯坦福大学全球前2%顶尖科学家。1997、2001和2004年分别毕业于复旦大学(学士)、中科院声学研究所(硕士)、新加坡南洋理工大学(博士)。目前研究方向为新能源材料及应用、人工智能机器学习。已发表SCI论文400余篇,其中第一/通讯作者SCI论文300余篇,被引用34000多次,H指数108。授权中国发明专利30余项。主编3本英文著作。目前担任Journal of Colloid and Interface Science等期刊的编委。

投稿、转载、合作可在后台留言(备注:微信号)或发邮件至sthjkx1@163.com

【点击下方超链接阅读16个栏目推文】 
1.【直播】
9.【院士】
2.【视频
10. 【综述】
3.【健康&毒理】
11.【写作】
4.【
12.【Nature】
5.【 13.【Science】
6.【14.【WR】
7.【固废
15.【EST】
8.【生态】
16.【JHM】

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180787
 
113 次点击