Py学习  »  机器学习算法

华东师范大学潘丽坤团队ES&T:机器学习加速共价有机框架在环境与能源应用中的发现

环境人Environmentor • 6 月前 • 242 次点击  

文章信息

第一作者:王昊

通讯作者:玄晓阳,王锴,潘丽坤

通讯单位:华东师范大学

https://doi.org/10.1021/acs.est.5c00390

亮点

• 系统总结MLCOFs材料筛选、结构设计、性能预测等方面的应用,涵盖CO₂捕集、CH₄储存、气体分离和催化等多个方向。

• 展示多种经典与前沿ML算法在不同任务中的表现。

• 深入讨论当前面临的挑战,如数据稀缺、特征工程复杂、模型可解释性差等,并针对每一问题提出改进方向,为后续研究提供了明确指引。

研究背景

作为一种通过预设计有机配体间的共价键连接而形成的新型多孔晶体材料,COFs自2005年Yaghi等人首次合成以来便引起了广泛关注。COFs具有高比表面积、可调节的结构功能空间和孔径,使其在吸附与分离、催化、传感和能源储存等多个领域中展现出广阔应用前景。随着现代工业对高性能材料需求的不断上升,实现对材料结构与性能的精确控制已成为亟待解决的问题。传统的材料研究方法主要依赖人工实验,通过“假设-验证”的迭代过程逐步接近目标材料。然而,这种方法不仅耗时费力,效率也较低。尤其是在COFs研究中,配体种类繁多且组合多样,单靠大量重复实验来筛选理想配体及其组合在实践中是不现实的。

近年来,随着计算机科学与数据科学的迅速发展,基于分子模拟的高通量筛选方法逐渐成为新材料探索的有力工具。COFs具有结构组成规律性强、结构单元类型丰富的特点,使得通过高通量计算方法可程序化地生成大量潜在结构。然而,随着COFs数量的迅速增长,即使是高通量分子模拟方法也逐渐难以应对,计算资源与时间成本成为限制其应用的瓶颈。在此背景下,ML作为一种无需明确编程即可让计算机自主学习的人工智能方法,正迅速崛起,并在材料研究中受到广泛关注。ML不仅擅长处理大规模数据集,还能有效建立材料的物理化学特性与性能之间的关联关系,从而构建出可靠的预测模型,实现对材料性能的快速、高效、精准预测。更重要的是,ML能够深入挖掘材料之间隐藏的模式与趋势,揭示其潜在的结构-性能关系,从而突破传统试错路径,加快新材料的设计进程,同时节省时间和成本。

除了从现有数据库中筛选具有特定功能的材料外,那些尚未在实验中制备、但被预测具有优异性能的材料结构,也可以通过高通量计算与ML等数据分析技术相结合加以预测。这种被称为“材料基因组学方法”的研究范式,已成为材料科学中的新兴方向。研究人员可借此在实验前自动且快速地生成并筛选潜在材料结构,有效克服传统实验与高通量计算耗时过长的局限。近年来,ML已广泛应用于多个材料领域,例如碳材料、金属有机框架、锂离子电池材料以及催化材料,并凭借其优势在COFs研究中表现出越来越显著的作用。大量的数据、方法与模型不断涌现,解决了许多传统方法和人类分析难以处理的复杂问题。因此,系统梳理ML在COFs研究中的最新进展显得尤为必要,但目前仍较为缺乏。这综述不仅可以整合已有研究成果,还能为未来研究指明方向,助力COF材料在机器学习辅助下持续取得突破与创新。

本研究总结了ML在COFs筛选、设计、优化与性能预测中的作用,这些工作基于传统实验与高通量计算筛选方法开展。同时,文章重点强调了ML与COFs在CO₂捕集、CH₄储存、气体分离及催化等领域的典型应用。此外,文章还指出了当前ML在COFs研究中面临的主要挑战,并对未来的发展方向进行了展望。

图文导读

摘要图

图1 ML在环境和能源应用中的工作流程

图2 (a)筛选最佳碳捕获表现COF的工作流程。五个不同目标的不同子集的ML预测散点图:(b)293 K和10 bar下CO₂的吸附,(c)293 K及0.1 bar下CO₂中的解吸,(d)293 K与10 bar下N₂中的吸附,以及(e)CO₂工作容量和(f)理想CO₂/N₂选择性。

图3 比较(a和b)CatBoost和(c和d)XGBoost模型的预测结果。(e)使用SHAP方法进行特征重要分析。(f)IL负载比、SHAP和TSN值之间的相关性。

小结

随着大数据时代的到来,ML的潜力愈发受到重视,这为COFs的发展提供了更多可能性。本综述总结了ML辅助COFs研究在多个领域的应用,包括CO₂捕集、CH₄储存、气体分离和催化等。目前,ML已成为探索COFs领域的重要工具。结合分子模拟和密度泛函理论等方法,ML不仅能够揭示传统技术难以察觉的结构-性能关联,还在COFs研究领域中发挥了深远影响。目前,ML在COFs研究中的应用仍处于快速增长阶段,展现出巨大潜力,但仍存在一些挑战:1)数据集的稀缺性与质量问题;2)特征工程的复杂性;3)高昂的计算成本;4)多目标优化的挑战;5)模型可解释性有限;6)实验验证的困难。

总体而言,ML在COFs领域的发展前景极为广阔。COFs凭借其精确的结构可控性和多样化的应用潜力,为ML算法提供了丰富的探索空间。因此本文梳理了ML在不同应用方向上指导COFs设计的实例,旨在为后续研究提供借鉴与启发。随着ML方法的不断演进,其与COFs研究的深度融合,将为材料设计与工程创新注入新的活力,助力探索更多前沿领域与应用可能。

作者介绍


王昊,华东师范大学物理与电子科学学院博士研究生,导师为潘丽坤教授,主要研究方向为机器学习和深度学习在新能源材料和器件设计中的应用。以第一作者身份在Environ. Sci. Technol.Coord. Chem. Rev.Chem. Eng. J.SmallMater. Horiz.等期刊上发表SCI论文8篇,其中ESI高被引论文2篇。曾获博士研究生国家奖学金,华东师范大学优秀学生等荣誉。

 

潘丽坤,华东师范大学物理与电子科学学院、上海市磁共振重点实验室教授、博导。科睿唯安全球高被引科学家,爱思唯尔中国高被引学者,斯坦福大学全球前2%顶尖科学家。1997、2001和2004年分别毕业于复旦大学(学士)、中科院声学研究所(硕士)、新加坡南洋理工大学(博士)。目前研究方向为新能源材料及应用、人工智能机器学习。已发表SCI论文400余篇,其中第一/通讯作者SCI论文300余篇,被引用34000多次,H指数108。授权中国发明专利30余项。主编3本英文著作。目前担任Journal of Colloid and Interface Science等期刊的编委。


图片

来源生态环境科学。投稿、合作、转载、进群,请添加小编微信Environmentor2020!环境人Environmentor是环境领最大的学术公号,拥有 20W+活跃读者。由于微信修改了推送规则,请大家将环境人Environmentor加为星标,或每次看完后点击页面下端的“在看”,这样可以第一时间收到我们每日的推文!环境人Environmentor现有综合群、期刊投稿群、基金申请群、留学申请群、各研究领域群等共20余个,欢迎大家加小编微信Environmentor2020,我们会尽快拉您进入对应的群

图片

往期推荐

年度热点文章Top10(2024年)
中科大俞汉青院士、陈洁洁教授、华中科大黄明杰Nat. Commun.:精准定制高价金属氧化物的d带中心实现污染物完全聚合去除
香港城市大学袁志国院士、新南威尔士大学郑敏Nature Sustainability综述:污水资源化前沿路径
Nature:全球塑料垃圾中的“潜行者”
中国科学院生态环境研究中心俞文正课题组Nature Water:三价金属混凝去除天然有机物的分子尺度理论
清华大学曲久辉院士团队刘锐平、中国科学技术大学陈洁洁Angew:纳米-生物杂合体界面间电子定向转移实现硝酸盐选择性转化
浙江大学环境纳米技术研究团队Nature Water:晶格工程实现纳米零价铁的高效选择性还原反应
山大刘建、港理工金灵等ES&T封面:联合提出“微塑料组”呼吁以整体视角研究微塑料以捕获其在真实世界中的生态与健康影响
哈工大(深圳)任南琪院士团队陈以頔、阿德莱德大学段晓光ES&T补充封面:聚焦微污染物聚合转化研究
大连理工陈景文团队、哈工大姜杰团队、宾大Joseph S. Francisco教授JACS:全多氟烷基化合物在微液滴表面自发降解
ESE专栏 | 《中国碳中和与清洁空气协同路径年度报告》工作组:2022年中国碳中和与清洁空气协同路径报告——提速重点部门转型
学术招聘
美国范德堡大学环境工程研究生项目招生 (博士硕士)
加州大学河滨分校化学与环境工程系门玉洁课题组招收博士生(或博士后)
香港城市大学能源与环境学院Dr. Sam H. Y. HSU课题组招聘博士
美国圣母大学环境分子与合成生物学实验室拟招收2名全奖博士生
瑞典斯德哥尔摩大学和瑞士Eawag联合招聘全奖博士生(环境方向)
北京大学环境科学与工程学院赵华章教授团队招聘博士
学术资讯
耶鲁大学Julie B. Zimmerman教授出任ES&T主编
贝勒大学Bryan W. Brooks教授出任ES&T Letters主编
韩国科学院院士Wonyong Choi将出任ACS ES&T Engineering创刊主编
CEJ Advances创刊 | 潘丙才教授任主编,四位华人学者任副主编
ACS对话 | ACS ES&T Engineering创刊副主编马军院士
专访:Environmental Science & Ecotechnology 主编团队

图片

图片
图片

扫描二维码,快速入群~

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180826