Py学习  »  机器学习算法

北化阳庆元/西交利物浦丁理峰Adv. Sci.:机器学习与遗传算法相融合,金属-有机框架分离材料逆向设计!

纳米人 • 2 周前 • 52 次点击  

研究背景

金属-有机框架(Metal–Organic Frameworks,MOFs)因其超高比表面积、可调控的孔道结构以及丰富的化学多样性,在气体吸附与分离等众多领域展现出巨大应用潜力。随着MOF研究的不断深入,目前已报道的实验结构数量超过十万种。在为特定应用寻找候选材料时,传统的实验合成与测试成本高昂、周期漫长,在面对海量候选结构时,难以实现全面探索。随着人工智能技术的快速发展,机器学习已成为推动材料科学领域变革的重要工具。通过对结构与化学描述符的深度挖掘和模式识别,机器学习模型能够在大规模MOF数据库中快速、准确地预测材料性能,从而实现高效、可扩展的筛选与优化流程。然而,现有研究大多仍局限于对已知结构数据库的挖掘和利用,难以覆盖更广阔的化学设计空间,尤其是那些尚未被探索的潜在高性能材料区域。为了突破这一瓶颈、有效探索包括“潜在未被发现结构”在内的更广阔设计空间,亟需从现有数据中深入挖掘结构–性能关系,并引入能够“从目标性能出发反推结构”的逆向设计策略。这一新兴的设计范式标志着MOF材料研究从传统的“试错式筛选”向“性能驱动的理性设计”的根本性转变,为下一代高性能MOF材料的高效发现提供了一条可控、精准且具有前瞻性的全新途径。

 

文章概述

近日,北京化工大学阳庆元教授科研团队提出了一种融合机器学习与遗传算法的新型材料逆向设计策略,用于高效筛选和精准设计面向CH4/N2分离的新型MOFs。通过与西交利物浦大学丁理峰教授合作,本工作构建了高精度机器学习模型,对MOF的拓扑结构、金属/有机次级构筑单元以及官能团等关键结构特征进行数据驱动的性能预测,并将模型嵌入切线自适应遗传算法(TAGA)框架中作为“适应度评估器”,以此指导遗传算法中的选择、交叉与变异等进化过程,从而在庞大的化学设计空间中高效搜索最优结构。

 

研究团队通过对进化种群的统计分析,揭示了影响CH4/N2分离性能的关键结构因素,并发现具有fsc拓扑以及芘、蒽、萘等芳香配体的MOFs在分离选择性方面表现尤为突出。基于这些高性能“基因型”信息,研究者进一步设计并构建了一系列新型MOF材料,其中性能最佳的材料实现了IAST选择性高达15.92、甲烷吸附量达2.47 mmol g-1的优异表现。该研究为下一代高性能气体分离材料的智能化设计提供了新的技术路径,也为未来在碳捕集、天然气净化和能源转化等领域的应用奠定了重要基础。

 

图文导读

图 1 将机器学习与切线自适应遗传算法相结合用于高CH4/N2选择性MOF材料逆向设计的整体流程示意图。


图2 CH4/N2选择性预测性能与特征贡献分析。a. XGBoost模型预测值与模拟值的散点对比图,同时展示了训练集(蓝色)与测试集(红色)的数据分布。b. 基于Mean(|SHAP|) 值的特征重要性排序,揭示各结构特征对CH4/N2选择性预测的贡献程度。


图 3 TAGA优化过程中MOF基因的进化趋势:a. 金属节点;b. 配体1;c. 官能团1;d. 配体2;e. 官能团2。f. 双环饼状图展示TAGA生成子代中的基因组合特征:外环为配体1与配体2的组合分布,内环为出现频率最高的前五种官能团基因。


图4 最优MOF的结构与选择性贡献分析。a. 最 MOF的拓扑结构及其构筑单元示意图。b. 基于XGBoost模型的CH4/N2选择性SHAP瀑布图,揭示关键特征对预测结果的贡献方向与幅度。c. 最优MOF晶体结构的正视图。d. 最优MOF晶体结构的侧视图。


图5 最优MOF的吸附行为与分离性能。a. CH4在最优MOF中的质心(COM)概率密度二维等高线分布图。b. N2的COM概率密度分布。c. 在0–1 bar、298 K、CH4/N2(5:5,v/v)条件下的GCMC模拟选择性结果。d. 最优MOF与已报道材料的IAST选择性及CH4吸附量对比。

 

结论

本研究通过对高精度机器学习预测模型和自适应遗传算法的深度耦合,实现了从目标性能出发的逆向结构设计,突破了传统“试错式”筛选的局限。结果表明,具有fsc拓扑及芳香配体(如芘、蒽、萘)的MOF在CH4/N2分离中表现出卓越的选择性和吸附能力,性能最优结构的IAST选择性高达15.92,CH4吸附量达到2.47 mmol g-1。该工作不仅展示了人工智能在多孔材料设计中的强大潜力,也为未来碳捕集、天然气净化与能源转化等领域的材料创新提供了可扩展、可推广的技术范式。

 

期刊简介

Advanced Science 是Wiley旗下创刊于2014年的优质开源期刊,发表材料科学、物理化学、生物医药、工程等各领域的创新成果与前沿进展。期刊为致力于最大程度地向公众传播科研成果,所有文章均可免费获取。被Medline收录,PubMed可查。最新影响因子为17.521,中科院2021年SCI期刊分区材料科学大类Q1区、工程技术大类Q1区。

 

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/191445