Py学习  »  机器学习算法

天大姜忠义/ 新国大姜建文合作Small:机器学习加速发现水稳定金属有机框架

高分子科学前沿 • 11 月前 • 443 次点击  

金属有机骨架(MOFs)是一种具有高孔隙率的晶体材料,具有良好水稳定性的MOFs在吸附、膜分离等领域具有重要需求。然而,许多MOFs在水中不稳定,水的偶极矩、氢键和亲核性导致MOFs内的多种客体-主体相互作用,进而破坏MOFs结构,这极大限制了它们的实际应用。传统上,改善MOFs水稳定性需要复杂的实验过程。而如今,机器学习(ML)技术的发展,为快速、精准地筛选水稳定MOFs提供了新的可能。ML作为一种变革性技术已被广泛用于指导实验开发新材料。ML模型可以定量化分析材料结构和理化性质之间的构效关系,进而为实验提供理论指导。尽管ML在预测稳定性材料方面具有较强能力,其在MOFs水稳定性高通量预测方面的潜力尚未得到充分挖掘。

最近,天津大学姜忠义课题组与新加坡国立大学姜建文课题组合作,建立了预测MOFs水稳定性的ML模型,并通过实验验证了模型的适用性,有助于快速设计筛选新的水稳定MOFs。该模型基于千余种MOFs水稳定性实验数据和晶体文件,使用物理化学结构描述符,尝试提出了水稳定MOFs的设计原则,从数据库中筛选出新的水稳定MOFs,为实验研究提供了候选材料和理论指导。
图1. 预测MOFs水稳定性研究流程:(a)收集和分类数据,(b)计算描述符,(c)处理数据,(d)训练模型,(e)预测水稳定性。
图2. 数据库信息:(a)数据库中1133种MOFs金属种类和代表性金属团簇在元素周期表中分布。元素周期表柱状图列高与MOFs数量成正比。深蓝色、浅蓝色和橙色分别代表硬酸、中性酸和软酸金属。(b)基于软硬酸碱理论的统计数据。外圈为代表金属类型,内圈代表每类金属的水稳定性类别。(c)基于金属种类的MOFs水稳定性统计。
图3. (a)与水稳定性相关性最高的10个结构片段与水稳定性的Pearson、Spearman和Kendall相关系数矩阵。(b)水稳定性与不同金属种类、配体氢键、极性表面积和Balaban’s J的相关性。
图4. 训练ML模型:(a)数据分类。(b)单次迭代流程。t-SNE图展示了原数据集和SMOTE处理后的数据集。(c)基于原数据集的RF分类模型的ROC和学习曲线。(d)基于SMOTE处理后数据集的RF 分类模型的ROC和学习曲线。学习曲线中的误差线棒表示20 个随机训练/测试的标准差。
图5. 基于ML模型分析构效关系:(a)各类描述符的重要性。(b)基于五次平均,重要性排名前20的描述符。(c)代表性金属描述符和(d)配体描述符的二维部分依赖性关系图。
图6. 实验验证:(a)[Cd21(TCA)14(H2O)9]·21DMF·21H2O 7天稳定性测试,(b)[Eu(pdc)(H2O)4]3·3Cl 3 天稳定性测试。
图7. ML模型的预测结果:(a)基于子数据集和金属种类的Sankey图,预测了129661个水稳定性MOFs。(b)基于子数据集和金属种类的Sankey图,预测了461个兼具水稳定性,热稳定性,和活化稳定性MOFs。(c)水稳定性预测概率t-SNE图。标记点代表461个同时具有三种稳定性的MOFs。W和A代表预测的水稳定性和活化稳定性的概率,T代表预测的分解温度。
研究结论:本研究开发了预测水稳定性的ML模型,用于加速发现水稳定MOFs,并通过实验对预测结果进行了验证。本研究构建了包含1133种MOFs水稳定性实验信息的数据库,基于全局和构筑单元描述符训练了机器学习模型,该模型具有高准确性和可转移性。其次,通过实验合成了两种MOFs并测试了它们的水稳定性,验证了ML模型的预测结果。最后,ML模型从包含280,000余种候选材料的ARC-MOF数据库中筛选出了约130,000(47%)种水稳定MOFs。通过多种稳定性分析,461(0.16%)种MOFs被预测为兼具水稳定性,热稳定性,和活化稳定性。本研究开发的ML模型方法作为高效准确的筛选工具,对于水稳定MOFs的研究具有重要意义,对于新范式材料开发具有参考价值。
通讯作者:
 
姜忠义 天津大学讲席教授/博导
教育部长江学者,国家杰出青年基金获得者,“万人计划”领军人才,中国化工学会会士,中国化学会会士,英国皇家化学会会士。Advanced Membranes等期刊副主编,Journal of Membrane Science等期刊编委。长期从事仿生与生物启发膜和膜过程、酶催化、光催化研究。发表SCI论文700余篇,SCI他引4万余次,H因子108。入选科睿唯安全球高被引科学家榜单、中国高被引学者(化学工程)榜单等榜单。主持国家重点研发计划项目等国家级科研项目和企业委托项目等项目多项。
通讯邮箱:zhyjiang@tju.edu.cn
课题组网站:http://jiang-lab.com/,
公众号:高端膜材料和膜过程团队。
姜建文 新加坡国立大学教授/博导
新加坡国立大学化学与生物分子工程系教授。研究方向主要包括纳米多孔材料中的吸附和扩散,膜分离的分子模拟和机器学习,以及二氧化碳转化相关的理论计算研究。在Chem. Soc. Rev.,Nat. Commun,Energy Environ. Sci.,JACS等期刊发表SCI论文270多篇,SCI引用18000余次(H-index = 80)。任AIChE Journal等期刊编委。
通讯邮箱:chejj@nus.edu.sg

--检测服务--

来源:高分子科学前沿
声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173483
 
443 次点击