Py学习  »  机器学习算法

【材料】ACS AMI | 聚合物基元分子指纹(PUFp):用于机器学习研究聚合物有机半导体的可解释表达

X-MOL资讯 • 12 月前 • 118 次点击  

英文原题:Polymer-Unit Fingerprint (PUFp): An Accessible Expression of Polymer Organic Semiconductors for Machine Learning


通讯作者:叶财超、张文清,南方科技大学前沿与交叉科学研究院&材料科学与工程系

作者:张新越,魏根旺,盛晔,白文俊,杨炯,张文清,叶财超


背景介绍


近年来,随着机器学习在材料科学的广泛应用,各种描述符作为输入的机器学习算法已经可以很好的预测材料的物理化学性质。对于模型的解释性问题上,由于有机材料的多样性和复杂性,现在还没有一个便捷的机器学习表示方法可以应用于有机材料性能机理的分析和解释。同时,在寻找高性能有机材料,建立定量构效关系的过程中,对有机分子结构中起关键作用的亚结构识别是非常重要的一个步骤:能够更好的帮助人们了解结构性能之间的关系。


有机材料,尤其是聚合物,是由一系列聚合基元(polymer-units)通过化学反应聚合而成。尽管有机材料千变万化,但是将它们拆分成聚合单元,总是能发现共同点!就好像用26个字母组成能够组成数千个单词一样!因此,将聚合基元作为有机材料的亚结构是一种很好的选择。


SMILES码作为一种线性分子表示方法,在常被用于表示有机分子结构。SMILES存储化学分子结构有一套固定的规则。利用这些规则,设计识别程序,就可以识别出有机分子材料数据中的共有的聚合基元!利用聚合基元作为机器学习模型的输入单元,也可以起到了提高模型解析性的作用。


图1. TOC 利用SMILES码规则识别有机分子中的聚合基元


文章亮点


近日,南方科技大学前沿与交叉科学研究院&材料科学与工程系的叶财超副研究员、张文清教授等人在ACS Applied Materials & Interfaces上发表了“聚合物基元分子指纹(PUFp):用于机器学习研究聚合物有机半导体的可解释表达”的研究论文。


文章提出了“聚合物基元(polymer-unit)”这一概念。作者编写的PURS (Python-based polymer-unit-recognition script) 程序可以按照设定的规则自动的识别出SMILES码中的聚合基元并生成相应的聚合物基元分子指纹PUFp (polymer-unit fingerprint)。


作者结合Sklearn平台的机器学习与SHAP分析,可以分析出了代表性聚合基元对目标性质的促进或抑制作用。并且,利用从数据中识别出的聚合物基元,可以重组生成新的有机聚合物。而通过将统计分析与机器学习相结合,还可以分析有机聚合物单体的聚合单元组合偏好。


图2. PUFp工作流及其在高迁移率OSC材料开发中的应用。(a) 收集OSC数据库;(b)聚合物基元识别;(c) 聚合基元库;(d) 生成PUFp;(e) 机器学习模型训练;(f) 定量构效分析。


总结/展望


为了更好地利用有机聚合物或大分子中的亚结构来探索定量的构效关系,研究团队提出了“聚合物基元”这一概念。并设计了聚合物基元分子指纹PUFp生成及应用框架,它由四个模块组成:聚合基元识别、性质预测、关键聚合基元分析、以及新材料设计。连接这四个模块的核心是聚合物基元库,其中存储着从数据中识别出的所有聚合基元。


相关论文发表在ACS Applied Materials & Interfaces上,南方科技大学材料科学与工程系博士生张新越为文章的第一作者,南方科技大学前沿与交叉科学研究院&材料科学与工程系的叶财超副研究员、张文清教授为通讯作者。


通讯作者信息

叶财超,南方科技大学前沿与交叉科学研究院,副研究员

南方科技大学前沿与交叉科学研究院副研究员,硕士研究生导师。主要从事计算材料学/化学、机器学习(化学反应、材料设计等)研究,集中于有机半导体功能材料、新型电催化/光催化材料、新型二维材料、含能材料等性质、反应性能及催化机理研究。在Adv. Mater.、Adv. Func. Mater.、Nano Energy、J. Mater. Chem. A、Energy Storage Mater.、ACS Appl. Mater. Interfaces等学术期刊发表论文50余篇,获得“孔雀计划深圳市海外高层次人才(2016)”、“深圳市高层次专业人才(2021)”及“江苏省优秀博士论文奖(2016)”等。


张文清,南方科技大学材料科学与工程系,教授

张文清教授,博士研究生导师。国家杰出青年科学基金、国家自然科学二等奖获得者,美国物理学会(APS) Fellow,国家重点研发计划首席科学家等。研究内容涉及高性能热电材料设计与实现、电-热输运及电子-声子输运物理、高性能热电材料设计、低维异质结构物性研究、深度学习等;研究方法包括第一原理计算、分子动力学、高通量计算等。发表Nature Mater.、PNAS、Phys. Rev. Lett.、JACS等SCI论文270余篇,国际会议邀请报告80余次。


课题组网站:

https://faculty.sustech.edu.cn/zhangwq 


课题组招聘

本实验室招聘计算材料学、计算物理、计算化学领域相关的博士后、博士生、硕士生,欢迎有相关计算背景的同学报名咨询。


张文清教授课题组招聘热电材料设计、电热输运及电子-声子输运和计算材料方向博士后和研究序列教授


扫描二维码阅读英文原文

ACS Applied Materials & Interfaces. 2023, ASAP

Publication Date: April 21, 2023

https://doi.org/10.1021/acsami.3c03298 

Copyright © 2023 American Chemical Society

ACS Applied Materials & Interfaces serves the interdisciplinary community of chemists, engineers, physicists and biologists focusing on how newly-discovered materials and interfacial processes can be developed and used for specific applications. The editors are proud of the rapid growth of the journal since its inception in 2009, both in terms of the number of published articles and the impact of the research reported in those articles. ACS AMI is also truly international, with the majority of published articles now coming from outside the United States, capturing the rapid growth in applied research around the globe.


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/154361
 
118 次点击