社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

美国路易斯安那州立大学李国强AISY:一言穷理——基于机器学习的高分子材料研发框架

AdvancedScienceNews • 2 年前 • 190 次点击  

创新点:美国南方大学严成和路易斯安那州立大学李国强在系统总结前人的基础上,提出了一套基于机器学习的高分子材料研发框架,主要包括数据搜集,分子指纹建立,机器学习框架建立及其如何挖掘新材料产生四个步骤。研究者们希望这套框架能够成为软材料开发领域一个切实可行的有效工具。

关键词:高分子,材料开发,机器学习,路易斯安那州立大学,南方大学

从IBM“深蓝”的横空出世,到谷歌阿尔法狗的一鸣惊人,再到最近ChatGPT一石激起千层浪,机器学习正在以惊人的速度引领另一次工业革命。在软材料开发领域,机器学习也以极快的速度占据了一席之地。众所周知,传统的高分子材料开发进展缓慢,一般都需要耗费由数个材料专家组成的团队历经数月甚至数年才能完成。而基于第一准则的材料优化设计计算同样是耗时不菲。例如,使用8-32核的CPU对一个典型的生物分子(一般由105-106个原子组成)进行纳秒级分子动力学模拟,研究者大概需要数周才能完成;对于基于密度泛函理论的电子结构计算,研究者需要在半经验方法中确定出一套有意义并且和物理联系紧密的参数集,这一过程大概需要数周至数年才能完成。另一方面,由于机器学习是基于拟合的数值优化技术,它巧妙地避开了第一性准则的巨大计算消耗,因而这一过程可望缩短数倍到数十倍。另一方面,由于计算机近20年来在并行计算方面取得了巨大进步,研究者们近年来开始把机器学习用于高分子材料开发,并且取得了一些显著的成效。

然而,由于基于机器学习的高分子开发涉及材料学,计算机,统计学三个领域的知识,初学者无论来自于哪个领域,初始阶段均会感觉似乎无从入手。更有甚者,即使是进入这个领域的研究者,也会由于局部知识的缺失感觉到难以深入。针对这些困难,美国南方大学严成和路易斯安那州立大学李国强合作,系统总结了近年来发表的论文,提出一套基于机器学习的高分子材料研发框架。

简而言之,这套框架主要包括正向预测与逆向挖掘两个方面。其中,正向预测包括数据搜集,分子指纹建立,正向机器学习模型建立三个方面 (1→2→3)。数据搜集一般从以往文献或者现有的数据库中寻找,而分子指纹建立这个过程可能对一般人来说并不熟悉。简单地说,分子指纹建立即把三维的分子结构转化为数字的排列。目前比较常见的过程包括线性符号编码,摩根编码,复合张量编码,分子图形编码,定量结构性质关系描述符等等。在正向机器学习模型机器学习中,研究者们一般选择合适的机器学习模型进行训练。当前比较流行的机器学习模型如人工神经网络,卷积网络,图形卷积,贝叶斯模型,决策树等等都能够在适当的场合运用于高分子属性预测。我们称这一模型为模型1。逆向挖掘也包含有两个子过程。第一个子过程为虚拟分子产生过程(4→5→6)。这一过程中研究者们会采用另外一些更为复杂的机器学习模型,它们包括变分自编码器,生成对抗网络,遗传算法,粒子群算法,蒙特卡洛机制等等。我们称这一模型为模型2。模型2将会产生一些全新甚至从未出现的分子结构。第二个子过程为虚拟筛选过程 (6→3→7→8→9)。在这一过程中,模型2产生的新分子结构将被输入到模型1中进行虚拟筛选。一般筛选的结果仍需专家的进一步筛选,最后我们便可以发现目标分子。通过这些步骤,研究者们可以节省海量的时间,目前已经有一些新材料面世,如新的形状记忆高分子材料。此外在此文中,作者系统地介绍了各种相关的机器模型,列出了相关的数学公式,希望读者对这些模型进行综合全面地理解。而后作者比较了各种模型的优缺点,使得读者能够针对自己的材料进行有的放矢的模型选择。

研究者希望此框架将会为成为软材料开发方面的一件利器,为即将踏入这一领域的研究者们提供一个总体的认识,也为深耕在这一领域的研究者们提供一些可能的新思路。本文第一作者为美国南方大学严成助理教授,通讯作者为路易斯安州立大学李国强教授。此综述发表在Advanced Intelligent System上。


WILEY


论文信息:

The Rise of Machine Learning in Polymer Discovery

Cheng Yan, Guoqiang Li*

Advanced Intelligent System

DOI: 10.1002/aisy.202200243

点击左下角 “ 阅读原文 ” ,查看该论文原文。


Advanced

Intelligent

Systems

期刊简介

Wiley旗下智能系统领域开放获取旗舰刊。期刊收录关于具有刺激或指令响应智能的人造装置系统的研究,包括机器人、自动化、人工智能、机器学习、人机交互、智能传感和程序化自组装等前沿应用





AdvancedScienceNews

Wiley旗下科研资讯官方微信平台

长按二维码 关注我们

分享前沿资讯|聚焦科研动态

发表科研新闻或申请信息分享,请联系:ASNChina@Wiley.com


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/152414
 
190 次点击