Python社区  »  机器学习算法

【计算】机器学习指导掺杂元素的筛选

X-MOL资讯 • 6 天前 • 11 次点击  


金属氧化物半导体是一种重要的光催化分解水材料,而掺杂工程是改进半导体金属氧化物性能的一种重要方式。在过去的众多探索过程中,掺杂元素的选择都是通过试错的方法进行的。这个过程中虽然也有些经验性的规律被发现(比如基于钙钛矿结构的体系中采用的Goldschmidt容纳因子),但是仍然是一个相对缓慢而无目的的探索过程。掺杂过程主要是通过利用杂原子的一些本征特性,改变主体材料的光电性质,比如光生电荷在半导体内的分离和迁移能力(CST)。对于不同元素的本征性质,比如价态、原子或离子大小、成键能力等等,可以很容易的从现有的物理化学手册中获得,那么有没有一种方法可以让我们从这么众多的本征性质中找出影响掺杂效果的关键的因素呢?

目前快速发展的机器学习给我们提供了一种有利工具。作为数据科学中的一个重要部分,机器学习通过利用合适的回归模型,可以构建出具有准确预测能力的模型,进一步通过对模型的理解可以分析影响模型输出的关键因素。

本研究中作者Fe2O3光电极为研究对象,考察掺杂对于CST和最终水氧化过程的影响。利用17种不同浓度的金属离子掺杂,构建用于训练机器学习模型的数据库(图1a和b)。作为结构数据库,他们从物理化学手册中筛选了10种元素的基本参数。利用不同模型对元素的基本参数与响应的CST和水氧化行为进行回归,可以发现随机森林(RF)模型具有最小的预测偏差。基于此模型,作者进一步预测了La和Y的掺杂行为对CST和水氧化能力的影响。就预测与实验的吻合程度而言,结果表明RF模型对CST的描述比对水氧化的描述要更优异,这可能是由于结构数据库没有将影响水氧化的结构因素充分地包含进来。

图1. 机器学习数据库的建立与模型筛选。

为了进一步理解改预测模型,并指出影响掺杂效果的关键因素,作者需要对RF模型进行进一步的理解。首先利用SHAP值,可以对影响RF模型的重要性程度进行评估,如图2所示。在SHAP值自上而下的排列中,越靠上,说明对模型的预测结果(CST能力)影响越大。由此,他们可以得到影响掺杂效果的几个关键参数。然而不同参数之间可能具有内在联系,而不是相互独立的(比如原子序数越高、原子半径越大)。通过对不同参数的关联性矩阵的计算,最终他们认为掺杂元素的价态、掺杂金属与氧的键能以及掺杂元素的离子半径三者是影响金属氧化物半导体CST的至关重要的三个因素。文章中,作者对这三个因素的影响做了半定量的讨论。

图2. 对影响机器学习模型的因素的分析。

掺杂元素的价态、掺杂金属与氧的键能以及掺杂元素的离子半径对金属氧化物的CST的影响也进一步在CuO光阴极体系中被验证。

该成果发表在Advance Materials 上的特别期刊Rising Stars系列,该系列旨在邀请全球有潜力青年研究学者展示其创新性成果,文章第一作者为Zhiliang Wang博士,通讯作者为麻省理工学院和美国丰田研究中心的Shijing Sun和昆士兰大学王连洲教授。昆士兰大学王连洲教授课题组常年招收光催化、太阳能电池、可充电电池等方向的博士生,包括昆士兰大学奖学金获得者、政府奖学金获得者。欢迎感兴趣的小伙伴加盟。

原文(扫描或长按二维码,识别后直达原文页面):

Machine Learning Guided Dopant Selection for Metal Oxide based Photoelectrochemical Water Splitting: The Case Study of Fe2O3 and CuO

Zhiliang Wang, Yuang Gu, Lingxia Zheng, Jingwei Hou, Huajun Zheng, Shijing Sun, Lianzhou Wang

Adv. Mater., 2022, DOI: 10.1002/adma.202106776




点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/125803
 
11 次点击  
分享到微博