▲共同第一作者:张鑫,丁斌
共同通讯作者:陈波,杨冠军,Mohammad Khaja Nazeeruddin
通讯单位: 西安交通大学;瑞士洛桑联邦理工学院
论文DOI:10.1002/adfm.202314529 (点击文末「阅读原文」直达链接)
近年来,利用小分子作为钙钛矿太阳能电池(PSCs)的钝化材料已经引起了广泛关注。该工作构建了高精度的机器学习模型,用于筛选出优秀的钝化分子材料。对于有限的数据集,本文提出了一种全新的模型评估方法random-extracted and recoverable cross-validation(RE-RCV),该方法可以更精确地评估模型并减少评估误差。在提取的31个分子特征中,偶极矩、氢键受体数量和HOMO-LUMO gap被确定为能显著影响钝化效果的分子特性,并提供了筛选标准。最后利用模型筛选出了数十种优异的钝化分子,并选择其中三种分子作为进行实验验证,其钝化效果与模型预测结果一致,其中分子钝化后的最佳电池器件效率达到25.41%。钙钛矿太阳能电池近年来取得了长足发展,但钙钛矿内部的缺陷导致非辐射复合,降低了器件的光电转化效率(PCE)。因此,钝化这些缺陷已成为研究的重点,各种材料如小分子、聚合物和离子化合物已被报道用于此目的。然而传统的实验方法来筛选钝化材料则需要大量的时间与实验资源。近年来,机器学习已经成为科学研究中的一个关键工具,为此,作者计划利用机器学习强大的数据处理能力,来筛选有效的钝化分子材料。a、实现了机器学习、第一性原理、实验表征的完美结合。b、提出了一种全新的模型评估方法random-extracted and recoverable cross-validation(RE-RCV),该方法可以减少评估偏差从而精确地获得模型的真实准确率。c、利用构建好的机器学习模型筛选出了数十种优异的钝化材料,并选择其中三种分子进行实验验证,验证结果与模型预测结果一致,证明了该模型的有效性。图1展示了开发机器学习模型的四个关键步骤。首先建立数据库。然后,基于不同的算法构建机器学习模型,并利用数据库进行训练。紧接着对模型进行评估,作者开发出了一种全新的评估方法(RE-RCV)来提高模型评估的精度。最后进行特征分析,定量评估每个分子特性对钝化效果的影响。图1. 机器学习过程包括四个步骤:数据集构建、模型建立、模型评估和特征分析。收集已发表的相关文献,并利用DFT和分子库网站来提取对应的分子特征。计算数据库中分子特征之间的皮尔逊相关系数以剔除冗余的特征参数(图2a)。此外为构建分类模型对数据库进行分类,基于缺陷钝化对PCE的增强(ΔPCE),将数据集分为三类(图2b)。
图2. a)筛选后的14个特征之间的皮尔逊相关系数;b)三个类别(Ⅰ类、Ⅱ类、Ⅲ类)在数据集中的比例。基于不同的算法构建了五种常见的机器学习分类模型进行训练评估(图3a)。由于单一模型容易出现过拟合现象,因此作者将五种模型两两结合来构建复合模型。其中SVM与RF结合的复合模型(S-R模型)具有最佳的准确率(图3b)。此外该工作提出了一种全新的模型评估策略(RE-RCV)来替代常用的K-Fold方法,通过对比发现, RE-RCV方法相比于K-Fold具有更小的评估偏差,能更精确地确定最佳模型(图3c-d)。
图3. 基于RE-RCV方法的a)单一模型和b)复合模型的准确率。c) RE-RCV和K-Fold得到的复合模型的准确率和评估误差。d)基于RE-RCV和K-Fold的复合模型精度离散度对比。e) 复合模型在测试集上的混淆矩阵。f)最新发表论文小分子钝化后模型预测结果与报道结果的对比。为了定量地说明每个分子特征的贡献,利用SHAP对模型进行深度解析。图4a和b展示了模型对于三个类别的分子特征重要性排序以及对于第Ⅲ类别的分子特征重要性排序。其中,DM、HA
、Gap和Initial PCE是所有分子特征的前四大贡献者。为了进一步分析这四种分子特征的贡献情况,图4c - f给出了分子特征值及其对应的SHAP值分布图,基于此作者提出了一个筛选有效钝化材料的通用标准(DM>3.3 HA>3.3、Gap<0.29),可以帮助研究人员快速地筛选出优秀的钝化分子。图4. a)分子特征重要性排序。b)针对Ⅲ类的分子特征的重要性排序。 c) 偶极矩(DM)、d) 氢键受体数量(HA)、e)HOMO-LUMO gap (Gap) f) Initial PCE的特征值与相应的SHAP值之间的关系。该工作利用机器学习模型成功地筛选出了数十种优异的钝化分子,将4-A,4-C和Phen作为分子代表进行实验验证(图5a-c)。将这三种分子引入到钙钛矿薄膜内部进行实验表征,证明了这三种分子均实现了对钙钛矿薄膜的缺陷钝化,并提升了薄膜的光电性能(图d-f)。最后制备出了相应的钙钛矿电池器件,从图5h-i对比发现钝化后的钙钛矿器件的PCE提升效果均超过了2%,与模型的预测效果一致,这证明了利用机器学习模型筛选优异钝化分子来制备高PCE的钙钛矿器件的可行性。
图5. 模型筛选的分子构型和预测概率:a) 4-A, b) 4-C和c) Phen。4-A、4-C和Phen钝化前后钙钛矿膜的d) Pb 4f和e) N1s XPS光谱比较f) FTO衬底上钙钛矿薄膜的稳态PL光谱。g)用于实验验证的钙钛矿结构。h) J-V曲线和i) 4-A、4-C和Phen处理和未处理的钙钛矿电池的PCE统计数据。综上所述,该工作探索了钝化分子的分子特性与钝化效果之间的关系,并利用机器学习模型来筛选优异的钝化分子材料。在研究过程中作者开发了一种全新的模型评估方法(RE-RCV)来减少模型评估过程中的误差。此外确定了三个关键的分子特性-偶极矩,氢键受体数量和HOMO-LUMO gap-是影响钝化效果的关键因素,在此基础上,提供了一个初步的筛选标准。最后,该工作利用机器学习模型筛选出了三个先前未报道的分子(4-A, 4-C和Phen)进行实验验证。与未经处理的电池器件相比,三种分子钝化后的电池器件PCE均超过了2%。以上结果证明了利用机器学习筛选优异钝化分子的有效性,也表明了机器学习在钙钛矿领域的应用潜力,从而加速钙钛矿的商业化进程。陈波,西安交通大学教授,博士毕业于弗吉尼亚理工大学,黄劲松教授课题组博士后和研究助理教授。主要研究方向是钙钛矿太阳能电池和叠层太阳能电池,以一作/通讯作者在Nat. Mater.、Sci. Adv.、Nat. Commun.、Joule、Chem. Soc. Rev.、Adv. Mater.等期刊发表论文30多篇,SCI引用11000余次,H-index 40。杨冠军,西安交通大学教授,博士生导师,国家重点研发计划项目首席科学家,2011年度入选国家级青年人才计划,2017年度入选陕西省中青年科技创新领军人才。主要研究方向是防护涂层、钙钛矿太阳电池和柔性电子。Mohammad Khaja Nazeeruddin,瑞士洛桑联邦理工学院教授,欧洲科学院院士、英国皇家化学会会士。主要研究方向是钙钛矿太阳电池、发光二极管、二氧化碳减排和制氢等。在2016年和2017年被评为化学、材料科学和工程领域的“高被引研究员”,并被列入所有科学领域的“World's Most Influential Scientific Minds”名单。更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。