金属卤化物钙钛矿太阳能电池(PSCs)在过去十年中发展迅速。钙钛矿薄膜的制备工艺方法和前驱体组分调控是获得高性能钙钛矿太阳能电池的重要手段。研究人员在这些方面做了大量的工作,揭示了其对器件性能影响的机制。然而,由于这些调控因素构成了巨大的变量空间,很难从全局理清它们与器件性能及它们之间的关联。如果研究者可以在实验前基于这些关联预测器件性能,器件性能将有效加速提升。但是受限于这些因素的复杂性及巨大的变量空间,单纯依靠实验研究来量化这些关联将会付出巨大的资源和时间成本。
近期北京交通大学徐征教授、宋丹丹副教授等采用机器学习方法对已有的实验研究结果进行学习,来挖掘PSCs的制备工艺方法和组分变量与器件性能之间的映射关系,实现了从这些因素对器件性能的预测;同时,采用SHAP等方法分析了各个变量对器件性能的作用机制。进而,为了提高机器学习模型的可解释性,作者以A位阳离子为例,采用密度泛函理论(DFT)计算和实验对预测结果进行了解释和验证。这项工作提供了一个完整的机器学习引导器件优化的流程,可以反向设计实验以获得高性能PSCs。该研究工作以“Predicting the device performance of the perovskite solar cells from the experimental parameters through machine learning of existing experimental results”为题发表在期刊Journal of Energy Chemistry上。论文第一作者为北京交通大学博士生路遥。
作者从超过340篇文献报道中获取了超过1000个器件的制备参数和性能,筛选了17个代表制备工艺方法和组分的变量特征与4个表征器件性能的目标特征(PCE,VOC,JSC,FF),如图1所示。
图1. 钙钛矿太阳能电池中提取的17个代表制备工艺方法和组分的变量特征与4个表征器件性能的目标特征。
特征之间的相关矩阵如图2所示。PCE与FF显示出强正相关性,这表示在文献报道中PCE的改善主要受益于增大FF的方法。
图2. 特征相关性矩阵。采用Pearson系数量化两个变量之间的相关性,符号(±)表示正(+)或负(-)相关性。
作者采用多种机器学习回归算法(线性回归、神经网络、随机森林、极致梯度下降等)建立17个变量特征与目标特征之间的映射模型,采用均方根误差(RMSE)和Pearson相关系数(r)来衡量算法模型的性能。其中,极致梯度下降(XGBoost)模型体现了较低的RMSE和较高的r值,表明XGBoost模型在预测器件性能方面具有较高的准确性和可靠性(如图3所示)。
图3. XGBoost预测结果与文献中报告的真实值进行比较。(a) PCE、(b) VOC、(c) JSC和(d) FF。黑色虚线表示预测值等于真实值时的条件。
为了分析变量特征对器件性能的影响重要性及作用机制,作者对变量进行了重要性分析和SHAP分析,如图4所示。左侧组图清楚地表示了不同算法(RF、XGBoost和GBDT)给出的特征重要性分布统计;右侧组图中的SHAP值可以反映每个特征对器件性能的积极或消极影响。从中可以看出,A位离子对器件性能的影响至关重要。
图4. (a, c, e, g)从不同算法(RF,XGBoost,GBDT)导出的特征重要性图和(b, d, f, h)基于PCE(a, b), VOC (c, d), JSC (e, f)和FF(g, h)的XGBoost模型的SHAP值。数据点的数量决定SHAP值的密度;颜色对应于特征的特征值。特征的正/负SHAP值表示其对器件性能的正/负影响。
为了对机器学习模型进行解释和验证,作者利用实验和量化计算方法解析了A位离子对器件性能的影响及机制,如图5至图7所示。
图5(b)显示了反向扫描下最佳器件的电流密度‒电压(J‒V)曲线。在FA基钙钛矿的PSCs中同时引入Cs和MA,PCE从18.22%提高到21.42%。图5(d-g)显示了这些PSC的光伏参数的重复性器件统计,表明混合阳离子主要改善了器件的VOC、FF和生成的PCE。这些实验趋势与机器学习模型的预测结果一致
图5. (a) 钙钛矿太阳能电池的横截面SEM图。(b) 钙钛矿太阳能电池的J‒V曲线。(c)基于不同A位阳离子组分的钙钛矿太阳能电池的EQE。(d-g) FA、MAFA、CSFA和CsMAFA钙钛矿太阳能电池的光伏参数的器件重复性统计。
添加MA或Cs离子的钙钛矿薄膜的荧光强度、TRPL寿命和形成能明显增强、Urbach能降低(图6),表明载流子非辐射复合受到了明显的抑制、缺陷减少。X射线衍射结果(图7)表明,混合A位阳离子的钙钛矿型薄膜中残留的PbI2较少。混合阳离子钙钛矿薄膜的(001)晶面的衍射强度增强,对应于结晶度的提高。同时,归一化衍射峰强度和相应的表面能呈现出一致的变化趋势,证明了实验结果的可靠性。
图 6. (a) FA、MAFA、CSFA、CsMAFA钙钛矿薄膜的光致发光光谱,(b)前驱体溶液中无Cs和有不同Cs比例的TRPL曲线。(c)FA、MAFA、CSFA、CsMAFA钙钛矿薄膜的Urbach能和(d)形成能。
图 7. FA、CSFA、MAFA和CsMAFA钙钛矿薄膜的 (a) X射线衍射谱,(b)归一化(001)面衍射强度和(001)-PbI2表面能。
这项工作为PSCs性能优化提供了一种低成本、高效的方法。该工作基于已有研究数据训练机器学习模型,建立了器件制备工艺方法和组分等变量与器件性能之间的关联模型,实现了对器件性能的预测。根据SHAP分析对影响器件性能的因素进行了排序,发现A位离子是获得高效PSCs的关键。通过实验和密度泛函理论计算对机器学习模型的预测结果进行了验证和解释。该工作证明了机器学习通过实验参数预测器件性能的可行性,为高效PSCs的反向实验设计提供了可能。
Predicting the device performance of the perovskite solar cells from the experimental parameters through machine learning of existing experimental results
YaoLu, Dong Wei, Wu Liu, Juan Meng, Xiaomin Huo, Yu Zhang, Zhiqin Liang, Bo Qiao, Suling Zhao, Dandan Song*, Zheng Xu*
Journal of Energy Chemistry
DOI:10.1016/j.jechem.2022.10.024
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。