【Adv Mater】加州大学戴维斯分校 Marina S. Leite：机器学习高精度预测卤化物钙钛矿组分依赖热稳定性

卤化物钙钛矿因其优异的光电特性，在光伏、发光二极管和辐射探测器等领域展现出巨大潜力，其光电转换效率已突破27%。然而，这类材料的长期不稳定性始终是制约其商业化的核心瓶颈。在温度、湿度、光照等环境应力作用下，钙钛矿薄膜的光电性质会发生复杂且难以预测的动态变化，涉及卤素离子迁移、相变、物质脱气等多种降解机制。这些机制高度耦合且依赖材料组分，使得传统的试错法研究思路难以系统揭示组分-稳定性间的内在关联。

在此背景下，将人工智能与高通量实验相结合的数据驱动研究范式显得尤为迫切。近年来，机器学习在电池寿命预测、固体电解质失效分析、光催化剂筛选等领域已取得显著进展，但在钙钛矿热稳定性研究中的应用仍处于起步阶段。现有工作多集中于单一组分的性能预测或有限条件的稳定性评估，缺乏对不同化学组成在复杂热循环条件下光学行为变化的系统性量化分析。本研究通过结合高通量自动实验与多算法机器学习比较，旨在建立钙钛矿组分、温度与光学性质之间的定量映射关系，为设计高稳定性钙钛矿材料提供可推广的预测框架。

本研究题为“High‐Accuracy Machine Learning Projections of Composition‐Dependent Thermal Stability in Halide Perovskites”，系统性地结合高通量自动光致发光实验与机器学习技术，对CsₓFA₁₋ₓPbIᵧBr₁₋ᵧ系列卤化物钙钛矿的热稳定性进行定量预测。研究团队通过137000个原位获取的PL光谱，训练并比较了10种机器学习算法，实现了单组分模型98.16%的预测准确率与组分泛化模型89.31%的准确率，并进一步通过堆叠模型重建完整PL光谱。该工作发表于Adv Mater，DOI为10.1002/adma.73636，原文链接https://doi.org/10.1002/adma.73636。

方法与技术创新

研究者构建了一套完整的实验与计算一体化工作流程。实验方面，团队设计了定制的高通量光致发光测量腔体，通过Arduino控制的步进电机驱动平移台，使10种不同组分的钙钛矿薄膜依次暴露于固定激光下，实现全自动原位光谱采集。温度曲线模拟了极端昼夜温差模式，在137小时内完成23个15°C至55°C的循环，共计获取137000个PL光谱，为机器学习提供了充足的训练数据。

在数据处理与分析层面，研究采用了从相关性分析到降维可视化再到多算法预测的递进策略。首先，通过皮尔逊相关系数热力图评估温度、时间、铯含量和溴含量与四个关键PL特征（峰值强度PLₘₐₓ、积分面积PLₐᵣₑₐ、半高宽PLFWHM、峰位PLₗₒc）之间的线性关联。随后，利用主成分分析和t分布随机邻域嵌入两种降维方法对高维数据进行可视化，识别样本在组分空间的聚类结构。

机器学习建模部分体现出系统性创新的核心。研究设立了三层预测策略：第一层针对每个组分的独立数据训练10种算法（包括线性回归、岭回归、决策树、随机森林、Extra Trees、梯度提升、K近邻、多层感知机、Bagging和XGBoost），共计400个独立预测模型；第二层采用留一组交叉验证构建组分泛化模型，即用九种组分的数据训练模型预测剩下的一种组分；第三层引入堆叠集成策略，将前一层Extra Trees对PLₘₐₓ、PLₐᵣₑₐ、PLₗₒc的预测结果作为额外输入，再结合岭回归预测PLFWHM，从而利用各PL 特征间的内在关联提升精度。与以往仅关注单一组分或单一算法的研究相比，这种系统性的多模型比较、泛化能力验证与堆叠增强策略显著提高了框架的鲁棒性和实用性。

Figure 1: 展示了从组分选择到机器学习预测的完整工作流程，包括10种CsₓFA₁₋ₓPbIᵧBr₁₋ᵧ样品、模拟昼夜循环的温度曲线、高通量PL采集装置示意图，以及数据处理和模型训练阶段，清晰呈现出闭环研究策略。(图片来源于Adv Mater)

主要发现与结果分析

实验数据揭示出清晰的组分依赖性降解行为。在10种组分中，低铯含量（10%-33%）和适中溴含量的样品表现出最佳的热稳定性，其PL强度在热循环后能够完全恢复；而高铯含量（≥50%）的样品则出现不可逆的强度衰减。例如，含33%铯和17%溴的样品g在整个实验过程中PLₘₐₓ和PLFWHM几乎保持不变，而含83%铯的样品a初始光谱即出现两个峰，对应α相与未混合的Cs₁₋ₓPbBr₁₋ᵧIᵧ相共存，长波长峰在循环过程中逐渐消失。这些现象可以用铯含量对晶格应变、缺陷形成和相稳定性的影响来解释——适量铯有利于稳定α-钙钛矿相并抑制光惰性δ相的形成，而过量铯则导致晶格应力累积和表面离子富集。

Figure 2: 通过初始与最终光谱对比和137小时热循环PL热图，直观显示不同组分的热稳定性差异，高铯样品出现不可逆衰减和额外相特征，而低铯样品光谱响应完全可逆，揭示了组分对降解模式的决定性影响。(图片来源于Adv Mater)

Figure 3: 皮尔逊相关系数热力图显示高铯样品中温度与PL特征相关性较弱而时间相关性强，低铯样品则完全相反；t-SNE降维图中各组分成簇清晰，稳定样品的紧密簇与降解样品的扩散簇形成对比。(图片来源于Adv Mater)

机器学习预测结果验证了方法的有效性。在单组分模型中，XGBoost表现最优，平均准确率达 98.16%（RMSE=1.84%），体现了梯度提升算法在捕捉PL特征与时间、温度非线性关系方面的优越性。在更具挑战性的组分泛化模型中，Extra Trees保持了最高精度（89.31%，RMSE=10.69%），表明完全可以通过学习多种组分的数据来预测未知组分的性能。堆叠模型进一步提高泛化性能至89.72%（RMSE=10.28%），其中PLFWHM的预测误差从21.29%降至19.68%，并通过伪Voigt拟合成功重建了完整的PL光谱，这一成果意味着研究者仅需输入时间、温度和组分信息即可预测任意条件下钙钛矿的光学响应。

Figure 4: 堆叠模型的预测结果图显示Extra Trees结合岭回归策略全面提升了PLFWHM预测精度；模型架构示意图明确展示了两阶段输入输出关系；预测的完整PL光谱与原始数据高度吻合，验证了全谱重建能力。(图片来源于Adv Mater)

特征重要性分析进一步揭示了各因素的作用权重。对于易降解的高铯样品，时间因素的贡献（0.45-0.75）远高于温度，反映了材料持续劣化的趋势；而对于稳定的低铯样品，温度的影响占主导地位，时间因素几乎无关紧要，说明材料能够从热循环中完全恢复。在全局模型中，温度对PLₘₐₓ和PLₐᵣₑₐ影响最大，铯含量次之，溴含量再次之，而时间的影响最小。SHAP分析结果与XGBoost特征重要性一致，进一步证实了铯含量对热稳定的关键调控作用。

Figure 5: XGBoost特征重要性累积图直观对比了温度和时间的相对贡献：高铯样品的时间重要性显著高于温度，低铯样品则温度完全主导，全局模型中温度影响最强而铯含量是影响PLFWHM和PLₗₒc的关键。

Figure 6: SHAP分析结果同样确认温度对PLₘₐₓ和PLₐᵣₑₐ的负面影响占主导，溴含量对PLₗₒc起决定性作用，而PLFWHM 受溴含量和温度共同调控，从可解释人工智能角度为组分-稳定性关系提供了量化证据。(图片来源于Adv Mater)

参考与索引

原文题名：High‐Accuracy Machine Learning Projections of Composition‐Dependent Thermal Stability in Halide Perovskites, Adv Mater, 2026, https://doi.org/10.1002/adma.73636

说明：本文仅作科研人员学术交流，若涉及版权或存有疑问，请联系我们及时处理。联系邮箱：ai4chem_mater@qq.com