《Nature》| 深度学习揭示全球变暖将加剧全球降雨变异性和极端情况

第一时间获取气象科研资讯
『气象学家』公众号交流群
加入

摘要

根据21世纪气候模式的预测，温室变暖将加剧全球降雨变异性和极端情况。然而，由于区域尺度的自然降雨波动较大，利用观测来验证这一预测仍然是一项重大挑战。在这里，我们证明了深度学习成功地检测了观测记录期间的每日降水场中的新出现的气候变化信号。我们利用从当前和未来气候模式模拟的集合中获得的日降水场和年全球平均地表气温数据训练了卷积神经网络（CNN）。将该算法应用于观测记录后，我们发现，日降水数据代表了观测到的全球变暖的一个很好的预测器，因为它们显示出自2010年代中期以来与自然变异性的明显偏差。此外，我们利用可解释的框架分析了深度学习模型，并观察到热带东太平洋和中纬度风暴路径区域的天气时间尺度(周期小于10天)的降水变率对人为变暖最敏感。我们的研究结果强调，虽然长期的年平均降水量的变化仍然看不见的自然背景的变化，全球变暖对每日水文的影响波动已经出现了。

引言

降水的变化极大地影响着社会和生态系统。因此，确定是否可以探测到人为的降水变化是至关重要的。在全球尺度上，全球气候模型模拟显示，每变暖1度全球平均降水量将增加约1-3%。这种变化在空间上不是同质的。预计湿润地区未来的增幅最大，这有时被称为“越湿越湿”或“最湿越湿”的反应。此外，预计将经历更大海洋变暖的地区也会出现降雨的平均强度(“越暖越湿”)，这可能进一步影响大规模的大气环流。根据这一理论，根据克劳修斯-克拉珀龙关系，在世界许多地区，极端日降水事件的强度预计将以约7% K^-1的速度增加，而在区域内观察到的增加速度更高。然而，由于降水变率的时空尺度范围很广，尚未找到明确表明人类活动对降水产生了影响的确凿证据。

以前的检测和归因研究已经确定了对预处理的降水统计数据的人为影响，例如陆地地区日降水量的年最大值以及全球和北极降水的季节性或纬向平均值。虽然使用空间/时间平均有利于检测，因为它降低了与自然内部变异性相关的不确定性，但基于使用平均值等平滑处理的检测结果可以在多大程度上应用于影响我们日常生活的水文气象天气事件，这是不确定的。

温室气体引起的变暖是否以及在多大程度上改变了观测记录中的每日降水仍然难以确定，原因有二。首先，日降水量表现出与非人为天气噪声相关的较大内部变异性，这阻碍了气候变化信号的检测。第二，传统的检测和归因方法假设一个固定的空间格局的气候变化信号（即指纹模式），这可能不足以捕捉捕捉方差等高阶统计量的变化。因此，迄今为止，检测日降水中印刻的气候变化信号的努力并不成功。在本研究中，我们通过将大集合气候模式模拟与深度学习算法相结合来克服这两个问题，并表明深度学习可以在日降水场中检测到统计显著的气候变化信号。

结果

1深度学习模型的检测结果

我们的深度学习模型是基于CNN的，这是一种广泛用于模式识别的深度学习技术。该算法以全球每日降水异常的地图（与长期每日气候学差异）作为输入变量，并输出全球平均2米气温（AGMT），这是一个关键的气候变化指标。为了构建一个能够在大内部变异中检测气候变化信号的深度网络，我们使用了80个CESM2大型集合（LE）模拟的每日降水图与AGMT的成对数据进行了模型训练，这些模拟数据在1850年至2100年间受到历史外部强迫和SSP3-7.0温室气体排放情景的影响。作为一个检测算法应用，深度学习模型将被称为深度检测（DD）模型。

嵌入在CNN中的卷积过程能够捕捉全球领域内的局部特征，使其适用于检测与全球变暖相关的区域模式变化。此外，由于其平移不变特征，DD模型可以在模型模拟和观测之间提取由全球变暖导致的共同变化模式，尽管它们存在系统性差异。这一特性与现有的检测与归因技术形成鲜明对比，包括修订后的基于线性回归的方法和前馈神经网络，这些方法根据全球固定的指纹模式来检测气候变化信号。

在使用CESM2-LE数据进行训练后，DD模型被应用于卫星降水观测数据（GPM的集成多卫星检索和GPCP降水观测与卫星再分析数据（MSWEP）以及融合地基雷达和卫星数据的现代再分析产品（ERA5）的降水数据中。在我们的检测分析中使用了多个数据集，以考虑与降水间接估算相关的不确定性。

通过观测的降水数据历史记录作为输入，我们从DD模型预测的AGMT与观测非常吻合，尤其是在近几十年有更大的增加（见图1a），这表明全球变暖可能对近期的日降水场产生了影响。从1980年到2020年，MSWEP和ERA5的年均观测和预测AGMT之间的皮尔逊相关系数均为0.88，P值小于0.001。在最近的20年（2001年至2020年），相关性略有降低（0.74-0.85）。相比之下，使用ridge回归方法获得的相关系数明显较低（MSWEP和ERA5的1980-2020年相关系数分别为0.33和0.36）。这表明DD模型识别了日降水的时空特征中的全球变暖信号，这是标准线性检测方法迄今无法实现的。

图1 a，1980年至2020年观测到的AGMT异常的时间序列（黑线）以及使用MSWEP（蓝线）、IMERG（紫线）、GPCP（橙线）观测和ERA5再分析（红线）的每日降水场作为DD模型输入获得的估计AGMT的年均值。在2001年至2020年期间，它们与观测到的AGMT的时间相关性分别为0.74、0.80、0.76和0.85。相应的彩色点表示使用MSWEP和ERA5降水数据估算的每日AGMT。虚线的黑色水平线表示AGMT估算的内部变异性的95%置信区间，定义为历史CESM2 LE模拟在1850年至1950年期间获得的每日AGMT估算的第2.5百分位数至第97.5百分位数。观测和模拟的异常相对于1980-2010气候学。

b，从1980年至2020年的相应年份内，估计的AGMT大于95%置信区间的上限的EM日的分数。虚线表示EM日分数内部变异性的95%置信区间的上限，为10.9%。

c，1980年至2020年ERA5和MSWEP以及2001年至2020年ERA5、MSWEP、IMERG和GPCP期间EM日数量的线性趋势。虚线表示根据Bootstrap方法估算的，使用历史CESM2 LE模拟数据（方法）计算的95%置信水平的上限。

为了测量使用DD模型与每日降水场相关的观测AGMT变化的可检测性，我们定义了每日估算AGMT的内部变异性范围，即从1850年至1950年历史时期CESM2 LE模拟中获得的第2.5百分位数至第97.5百分位数值（见图1a的虚线范围）。检测结果显示，从2010年代中期开始，DD预测的AGMT年均值超过了内部变异性的上限，从而表明温室气体变暖已经改变了每日降水场。

估算的AGMT大于内部变异性上限的日子，即后续称为“出现（EM）日”，自1980年以来不断增加（见图1b）。近年来的EM日明显高于使用CESM2 LE估算的内部生成的EM日的97.5百分位数（10.9%）（方法）。从2010年代中期开始，每年超过半数的日子中都可以检测到气候变化信号（即大于50%的EM日的分数），无论输入数据类型如何。

所有降水数据集都显示出EM日的强正线性趋势：对于MSWEP和ERA5，在1980年至2020年期间分别为17.1%每十年和16.3%每十年，对于IMERG和GPCP，在2001年至2020年期间分别为21.3%每十年和16.5%每十年（图1c）。这些趋势也超过了EM日趋势的内部变异性范围（图1c中的虚线；方法）。检测结果在DD模型的培训中使用的气候模型模拟34的选择方面基本没有受到影响（扩展数据图4），这表明深度学习模型在气候变化检测方面具有泛化能力。与我们基于DD的结果不同，岭回归在最近几十年的EM日中几乎没有趋势（扩展数据图3b, c），这表明线性方法几乎无法检测到信号。

2 降水时间尺度和热点区域

为了确定气候变化信号的来源，我们反复运行了DD模型，使用卫星和再分析降水产品，每次使用不同时间尺度的异常来捕捉。为了完成这项任务，降水异常被分解为线性趋势和高频率（<10天）、子月（10-30天）、亚季节（30-90天）、亚年（90天-1年）和低频率（>1年）的变异，使用Lanczos滤波器。然后将这些不同时间尺度的检测结果与保留所有时间尺度的降水异常的结果进行比较。

当将降水异常的线性趋势分量提供给DD模型时，ERA5和MSWEP数据集在1980-2020年期间的估算AGMT逐渐减小（图2a）。在2001-2020年期间，IMERG和GPCP数据集的结果对估算AGMT的时间变化的符号存在分歧（图2b），可能是由于降水数据集之间的趋势差异。显然，由线性趋势表示的降水的平均状态变化不是在图1中发现的人为气候变化信号的主要来源。在四个降水数据集中发现的线性趋势分量的负贡献可能部分是由于二十一世纪初热带太平洋的年代际太平洋涛动（IPO）的负相位及其相关的降水响应所引起的。热带降雨的观测年代际趋势与全球气候模型模拟的结果存在相当大的差异（扩展数据图5a、b）。线性趋势分量对气候变化检测的微弱贡献与使用每日降水的岭回归方法得到的结果一致，在该方法中的模式在其符号上与气候降水变化的空间模式一致。

在考虑的所有时间尺度中，周期短于10天的高频降水异常在AGMT的正趋势中起主要作用（图2a，b），而其他时间尺度的贡献可以忽略不计。这清楚地表明，观测到的日降水场中新兴的气候变化信号主要包含在高频气象成分中，而不包括低频成分或长期平均状态的变化。高频降水异常在产生正AGMT趋势方面的主导作用在使用的降水输入数据集不同的情况下都存在，而预测的全球变暖趋势在降水产品之间略有不同。这种数据集间的差异可能是由于检索算法或用于数据集制作的预报模型的不确定性，特别是在缺乏降水直接观测的海洋地区。

接下来，为了确定与气候变化信号相关的高频降水异常显示出显着变化的空间位置，我们使用了一种名为occlusionsensitivity的机器学习可解释方法。这种方法量化了在导出机器学习预测中的输入字段的相对重要性。输入格网箱的occlusion sensitivity是指在原始输入数据和通过用周围7×7个格网箱的输入数据替换目标格网箱中的零值后获得的对应值之间的差异（方法）。对于每个格网箱，计算了occlusion sensitivity，并在1980–2020年期间计算了其线性趋势，以测量其对全球变暖信号检测的贡献。occlusion sensitivity的线性趋势（图2c）突出显示了一些热点区域，其中出现了强烈的正趋势：北热带东太平洋、南美洲北部、北太平洋、北大西洋和南大洋。因此，我们的结果表明，DD模型估算的AGMT的正趋势主要是由于这些热点区域的高频降水异常发生变化所致。当使用不同的遮挡灵敏度（Extended Data Fig. 6a）或使用其他可解释方法，如Shapley添加解释（SHAP或集成梯度方法（Extended Data Fig. 6b，c）时，这些热点区域仍然清晰可见。

即使使用未经滤波的异常数据（Extended Data Fig. 7a），相同的位置也会出现热点。此外，请注意，对于相对较短的卫星降水产品（即2001–2020）（Extended Data Fig. 7b，c），热点上occlusion sensitivity的正线性趋势非常显著，而在赤道大西洋和中非洲的occlusion sensitivity只有在使用ERA5和MSWEP数据集时才出现。

图2a-b,利用ERA5再分析（红色）或MSWEP（蓝色）的DD模型估算的AGMT在1980–2020年（a）和利用IMERG（紫色）或GPCP（橙色）的2001–2020年（b）的线性趋势。每种情况下都显示了使用未经滤波的降水异常（表示为“总计”），降水异常的线性趋势（“趋势”），10天高通滤波（“10天HP”），10–30天带通滤波（“10–30天BP”），30–90天带通滤波（“30–90天BP”），90天–1年带通滤波（“90天–1年BP”）和1年低通滤波（“1年LP”）降水的结果。面板a和b中的虚线黑色水平线表示估算的AGMT线性趋势的95%置信度范围的上限，该范围是从1850年到1950年历史CESM2 LE模拟获得的。c，1980年至2020年10天高通滤波ERA5和MSWEP降水异常的AGMT遮挡灵敏度的线性趋势。面板c中的黑色框表示出现强烈正趋势的热点区域。阴影区域表示线性趋势值超过了95%的置信水平，由t检验确定。地图是使用Basemap Toolkit（版本1.2.0；https://matplotlib.org/basemap/）生成的。

3 物理解释

当在热点区域（图2c中的方框区域）分别为每个高频降水百分位数获取occlusion sensitivity时，最高的是前后百分位数，最低的是大约在55 th–60 th百分位数，对应的值接近零（图3a，b中的绿线）。这种V形模式表明，在东太平洋赤道辐合带（ITCZ）、南美洲北部和中纬度风暴路径地区，DD模型为具有正或负符号的强高频降水异常生成了更高的AGMT值。请注意，AGMT对高频降水异常的这种非线性响应不能在岭回归方法中解释，因为岭回归方法是线性的（图3a，b中的黑线）。此外，热点地区的高频降水异常的概率密度函数（PDF）在近几十年中朝着极端百分位数方向呈现系统性偏移；对于前（>90th）和后（<10th）百分位数，每十年的PDF与整个时期的参考PDF之比在1980年代最小，在2010年代最大（图3c，d）。

图3 这两个图表（图3a和图3b）显示了在DD模型和岭回归模型中，在东太平洋赤道辐合带（ITCZ）和中纬度风暴路径地区，高频（即10天高通滤波）降水异常的百分位数与occlusion sensitivity之间的关系。绿线代表DD模型的结果，黑线代表岭回归模型的结果。如图所示，DD模型的occlusion sensitivity表现出了一个V形的模式，即对于在东太平洋赤道ITCZ、南美洲北部和中纬度风暴路径地区具有正或负符号的强高频降水异常，DD模型生成的AGMT值更高。而岭回归模型则不具备这种非线性响应，因为它是线性模型。这两个图表的结果表明，在这些热点地区，高频降水异常的非线性变化主要贡献了观测到的AGMT趋势

在综合图3中呈现的结果时，DD模型显示了估计的AGMT在近几十年内稳健增加，高频降水事件的极端波动在热点地区更为频繁。换句话说，DD模型强调了全球变暖信号下东太平洋ITCZ和中纬度风暴路径地区高频降水变异性的观测放大。尽管过去的气候预测结果显示，随着气温升高，降水变异性会增加，但研究人员尚未评估观测中是否能够检测到这些预测的变化。

图4a确认了东太平洋ITCZ、南美洲北部和中纬度风暴路径地区降水变异性在1980-2010或2001-2020期间显著增加，无论是在卫星观测还是再分析产品中，高频降水变异性的增加在时间上都具有统计学显著性，超出了从1850-1950历史CESM2 LE模拟中估计的内部变异性的95%范围。

图4a,标准化ERA5（红色）和MSWEP（蓝色）高频降水异常的线性趋势，分别在1980-2020（较深的柱子）和2001-2020（较浅的柱子）期间，覆盖了东太平洋ITCZ（在20°S-20°N之间的方框区域）和中纬度风暴路径地区（在30°S和30°N之间的方框区域）。b, 在数据集（MSWEP、ERA5、GPCP和IMERG）上，2016-2020年和2001-2005年之间高频降水标准差的差异的平均值。c, 使用ERA5（红色）和MSWEP（蓝色），在东太平洋ITCZ、中纬度风暴路径和亚热带地区，在1980-2020年高频降水变异性的线性趋势与降水气候学的线性趋势的比值（每个都以1980-1984年的平均值为分母）。a和c中的误差线表示内部变异性的95%置信区间，是从1850-1950历史CESM2 LE模拟中获得的。d,e, 使用美国国家海洋和大气管理局气候预测中心（CPC）每日雨量计数据，2016-2020年与1980-1984年之间（d）以及2001-2020年与1960-1979年之间（e）高频降水标准差的差异。地图是使用Basemap Toolkit（版本1.2.0; https://matplotlib.org/basemap/）生成的。

最近，高频降水变异性的显著增加，表现为高频降水事件从中等百分位移动到极端百分位的转变，通过高频降水变异性差异的空间分布得以证实（图4b）。在2016-2020年相对于2001-2005年期间，高频降水变异性的增加在东太平洋ITCZ和中纬度风暴路径上非常明显。更重要的是，高频降水变异性的增加空间分布与遮挡敏感性的线性趋势相似（图2c）。这清楚地证明，全球变暖信号已经成功地从日降水中检测到，通过增加气象时间尺度的降水事件的极端波动。

在东太平洋ITCZ和中纬度风暴路径上，高频降水变异性的显著增加可以通过简单的水分平衡分析进行物理理解。历史降水平均值和高频变异性都突出表现在东太平洋ITCZ、北南美洲和中纬度风暴路径上（扩展数据图8），这支持了“湿润越来越多变”和“变化越来越多变”的范例。尽管观察到的长期趋势可能被最近的IPO负面事件所掩盖，但东太平洋ITCZ地区的平均降水略有增加（扩展数据图5a），而IPO相关的热带SST异常的振幅在该地区显示出局部最小值。因此，我们的结论不否定“变暖越来越湿润”及其高频变异性的相似范式（即所谓的变暖越来越多变的模型）。

在东太平洋ITCZ和中纬度风暴路径上，高频降水变异性的增加程度远远超过了气候降水的相应变化（图4c）。高频变异性趋势比（即高频降水变异性趋势除以参考期间内的变异性）在MSWEP和ERA5中东太平洋ITCZ和中纬度风暴路径地区约为气候趋势比的三倍。因此，我们的检测方法使我们能够克服线性方法的局限性，这些方法以往通过关注平均状态的变化而不是更高阶矩的变化，低估了全球变暖对降水数据的可检测影响。

我们的结果还使用直接降水测量进行了进一步评估。尽管我们研究中确定的热点区域主要位于海洋上，但其中一个位于大西洋风暴路径上，覆盖了美国东部，那里有相对较多的站点提供每日雨量数据。来自雨量计数据的结果与来自卫星和再分析降水数据集的结果基本一致，表明近几十年来美国东部高频降水变异性的幅度有显著增加（图4d、e和扩展数据图9a、b）。相反，在大西洋风暴路径之外的西部美国，高频降水变异性没有显示出有组织的趋势模式。高频变异性的变化仅在美国东部大西洋风暴路径之外（扩展数据图9c、d）大于平均降水变化。这种基于雨量计的分析增强了我们主要发现的稳健性。

全球变暖导致了热带和中纬度地区高频降水变异性的增加，而亚热带大西洋和东南太平洋则显示出气候干燥的主导性特征（图4c的右柱）；这与相应地区的遮挡敏感性一致，该敏感性指示底部百分位数为正值，而顶部百分位数为负值（扩展数据图10）。这些结果表明，深度学习模型中的独特卷积过程和非线性响应函数允许检测各种时间尺度中的全球变暖主要地区特征变化。请注意，底部极端百分位数中更强的正AGMT响应，而顶部极端百分位数中的负响应，导致AGMT对亚热带大西洋和东南太平洋高频降水变异性的减少产生了净负AGMT响应（图4b）。因此，这有助于遮挡敏感性与高频降水输入（图2c）的高频降水变异性趋势呈负相关。

深度学习的最新进展已经在气候科学中产生了许多创新的应用程序。通过将全球信息通过非参数映射压缩到抽象级别，深度学习是一种有用的方法，可以以自动化方式揭示和分类导致目标气候现象的各种时空尺度的模式。通过从复杂的降水概率分布中提取全球变暖在复杂概率分布中隐藏的稳健区域指纹，深度学习模型揭示了尽管有降水数据的短时间段，但日降水的增加幅度是一种新兴的人为信号；然而，平均状态的变化仍然几乎是不可检测的，因为它们受到大的内部日际变异的阻碍。这证实了全球变暖对与高的自然方差相关的变量的影响是无处不在的，是可以检测到的。

Data availability

The data related to this study can be downloaded from: IMERG version 6, https://gpm.nasa.gov/data/imerg; ERA5, https://www.ecmwf.int/en/forecasts/datasets/reanalysis-datasets/era5; MSWEP version 2.8, http://www.gloh2o.org/mswep/; GPCP version 3.2, https://disc.gsfc.nasa.gov/datasets/GPCPDAY_3.2/summary; CESM2 LE, https://www.cesm.ucar.edu/projects/community-projects/LENS2/; CMIP6, https://esgf-node.llnl.gov/projects/cmip6/; HadCRUT5, https://www.metoffice.gov.uk/hadobs/hadcrut5/; CPC rain-gauge data, https://psl.noaa.gov/data/gridded/data.unified.daily.conus.html.

Code availability

TensorFlow (https://www.tensorflow.org) libraries were used to formulate a climate-change-detection model using a CNN. The codes for generating the detection model and plotting the figures were downloaded from https://doi.org/10.5281/zenodo.8107114.

References

Ham, YG., Kim, JH., Min, SK. et al. Anthropogenic fingerprints in daily precipitation revealed by deep learning. Nature (2023). https://doi.org/10.1038/s41586-023-06474-x