《自然-通讯》| 基于深度学习的全球陆地蒸发混合模型

第一时间获取气象科研资讯
『气象学家』公众号交流群
加入

期刊：nature communications

中文题目：基于深度学习的全球陆地蒸发混合模型

英文题目：A deep learning-based hybrid model of global terrestrial evaporation

作者：Akash Koppa , Dominik Rains, Petra Hulsman, Rafael Poyatos & Diego G. Miralles

摘要

陆地蒸发（E）是一个关键的气候变量，由过多的环境因素控制。调节植物叶片蒸发（或蒸腾作用，Et）的约束特别复杂，但由于基于局部研究的知识有限，在全局模型中通常假设为线性相互作用。在这里，我们使用涡度协方差和sap流数据以及卫星观测来训练深度学习算法，旨在模拟蒸腾应力（St），即从理论最大值减少蒸腾应力。然后，我们将新的蒸腾应力公式嵌入到基于过程的陆地蒸发模型中，以生成全局混合陆地蒸发模型。在这种混合模型中，蒸腾应力公式在每天的时间尺度上与宿主模型双向耦合。现场数据和基于卫星代理数据比较表明，全球估计蒸腾应力和陆地蒸发的能力增强。该框架可以扩展以改进地球系统模型中陆地蒸发的估计，并增强我们对这一关键气候变量的理解。

研究背景

陆地蒸发是全球水循环的一个关键因素：陆地上约三分之二的降水被蒸发回大气。由于其对水蒸汽和云反馈的影响，陆地蒸发在全球变暖中起着至关重要的作用，预计其增加将加剧全球水文循环。陆地蒸发的变化不仅会对水的可用性和气候产生深远的影响，还会严重影响水气候极值的发生以及生态系统和流域从这些极值中恢复的能力。此外，陆地蒸发是植被胁迫的一个重要指标，因此，它被广泛用于估计干旱条件及其对水管理、生态系统健康和农业生产的影响。因此，它在水文和气候模型中的可靠描述至关重要，从空间进行准确的全球监测也至关重要。然而，陆地蒸发不能直接从基于卫星的测量中得出，这就是为什么即使是检索算法也倾向于依赖基于过程的公式。

我们利用卫星遥感的最新进展和遍布全球的前所未有数量的现场观测，在没有任何事先假设的情况下，从头开始开发蒸腾应力的新公式。因此，使用深度学习的目标与纯粹基于机器学习的模型根本不同（开发改进的植被蒸腾应激反应公式），后者旨在直接预测蒸腾速率，并存在上述缩放问题。此外，我们在基于过程的全局蒸发模型中实现了蒸腾应力的新公式，并在线执行，该模型为基于深度学习的蒸腾应力公式提供了物理约束。为此，我们开发了一个混合模型，其中新的基于深度学习的蒸腾应力（St）公式与基于过程的公式紧密耦合，旨在在全球范围内模拟每日的陆地蒸发。使用现场观察和网格数据集对该模型进行了综合评估，包括与纯机器学习和基于过程的方法的比较。

研究结果

（1）混合模型架构

最高抽象级别的混合模型由两部分组成：基于过程的主机模型和嵌入主机中用于表示特定过程的基于机器学习的公式。对于基于过程的模型，我们选择全球陆地蒸发阿姆斯特丹模型（GLEAM）。GLEAM将陆地蒸发模拟为其组成部分的总和：蒸腾作用（Et），土壤蒸发（Eb），露天水体蒸发（Ew）、积雪升华（Es）和截留损失（Ei）。使用基于Priestley-Taylor公式的潜在蒸发（Ep）及其各自的蒸发应力因子（St和Sb）估计全球模型每个网格单元的蒸腾作用（Et）和土壤蒸发（Eb），并通过矮植被、高植被、裸露土壤和开阔水域的覆盖率分数进行加权（图1）。通过将基于深度学习的蒸腾应力模型与基于GLEAM过程的模型耦合，创建了全局陆地蒸发的混合模型。在全球模型的每个（每日）时间步长和每个（0.25度）网格单元，GLEAM的土壤水分平衡模块使用降水量（P）计算PAW。然后，将PAW、VOD、Ta、VPD、SWi、CO2转移到（离线训练的）深度学习模型。深度学习模型以预测模式运行以生成蒸腾应力（St）。然后使用蒸腾应力（St）约束潜在蒸发（Ep），从而通过基于过程的主机模型计算实际蒸发。最后，在下一时间步骤（图1）重复该过程之前，使用实际蒸发更新土壤水分（和PAW）。

图1混合模型架构

注：混合陆地蒸发模型示意图，包括表示子网格的异质性以及深度学习模型和混合模型的足迹差异。Ei是拦截，Ep是潜在蒸发，S是蒸发应力因子，St是蒸腾应力，E是实际蒸发，P是降水，Rn是净辐射，Ta是气温，VOD是植被光学深度，VPD是蒸气压差，SWi是入射短波辐射，CO2是二氧化碳。红色箭头表示基于处理的模型专用的建模步骤，绿色箭头表示混合模型中添加的步骤，黑色箭头表示两个模型通用的步骤。

（2）现场测量验证

混合模型的蒸腾应力和实际蒸发估计值在458个现场监测站进行验证，这些监测站来自多个通量塔和sap流数据库。将混合模型的性能与完全基于过程的模型进行了比较。小提琴图和空间地图说明了克林-古普塔效率（KGE），这是一种结合了相关性、可变性偏差和平均偏差的指标。克林-古普塔效率（KGE）值理论范围为−∞到1.0，其值大于-0.41，表明该模型是一个比平均季节周期更好的预测器。小提琴图（Violin Plots）（图2a）显示了位于矮植被生态系统中的231个站点和位于高植被生态系统中的227个站点（137个通量塔站点和90个sap流量测量站点）的KGE值分布。

图2混合模型和基于过程的模型的现场验证总结

注：a、b小提琴图显示了分别为所有通量塔和sap流量测量点计算的蒸腾应力因子（St）和蒸发（E）的克林-古普塔效率（KGE）指标的分布。混合模型和基于过程的模型的KGE分布根据矮植被和高植被类型进行分类。虚线表示中间值（大虚线）和四分位范围（小虚线）。红线表示-0.41的KGE值，高于该值模型预测或模拟被认为优于平均季节周期。对于sap流站点，使用蒸腾估算（Et）而不是实际蒸发（E）。

为了更好地理解混合模型和基于过程的模型之间的差异，我们比较了两个模型在不同地理区域的蒸腾应力因子和蒸发的克林-古普塔效率（KGE）值差异的空间分布（图3）。在通量塔和sap流站点数量最多的北美（NA），混合模型在估计蒸腾应力和陆地蒸发方面优于基于过程的模型，尤其是在潮湿的东部和东北地区。相比之下，这两种模型往往无法准确模拟西南干旱地区的蒸腾应力（St）。在欧洲（EU），混合模型在估计大多数通量塔站（包括位于相对干旱的南部的站）的蒸腾应力（St）方面优于基于过程的模型。然而，在亚洲（AS）和世界其他地区（RW），混合模型的性能与基于过程的模型非常相似。一个原因可能是亚洲（AS）和世界其他地区（RW）分布非常稀疏，因此这些生态系统中的通量塔和sap流站点可能具有与训练数据库中大多数站点不同的生物物理特征。此外，我们比较了相关和RMSE的空间图，以了解克林-古普塔效率值（KEG）差异的来源。就相关性而言，这两个模型在不同地区的表现非常相似。

图3混合模型和基于过程的模型的现场比较

注：显示混合模型和基于过程的模型之间克林-古普塔效率（KGE）指标差异的地图，使用在不同地理区域（北美（NA）、亚洲（AS）、欧洲（EU）、世界其他地区（RW）的通量塔和sap流量测量点的观测值，用于蒸腾应力因子（St）和蒸发（E）的计算。蓝色（红色）色调表明，与基于过程的对应模型相比，混合模型有所改进（退化）。对于sap流站点，使用蒸腾估算（Et）而不是蒸发（E）。

（3）与全球数据集的比较

混合模型的目标是在整个大陆表面上生成林分蒸发的时空连续估计。因此，根据蒸腾应力和实际蒸发的独立全球估计值对其进行验证也很重要。因此，蒸腾应力和蒸腾估算季节性聚集分别与图4和图5中的其他全球数据集进行了比较。为了进一步研究这些全局模式的真实性，通过显示基于月度时间序列的相关图。

由于在这些尺度上没有观测到蒸腾应力因子（St），我们选择了一个卫星数据的代理，该数据代理已被证明相当好地代表了植被经历的蒸腾压力：太阳诱导的叶绿素荧光与光合有效辐射（SIF/PAR）的比率。我们在这里注意到，SIF/PAR的单位和范围不同于蒸腾应力因子（St）的单位和范围，但预计空间梯度和时间动态具有可比性。在极端条件和较高CO2条件下，进行比较可能不合适，因为碳和水循环可能会解耦。在北半球夏季的6-7-8月（JJA），我们看到混合模型中蒸腾应力因子（St）的空间模式与基于过程的模型中的模式相似（图4a，c）。然而，混合模型更好地捕捉到较高纬度的SIF/PAR低值所建议的较高蒸腾应力（图4e）。对于12-1-2月（DJF），情况类似；高纬度的蒸腾应力由混合模型准确捕捉（图4b，d，f）。相似地，我们可以看到混合模型准确表示刚果、亚马逊和东亚雨林的蒸腾应力，包括6-7-8月(JJA)（图4a）和12-1-2月(DJF)（图4a）。此外，混合模型显示，无论是在6-7-8月（0.66对0.59）还是在12-1-2月（0.42对0.34），与SIF/PAR的空间相关性都有显著改善。

我们还将混合和基于过程的模型的陆地蒸发估计与纯机器学习的陆地蒸发数据集（FLUXCOM）进行了比较。结果发现在6-7-8月(JJA)和12-1-2月(DJF)这两个季节，混合和基于过程的模型的蒸发的空间模式与FLUXCOM的相似（图5）。在混合模型和基于过程的模型中，一个主要的分歧区域是亚马逊。这可能与热带森林中很少有台站可用于模型训练有关，因此FLUXCOM和混合模型的估计在那里往往更不确定，这也可能反映出在FLUXCOM中没有明确考虑拦截损失作为陆地蒸发的一个组成部分。

图4模拟蒸腾应力的全球尺度评估

注：基于处理和混合模型的季节平均蒸腾应力因子（St）以及6-7-8月（JJA）a、c、e和12-1-2月（DJF）b、d、f季节太阳诱导叶绿素荧光和光合有效辐射（SIF/PAR）的比率。SIF的单位为mWm²/sr/nm，PAR的单位为W/m²。

研究结论

大规模的地球系统和气候模型日益复杂，需要越来越多的计算资源。更重要的是，过程通常是基于有限的实验理解来表示的，因此在更大范围内的应用中是不确定的。混合建模方法有可能减少过度参数化的不良影响，减少计算时间，甚至提高过程表示的准确性。在此，我们重点关注全球水循环中的一个主要未知数和气候模型中的一个关键变量：陆地蒸发（E）。我们开发并应用了一个全球尺度的陆地蒸发混合模型，其中基于深度学习的蒸腾应力公式嵌入到每日时间尺度的基于过程的模型中。我们的研究表明，在捕获产生蒸腾应力的非线性交互过程方面，在没有先验假设的情况下设计的基于专家知识的深度学习模型总体上比基于过程的传统模型更准确。最大的改善出现在森林（高大植被）地区，尤其是在北纬地区。这对于限制热带、温带和北方森林的蒸腾估计具有重要意义，这些森林是全球蒸腾的主要组成部分。该研究还强调了任何深度学习模型的局限性，训练数据的充分可用性至关重要：用于训练的大多数流量塔和sap流量测量站点位于北美和欧洲。这对于模拟具有较大区域（和局部）可变性的地球系统过程尤其相关，因此，默认情况下，任何数据驱动公式在全球范围内的推广能力都不完善。从计算角度来看，该模型是在TensorFlow中开发的，TensorFlow是一个用于深度学习的流行Python库，可扩展到各种硬件、操作系统和编程语言。蒸腾应力模型与宿主模型无关，因此可以嵌入到不同的全球尺度的地球系统模型中。

以上中文翻译为译者个人对于文章的概略理解，论文传递的准确信息请参照英文原文。

来源;早晚地理