RSE最新成果｜GPP-net 深度学习网络，仅用 SR+PAR解锁高分辨率总初级生产力精准估算

论文摘要

高分辨率总初级生产力（GPP）估计对于需要精细空间细节来捕捉GPP异质性的生态和农业应用至关重要。基于卫星的GPP估计通常依赖于土地覆盖和气象数据。然而，土地覆盖数据的错误分类和气象数据的粗分辨率大大增加了不确定性。在这里，我们提出了一种强大的高分辨率GPP估计深度学习（DL）网络，名为GPP-net，它仅使用哨兵2号卫星的地表反射率（SR）和光合有效辐射（PAR）。具体来说，GPP-net基于一个完全一维卷积编码器-解码器网络，并结合了一个光谱带重要性估计模块。为了增强GPP-net的泛化能力，我们运行了土壤-冠层能量平衡辐射传输（SCOPE）模型，然后将这些SCOPE模拟的反射率数据与从FLUXNET2015中提取的GPP和PAR数据相结合，对GPP-net进行预训练。与包括植被近红外反射率乘以入射阳光（NIRvP）、偏最小二乘法（PLS）和随机森林（RF）在内的基准模型相比，GPP-net在包括四种森林类型、农田、草地和湿地在内的七种植物功能类型（PFT）上提高了半小时和每日GPP检索精度。由于其强大的非线性特征学习能力，GPP-net还促进了对C3和C4植被的稳健GPP估计。我们发现，GPP-net能够在干旱和热浪条件下可靠地估计GPP，将蒸气压亏缺（VPD）作为预测因子时改善最小。此外，GPP-net在GPP制图中对土壤效应表现出很强的稳健性，并且在捕捉GPP的年际变化方面具有很强的能力。预训练范式使我们能够充分利用历史数据，而DL框架确保随着新数据的整合，模型泛化能力不断提高。我们的模型无需土地覆盖数据，并将高分辨率GPP估计对粗分辨率气象数据的需求降至最低，这可以支持未来全球高分辨率GPP制图的工作。

关键图表

图 1.总初级生产力网络（GPP-net）。（a）一维全卷积网络结构；（b）GPP-net 中特征图的维度变化。上标 “e” 表示编码器（encoder）中的特征，上标 “d” 表示解码器（decoder）中的特征，上标 “b” 表示光谱波段重要性估计模块中的特征，上标 “r” 表示回归层（regression layer）中的特征；下标表示不同模块内的层数。

图 2.GPP-netSCOPE 的训练流程。预训练阶段仅使用混合 SCOPE 数据集（hybrid-SCOPE dataset），微调阶段仅使用真实匹配数据集（real matched dataset）。

图 3. 整体研究框架。IAV 为年际变率（inter-annual variability）的缩写，SR 为地表反射率（surface reflectance）的缩写。具有年际变率的通量站点以及 C3/C4 作物站点均从 AmeriFlux（美国通量网）和 ICOS（欧洲综合碳观测系统）网络中选取；所有实地观测数据均与哨兵 2 号（Sentinel-2）地表反射率数据进行匹配。基于 FLUX2015 数据集和 MODIS 叶面积指数（LAI）数据开展 SCOPE 模型模拟，且混合 SCOPE 数据集仅用于 GPP-netSCOPE 的预训练。采用五折交叉验证法测试模型在半小时尺度和日尺度总初级生产力（GPP）估算中的性能。“PFT” 表示使用功能型植物类型（Plant Functional Type）信息，“nonPFT” 表示不使用该信息；“SCOPE” 表示引入混合 SCOPE 数据集进行预训练，“nonSCOPE” 表示不使用 SCOPE 模拟数据集。在整个实验过程中，GPP-net 均不使用 PFT 信息。

图 4. 半小时尺度总初级生产力（GPP）估算结果。GPP 单位为微摩尔二氧化碳・平方米⁻¹・秒⁻¹（μmol CO₂・m⁻²・s⁻¹），均方根误差（RMSE）单位同 GPP。（a）各功能型植物类型（PFT）的估算结果；（b）不同功能型植物类型间的综合估算结果。整个实验过程中，GPP-net 均不使用 PFT 信息。

图 5. 日尺度总初级生产力（GPP）估算结果。GPP 单位为克碳・平方米⁻¹・天⁻¹（gC・m⁻²・d⁻¹），均方根误差（RMSE）单位同 GPP。（a）各功能型植物类型（PFT）的估算结果；（b）不同功能型植物类型间的综合估算结果。整个实验过程中，GPP-net 均不使用 PFT 信息。

图 6. 光谱波段重要性估计结果及对比。（a）未引入混合 SCOPE 数据集进行预训练时的波段重要性估计结果；（b）引入混合 SCOPE 数据集进行预训练后的波段重要性估计结果。为保证结果的稳健性并考虑实验变异性，每种实验设置（使用 / 不使用混合 SCOPE 数据集）均重复进行 3 次。B1-B8A 代表所使用的哨兵 2 号（Sentinel-2）卫星光谱波段。

图 7. 不同功能型植物类型（PFT）的哨兵 2 号（Sentinel-2）瞬时总初级生产力（GPP）制图结果。分别选取 FR-Lam（法国朗格多克）、BE-Dor（比利时多尔）、US-BZF（美国本泽尔维尔）、IT-SR2（意大利圣雷莫）、BE-Vie（比利时维耶）、IT-Cp2（意大利卡普里）和 US-Rpf（美国罗斯福）站点周边区域，对应绘制农田（CRO）、草地（GRA）、湿地（WET）、常绿针叶林（ENF）、混交林（MF）、常绿阔叶林（EBF）和落叶阔叶林（DBF）的 GPP 图。（a）RGB 影像；（b）不使用 PFT 信息的近红外植被指数（NIRvPnonPFT）方法结果；（c）使用 PFT 信息的近红外植被指数（NIRvPPFT）方法结果；（d）不使用 PFT 信息的偏最小二乘（PLSnonPFT）方法结果；（e）使用 PFT 信息的偏最小二乘（PLSPFT）方法结果；（f）不使用 PFT 信息的随机森林（RFnonPFT）方法结果；（g）使用 PFT 信息的随机森林（RFPFT）方法结果；（h）不使用 SCOPE 数据集预训练的 GPP-net（GPP-netnonSCOPE）结果；（i）使用 SCOPE 数据集预训练的 GPP-net（GPP-netSCOPE）结果。所用实地光合有效辐射（PAR）数据与哨兵 2 号过境时间相匹配。整个实验过程中，GPP-net 均不使用 PFT 信息。

图 8. GPP-netSCOPE 与其他方法的总初级生产力（GPP）制图结果空间相关性分析。以 GPP-netSCOPE 的 GPP 制图结果作为参考基准。

图 9. 年平均预测误差。RRMSE 表示模型预测结果在各年份间的年平均相对均方根误差，MAD 表示模型预测结果在各年份间年平均 RRMSE 差值的最大绝对值；n 表示每个站点的有效年份数量。RRMSE 和 MAD 值越小，表明模型对 GPP 年际变率的追踪能力越强。

图 10. C3 和 C4 植被总初级生产力（GPP）预测结果对比。灰色虚线表示等值线（观测值与预测值相等）；红色虚线表示 C3 植被 GPP 预测结果的趋势线；蓝色虚线表示 C4 植被 GPP 预测结果的趋势线。（a）不使用 PFT 信息的近红外植被指数（NIRvPnonPFT）方法结果；（b）使用 PFT 信息的近红外植被指数（NIRvPPFT）方法结果；（c）不使用 PFT 信息的偏最小二乘（PLSnonPFT）方法结果；（d）使用 PFT 信息的偏最小二乘（PLSPFT）方法结果；（e）不使用 PFT 信息的随机森林（RFnonPFT）方法结果；（f）使用 PFT 信息的随机森林（RFPFT）方法结果；（g）不使用 SCOPE 数据集预训练的 GPP-net（GPP-netnonSCOPE）结果；（h）使用 SCOPE 数据集预训练的 GPP-net（GPP-netSCOPE）结果。整个实验过程中，GPP-net 均不使用 PFT 信息。决定系数（R²）为实地观测 GPP 与预测 GPP 之间的皮尔逊相关系数平方；斜率为强制过原点（即截距 = 0）的线性回归系数，该回归以估算 GPP 为因变量、观测 GPP 为自变量拟合得到。

图 11.干旱和热浪期间的总初级生产力（GPP）估算结果。横轴为实地观测 GPP，纵轴为估算 GPP；灰色虚线表示等值线（观测值与预测值相等）。（a）不将水汽压亏缺（VPD）作为预测因子的结果；（b）将 VPD 作为预测因子的结果。有无 VPD 的模型使用相同数据集训练，唯一差异在于是否将 VPD 纳入预测因子。整个实验过程中，GPP-net 均不使用 PFT 信息。

END

以上内容来源于GEE遥感训练营，为学术分享，仅供科研交流，如有错误/侵权等，请联系修改或删除。联系方式：Novel_2020