衡阳师范学院Water Resources Research | 一种可解释的物理引导深度学习框架实现流域蓝绿水稳健预测与非线性解释

点击上方蓝色字关注我们~

蓝水和绿水是流域水循环与水资源管理中的两个核心组成部分。蓝水（Blue water）通常对应河川径流和深层含水层补给，绿水（Green water）则包括实际蒸散发（Actual evapotranspiration）和土壤水储量（Soil water storage）。长期以来，流域水资源研究更多关注蓝水，而对蓝绿水整体过程及其未来变化机制的认识仍相对不足。尤其在气候变化与土地利用变化共同作用下，蓝绿水过程表现出显著的非线性特征，使未来长期预测面临较大挑战；而单一物理模型或数据驱动模型难以同时兼顾水文机理、非线性学习和结果解释。

针对这一问题，本文提出了一个可解释物理引导深度学习框架（Interpretable Physics-Guided Deep Learning, IPGDL）。该框架耦合SWAT物理水文模型、CVOA-CNN-BiLSTM（CCB）深度学习模型和SHAP可解释方法，在质量控制后的CMIP6气候情景和PLUS 土地利用情景驱动下，对湘江流域2022—2100年的蓝绿水变化进行稳健预测，并从全局贡献、交互阈值、时间滞后和空间效应四个方面解析其非线性影响机制。

数据与方法

1、研究区：湘江流域位于中国湖南省，范围约为110°E—115°E、24°N—29°N，以湘潭水文站为出口，研究面积约82689 km²。流域地形起伏明显，年降水量约为1,200—1,700 mm，森林和农业用地占主导，是典型的亚热带湿润季风气候流域。以往研究表明，湘江流域在蓝绿水资源开发和利用方面具有重要潜力。（原文图2）

2、基础数据：研究使用36个气象站的日尺度气象数据（降水、最高/最低气温、相对湿度、太阳辐射和风速）、湘潭站和衡阳站径流数据，以及DEM、土壤和2010、2015、2020年土地利用数据；同时引入GLEAM、MODIS和ERA5-Land等遥感产品用于蓝绿水校准与验证，并结合CMIP6气候情景和PLUS土地利用模拟结果构建未来驱动数据。

3、SWAT蓝绿水模拟和校准：本文基于SWAT模型计算流域蓝绿水资源量。其中，蓝水由总产水量（WYLD）表征，绿水由实际蒸散发（ET）和土壤水（SW）共同表征。模型共划分为104个子流域并采用多变量、多源数据校准方式，将2个水文站的径流数据、2种遥感蒸散发产品（GLEAM和MODIS）以及2种遥感土壤水产品（GLEAM和ERA5-Land）共同纳入模型约束，最终形成418组校准数据集。基于RSWAT4.0函数接口，研究进一步开发了适用于蓝绿水过程的多源校准流程；同时，针对SWAT土壤水主要表征植物可利用水、难以与遥感土壤水产品直接对比的问题，对其进行了修正，以提高二者的可比性。综合校准与验证结果表明，SWAT模型能够较好地表征湘江流域蓝绿水过程，为后续物理引导深度学习建模提供可靠的物理基础。（原文图4）

4、IPGDL框架构建：IPGDL框架将SWAT输出的物理过程变量与外部环境特征对CCB模型施加物理约束（soft constrain）,从而XX。其中，CNN用于识别蓝绿水系统中的局部非线性特征，BiLSTM用于捕捉长期时间依赖关系，CVOA用于优化模型超参数，从而增强深度学习模型的稳健预测能力。（原文图2）

5、未来情景构建：研究选取12个CMIP6全球气候模式，并针对SSP126、SSP245和SSP585三类气候情景使用偏差校正、模式优选和多模式集合平均。同时，利用PLUS模型模拟2050年土地利用格局，构建低、中、高三类综合强迫情景，用于驱动2022-2100年蓝绿水预测。（原文表5）

6、非线性解释：在训练完成的物理引导CCB模型基础上，采用SHAP方法解释蓝绿水的非线性影响机制，重点分析不同特征的全局贡献、关键阈值、时间滞后效应及空间异质性，为未来水资源管理提供可解释依据。

主要结果

1、Physics-guided CCB模型具有较好的稳健预测能力：Physics-guided CCB模型在蓝水和绿水训练集、测试集上均取得较高精度，R²和KGE均超过0.8。与BiLSTM、 LSTM、CNN、GRU、MLP、Transformer和BERT等模型相比，Physics-guided CCB模型在测试集上的综合表现最优。（原文图5）

2、未来蓝绿水变化并非简单随强迫增强而增强：未来预测表明，低强迫情景（Scenario A）反而触发了最强烈的蓝绿水响应：蓝水相对历史期显著减少，变化幅度约为-43.6%至-31.1%；绿水则明显增加，变化幅度约为26.1%-34.8%。相比之下，中、高强迫情景下蓝水变化范围约为-25.3%至0.4%，绿水整体较为稳定，约在-7%至8%之间波动。该结果说明，蓝绿水系统对外部环境变化的响应具有明显非线性，不能仅用“强迫越强，响应越大”的线性逻辑解释。（原文图8和图9）

3、气象因子是历史期蓝绿水变化的主导因素：SHAP全局解释结果表明，气象特征对蓝水和绿水的贡献分别达到约46%和53%，是控制蓝绿水变化的主要因素。其中，降水是最关键的驱动因子，并表现出明显阈值效应：蓝水和绿水对应的降水阈值分别约为140.5 mm和109.4 mm。（原文图11）

4、低强迫情景下的极端响应主要源于降水主导的非线性机制：在Scenario A中，降水对蓝水和绿水的SHAP贡献分别达到约86.5%和78.38%，显著高于中、高强迫情景。进一步分析表明，蓝水在Scenario A下的降水阈值约为133.1 mm，较小降水扰动即可推动蓝水从抑制状态转向促进状态；绿水则呈现双阈值结构，当降水处于特定区间时表现为负贡献，而在较低或较高降水范围内转为正贡献。这解释了为何低强迫情景会产生更极端的蓝绿水再分配。（原文图17）

5、土地利用阈值为流域管理提供了定量参考：研究进一步发现，农业用地比例对蓝绿水具有明显非线性影响。当农业用地比例超过约 30%时，可能对蓝水和绿水产生显著抑制效应。这一阈值结果提示，在水资源敏感子流域中，应关注农业用地扩张对蓝绿水可利用性的潜在影响，并通过土地利用优化降低非线性突变风险。（原文图19）

研究启示

总体而言，本文提出的IPGDL框架兼顾了物理模型的机理约束、深度学习的非线性拟合能力和SHAP方法的解释优势，为复杂变化环境下流域蓝绿水稳健预测与机制识别提供了一个可推广的技术路径。与单一物理模型或单一数据驱动模型相比，该框架能够在保持水文过程合理性的同时，更有效地捕捉未来情景下的非线性变化。更重要的是，研究结果表明，未来蓝绿水变化并不一定随排放强度或外部强迫增强而单调变化。低强迫情景下，由降水主导的阈值效应可能引发更剧烈的蓝绿水再分配。因此，未来流域水资源适应性管理需要从线性预期转向非线性风险识别，重点关注关键阈值、滞后响应和空间异质性。

原文链接：https://doi.org/10.1029/2025WR041535

END

以上内容来源于水文学者，为学术分享，仅供科研交流，如有错误/侵权等，请联系修改或删除。联系方式：Novel_2020