Py学习  »  机器学习算法

Journal of Hydrology | 基于全球和局地信息驱动的深度学习模型可解释框架揭示长期径流机制

生态遥感前沿 • 2 天前 • 34 次点击  

论文推荐


🌐文献导览

  • 题目: Revealing long-term runoff mechanisms using the deep learning model interpretable framework driven by global and local information

  • 作者: Binlin Yang, Lu Chen, Siming Li, Bin Yi, Nengjie Hu

  • 期刊: Journal of Hydrology

  • 中科院分区: 一区 (TOP期刊)

  • 发布日期: 2025年

  • DOI: 10.1016/j.jhydrol.2025.134167

  • 摘要: 长期径流预报(LRF)在水资源管理中具有重要意义。由全球气候指数(GCIs)和局地气象变量(LWVs)驱动的深度学习(DL)模型是LRF的主要方法,且DL模型的可解释性分析为理解径流机制提供了宝贵见解。然而,高维度的GCIs和LWVs存在冗余性和多重共线性,严重影响了DL模型的预测精度并削弱了其可解释性。同时,现有研究缺乏关于GCIs和LWVs在基于DL的LRF中的物理机制及贡献关系的研究。因此,本研究提出了一种基于LSTM的新型LRF可解释框架。该框架采用“过滤-封装”式输入变量选择(FWIVS)方法,通过减少输入变量间的冗余和多重共线性来提高精度和可解释性。此外,该框架结合无监督聚类和Shapley加性解释(SHAP)方法,评估GCIs和LWVs对长期径流产流机制的影响,并量化它们在LRF中的贡献关系。研究选取三江源区(TRSR)作为研究区域。结果表明,由GCIs-LWVs驱动的LSTM比仅由LWVs驱动的LSTM具有更优的预报精度。这种提升是因为GCIs为预报模型提供了比温度更大的预测贡献,甚至在预报最小径流时超过了降水的贡献。在三江源区,降雨径流是主导的产流模式,具有最大的SHAP值,其次是融雪和冰川融水产流模式。冰川、积雪和降雨的存储持续时间决定了其产流模式对长期径流的时间影响。值得注意的是,GCIs对产流机制及其持续时间的影响表现出与温度相似的模式,表明通过FWIVS选择的GCIs在表现出与降雨强信息互补性的同时,有效地替代了温度信息。在CMIP6气候模式下,预计在降雨期(6月至10月),长江和澜沧江源区的冰川融水和融雪径流将增加,而黄河源区的蒸发将加剧;在积雪期(11月至5月),固体水储量预计将减少。在SSP585情景下,这些变化将被放大。这些发现增进了对长期径流的新理解,并为优化水资源管理中的水资源配置策略提供了理论基础。

📡研究背景

水资源是人类生存和发展的关键基础,也是维持生态系统生物多样性的核心。长期径流预报(LRF)作为水资源开发管理、旱涝灾害防治以及水库调度运行的重要工具,其准确性至关重要。目前,深度学习(DL)因其强大的自动特征提取能力,已成为LRF的主流方法。然而,长期径流受到海温、大气环流及下垫面特征等多种因素的影响,导致输入变量维度高、非线性关系复杂。高维输入变量往往伴随着显著的信息冗余和多重共线性,这不仅制约了模型的预测精度,更使得DL模型面临“黑箱”难题,难以进行可靠的物理可解释性分析。

在全球变暖的背景下,全球气候指数(GCIs)与局地气象变量(LWVs)之间的复杂相互作用日益显著。以往研究多侧重于利用局地气象数据解释径流机制,而忽视了全球与局地变量协同对长期径流的影响。因此,如何筛选合适的输入变量,并准确量化GCIs和LWVs对径流的物理贡献及相互关系,是当前长期径流预报面临的重大挑战。三江源区(TRSR)作为“中华水塔”,是气候变化的敏感区,研究其在气候变化下的径流演变机制具有重要的科学与现实意义。

🌍主要方法

本研究提出了一种融合全球和局地气候信息的深度学习可解释框架,旨在揭示长期径流的潜在物理机制(如图1所示)。

  1. 输入变量选择框架(FWIVS): 采用过滤-封装式变量选择方法。首先利用最大互信息系数(MIC)和Hampel测试进行初步筛选(过滤),识别出与径流显著相关的变量。随后,使用改进的金豺优化算法(IGJO)结合LSTM模型(封装)进行二次筛选,剔除冗余变量并确定的最佳变量组合及模型超参数。

  2. 多重共线性检验: 利用方差膨胀因子(VIF)、皮尔逊相关系数和互补性分析对筛选出的关键变量进行检验,确保输入变量间不存在严重的多重共线性,从而保证解释结果的可靠性。

  3. 深度学习可解释性模型: 构建基于LSTM的预测模型,并引入Shapley加性解释(SHAP)方法。SHAP基于博弈论,能够量化每个输入变量(LWVs和GCIs)在每个时间步对模型输出(径流)的贡献值(Shapley value)。

  4. 聚类分析: 采用K-means无监督聚类算法对SHAP值进行聚类,识别不同时间步长下的主导产流模式。利用轮廓系数确定最佳聚类数。

  5. 未来情景预估: 基于CMIP6的MRI-ESM2-0气候模式,在SSP245和SSP585情景下,利用Delta降尺度方法处理未来气象数据,驱动训练好的模型以评估未来气候变化对径流机制的影响。

🌍数据来源

  1. 研究区域: 三江源区(TRSR),包括黄河源区(SAYR)、长江源区(SAYZR)和澜沧江源区(SALR)。

  2. 径流数据: 来自唐乃亥(1960.1-2020.12)、直门达(1958.1-2016.12)和香达(1958.1-2016.12)水文站的月径流观测数据。

  3. 局地气象数据(LWVs): 中国气象局提供的月降水和气温数据。

  4. 全球气候指数(GCIs): 国家气候中心提供的18项全球气候指数(如亚洲极地涡旋强度指数APVI、东亚槽强度指数EATI等)。

  5. 未来气候数据: CMIP6发布的MRI-ESM2-0模式在SSP245和SSP585情景下的历史(1959-2014)及未来(2025-2050)降水和气温数据。

🔍研究结果

1. 长期径流物理机制的可解释深度学习框架

本研究构建的框架(图1)逻辑清晰,从变量选择到模型构建,再到基于SHAP的可解释性分析,形成了一套完整的闭环。该框架的核心优势在于能够处理高维数据,并通过FWIVS有效去除冗余信息,为后续的物理机制解析奠定基础。

图1 长期径流物理机制(PM)的可解释深度学习框架。

2. 三江源流域概况

研究区位于青藏高原腹地(图2),海拔高差大,多年冻土广泛分布,对气候变化极为敏感。不同源区(黄河、长江、澜沧江)的水文气象特征差异,使得分区域研究径流机制尤为必要。

图2 三江源流域示意图。

3. 变量相关性与多重共线性检验

在变量选择阶段,FWIVS方法筛选出了各源区的关键变量(如表1及文中描述)。为了验证变量组合的合理性,图3展示了变量与降水之间的皮尔逊相关性和互补性。结果显示,选定的GCIs(如APVI, EATI)与降水的相关性较低,但互补性较强,说明GCIs提供了降水之外的关键预测信息。图4进一步展示了选定变量的方差膨胀因子(VIF)均小于10,表明不存在严重的多重共线性,适合用于可解释性分析。

图3 变量与降水的皮尔逊相关性和互补性。

图4 选定关键变量的方差膨胀因子值。

4. 预测性能评估

对比由LWVs驱动和GCIs-LWVs驱动的LSTM模型性能(图5)。结果表明,引入全球气候指数后,所有流域的纳什效率系数(NSE)均有提升,尤其是在黄河源区(SAYR)和澜沧江源区(SALR),预测精度显著提高。散点图和线性回归拟合显示,GCIs-LWVs模型在模拟高径流事件(洪峰)方面表现更为优异,这证明了全球气候信息对于捕捉极端水文事件的重要性。

图5 不同数据驱动的LSTM模拟月径流的性能和带有线性回归拟合的散点图。

5. 基于SHAP值的产流模式聚类分析

利用K-means对SHAP值进行聚类,揭示了不同源区的主导产流模式(图6)。

  • LWVs驱动模型: 识别出“降雨径流”(正降水贡献)、“融雪/冰川融水”(正温度贡献)以及“冰雪存储”(负降水/负温度贡献)等模式。降雨径流在所有源区均占主导地位。

  • GCIs-LWVs驱动模型: 全球气候指数(如APVI, EATI)的贡献率通常高于温度。值得注意的是,GCIs对产流机制的影响与温度表现出相似的模式(图7显示GCIs与温度存在相关性),说明筛选出的GCIs有效地替代了温度信息,并补充了降水无法解释的变异。

图6 三江源区的SHAP聚类分析结果。

图7 选定的全球气候指数与平均气温之间的皮尔逊相关性。

6. 极端径流事件中的变量贡献

针对极端径流(最大值和最小值)的归因分析发现(图8):

  • 局地变量(LWVs): 降水是极端径流的主导因素。温度在长江和澜沧江源区表现为正贡献(融雪/冰川融水增加径流),而在黄河源区最大径流期间表现为负贡献(高温导致蒸发加剧)。

  • 全球-局地变量(GCIs-LWVs): 引入GCIs后,它们在极端径流预测中的贡献显著,甚至在某些情况下(如预测最小径流时)超过了降水。这表明大尺度大气环流异常是引发三江源区极端水文事件的重要驱动力。

图8 不同变量类别对三江源区极端月径流预测的比例贡献。

7. 产流模式的时间分布特征

分析不同产流模式在水文年内的占比(图9),发现产流模式的持续时间取决于冰川、积雪和降雨的存储时长。

  • 降雨期(6-10月): 降雨径流模式占主导。

  • 积雪期(11-5月): 降水以冰雪形式存储的模式占主导。

  • GCIs-LWVs模型识别出的产流模式在时间分布上与LWVs模型高度一致,但存在一定的时间滞后,这反映了全球气候信号对局地水文过程的滞后影响。

图9 对应月份月气象变量驱动的径流产流模式比例。

8. 历史趋势与未来情景下的径流机制演变

Mann-Kendall趋势检验显示(图10),在历史时期:

  • 积雪期: 变量的SHAP值呈显著下降趋势,表明全球变暖导致固体水储量(积雪、冰川)逐渐减少。

  • 降雨期: 降水和温度的贡献主要呈上升趋势,意味着融雪和降雨径流在增加。但在黄河源区,温度贡献无显著趋势,可能被蒸发抵消。

图10 第一时间步LWVs和GCIs的SHAP值变化趋势。(向上箭头表示显著增加,向下箭头表示显著减少)

基于CMIP6未来情景(SSP245和SSP585)的预测显示(图11):

  • 径流变化: 长江和澜沧江源区径流预计增加,而黄河源区径流可能减少(受蒸发加剧影响)。

  • 机制变化: 积雪期,降水和温度的SHAP值在SSP585情景下显著下降,预示固体水储量进一步枯竭。降雨期,长江和澜沧江源区的温度贡献增加(融水增加),而黄河源区的温度贡献下降(蒸发主导)。SSP585高排放情景下,这些变化将更为剧烈。

图11 不同情景下第一时间步LWVs的SHAP值变化趋势。

⚛️结论

本研究提出了一种结合全球气候指数和局地气象变量的深度学习可解释框架,成功应用于三江源区的长期径流预报与机制解析。主要结论如下:

  1. 精度与解释性双提升: 通过FWIVS方法筛选的变量组合,不仅显著提高了LSTM模型的预报精度(NSE提升约0.10),而且有效避免了多重共线性,确保了基于SHAP值的物理机制解释的可靠性。

  2. 全球气候指数的关键作用: 筛选出的GCIs在模型中表现出比温度更高的贡献率,且与降水具有很强的信息互补性,能够有效替代温度信息并捕捉大尺度气候强迫对径流的滞后影响。

  3. 产流机制的时空差异: 降雨径流是三江源区最主要的产流模式。冰川、积雪的存储与消融决定了产流模式的季节性切换。

  4. 气候变化的响应: 无论是历史时期还是未来情景(特别是SSP585),气候变暖都导致了积雪期固体水储量的显著减少。在降雨期,长江和澜沧江源区因融水增加而径流增加,而黄河源区则因蒸发加剧面临径流减少的风险。

该研究不仅展示了深度学习在水文预报中的巨大潜力,更为打开“黑箱”、理解复杂气候背景下的水文驱动机制提供了新的视角。

🔖引用格式

Yang Binlin, Chen Lu, Li Siming, Yi Bin, Hu Nengjie. Revealing long-term runoff mechanisms using the deep learning model interpretable framework driven by global and local information[J]. Journal of Hydrology, 2025, 663: 134167.


END


以上内容来源于水文学者,为学术分享,仅供科研交流,如有错误/侵权等,请联系修改或删除。 联系方式:Novel_2020

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/197776