3.1 模型性能度量
KGE和Cohen's kappa值在384个测站上计算,中位数分别为0.46和0.24。基于中位数,测站被分为两类:159个测站性能“高于中位数”,225个“低于中位数”。性能分布显示空间异质性,干旱区域和人类活动频繁区域性能较差。
3.2 静态流域属性聚类与模型性能关联
SOM聚类将流域分为7个类型(如表1所示),包括小型森林流域、高海拔雪域、湿润高基流流域、干旱城市流域等。聚类结果显示出明显的地理模式(图4a),且与模型性能密切相关。
性能分析表明(图5):
•高性能集群(如集群1、2、5)通常位于高海拔、低流量调节度、自然流主导区域。
•低性能集群(如集群3、4、6)与高流量调节度、干旱气候或农业活动相关,其中集群4(干旱城市流域)性能最差。
3.3 干旱签名聚类与模型性能关联
SOMTimeS聚类将干旱签名分为8个集群(图6),反映了不同的季节性模式(如1-6月峰值集群性能较好,而复杂模式集群性能较差)。集群空间分布如图7a所示。
性能比较(图8)显示,集群B、C、F(峰值在1-6月)性能较好,而集群D(高调节度)性能较差。这强调了流量调节和季节性对模型性能的影响。
3.4 空间随机森林模型结果
随机森林分类器的F1分数为0.72,能有效预测性能类别(图9a)。SHAP分析(图9b)显示,流量调节度、水库存储强度、高程和森林覆盖率是关键预测因子,低调节度与高性能正相关。
3.5 未测流域性能投影
模型性能投影到3539个未测流域(图10),显示高性能区域主要分布在上游高海拔多雨区,低性能区域在下游干旱区,不确定区域位于东南部。这为模型应用提供了可靠性指导。
结果揭示了多个影响LSTM模型性能的因素:
•人类活动:高流量调节度(如水库和农业灌溉)显著降低性能,因为模型输入缺乏动态人类活动数据。
•基流和气候:极端基流regime(高或低)和干旱气候区域性能较差,表明模型对地表-地下水相互作用捕捉不足。
•数据代表性
:训练数据中某些流域类型(如干旱区)样本不足,导致性能偏差;空间平均化的流域属性可能无法反映异质性。
•方法局限性:数据驱动模型的性能可能受训练数据偏差影响,而非纯粹的水文过程,需谨慎解读。
研究还指出,聚类分析从模型输入(静态属性)和目标(干旱签名)两个角度提供了互补见解,增强了可解释性。与现有研究一致,该工作强调了在数据驱动模型中融入物理过程信息的重要性。
本研究通过时空聚类和机器学习方法,系统评估了USGS LSTM流干旱预测模型的性能。主要贡献包括:
•识别了流量调节度、高程、基流贡献和气候等关键影响因素。
•证明了模型性能可在未测流域部分估计,为水资源管理提供实用工具。
•提出了改进方向,如增加动态人类活动数据、提高数据多样性和空间分辨率。
未来工作可扩展至其他区域或模型,并探索如何将物理机制更直接地整合到数据驱动模型中。该框架为增强水文模型的可解释性和可靠性提供了范例。