Optimizing flood resilience in China’s mountainous areas: Design flood estimation using advanced machine learning techniques
DOI:https://doi.org/10.1016/j.ejrh.2025.102345
我们开发了机器学习 (ML) 模型,用于在中国山区集水区(≤ 500 km²)设计洪水估算。这个过程考虑了不同的 ML 算法(随机森林、极端梯度提升和支持向量回归)、模型范围(国家和水文区域)和特征输入集(1-14 个特征)来优化模型开发策略。基于估计性能和超参数调优效率,发现随机森林是最优算法。最佳模型范围产生了五个不同的模型:一个包含六个东部区域的单一集总模型和四个单独的西部区域的纬向模型。考虑到准确性和效率,不同模型的最佳输入特征数量在 5 到 14 个之间。秦巴—大别北部、东南、西南和云藏区估计精度较高,不同重现期测试集的平均 RMSE、R²、MQE 和 QR 范围分别为 55.90 至 103.97、0.83–0.93、45.62 — 65.77 % 和 55.90 — 60.98 %。其余区域表现出中等精度,而西北盆地区域由于集水区较少而表现出特别低的精度。值得注意的是,面积> 100 km² 的流域表现出更高的估计精度,与各种规模的流域相比,MQE 平均减少 60%,QR 增加 30%。本研究为全国山洪防治工作提供了重要的参考和数据支持。
2-图表
在这项研究中,我们为中国山区集水区(≤ 500 km²)开发了基于 ML 的设计洪水估计模型,考虑了不同的算法、模型范围和特征输入集以进行模型开发优化。RF 模型凭借其高估计精度和超参数调谐效率优于 XGBoost 和 SVR 模型。考虑到模型范围,我们总共构建了 5 个设计洪水估计模型,包括 1 个用于 6 个东部水文区的集总模型和 4 个用于西部区域的纬向模型。最佳特征集因模式而异,东部集总模式和青藏高原模式使用 5-6 个关键因子(例如,集水区、年平均最大 3 小时和 6 小时降雨量、海拔),而云藏、西北山和西北流域模式使用所有 14 个因子。设计洪水的估计精度在不同重现期是一致的,在钦巴-大别北部、东南、西南和云藏区具有较高的精度(测试集不同重现期的平均纬向指标:RMSE=55.90–103.97;R²=0.83–0.93;MQE=45.6–65.77 %;QR=55.90–60.98 %)。东北、华北、内蒙古、西北山和青藏高原带的精度中等,而西北流域区的精度较低。此外,面积> 100 km² 的集水区显示出很高的准确性,与各种规模的集水区(0-500 公里)相比,MQE 平均下降(QR 增加)60% (30%)2).本研究没有考虑气候变化和人类活动的动态影响,这可能会在长期设计洪水预测中引入偏差。未来的工作应整合这些动态因素,例如使用先进的深度学习方法,以更好地捕捉洪水演变模式并适应不断变化的环境条件。本研究为中国山洪灾害风险管理提供了有价值的工具。开发的模型和方法可以适用于全球类似的山区,为全球洪水风险评估和减灾工作做出贡献。研究结果还为政策制定者和城市规划者制定有效的防洪策略提供了见解,特别是在脆弱的山区。