Py学习  »  机器学习算法

SCIE-1区Top-IF9.2 基于可解释机器学习模型和多目标优化算法的城市尺度绿色基础设施优化规划:以北京核心区为例(翻译)

生态遥感前沿 • 1 月前 • 57 次点击  

题目:Optimized green infrastructure planning at the city scale based on an interpretable machine learning model and multi-objective optimization algorithm: A case study of central Beijing, China

期刊分区:环境科学与生态学1区Top,IF=9.2

Web of Science: SCIE

原文链接:https://doi.org/10.1016/j.landurbplan.2024.105191


摘要:
      【背景】绿色基础设施作为缓解城市洪涝的可持续途径已得到广泛应用。【存在问题】尽管机器学习模型在城市洪涝模拟中展现出优势,但其直接用于支撑城市尺度的绿色基础设施量化规划仍存在挑战。【研究方法】为此,本研究融合基于支持向量机的可解释机器学习模型(SVM)与沙普利加和解释法(SHAP),结合非支配排序遗传算法-II(NSGA-II),构建新型优化框架。【研究结果】以北京核心区为案例的研究显示:模型性能优异,曲线下面积(AUC)值达0.94;洪涝敏感性评估表明城乡过渡带面临更高洪灾风险;通过SHAP模型解析揭示:当绿色基础设施占比低于0.45时,其与灰色基础设施在防洪中呈现显著非线性互补关系。基于NSGA-II的优化框架获得不同实施规模下的最优方案,其中总绿色基础设施面积增加3.21%的方案具有最佳投资效益,模型建议采用分散式小规模建设模式。【研究意义】本研究开发的工具具有广阔应用前景,有效衔接绿色基础设施实施与城市规划,成果不仅为北京新增生态空间优先区划定提供重要依据,也为同类地区的洪涝治理与绿色基础设施规划提供新视角。
关键词:绿色基础设施;城市洪涝;支持向量机;SHAP


1.引言
      快速城市化已深刻改变城市地表及深层水文条件(Shrestha et al., 2022),而全球变暖背景下极端降雨事件正日益频发。在此背景下,被称为灰色基础设施(GrI)的城市管网与蓄水设施,已难以承受剧增径流带来的巨大压力(Hood et al., 2007; Onuma & Tsuge, 2018)。由此,日益频发的城市洪涝事件已造成巨大经济损失,并威胁民众生命财产安全(Tang et al., 2018)。在此背景下,绿色基础设施(GI)——一种通过模拟自然水文过程实现暴雨管理的环境友好型途径——正受到越来越多的关注。将绿色基础设施与传统排水系统结合,不仅能提升洪涝风险管理成效,还可获得多重生态与社会效益(Alves et al., 2019; Onuma & Tsuge, 2018)。城市洪涝治理有赖于多尺度协同(Xu et al., 2023a)。扩大自然地表覆盖是城市尺度绿色基础设施实施的核心策略,业已证明此举能有效降低洪涝发生频率与强度(Hounkpe` et al., 2019; Li et al., 2013)。从系统视角观之,其重要性更为凸显:宏观尺度的土地管理可增强微观层面工程系统的稳健性(Szllsi-Nagy & Zevenbergen, 2018)。
      洪涝敏感性评估是城市洪水管理的重要基础(Nguyen et al., 2024)。数据驱动的机器学习(ML)模型近年来在该领域展现出显著吸引力(Chen et al., 2021; Mosavi et al., 2018),其优势在于能够模拟数据集中的非线性行为,无需预设概率分布(Ekmekciog ̆lu & Koc, 2022),避免了定性分析模型中依赖专家经验手动赋权带来的不确定性(Zhang et al., 2021)。相较于水文水动力(H&H)模型对精确数据和复杂建模的强依赖性(Torres et al., 2021; Zhang et al., 2021),数据驱动的ML模型在大尺度空间具有更高计算效率与适用性——H&H模型常因城市尺度数据可获性不足而受限。支持向量机(SVM)作为最有效的ML模型之一,与地理信息系统(GIS)高度兼容(Lou et al., 2012; Tien Bui et al., 2012),在灾害敏感性评估中较其他ML模型展现出更优的分类精度(Lau et al., 2015; Marjanovic ́ et al., 2011; Nguyen et al., 2022)。GIS-SVM融合框架已广泛应用于城市洪涝研究,通过输出各空间单元的分类预测概率获取洪涝敏感性空间分布(Du et al., 2022; Tang et al., 2019)。然而现有研究多将整个城市视为单一对象,过度简化了建成区的洪涝敏感性空间特征,致使SVM模型在空间异质性更显著的建成城区洪水模拟效能仍有待验证。
      然而,包括支持向量机在内的机器学习模型在可解释性方面的不足,使其难以直接支撑城市尺度的绿色基础设施量化规划——尽管这些模型在洪涝敏感性评估中表现出色。由于难以清晰阐述主导结果的关键因子及其交互作用,阻碍了构建稳健的城市尺度绿色基础设施规划决策框架,而该框架需要输入变量与结果间存在明确、稳定且可量化的关系。沙普利加和解释法(SHAP)于2017年提出,旨在解决机器学习模型可解释性不足的问题。该方法基于1953年经典博弈论中的沙普利值理论,旨在公平量化任务协同中各参与者的贡献度(Lundberg & Lee, 2017)。SHAP作为模型无关技术,适用于解释多种机器学习模型,无需深入了解特定模型的技术细节即可生成人类可理解的输出结果(Li, 2022; Lundberg & Lee, 2017),已被多项研究用于探索自然灾害的关键驱动因子及其影响权重。例如,Ekmekciog ̆lu与Koc (2022)采用SHAP框架揭示了肯塔基州洪涝与滑坡灾害的关键诱因;Iban和Sekertekin (2022)则运用该框架阐释了土耳其梅尔辛与阿达纳地区野火敏感性评估模型的作用机制。迄今为止,SHAP在城市洪水研究中鲜有应用,但已有研究表明将机器学习模型与现有优化工具结合,有望为城市尺度的绿色基础设施量化规划提供支撑——这些工具传统上主要与小尺度水文水动力模型耦合使用。
      因此,为支撑城市尺度的绿色基础设施量化高效规划,本文探索构建融合可解释机器学习模型与多目标优化算法的创新框架。选取近年来频受城市内涝困扰的北京核心区作为中国典型高度城市化区域,用以验证所提模型的适用性。具体研究目标包括:(1)通过支持向量机分析研究区洪涝敏感性及其空间分布,验证机器学习模型在高空间异质性建成城区洪水模拟的可行性;(2)引入沙普利加和解释法揭示城市洪涝主导影响因子及其相互作用量化机制;3)采用基于非支配排序遗传算法-II(NSGA-II)的优化框架确定绿色基础设施的实施位置与规模。本研究通过将可解释机器学习模型应用于城市洪涝领域,弥合了现有研究空白,补充了城市尺度绿色基础设施规划的理论与技术手段,为城市绿色基础设施建设和洪涝防治提供了新的科学视角。
2. 研究区与数据来源
2.1 研究区概况 
      北京(北纬39°28′–41°05′,东经115°22′–117°30′)是中国首都及华北地区最大城市,地处华北平原北端,总面积16410.54平方公里。经历数十年快速城镇化,至2022年末全市城镇化率达87.60%。研究区——北京核心区即主要建成区所在地,总面积1378平方公里(图1)。高密度建成环境使该区域大量透水性地表消失,显著削弱城市降雨应对能力,导致城市洪涝事件频发(Wang  et al., 2020)。近年来以2011年7月24日、2012年7月21日及2020年8月12日暴雨引发的洪涝事件影响最为显著。
2.2 数据来源 
      本研究采用的数据包括洪水记录土地覆盖数据数字高程模型(DEM)数据、归一化植被指数(NDVI)数据降水数据道路网络数据国内生产总值(GDP)数据(表1)。洪水记录涵盖研究区127个历史洪水点位,用于构建洪水清单;其余数据以原始或经转换形式作为城市洪水解释因子,均以分辨率数据形式参与分析。
3. 研究方法 
      本研究的方法框架如图2所示:首先将研究区划分为若干研究单元并选取解释因子其次基于洪水清单与解释因子构建支持向量机(SVM)模型,评估各单元洪涝敏感性根据评估结果,采用沙普利加和解释法(SHAP)解析SVM模型运行机制,建立绿色基础设施(GI)规模与灰色基础设施(GrI)压力间的函数关系最终构建基于非支配排序遗传算法-II(NSGA-II)的多目标优化框架,以绿色基础设施面积为决策变量,确定各单元最优绿色基础设施增建规模。
3.1 研究单元划分 
      在城市洪涝研究中,采用基于高程定义的自然汇水单元进行分析存在局限性,复杂的城市地表与管网系统会干扰自然地表径流过程。本研究将研究单元定义为500米×500米的网格单元(单格面积25万平方米),该尺度与北京市街区平均规模高度匹配(Hu  et al., 2022)。城市街区作为由街道或道路界定的功能分区,因其相对独立的水文特征,可视为城市汇水区内的子汇水单元(Wang et  al., 2022; Xu et al.,  2023a)。最终研究区共划分为5159个单元,其中包含洪水记录点的127个单元被标记为"洪水单元"。
3.2 解释因子选取 
      城市洪水与地形、地表覆盖及水文条件等环境特征密切相关。综合既有城市洪水研究成果(Jia et al., 2022;  Roy et al., 2021; Zhang et al.,  2021),本研究选取七项解释因子:绿色基础设施占比(P_GI)灰色基础设施水平(L_GrI)高程坡度地形湿度指数(TWI)归一化植被指数(NDVI)降水量。除P_GI与NDVI外,其余五项因子以30米空间分辨率计算栅格值,继而通过空间统计分析获取各单元均值(图3)。最终采用下式对全部因子进行[0,1]区间归一化处理:
      其中xi表示研究单元I的指标x的参数值,xmax和xmin分别为所有单元中指标x的最大和最小参数值。
      对七个解释因素的具体描述如下。
P_GI:既有研究表明,城市尺度的绿色基础设施规划应聚焦其规模与空间分布,而非具体类型(Torres等, 2021)。据此,本研究统计城市尺度绿色基础设施时纳入六类具有径流调控功能的土地类型:森林、草地、灌木林地、耕地、水体及湿地。通过统计各单元内绿色基础设施栅格数(CGI)并乘以单元网格面积(本研究为100 m²),按下列公式计算各研究单元的P_GI值:
L_GrI:该指数用于表征城市管网的相对发展水平,数值越高代表排水能力越强。一般而言,管网排水能力主要受数量与质量双重影响,但因数据可获性受限,城市尺度的直接评估具有挑战性。故研究提出基于空间数据的间接评估方法。Mair等(2018)发现利用道路数据估算雨水管网分布具有可行性,因城市雨水管网通常沿道路布设。尤其在发达城市,路网密度越高往往对应更完善的管网系统。此外,城市经济活跃区域通常具备更高的管网建设与维护标准(Jia等,  2022)。据此采用以下估算方法获取L_GrI:
     其中,Droad 为标准化路网密度指数(基于道路数据通过ArcGIS线密度工具计算得出),GDP为标准化GDP值。鉴于数量要素与质量要素对排水能力具有同等重要性,故将其贡献系数设定为相同值。
      高程:在地形重力作用下,径流自然流向地势较低区域,因此低高程区域除自身产生的径流外,还可能受上游径流影响。该指标常被用于表征单元的潜在水文连通性(Agonafir等, 2023)。
      坡度指标:地表坡度越大,低洼处径流汇集速度越快。
      地形湿度指数(TWI) 该指数亦表征单元的潜在水文连通性,其数值对应单元集水区的汇流强度等值线。TWI值越高,表明因汇水面积扩大而承受上游径流影响的程度可能加剧。
      归一化植被指数(NDVI):该指数反映植被生长状况,其数值越高则植被越茂盛、健康且密集,意味着截留雨水的潜力越大。
      降水:城市洪水通常与极端降雨直接相关。历史统计表明,研究区年降雨量与极端降雨量存在显著正相关关系(Wu等, 1998)。因此,本研究采用近30年(1991–2020)平均年降雨量作为无法获取的极端降雨数据的替代指标。
3.3.模型描述与实施
3.3.1  多重共线性分析
      在城市洪水模拟中,多重共线性(即解释因子间存在高度线性相关)可能导致结果不可靠(Chen等,2019)。为确保洪水易发性评估的准确性,在建模前对七个解释因子进行多重共线性检验。基于Python的Statsmodels库计算各因子方差膨胀因子(VIF),若某因子VIF值超过10,则判定其未通过检验并予以剔除。
3.3.2 洪水易发性评估
(1)支持向量机(SVM)
       SVM是一种基于统计学习理论的有监督机器学习技术(Kanevski等,  2008;Pradhan, 2013)。其样本以因子-标签对(x,  y)形式输入:其中x为包含七个解释因子特征的多维输入空间向量,y代表样本标签(即0或1),0和1分别对应负样本(非洪灾)与正样本(洪灾)分类。SVM通过构建将训练数据集按最大间隔分离至超平面两侧的分类模型(0/1类居中分离),实现基于特征的新数据分类。本研究选用径向基函数(RBF)核作为SVM核函数,该函数能以较少参数实现较高分类精度(Tang等,  2019;Tehrany等, 2014)。模型通过Python的Scikit-learn库实现。
(2)模型精度验证
      受试者工作特征(ROC)曲线作为精度验证的常用方法,基于系列二分分类策略构建:以敏感性(真阳性率)为纵坐标,假阳性率(1-特异性)为横坐标。曲线下面积(AUC)即ROC曲线与横轴所围区域,是模型性能的核心评价指标。AUC值越接近1,分类性能越优异;当AUC超过0.8时,通常认为模型具备良好分类能力(Jaafari等,2018)。敏感性及特异性计算公式如下:
      式中:TP与TN分别为真阳性和真阴性,指被正确归类为洪灾单元和非洪灾单元的数量;FN与FP分别为假阴性和假阳性,指被错误归类为非洪灾单元和洪灾单元的数量。
(3)基于SVM的样本选取与空间分析模型 
      SVM分类器训练需使用分别标记为1和0的正负样本。历史洪水点位主要作为正样本来源,而无灾情记录的点位则视为负样本(Tang等,  2019)。未标记的负样本常需人工选取(Du等, 2022;Wang等,  2021),且建议负样本数量与正样本保持一致,以避免模型训练偏差(Lane等,  2012)。本研究参照Tang等(2019)提出的多重随机抽样法,选取127个与正样本数量相等的负样本。鉴于负样本特征过度聚集时随机抽样难以获得适宜分类器,本次127个负样本由若干单元聚类组等量抽取构成——这些聚类组通过基于七项解释因子的k均值聚类算法生成。经多轮不同聚类组数的预抽样测试,最终将聚类组数设定为9,以实现负样本在研究区内的均衡分布。
      为构建SVM模型,将包含127个正样本和127个负样本的多个样本组划分为训练集(70%)与测试集(30%)(Tang等,2019;Zhang等,2021)。此外,采用径向基函数核的SVM需优化惩罚系数C与核参数gamma以确保模型效能。惩罚系数C控制误分类惩罚力度:较低C值会导致误判率上升,但过高的C值将引发过拟合并削弱模型泛化能力。核参数gamma影响支持向量数量:较高gamma值意味着基于更多支持向量构建的复杂决策边界,但该值过高可能捕获数据噪声。本研究在抽样前预设多组C-gamma参数组合,针对每组参数执行200,000次随机抽样以最大限度覆盖适宜样本组(Tang等,2019)。最终从训练集与测试集AUC值均超过0.85的样本组中,保留整体AUC最高组所含负样本及其对应参数。
      基于样本组与优化参数的SVM模型输出各研究单元的分类标签及正分类概率。后者被视为各单元的洪水易发性值,并通过ArcGIS进行易发性值空间分布分析。
3.3.3 模型可解释性
      SHAP解释框架以统一形式呈现结果:为数据的每个特征分配SHAP值,量化描述该特征对预测结果的影响机制。基于合作博弈理论,特征的SHAP值可通过以下过程计算:在其他特征的多重组合中引入该特征,对比特征引入前后预测结果的变化量(Lundberg与Lee,2017)。
式中ybase表示所有观测样本的预测均值,f(xij)代表第i个观测样本中第j个特征的SHAP值。SHAP具备加和特性:所有特征SHAP值之和恒等于模型实际预测值与平均预测值之差。即使面对高度复杂的模型,SHAP方法仍能解析预测机制——特征SHAP值的绝对值表征该特征对预测结果的影响强度(Ekanayake等,2022)。据此,可通过计算平均绝对SHAP值对特征预测重要性进行排序,特征j的预测重要性(Contributionj)计算公式如下:
      本研究利用Python的SHAP库计算各研究单元中七个解释因子的SHAP值,通过对比特征贡献度识别城市内涝的主要影响因素。基于式(7),对于SVM模型分类的非涝单元,L_GrI对预测的贡献度越大,表明绿色基础设施(GrI)的防洪贡献越显著。因此,通过分析沿P_GI梯度分布的非涝单元间L_GrI预测贡献度(平均绝对SHAP值)的差异,推导出不同P_GI值对应的灰色基础设施相对压力(P_GrI),具体公式如下:
3.3.4 多目标优化
      绿色基础设施(GrI)是抵御洪涝的最后防线,一旦其所承受的排水压力超过自身排水能力,洪涝即会发生。因此,本研究核心目标之一是通过GI规划调整过高的灰色基础设施相对压力值(P_GrI),使其与绿色基础设施水平(L_GrI)相匹配。为量化P_GrI与L_GrI的匹配程度,引入耦合度评估指标。此外,考虑到研究区域土地资源约束,GI规划的成本友好性成为另一优化目标。本研究开发了基于NSGA-II算法的优化框架,用以遴选同时平衡两个目标的最优解集。
(1)耦合度
      耦合度作为定量分析指标,表征系统间相互作用的强度(Kai等,2017)。依据二元系统耦合度计算方法(Li等,2012),单元i内灰色基础设施相对压力(P_GrI)与绿色基础设施水平(L_GrI)的耦合度(Ci)可按下式计算:
式中Ci∈[0,1],当Ci趋近于1时,灰色基础设施相对压力(P_GrIi)与绿色基础设施水平(L_GrIi)的相互作用越强。该耦合度将优化单元限定于P_GrI值大于L_GrI值的单元——若P_GrIi < L_GrIi,则随着P_GrIi降低,Ci值将同步减小。
(2) NSGA-II算法
      NSGA-II是NSGA算法的改进版本,基于遗传算法与非支配排序理论构建 (Deb等,2000)。近十年来,该算法凭借其强鲁棒性被广泛应用于多类优化问题研究(Ghodsi等,2016;Raei等,2019)。本研究基于Python的Pymoo库实现NSGA-II优化框架,设置种群规模、子代数量和迭代次数分别为500、100和500次,共计执行50,400次模拟运算。以研究单元的绿色基础设施面积(A_GI)作为决策变量,其取值范围从初始值延伸至单元最大面积(250,000   m²)。根据《北京城市总体规划》约束条件,绿色基础设施总扩建规模不得超过其初始总面积(A0)的10%。此外,为提升计算效率,限定A_GI取值为土地覆盖数据单元网格面积的整数倍(A_GI  ∈ [0, 100, 200, ⋯, 250000])。本研究设定了两个优化目标:(1) y1:相比初始面积A0,绿色基础设施(GI)总扩建规模应尽可能小;(2) y2:灰色基础设施相对压力(P_GrI)与绿色基础设施水平(L_GrI)的综合耦合度应最大化。
4 结果
4.1 多重共线性分析、抽样与模型精度验证
      七项解释因子的方差膨胀因子(VIF)均小于10,表明不存在多重共线性,所有因子均可用于后续分析。通过随机抽样从九个单元簇中选取127个标记为非涝单元的研究单元,并确定最优参数组合(C=9.1,γ=6.8)。训练集与测试集的ROC曲线如图4所示,其AUC值及总体AUC值分别为0.96、0.89与0.94,证明训练所得分类器性能良好。
4.2 洪水敏感性评估
      采用灾害敏感性分类中常用的自然断裂点法(Kaiser等,2022),将支持向量机(SVM)判定为1的单元洪水发生概率划分为五级:无、低、中、高及极高敏感性。
      如图5所示,研究区洪水敏感性呈显著极化特征,反映了高密度建成环境的高度异质性。无敏感性单元(26.19%)与低敏感性单元(16.79%)主要分布于城市中心区、西郊及东北部部分郊区,合计占比42.98%。中等敏感性单元占比14.73%,在研究区内呈散点分布。而面临严重洪水威胁的单元(42.29%)围绕中心城区呈环状分布,其中高敏感性与极高敏感性单元分别占总研究单元的15.62%与26.67%。
      研究发现,市中心区域及城市西部山区构成洪涝敏感性冷点区。前者在研究区内呈现最高的绿色基础设施水平(L_GrI)与最低的灰色基础设施压力(P_GI),后者则具有最高的P_GI与最低的L_GrI。该结果证实绿色基础设施(GI)与灰色基础设施(GrI)均能抑制城市内涝,并揭示二者存在协同防洪的互补关系,具体机制下文将深入解析。
4.3 模型解析
      如图6a所示,较高的灰色基础设施压力(P_GI)、绿色基础设施水平(L_GrI)、归一化植被指数(NDVI)及高程值会提升单元被模型判定为非涝单元的可能性。然而降水与坡度的影响机制则相反。在特定阈值范围内,较高的地形湿度指数(TWI)会加强模型将单元判定为涝灾单元的倾向;但在汇水面积显著大于建成区的山区,高TWI值则呈现反向作用。值得注意的是,绿色基础设施(GI)与灰色基础设施(GrI)在横轴方向具有最长延伸幅度,表明二者对分类决策具有显著影响。
      如图6b所示,基于平均绝对SHAP值对七项解释因子进行排序。最高预测贡献度来自灰色基础设施压力(P_GI=0.26)与绿色基础设施水平(L_GrI=0.16),其余五项解释因子的重要性区间为0.02-0.08——其中高程值尽管与城市内涝呈显著负相关,却贡献度最低。地形因子(高程、坡度及地形湿度指数)未对城市内涝发生概率产生显著影响。
      本研究提出创新解读:非涝单元中绿色基础设施水平(L_GrI)的绝对SHAP值表征灰色基础设施(GrI)承担的防涝压力分配,其压力分配受灰色基础设施压力(P_GI)影响。例如,中心区非涝单元因自然地表有限,其防涝压力主要由高度发达的城市管网系统承担,故L_GrI呈现高绝对SHAP值。反之,当绿色基础设施(GI)达到特定规模时,GrI将不再是内涝决定性因素——如研究区西部部分单元,因排水压力已被自然地表分担,致使绝对SHAP值降低。为此,提取所有非涝单元样本,依据P_GI值按0.1间隔划分10组梯度,逐组计算非涝单元的平均P_GI值及其L_GrI对预测的平均贡献度。
      如图7所示,通过分段线性插值方法确定了不同P_GI值下L_GrI对预测的平均贡献。曲线显示,随着P_GI值的增加,L_GrI对预测的平均贡献逐渐降低,表明GI与GrI在防止城市洪水方面具有显著的互补性。此外,二者的互补性表现为非线性,且当P_GI超过0.45时,曲线的变化趋于平缓。该曲线的值依据公式(1)进行了归一化处理,用于表征GrI所面临的压力相对强度,并用于耦合度的计算。
4.4 多目标优化
      在50,400次模拟过程中,获得了361个帕累托最优解,并将其绘制在同一坐标系中。如图8a所示,随着GI实施规模的增加,整体耦合度得到了提高,并且这一提高呈现出随GI实施规模逐渐增长的趋势。在这些解中,通过乌托邦点法选择了代表最具成本效益的GI投资的理想解。该方法通过最小化假设理想标准(即乌托邦点)与帕累托解集之间在归一化坐标系中的距离,来从帕累托解集中选取单一最优解(Gunantara, 2018; Szparaga et al., 2019)。理想解(17553200, 0.81)使P_GrI与L_GrI之间的整体耦合度从0.80提高至0.81,同时GI总面积增加了3.21%(见图8b)。
      理想解通过ArcGIS可视化,并与总GI面积分别增加1%、2%和5%的三个最邻近解一起展示,以便于分析空间分布变化(见图9)。在四个选定解中,观察到GI实施呈现分散且小规模的模式。优化单元的比例分别为72.42%、84.14%、89.30%和94.69%,按GI实施规模递增,平均增量分别为1468.84 m²、2651.72 m²、3810.12 m²和5603.23 m²。此外,仅有2.20%、5.48%、8.94%和14.90%的优化单元被推荐进行超过10,000 m²的GI扩展,尽管增量的均值和极值有所增加。初始时,优化单元主要分布在研究区的郊区。随着GI实施规模的扩大,不仅郊区的优化单元数量进一步增加,城市内部也出现了更多的优化单元。特别是在这一过程中,研究区西南部的郊区出现了一簇大规模GI扩展的优化单元。
5.讨论
5.1 洪水易感性分布 
      本研究采用支持向量机(SVM)模型评估了机器学习模型在大规模城市化区域模拟城市洪水的有效性。SVM模型具有较高的AUC值(0.94),揭示了城市洪水易感性的空间特征,而这一特征在以往的研究中常被过度简化(Chen  et al., 2021; Zhang et al.,  2021)。位于北京市中心的城乡过渡带被识别为受相对严重城市洪水威胁的突出区域,这与Zhao et  al.(2019)的研究结果一致。尽管这些区域在过去二十年经历了快速的城市扩展,但GrI的开发进展滞后,且在此过程中自然地表面遭遇了较大程度的破坏(Tian  et al.,  2019)。根据结果,建议在雨季更加关注城乡过渡带的城市洪水预警。对这些区域洪水脆弱性的评估对于通过应用时空数据(如人口分布和兴趣点,反映经济、社会及文化活力)提供详细支持,进而最小化洪水的负面影响,具有重要意义(Nguyen  et al., 2024; Tang et al., 2024)。
5.2 城市洪水的主导因素 
      通过SHAP方法定量描述解释变量对城市洪水的影响,本研究清晰地揭示了GI和GrI在防止城市洪水方面的主导作用,以及这两大主导因素之间的非线性互补性,这一特性在以往研究中较少讨论。研究结果表明,自然地表的损失将导致对GrI投资需求的增加,尤其是在P_GI值低于0.45的单元中,这一效应更为显著。这不仅突显了在城市发展过程中有效管理GI区域的重要性,也为相关部门从综合成本的角度提供了土地管理的参考。与一些聚焦于大尺度空间的研究(Zhang et al., 2021; Zhang et al., 2020)相比,本研究中降水和地形因素对城市洪水的影响排名较低。这一结果证明了不同尺度下城市洪水机制的差异,正如Zhang et al.(2020)的研究所示。
5.3 规划实施 
      通过采用基于NSGA-II的优化框架,本研究在不同GI总实施规模下,获得了研究区内各单元的GI最优实施规模。这些基于空间的结果在城市生态扩展背景下具有重要意义。正如《北京市城市总体规划》中所指出的,到2035年,研究区所在平原地区的森林覆盖率将从2020年的30%提高到33%。本研究的结果为选择这些潜在生态空间的合适位置提供了有力支持。此外,模型所建议的分散且小规模的GI实施模式,不仅具有较高的效率,而且在考虑到大部分适宜建设的土地已被开发的情况下,也表现出可行性,进一步开发的空间相对有限。这为类似案例的GI规划提供了重要的参考和启示。
      不同区域的发展状况使得GI实施的差异化显得尤为重要。例如,在研究区中心区域,该地区经济发展强劲且土地成本较高,小规模的生态修复措施(如垂直绿化)比大范围的土地利用变更更具可行性。尽管土地利用压力较大,城乡过渡带内仍存在弥补GI实施差距的机会,尤其是通过利用尚未充分开发且具有成本效益的土地,如棕地和废弃矿场(Wu & Rowe, 2022)。考虑到生态效益,可以根据土地可用性,在郊区特别是西南郊区开发连片的GI。
      此外,需要注意的是,城市洪水防治依赖于GrI的压力与承载能力之间的平衡。尽管GI的实施已减轻了GrI的压力,但GrI发展滞后可能限制了GI扩展在降低城市洪水易感性方面的实际效果。因此,GrI的进一步发展仍然是必要的。
5.4 优势、局限性与未来研究方向 
       本研究创新性地提出了一种模型,旨在支持城市尺度上GI扩展规模的空间分配的定量决策,为GI实施与城市规划的有效结合提供了有力支持。考虑到城市建设通常是分阶段进行的,该模型在确定不同投资情境下的最优GI规划位置方面具有重要的实际价值,应进一步强调其应用意义。与复杂的物理模型相比,该数据驱动模型不仅具有较低的数据需求和较强的灵活性,还在可转移性方面具有显著优势。对于类似的平原城市,特别是那些缺乏足够样本的城市,通过该模型的迁移学习,可以迅速获取用于评估洪水易感性的地方性工具。此外,作为一种空间量化工具,该模型还为与其他定量决策框架的整合提供了可能性,例如基于GI多重生态系统服务的框架(Dong  et al., 2024; Liu et al., 2022)。
     然而,本研究仍存在以下需要解决的局限性。首先,本研究中使用的机器学习(ML)模型的稳健性可以通过增加样本数量得到改进,因为本研究使用的数据未能涵盖所有历史洪水事件,主要受到洪水监测限制的影响。随着地方性监测系统的发展,这一问题有望得到改善。此外,构建本地的水文水动力(H&H)模型生成更多样本是有效解决这一问题的方法(Huang et al., 2023)。其次,由于缺乏高精度数据,模型对城市洪水的理解存在一定的不确定性;例如,数字高程模型(DEM)和归一化植被指数(NDVI)的低分辨率可能模糊了微地形和植物截留的影响。随着观测和监测技术的不断发展,预计可以使用更精确的数据来减少这种不确定性。第三,尽管本研究引入了诸如海拔和土壤湿度指数(TWI)等因素以表征上游对单元的潜在影响,但由于机器学习模型的特性,单元之间的水文连接性仍不明确。因此,本研究仅提供了GI扩展变化对单元GrI压力影响的总体理解,这可能导致优化过程中GI位置选择的潜在偏差。未来的研究应进一步改进这一点,一些已将空间滞后引入数据驱动模型的研究为这一改进提供了可能性(Li et al., 2023)。
      除了提高模型的准确性外,提升其实际应用价值也是未来研究中应解决的另一个重要任务。应补充一些洪水事件的详细信息,如极端降水量和水深,以支持洪水强度的预测,这对于应急管理具有重要意义(Xu et al., 2023b)。尽管本文聚焦于城市尺度,但在城市洪水管理中仍应强调多尺度的方法。将源自微观尺度研究的高效GI工程模式作为决策变量,融入宏观尺度GI规划的决策支持框架,这一理念具有极大的应用前景(Dong et al., 2020; Torres et al., 2021)。此外,在不同未来气候情景下的优化研究有助于提高规划的有效性和前瞻性,因此在未来的研究中是非常必要的(Nguyen et al., 2024)。
6.结论 
      本研究提出了一种新颖的模型,以实现城市尺度上GI的定量规划,并以北京市中心为案例对模型的性能进行了评估。本研究的主要结论可以总结如下:
1)基于支持向量机(SVM)和SHAP的可解释机器学习模型有效捕捉了城市化区域内解释变量与洪水之间的非平稳性和非线性相互作用。
2)北京市中心的洪水易感性呈现显著的极化现象,城乡过渡带的洪水监测与预警应得到加强。
3)GI面积的减少将引发排水压力的非线性上升,尤其是在P_GI值低于0.45的单元中,这一压力需要通过GrI进行解决。因此,管理GI的规模应被视为防洪工作的核心任务。 
4)建议在研究区实施分散且小规模的GI模式,以平衡城市洪水管理与土地成本。在北京市中心的西南郊区,应将其作为GI实施的优先区域。
      本研究提出了一种模型,能够有效地将GI实施与城市规划相结合,解决了城市尺度上GI定量规划的技术难题,并展示了其广泛应用的潜力。本研究的成果为研究区及具有相似特征的区域提供了GI规划和土地管理的重要见解,为决策者设计有效的减洪措施奠定了基础。未来,应进一步提高模型的准确性及其实际应用价值,特别是在工程系统指导和适应未来气候变化等方面。


END


以上内容来源于八宝粥的科研日记,为学术分享,仅供科研交流,如有错误/侵权等,请联系修改或删除。联系方式:Novel_2020

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/190292