社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【论文分享】Sustain Cities Soc—通过可解释的机器学习揭示蓝绿空间景观对PM2.5暴露的非线性关系和协同减缓效应

GISer last • 4 月前 • 219 次点击  
本推文来源:董董的生态科研日记

图片

摘要

空间是基于自然的解决方案,用于减轻颗粒物污染。然而,蓝绿空间景观对PM2.5暴露风险的个体和协同缓解效应仍然了解不足。本研究采用可解释的机器学习框架,调查了蓝绿空间景观模式对中国长三角地区人口加权PM2.5暴露(PWP)的非线性关系、交互效应和异质性。我们的发现强调:(1)绿地覆盖率(G_PLAND)、平均绿地斑块大小(G_AREA_MN)、蓝色空间斑块连通性(W_CONTIG_MN)以及蓝色空间斑块之间的平均距离(W_ENN_MN)是四个最具影响力的景观指标。(2)G_PLAND和G_AREA_MN分别以40%和50公顷的阈值负影响PWP。W_CONTIG_MN(> 0.26)和W_ENN_MN(< 400米)正面影响PWP。(3)蓝绿空间景观对PWP的影响随不同的暴露水平而变化:高(蓝色空间更重要)、中(绿色和蓝色空间同等重要)和低(绿蓝空间不重要)。(4)在某些条件下,蓝绿空间的交互作用可以加强PWP的缓解(G_PLAND>40%,G_AREA_MN<12公顷,W_ENN_MN和W_CONTIG_MN分别为200米和0.31的阈值)。这些发现有助于全面规划和优化区域绿蓝空间以减轻PWP。

引言

空气污染是全球公共卫生面临的最重大的环境风险之一,威胁着人们的身心健康(Burnett et al., 2018; Cao et al., 2023)。2019年,室外空气污染造成667万人过早死亡,其中PM2.5(空气动力学直径<2.5μm的颗粒物)造成410万人死亡,占全球空气污染的61.5%和所有死亡人数的7.3%(Bai&Liu, 2024; Murray et al., 2020)。研究表明,暴露于高水平甚至可接受的空气污染会导致人们的健康问题,如心血管和呼吸道疾病(Cohen et al., 2017; Jaafari et al., 2020; Lu et al., 2015)。此外,短期和长期接触PM2.5都会显著增加全球死亡负担,其中亚洲的影响最大(Yu et al., 2024; Zhu&Shi, 2023)。

在过去的几十年里,由于能源消耗的大幅增加,中国社会经济的快速发展引发了严重的空气污染问题。自2013年以来,中国政府实施了一系列空气污染防治行动计划,环境空气质量不断改善,年平均PM2.5浓度达标的城市数量增加。然而,到2022年,全国年平均浓度为29 ug m -3,低于2021年世界卫生组织中期目标135 ug m-3的限值,但仍大大高于世界卫生组织指导水平5 ug m-3(世界卫生组织, 2021)。自2022年以来,京津冀、长三角和汾渭平原三个重点地区的PM2.5浓度没有持续改善,许多城市的年平均浓度出现反弹(中国清洁空气,2023)。因此,需要大力降低中国的颗粒物(PM)浓度。

PM主要是从多个来源直接排放的,而它也可以通过大气中发生的复杂物理化学过程间接形成。研究表明,环境PM的分布和浓度受到排放、气象、土地利用和景观格局因素的共同影响(Łowicki, 2019; Pasch et al., 2011; Shi et al., 2019)。蓝绿空间被定义为被绿色元素(如森林、草原、公园和其他植被区)和蓝色元素(如湖泊、河流、湿地和其他水体)覆盖的自然、半自然和人造区域(Jamil et al., 2024; Van Oijstaeijen et al., 2020; Yu et al., 2020)。先前的研究已经证实,这些空间对PM浓度具有特别显著的调节作用。

绿地在调节 PM 浓度和分布方面发挥着复杂的作用。植物叶子的表面允许颗粒物沉积并通过气孔部分吸收(Abhijith et al., 2017)。沉积和吸收效应可以减轻 PM 污染。然而,森林的多孔结构会影响风流和湍流,甚至产生局部逆温。这种空气动力学效应可能会抑制扩散,导致拦截或触发颗粒物的再悬浮(Buccolieri et al., 2018; Miao et al.,  2021)。这些过程也受到气象和气候因素的调节(Abhijith et al., 2017;圣地亚哥和里瓦斯, 2021)。绿地对颗粒物的整体调节作用是由植物的性状、植被的组合、绿地的二维/三维特征等决定的(Chen et al., 2016; Chen et al., 2022; Grote et al., 2016; Ren et al.,  2022) 以及气象因素。另一方面,蓝色空间主要通过改变周围的小气候(包括温度、湿度和风型)来影响 PM 的积累、扩散和沉积。PM 在重力作用下沉积在水面上。沉积速度随着相对湿度的增加而显着增加 (Janh ̈all, 2015)。与植被不同,沉积在水面上的颗粒不能重新悬浮。水体的冷却能力减慢了光化学反应,从而抑制了 PM 前体的二次形成(Lou et al., 2017; Wang et al., 2014)。此外,由于水和陆地之间的热差引起的压力梯度,大型水体可以形成湖风(Bauer, 2020)。 湖风环流可以将 PM 从陆地转移到湖泊(Davis et al., 2020),而进入湖风环流的 PM 也可能被沉降气流捕获(Hayden et al., 2011)。此外,水体还可以通过增强气流和风速来促进局部空气交换和 PM 向外扩散(Fan et al., 2017)。

蓝绿空间可以分别调节小气候条件,包括空气温度、湿度、风速和方向(Arzberger et al., 2024; Buccolieri et al., 2018; Zhao et al., 2023; Zhou et al., 2016)。它们的相互作用也对小气候产生了协同效应。研究表明,城市蓝绿空间的特定组合或空间配置具有更显著的降温效果(Zhou et al. 2023)和改善的气温-湿度条件(Zhao et al., 2021),这些好处被湖上的微风放大了(Liu et al., 2025)。微气候因素的变化会影响PM的扩散和分布(Abhijith et al., 2017; Hayden et al., 2011; Janhall, 2015; Lou et al., 2017; Santiago&Rivas, 2021; Zhou et al., 2021)。因此,蓝绿空间之间的相互作用会进一步影响PM。例如,水体引起的湿度增加会增强周围植物叶片的水分和粘性,并可能扩大吸湿性PM颗粒,从而改善PM积累并减少再悬浮(Janhall, 2015)。一些植物可以产生高生物源挥发性有机化合物(BVOC),蓝绿空间的明显冷却作用(Zhou et al., 2023)有助于减少BVOC排放和化学反应,从而抑制二次PM的形成。增加的气流有助于PM向外扩散(Fan et al., 2017)。虽然顺风植被会阻碍通风走廊,从而影响PM的扩散,但它们也可以捕获部分PM(Brantley et al., 2014)。此外,空气流量的增加可能会导致树叶上的PM重新悬浮到大气中(Nowak等人,2014)。很明显,相互作用非常复杂,蓝绿空间的空间配置可能是一个促成因素。探索蓝绿空间景观对PM浓度相互作用的研究非常有限,大多数现有研究分别考察了蓝绿空间景观的PM缓解效果。Zhao等人(2021)和Fan等人(2022)的两项研究确定了蓝绿空间景观对PM浓度的增强作用。这两项研究都是在中国武汉市的社区规模上进行的。Zhao等人(2021)发现了湖泊湿地和邻近绿地对300米缓冲区内PM缓解的耦合积极影响,Fan等人(2022)揭示了3000米内邻近蓝绿空间对城市土地利用斑块PM2.5浓度的增强作用。然而,耦合的具体方式以及这种效应是否在区域尺度上持续存在需要进一步研究。

此外,许多先前的研究探讨了蓝绿空间景观格局与PM浓度之间的线性关系。对于绿地景观,Lu等人(2018)发现森林和草地的比例与PM2.5浓度呈负相关。Li等人(2023)揭示,绿色基础设施的密度对PM2.5浓度有积极影响。然而,Lei等人(2021)发现,绿地面积、丰度和边缘与内部比率的增加显著降低了PM10浓度,但对PM2.5没有显著影响。关于蓝色空间景观,Zhou等人(2021)发现,对PM2.5的阻断作用强度与内陆城市湖泊的大小有关。Zhao等人(2021)发现,景观形状指数对PM10浓度有负面影响。Zhu和Zeng(2018)发现,分散的小型湿地比大型湿地更有利于PM缓解。相比之下,Zhu等人(2023)观察到,集中式大湖的PM2.5缓解能力明显高于离散的小湖。上述研究表明,研究结果存在差异。一个可能的原因是蓝绿空间与PM之间的复杂相互作用,线性模型无法充分表示。尽管绿地景观格局指标在这些研究中具有重要意义,但模型拟合度往往较低。通过预设和测试不同的非线性函数形式,Chen等人(2019)建立了组成绿地景观指标(如树木和草地覆盖率)与PM2.5浓度之间的相互关系。本研究确定了绿地缓解效应的阈值,并提高了模拟精度和模型拟合度。然而,绿地配置景观指标(如形状和聚集指数)与PM之间的非线性关系尚不清楚。

此外,大多数研究使用PM浓度作为目标变量,而没有考虑人类住区的影响(Lei et al., 2021; Li et al., 2023;  Łowicki, 2019)。例如,在PM浓度较高的地区,如果这些地区的人口密度也很高,PM对整体人口构成的健康风险将高于这些地区人口密度较低的地区(Yu et al., 2024)。因此,直接使用PM浓度的研究无法准确反映普通人群的暴露情况,结果可能无法提供足够的证据来支持降低总体人群暴露风险。

长江三角洲地区是中国大气污染防治的三大重点地区之一。近年来,该地区的PM2.5浓度并未达到预期的持续下降。此外,在三个关键地区中,该地区的蓝绿空间比例最高,这表明通过优化绿色和蓝色的空间规划实践,PM缓解的潜力最大。这些因素使长三角地区成为调查蓝绿空间景观模式对PM2.5暴露影响的适当案例研究。本研究以长三角地区为研究区域,采用可解释的机器学习方法,探索绿色和蓝色空间景观对人群加权PM2.5暴露的个体和交互影响。该研究旨在解决以下研究问题:(1)缓解PM 2.5暴露的最有影响力的蓝绿空间模式指标是什么?排名是多少?(2)蓝绿空间的景观组成和配置特征与PM2.5暴露之间的非线性关系是什么?如何有意义地解读它们?(3)蓝绿空间景观在减少PM2.5暴露方面是否存在显著的相互作用,如果是,具体影响是什么?(4)上述结果在不同PM2.5暴露水平下有何变化?通过全面评估蓝绿空间格局对PM2.5暴露的监管效果,本研究希望通过规划新的蓝绿区域以及优化和更新现有区域,为降低PM2.5暴露风险提供新思路。长三角地区的研究结果可能为全球拥有可比绿地和绿地资源的地区提供参考。

2.材料和方法

图1所示,该方法包括三个主要步骤:(1)生成人口加权PM2.5暴露值,量化蓝绿空间景观指标;(2)利用XGBoost和SHAP模型进行非线性关系建模和解释;以及(3)分析结果,包括相对重要性、定量效应、相互作用效应,以及这些效应和关系在不同PM2.5暴露水平下的变化。

图片

2.1.研究区域

长三角地区位于中国东部,面积35.9万平方公里。它包括一个直辖市,上海和三个省,即江苏、浙江和安徽。这个地区是中国经济最发达、人口最多的地区之一。2023年,长三角的国内生产总值约为30.5万亿美元,拥有2.38亿人口。根据中国清洁空气协会(2023)的数据,2022年长三角地区的PM2.5和O3浓度表现不佳。PM2.5的年平均浓度为31 ug m-3,远高于世界卫生组织空气质量指南水平5 ug m-3(世界卫生组织,2021年)。与去年相比,11个地级市的PM2.5浓度有所上升。另一方面,长三角地区的地方政府正在鼓励优化和扩大 绿空间规划,以充分发挥其生态和社会功能。本研究以该地区所有307个县为研究单位(图2),以2000-2020年(每五年一次)为研究时间段,探讨绿空间景观与PM2.5暴露之间的关系。

图片

2.2.数据来源和数据处理

2.2.1. 数据来源

1×1km年平均PM2.5浓度数据来自中国高空气污染物(CHAP)数据集(https://weijing-rs.github.io/product.html)(Wei et al.,  2021)。CHAP是中国地面空气污染物的长期、全覆盖、高分辨率和高质量数据集。它是通过人工智能方法开发的,利用MODIS作为主要预测器。该数据集整合了来自地面测量、卫星遥感产品、大气再分析和模型模拟的大数据。它还考虑了空气污染的空间和时间异质性。

1×1km的人口数据由LandScan全球计划提供(Sims et al., 2022)。它提供了一个全面和高分辨率的全球人口分布数据集,该数据集已广泛应用于研究和教育环境。LandScan利用最先进的空间建模技术和先进的地理空间数据源,以30弧秒的分辨率提供了有关人口计数和密度的详细信息,从而能够对全球人类住区模式进行精确和最新的了解。

所选年份的30m年度中国土地覆盖数据集(CLCD)(Yang&Huang, 2021)用于量化绿色和蓝色空间景观。该数据集来源于谷歌地球引擎平台上所有可用的陆地卫星图像。为了生成这个长期数据集,执行了一系列程序,包括随机森林分类、时空过滤和逻辑推理。该数据集的总体准确率为79.31%,与森林、水和不透水表面等主题类时间序列产品具有良好的一致性。长三角地区有七种土地覆盖类型,即农田、森林、灌木、草原、水、不透水和湿地。我们将森林、灌木和草地组合成绿地,并将水和湿地重新分类为蓝色空间。值得注意的是,灌木和草地占总面积的比例很小(<0.1%),因此大部分绿地是森林。

2.2.2.人口加权PM2.5浓度计算

我们使用人口加权PM2.5浓度(PWP)来衡量居民对PM2.5 污染的暴露风险。该模型是一种自下而上的评估,通过为更多人居住的PMv暴露按比例分配更高的权重,量化人口与PM2.5分布之间的空间相互作用。详细解释如图3所示。PWP已被广泛应用于绿地(Chen et al., 2022)、空气污染(Jbaily et al., 2022)和气候变化(Wu et al., 2023)等领域。PWP是一个负面指标,即较低的PWP表明居民接触PM2.5的风险较低,对人们的健康更好。计算公式如下:

图片

其中PWP是研究区域内每个县的PM2.5人口加权暴露量;n是1×1km网格的数量;Popi和CPM2.5,i分别表示网格i处的人口和PM2.5浓度。计算基于ArcGIS平台。

2.2.3.景观指标选择与计算

景观指标被用作描述蓝绿空间景观的结构组成和空间配置的指标。景观指标可能高度相关,并导致冗余问题(Xiang et al., 2022)。因此,大多数先前的研究基于早期的研究选择了具有代表性的指标。本研究采用探索性方法选择具有代表性的指标。首先,我们通过Fragstats 4.2计算了尽可能多的绿色空间和蓝色空间的景观指标。总共计算了62个指标,其中绿色空间31个,蓝色空间31个。其次,我们对PWP和所有景观指标进行了皮尔逊相关分析(表S1),以初步了解它们之间的关系。第三,进行皮尔逊相关分析,以检验绿色(表S2)和蓝色(表S3)空间指标之间的内在关系。第四,我们选择了(1)最相关的指标,(2)代表景观格局不同维度的指标集,以及(3)易于理解或常用的指标,因为它们在规划实践中更适用。细节请参阅附录一。表1显示了最终选定的绿色和蓝色空间景观格局指标及其描述。

图片

2.3.数据分析

2.3.1.XGBoost回归模型

本研究利用XGBoost(极限梯度提升)回归模型来评估绿空间景观格局特征对PWP的相对重要性、非线性关系和相互作用效应。XGBoost是一个可扩展的机器学习系统,通过使用梯度增强技术构建一系列连续的浅回归树(Chen&Guestrin, 2016)。该技术将弱回归树组合成一个强模型,其中每棵树都试图纠正先前树预测中的残差(Yu et al., 2020)。作为一种优化的分布式梯度提升决策树算法,XGBoost提供了几个优点,包括通过使用并行处理实现快速性能、很好地处理缺失值、在小数据集上表现良好、对异常值敏感以及防止过拟合。经过适当调整的XGBoost模型通常优于其替代方案,如随机森林(Zamani-Joharestani et al., 2019)。因此,XGBoost在相关研究领域的应用越来越多,包括空间格局对颗粒物污染的影响(Li et al., 2023; Zhang et al., 2022)、热环境(Yu et al., 2020; Zhou et al., 2022)等。

数据集分为80%用于训练,20%用于测试。采用5倍交叉验证和网格搜索方法进行参数整定。经过训练和微调后,通过均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、均值解释方差(MEV)和R2来评估XGBoost模型的性能。如表2所示,所有样本的R2为44.4%,据信这足以进一步解释模型(Zhou et al., 2022)。

图片

2.3.2.SHAP解释方法

我们采用SHAP(SHapley Additive exPlanations)方法来解释XGBoost回归的输出,这是一种解释机器学习模型输出的博弈论方法。与其他解释方法相比,SHAP方法具有提供更一致和局部准确的归因值的优点,这些归因值针对每次预测都是个性化的(Lundberg&Lee, 2017)。它通过Shapley值量化每个自变量对因变量的影响。特征i的Shapley值基于公式(1)计算:

图片

其中∅i表示第i个特征的贡献,N表示具有N个特征的数据集,f(SU{i})和f(S)表示模型结果用带或不带有特征i的模型结果表示。然后采用加性特征插补方法计算SHAP值:

图片

其中g代表解释模型;z'∈{0,1}M表示在计算中是否存在特征(z'=1)h或者(z'=0),M是输入特征的数量;ϕ0是特征i的基值,ϕi是特征i的Shapley值。

3 结果

3.1. PWP的时间与空间模式

2000年至2020年期间,黄河流域PWP的时间变化如图4(a)所示。2000年,年平均值为45.4ug/m3,高于世界卫生组织临时目标1阈值(35ug/m3)。然后年平均PWP呈上升趋势,到2005年达到55.7ug/m3,到2010年达到58.9ug/m3。Bai和Liu(2024)将2013年确定为全国PWP的一个转折点。2013年,中国政府实施了《大气污染防治行动计划》(中华人民共和国国务院,2013年)。此后,PWP显示出显著下降,特别是在2015年至2020年期间。每年箱线和须的长度相对相似,表明所选五年内PWP的变异性和分散度接近。中位数都更接近箱子的上限值(即左偏),表明大多数县显示出高PWP值。

图片

图4(b)进一步展示了江苏、浙江、安徽和上海PWP的时间变化。研究期间,每个省份的PWP值都呈现出先上升后下降的趋势,其中江苏和上海的降幅最为明显。江苏和安徽的县份PWP值较高。这两个省份所有年份的PWP平均值范围从37到64ug/m3不等,总体平均值都在53ug/m3左右。然而,江苏的箱线图比安徽的要短,这意味着江苏的县份PWP值更为集中,而安徽则更加分散且变化较大。浙江的县份拥有最低但最不稳定的PWP值,这一点通过相对宽的四分位距可以看出。

图5展示了2000年、2005年、2010年、2015年和2020年黄河流域(YRD)地区降水总量(PWP)的空间分布。总体而言,北部地区的PWP显著高于南部地区。特别是西北部的一些县在相应年份的PWP最高,其中2010年的值最高。沿海地区的PWP值通常低于内陆地区,例如江苏东北部和浙江东南部的区县。

图片

3.2 相对重要性(RI)分析

3.2.1. 变量的相关性系数

计算了所有变量的SHAP值,以调查蓝绿空间景观指标对PWP的相对贡献。图6(a)是通过取每个变量的平均绝对值得到的条形图。它显示G_PLAND和G_AREA_MN是评估的所有变量中最有影响力的指标。这两个绿地指标占所有蓝绿空间景观指标总贡献的39.8%。W_CONTIG_MN和W_ENN_MN分别排名第三和第四。这两个蓝色空间特征占所有蓝绿空间指标贡献的25.7%。在所有指标的总贡献中,绿地指标占58.9%,蓝色空间指标占41.1%。上述结果表明,绿地景观对PWP的贡献大于蓝色空间景观。此外,面积指数对所有绿地指标中的PWP影响最大,而形状和聚合指数对所有蓝色空间指标中的PWP影响最大。

图片

图6(b)是一个蜂巢图,它展示了每个样本中每个特征的SHAP值。通过颜色可以观察到特征值的大小与预测影响之间的关系,同时显示其特征值的分布。在G_PLAND的情况下,图中右侧用蓝色表示的观测数据表明G_PLAND与PWP之间存在负相关。这意味着在研究区域内,绿地比例越大,PWP越低。G_AREA_MN呈现出与G_PLAND相似的模式,表明增加绿地斑块的平均大小有助于减少居民暴露于PM2.5的风险。W_CONTIG_MN和W_ENN_MN与PWP之间的关系是正的。这表明随着水斑块形状的空间连通性和水斑块之间的平均距离的增加,PWP也会相应增加。此外,其他指标也显示出对PWP有明确的影响。例如,G_SHAPE_MN和W_SHAPE_MN通常对PWP产生积极影响,这表明蓝绿空间斑块的形状越简单,PWP就越低。

3.2.2. 不同PWP组中变量的RI

鉴于PWP值的范围(19.15至78.64ug/m 3),我们将数据样本分为三组:低PWP组(低于40ug/m3)、中PWP组(40-60ug/m3)和高PWP组(60-80ug/m3)。然后我们重新运行了XGBoost和SHAP模型,针对每个组别。RI的结果和模型评估结果分别在图7表2中呈现。我们发现,蓝绿空间景观指标对PWP的贡献在不同组别之间有所变化。高PWP组的模型具有最低的平均平方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)值,以及最高的R2值。这表明当PWP处于高水平时,蓝绿空间景观对PWP的预测能力最大。在这个组别中,蓝色空间指标具有主导重要性。最有影响力的特征依次是W_ENN_MN、W_PD和W_CONTIG_MN。在中组中,蓝绿空间的影响大致相等。G_AREA_MN和W_CONTIG_MN对PWP的影响最为显著,其次是W_PD和G_PLAND。在低PWP组中,蓝绿空间景观对PWP的预测能力非常差。

图片
图片

3.3 非线性关联分析

通过SHAP依赖图可视化了SHAP值与每个变量之间的关系,这有助于探索非线性模式和阈值效应。

3.3.1. 绿色空间景观指标的影响

图8(a-g)展示了每个绿地指标与SHAP值之间的关联。G_PLAND与PWP显示出强烈的负相关,意味着在绿地覆盖率较高的县,居民暴露于PM2.5的风险较低。然而,当G_PLAND达到约40%时,这种效应似乎趋于饱和,表明一旦有40%的土地被绿地覆盖,进一步增加绿地覆盖率在减少居民暴露于PM 2.5方面的效果要小得多。G_AREA_MN也对PWP有负面影响。当G_AREA_MN从零增加到大约50公顷时,这种效应尤为明显。当G_AREA_MN达到50公顷的阈值时,它在抑制PWP方面的作用变得稳定。其他绿地指标对预测的影响远小于G_PLAND和G_AREA_MN。G_SHAPE_MN与PWP显示出U形关系,当G_SHAPE<1.25时观察到负的且相对较弱的影响,而在它超过1.25后显示出正的且强烈的影响。这表明绿地斑块的平均形状复杂性在1.0到1.25之间(即形状更简单)时可能有助于抑制PWP,但当它超过1.25时反而会增加PWP。G_AI对PWP有负面影响。当G_AI低于80时影响最小,在80到90之间逐渐增加,并在大约90时达到峰值,之后趋于稳定。这表明绿地斑块聚合水平超过90并不会导致PWP进一步降低。G_ENN_MN对PWP有总体负面影响,但当绿地斑块之间的平均距离从0到近3000米变化时,这种关系是弱且波动的。G_NP与PWP显示出正但弱的关系。作为所有森林指标中最不具影响力的因素,G_PD在模型中与PWP没有明显的相关性。

图片

3.3.2. 蓝色空间景观指标的影响

图8(h-n)展示了每个蓝色空间指标与SHAP值之间的关系。W_CONTIG_MN对所有蓝色空间指标中PWP的影响最为显著。当W_CONTIG_MN的值<0.26时,它对PWP呈现负但温和的影响,然后当其超过0.26时,它与PWP显示出强烈且线性的正相关。W_ENN_MN对PWP有显著的正面影响。随着蓝色空间斑块之间的平均边缘到边缘距离的增加,居民暴露于PM2.5的风险也随之增加。然而,当平均距离超过大约400米时,这种效应减弱并变得不稳定和分散。W_SHAPE_MN在值<1.25时对PWP没有显著影响,在1.25-1.35之间表现出正面影响,而在大于1.35的值时则呈现出负面影响。W_NP与PWP之间的关联并没有展现出明显的模式。W_PD对PWP的影响先是增加然后减少。也就是说,如果每平方公里的斑块数量不超过2.5个,那么斑块数量的增加将导致PWP值的相应增加。这意味着蓝色空间斑块越破碎,它们在缓解PWP方面的效果就越差。当W_PD大于2.5时,这种关系就颠倒了。W_AREA_MN对PWP的影响较弱,显示出随时间波动而上升的趋势。W_AI对PWP的影响较小且不太规律。

3.3.3.不同PWP组中森林和水变量的影响

图9通过SHAP依赖图显示了高和中PWP组最重要特征与PWP之间的关系。由于低PWP组的性能较差,因此没有对其进行介绍或讨论。在高PWP组中(图9(a-d)),四个蓝色空间指标对PWP有很强的影响。当W_ENN_MN小于230m时,W_ENN_MN的变化对PWP没有显著影响。当W_ENN_MN大于230m时,其对PWP的影响与模型1一致,表明主要是积极的影响。W_PD对PWP表现出主要的负面影响,在值超过约2后出现稳定。由于W_CONTIG_MN值在该组中主要大于0.26,因此W_CONTIG_MN对PWP具有积极影响。与模型1不同,W_NP在此组中显示出明显的负面影响,即PWP随着水体斑块数量的增加而减少。在中等PWP组中(图9(e-h)),G_AREA_MN和W_CONTIG的影响显示出与模型1相似的趋势。而W_PD对PWP显示出主要的积极影响,当它超过2时趋于稳定。在这个组中,G_PLAND显然对PWP有负面影响,而且与模型1不同,它在40%后不会饱和。

图片

3.4.交互效应分析

图10显示了蓝绿空间景观指标对PWP的相互作用效应。X轴表示四个最有影响力的特征的值,即G_PLAND、G_AREA_MN、W_ENN_MN和W_CONTIG_MN。颜色代表右侧标注的对应蓝绿空间 景观特征的数值(红色表示高值,蓝色表示低值)。散射的垂直分散程度反映了两个变量之间相互作用的程度。由于PWP是一个反向指标,我们主要关注SHAP值较低的区间。

图片

10(a)图S1所示,当G_PLAND大于40%时,W_SHAPE_MN和W_CONTIG_MN的值越高,SHAP值越低,这意味着G_PLAND与两个蓝色空间指标的相互作用抑制了PWP。根据颜色散射的垂直色散,W_SHAPE_MN的相互作用效应显著,表明当蓝色空间斑块的平均形状更复杂,绿色空间覆盖率大于40%时,减少PWP的综合效应更强。G_PLAND和W_CONTIG_MN对PWP的相互作用效应相对较弱,在约50%-87%的区间内略有增加。剩余的蓝色空间变量与G_PLAND之间的交互作用并不明显。

图10(b)图S2显示了G_AREA_MN和蓝色空间指示符对PWP的相互作用效应。当G_AREA_MN小于12公顷时,W_NP的增加有助于PWP的减少。当G_AREA_MN大于12公顷时,这种效应减弱并逆转,逐渐消失。另一个影响是W_SHAPE_MN。当G_AREA_MN小于12公顷时,观察到W_SHAPE-MN值越小,PWP越低。

W_ENN_MN显示了PWP与绿地指标的多种相互作用效应(图10c)。当W_ENN_MN相对较小(低于200米)时,G_PD、G_NP和G_AI的降低以及G_ENN_MN的增加促进了其降低PWP的能力(图S3)。这表明,当蓝色空间斑块相对靠近时,当绿色空间斑块距离更远、碎片更少或聚集更少时,减少PWP的综合效果会增强。然而,当W_ENN_MN相对较大(超过200米)时,效果减弱并逆转,只有略高的G_AI和低的G_ENN_MN有助于进一步缓解PWP。也就是说,在蓝色空间斑块之间平均距离较长的地区,当绿色空间斑块更加聚集时,减少PWP的综合效果会被放大。

当W_CONTIG_MN低于0.31时,G_PD和G_NP的降低促进了PWP的降低(图10d图S4)。当W_CONTIG_MN高于0.31时,情况正好相反。W_CONTIG_MN和其他绿地指标之间没有发现对PWP的显著交互作用。

4 讨论

4.1.绿地和绿地景观指标对PWP的影响及其相对重要性

本研究确定了对PWP影响最大的四个绿地和绿地景观指标,以及每个指标与PWP之间的相应非线性关系。在所有指标中,G_PLAND和G_AREA_MN对PWP的负面影响最大。类似的发现包括Zhan等人(2024),他们发现G_PLAND与PM2.5暴露风险的关联范围比形状、边缘和聚集指标更广。Cao等人(2024)和Jaafari等人(2020)发现,林地百分比和绿地总面积分别与PM2.5浓度呈负相关。Łowicki(2019)和Yang等人(2023)的研究表明,绿地的平均大小分别与PM2.5浓度呈中度和高度负相关。 我们的研究进一步确定了这两个指标的阈值。我们发现,当G_PLAND和G_AREA_MN分别超过约40%和50公顷时,这两个指标的进一步增加不会导致PWP的进一步降低。G_PLAND的结果与Chen等人(2019)的研究结果非常一致,他们将这一阈值确定为30-40%左右。可能的原因包括,当G_PLAND和G_AREA_MN相对较小时,植被的沉积和吸收作用占主导地位,绿地引起的局部环境变化可能会降低PM水平(Abhijith et al., 2017; Chen et al., 2019)。随着绿地覆盖率和斑块面积的增加,可能会吸引更多的居民定居。然而,当绿地覆盖率和斑块尺寸相当大时,绿地水平和垂直结构形成的空气动力学效应可能会对PM的扩散造成阻碍(Buccoiri et al., 2018),这将部分抵消增加的吸收和沉积。由于森林覆盖率高,持续吸引大量人口变得具有挑战性。

W_CONTIG_MN和W_EN_MN是最具影响力的蓝色空间指标。由于水的加湿和冷却能力,水体可以促进PM的沉积过程,提供的开放空间水体也有助于PM的分散。之前的研究证实,较大的水面面积具有更好的PM缓解效果(Zhou et al., 2021; Zhu&Zhou, 2019)。我们的结果表明,W_CONTIG_MN是最重要的蓝色空间指标。W_CTIG_MN越低,居民接触PM2.5的程度越低。CONTIG_MN是一种形状度量,根据其含义和公式,斑块内单元格的水平和垂直关系的权重大于单元格的对角线关系(Lagro, 1991)。低平均CONTIG值表明斑块内的细胞具有较差的空间连通性,这意味着蓝色空间斑块形状较少聚集,更分散、线性或分支等。这些类型的水域或湿地斑块更有可能形成风洞,有助于PM的扩散,并为人类活动提供更多的滨水区。W_ENN_MN是第二个关键的蓝色空间指标。蓝色空间斑块之间的平均距离越近,可能意味着蓝色空间斑块的数量越多,该地区水体和湿地的连通性增强,这不仅会吸引人类居住,也有利于空气流动,从而促进PM的扩散。这一结果与Zhu等人(2023)的研究结果相当,朱等人发现集中式大湖的PM2.5缓解能力远强于离散的小湖。

此外,有两点值得注意。首先,之前的研究倾向于选择更常用的指标,如CA、LSI或AI,来描绘绿色和蓝色空间的景观模式。我们的研究证明,其他景观指标,如邻近度指数或欧几里德最近邻距离指数,可能比常用的指标具有更大的预测能力。其次,我们的结果表明,与通过冷却和加湿减少PM的作用相比,蓝色空间通过促进空气流动在减少PM方面的作用也很重要。

4.2.不同PWP水平下,绿地和绿地景观对PWP的影响各不相同

第3.3.3节发现绿色和蓝色空间景观对PWP的影响存在异质性。在PWP值较高的县(60-80μg/m3),蓝色空间指标对PWP的影响最大。在PWP值中等(40-60μg/m3)的县,蓝绿空间指标具有同等重要的影响。然而,对于PWP值较低(低于40μg/m3)的县, 蓝绿空间指标对PWP的影响很小。这些发现与Cong等人(2018)的研究结果部分一致,他们发现,当空气受到严重污染时,湿地对PM2.5的阻断率最高;当空气受到中度或轻度污染时,阻塞率降低;当空气质量得到改善时,森林的阻断率更高。Zhu等人(2023)证实,密集的水网可以在重污染事件中降低PM2.5浓度。Zhan等人(2024)还发现,绿地对PWP的缓解作用受到PWP水平的影响,PM2.5暴露与绿地景观之间的关联在PWP水平较高的年份不如其他年份明显。可能的解释包括当PM2.5浓度较高时,植被的沉降和吸收效应可能达到饱和状态,其空气动力学效应可能产生反作用,导致绿地整体减缓效果减弱。然而,在这种情况下,由于水体的加湿和冷却能力(Xiao et al., 2015)以及湖风环流效应(Pasch et al., 2011),水体缓解PM2.5的能力变得占主导地位。当PM2.5浓度处于中等水平时,森林在减少PM方面的作用越来越明显,再加上水指标,PWP显著降低。

4.3 蓝绿空间对PWP的相互作用效应

第3.4节证实了蓝绿空间景观指标对PWP的相互作用效应,这与Zhao等人(2021)一致,他发现湖泊湿地和邻近的绿色植物可以协同降低PM浓度。具体来说,我们的结果进一步表明,当G_PLAND达到约40%的饱和阈值时,提高蓝色空间斑块的形状复杂性可以进一步促进PWP的缓解。一种可能的解释是,当绿地覆盖率达到一定水平时,水体的形态越复杂,就可以形成越多的通风廊道,从而促进空气流动和PM扩散(Fan et al., 2017)。另一种可能的解释是,形状复杂的水体边缘较长,因此更多的植物暴露在水中。靠近水体的植物叶子更潮湿、更粘稠,这会增加PM的积累(Janh¨all, 2015)。此外,较长的水边也可能吸引更多的人类定居。

研究结果还表明,当W_ENN_MN小于约200m时,更少、更分散的绿地斑块将有助于进一步降低PWP;当W_ENN_MN大于200 m时,情况正好相反。可以假设,在水网密集的地区(W_ENN_MN较小),水体周围的PM2.5浓度可以通过冷空气流动,在局部空气循环下将PM带到邻近地区(Wu et al., 2015; Zhao et al., 2021)。密集和聚集的绿地可能会阻碍气流和PM向高层大气的扩散,从而抑制PM2.5的稀释(Fan et al., 2017; Zhao et al., 2021)。然而,在水体较远或较少的地区(W_ENN_MN较大),绿地在缓解PM2.5方面的作用变得更加明显。提高绿地聚集水平将有助于减少PWP。

总之,当满足特定条件时,蓝绿空间景观的相互作用可以增强PWP的缓解。如图11所示,当绿地覆盖率大于40%或平均绿地斑块大小小于12公顷时,修改蓝色空间的空间配置可以进一步降低PWP。优化绿地景观格局也有助于蓝色空间景观格局缓解PWP;然而,绿地景观格局的变化方向因蓝色空间斑块的平均距离和邻接水平而异。

图片

4.4.对蓝绿空间规划和设计的影响

根据我们的研究结果,推荐了几种常见的规划、设计和优化策略,以降低长三角地区居民的PM2.5暴露风险。首先,一般来说,增加绿地覆盖率和绿地斑块面积是降低居民PM2.5暴露的最直接和最有效的方法,特别是对于绿地覆盖率低于40%或绿地斑块平均面积<50公顷的县。其次,建议不同PM2.5暴露水平的县采取具体和有针对性的绿地和绿地规划设计策略。对于暴露程度较高的县,应首先考虑水体的空间配置;对于中等暴露水平的县,应根据结果综合考虑蓝绿空间的空间构成和配置;对于曝光水平较低的县,除了蓝绿空间优化外,还应探索其他策略。第三,通过蓝绿空间的综合规划和设计,可以进一步减少PM2.5的暴露。例如,当绿地覆盖率达到约40%时,水体的形状应该更复杂。在绿地斑块平均面积<12公顷的地区,增加水体的数量并降低其形状复杂性是有益的。在水网密集的地区,绿地斑块的分布应该更加分散,而在水体密度较低的地区,绿带斑块可以更加聚集。

4.5.局限性和未来研究

这项研究有几个局限性。首先,这项研究侧重于蓝绿空间的缓解作用。然而,PM 2.5的暴露受到许多因素的影响,包括社会经济因素和环境因素。社会经济因素,如高GDP,通常与导致更大PM2.5排放的高强度经济活动有关,而高GDP的城市对更多人口具有吸引力,这两者都会增加PM2.5的暴露。环境条件(纬度、地形、气象条件等)也是重要因素,因为它们影响人类居住和PM2.5的分布和扩散。未来的研究应通过纳入这些协变量来进一步研究其机制。其次,本研究主要关注绿色和蓝色空间的二维空间特征。蓝绿空间的三维特征(植被的高度和体积、空间的开放性等)、自然质量(植被的生长、水的清除等)和社会质量(可达性、美学、维护等)也可能影响PM2.5暴露。未来的研究应尝试纳入这些维度,以进行更深入和全面的分析。第三,研究区域和样本量相对有限。除长三角地区外,进一步的研究可以将范围扩大到其他两个重点地区(京津冀地区和汾渭平原)或其他地区,以制定更完整、更具区域针对性的蓝绿空间规划和优化策略。最后,PM2.5、人口和土地覆盖数据的时空分辨率相对较低。如果可能的话,未来的研究应该使用更高分辨率的数据和更小的研究单位(如街道和乡镇)来更全面地描述和分析变量之间的关系,并更好地利用机器学习算法处理大型数据集的能力。使用PM2.5暴露的现场观测和蓝绿空间的人类尺度量化进行邻里尺度分析也将是这项区域尺度研究的宝贵补充。

5 结论

本研究利用多源大数据,提出了一个XGBoost SHAP机器学习框架,分析2000-2020年期间中国长三角地区绿色和蓝色空间景观对居民PM2.5暴露的个体和交互影响。

主要发现包括:(1)G_PLAND、G_AREA_MN、W_CONTIG_MN和W_ENN_MN被确定为缓解PWP的四个最有影响力的景观指标。具体来说,G_PLAND和G_AREA_MN对PWP的负面影响分别在40%和50ha的阈值达到饱和。W_CONTIG_MN(0.26以上)和W_ENN_MN(<400m)对PWP有积极影响。(2)绿地和绿地景观格局对PWP的影响在不同的PWP水平上有所不同。在PWP值较高的县(60-80μg/m3),蓝色空间景观具有主导作用。在PWP水平中等(40-60μg/m 3)的县,蓝绿空间景观的缓解效果相似。然而,在PWP水平较低(<40μg/m3)的县,蓝绿空间景观不能很好地解释PWP的变化。(3)只要满足特定条件,蓝绿空间景观的相互作用效应可以加强PWP的缓解。对于绿地,如果覆盖率超过40%或平均斑块面积<12公顷,调整水体的形状复杂性和数量可以进一步促进PWP的缓解。对于蓝色空间,具体的绿色空间优化策略是有益的,具体取决于水体的平均距离(阈值为200米)和邻接水平(阈值为0.31)。

因此,建议各县区首先明确自己的绿地和绿地景观格局以及PWP水平。然后,可以根据结果制定具体的规划策略,优化绿地和绿地空间格局。此外,我们的研究结果为减少中国长三角地区居民接触PM2.5提供了切实可行的建议,同时也为全球其他地区提供了参考价值。

引用

Wei Cao, Liyan Wang, Rui Li, Wen Zhou, Deshun Zhang. Unveiling the nonlinear relationships and co-mitigation effects of green and blue space landscapes on PM2.5 exposure through explainable machine learning, Sustainable Cities and Society, 2025, 122, 106234.

https://doi.org/10.1016/j.scs.2025.106234.




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184032