本文针对城市基础设施不平等评估中环境因素被忽视的现状,提出了一种融合可解释机器学习的数据驱动方法。研究以美国五大都市区(休斯顿、达拉斯、洛杉矶、芝加哥、底特律)为案例,通过XGBoost模型和SHAP解释技术,量化了道路、铁路、住房年龄、公园、步行性与POI密度六类基础设施特征对空气污染和极端热环境危害的贡献度,进而构建了整合环境考虑的基础设施供应指数。结果表明,基础设施扩张存在环境阈值效应(如铁路覆盖率超10.68%将加剧热风险),传统评估方法高估了高收入区基础设施水平,而新方法更精准揭示了低收入社区的环境不公。本研究为协调基础设施发展与环境正义提供了科学工具。
(1) 如何量化基础设施特征对环境危害(空气污染、极端热)的非线性影响?
(2) 如何基于数据驱动方法确定多基础设施系统的综合供应指数权重?
(3) 环境整合型基础设施评估如何揭示空间与收入维度的不平等?
(4) 机器学习能否识别基础设施供应的环境阈值以指导可持续规划?
城市基础设施不平等研究长期忽视其环境外部性,传统评估方法多采用等权重或主观赋权,难以捕捉基础设施过度集中引发的热岛效应、污染加剧等问题。随着环境正义议题兴起,需将环境危害纳入基础设施供应评估框架。本研究通过可解释机器学习,解析基础设施与环境的复杂关系,为优化城市发展策略提供新视角。
① 研究区域与数据
选取美国五大代表性都市区:休斯顿(快速扩张型)、达拉斯(新兴城市)、洛杉矶(高密度蔓延)、芝加哥(成熟基础设施)、底特律(衰退转型)。数据包括:
基础设施特征:高流量道路、铁路、住房年龄(1980年前占比)、休闲公园、步行指数(国家步行指数)、POI密度(SafeGraph数据),空间单元为人口普查区。
环境危害指标:空气污染(PM2.5超标天数均值)、极端热(年极端热事件天数),源自CDC环境负担模块。
社会经济数据:社区中位收入(美国社区调查)。
② 机器学习模型构建
使用XGBoost分类环境危害水平(K-means聚类分为高/低风险),输入6类基础设施特征,80%数据训练,20%测试,SMOTE处理类别不平衡。
通过SHAP分析特征贡献度,识别基础设施的环境阈值(如SHAP依赖图中曲线与x轴交点)。
权重计算:特征重要性经Softmax归一化,基础设施供应指数公式为:
③ 不平等评估
采用Pandey等(2022)不平等指数:
计算空间与收入维度的基尼系数式不平等。
① 基础设施特征的环境贡献度
道路与铁路普遍呈正贡献(阈值存在):休斯顿铁路阈值10.68%,超阈值后SHAP值转正。
公园与新房占比负相关环境风险:公园扩张持续降低热危害(无阈值)。
特征重要性城市差异大:芝加哥铁路权重最高(0.28),达拉斯最低(0.05)。
② 环境整合指数与传统指数对比
洛杉矶案例中,传统评估下高水平区67.21%在新方法中转为低水平,因这些区域基础设施过度集中加剧环境危害。
空间不平等指数:达拉斯最高(0.352),洛杉矶最低(0.277)。
③ 收入不平等
高收入社区基础设施供应指数比低收入社区高20%(洛杉矶差距达27%)。
达拉斯收入不平等最显著,休斯顿最弱。
(1) 方法创新性
XGBoost+SHAP解决了传统线性模型无法捕捉的非线性关系,如道路密度的阈值效应。
数据驱动赋权避免了AHP等方法的主观偏差,权重反映环境危害贡献度。
(2) 政策启示
基础设施规划需设置环境容量上限(如道路覆盖率阈值),避免过度集中引发热岛效应。
低收入社区应优先布局公园等负排放设施,通过绿色基础设施补偿环境风险。
(3) 局限性与展望
未涵盖全部基础设施类型(如能源网络),未来可扩展多源数据。
阈值识别仅基于单特征分析,需进一步研究多特征交互效应。
(1) 基础设施扩张存在环境阈值,道路/铁路超限将加剧热污染风险。
(2) 环境整合指数揭示传统方法掩盖的低收入社区基础设施赤字。
(3) 机器学习赋权能精准量化不同城市基础设施的环境贡献差异。
(4) 可持续规划需平衡设施供给与环境正义,优先投资高风险区绿色改造。
Li, B., & Mostafavi, A. (2025). Incorporating environmental considerations into infrastructure inequality evaluation using interpretable machine learning. Computers, Environment and Urban Systems, 120, 102301. https://doi.org/10.1016/j.compenvurbsys.2025.102301
以上内容来源于SE-System Lab,为学术分享,仅供科研交流,如有错误/侵权等,请联系修改或删除。联系方式:Novel_2020