基础设施是城市的骨干,但不平等的供给会长期影响居民福祉与环境可持续性。现有评估方法存在两大局限:一是仅关注设施数量,忽略其带来的环境负担(如道路增加热岛与污染);二是权重分配要么采用等权重,要么依赖主观的专家打分(如AHP),易引入偏差。为填补这些空白,本研究提出数据驱动的可解释机器学习框架,以空气质量和极端高温为环境危害指标,用XGBoost+SHAP模型客观量化各基础设施特征对环境的贡献度,并以此作为权重构建环境集成的供给指数。通过对美国五大都市区(休斯顿、达拉斯、洛杉矶、底特律、芝加哥)的应用,研究发现传统方法会高估高环境风险区域的供给得分,且基础设施供给存在显著的空间与收入双重不平等,为城市规划提供了更精准的环境正义评估工具。
充足的基础设施是城市发展的基础,但不平等供给会加剧社会隔离与健康风险。现有研究多假设“设施越多越好”,却忽略过度硬化路面带来的噪音、污染与热岛效应;同时,多设施综合评估时,等权重或主观赋权(如AHP)无法反映不同设施对可持续发展的差异化贡献。例如,道路与铁路可能增加环境负担,而公园与步行性可降低风险,传统方法未区分这些差异,导致评估结果偏离环境正义目标。因此,需要一种客观、动态的评估框架,整合环境成本与设施效益。
如何将环境因素纳入基础设施供给评估,纠正传统方法“重数量、轻环境”的偏差?
如何用数据驱动方法客观确定多类基础设施特征的权重,避免主观赋权的局限性?
环境集成的基础设施供给指数在空间(不同城市、不同普查区)和收入层面呈现怎样的不平等特征?
研究采用三步走流程:① 特征-环境关系解析:用XGBoost模型以6项基础设施特征(高流量道路、铁路、房龄、休闲公园、步行性、POI密度)为输入,预测环境危害(高/低,基于PM2.5超标天数与极端高温天数),通过十折交叉验证与SMOTE处理类别不平衡,优化模型性能;
② 权重与阈值确定:用SHAP方法解释模型,以各特征对环境的贡献度为权重,并通过SHAP依赖图识别特征的“最优阈值”(超过阈值则设施从降低风险转为增加风险);
③ 供给指数与不平等测量:构建环境集成的供给指数(加权求和各特征与阈值的偏差),与传统等权重指数对比;用Pandey等人提出的不平等指数,测量五大城市普查区间的空间不平等,以及不同收入组的收入不平等。
第一,研究的五大核心贡献:① 首次将环境因素系统纳入基础设施不平等评估;② 识别特征阈值,纠正“越多越好”的认知偏差;③ 用机器学习捕捉设施与环境的非线性复杂关系;④ 客观权重减少主观性,提升评估科学性;⑤ 揭示空间与收入的双重不平等,完善环境正义评估维度。
第二,研究的局限性:① 受数据限制,未覆盖所有基础设施类型(如供水、医疗);② 假设每个特征最多一个阈值,实际可能存在多个阈值;③ 模型性能受采样与参数选择影响,泛化性需进一步验证;④ 仅考虑收入不平等,未涵盖种族、健康负担等其他社会维度。
第一,本研究提出的环境集成基础设施评估框架,有效解决了传统方法忽略环境成本的缺陷,为可持续城市规划提供了数据驱动的工具。
第二,通过可解释机器学习客观确定特征权重,避免了主观赋权的偏差,且识别出的特征阈值可指导基础设施的合理规模,避免过度建设。
第三,基础设施供给存在空间与收入的双重不平等,传统评估方法会误判高环境风险区域的供给水平,掩盖低收入群体的环境不公。
第四,该框架可推广至不同城市,帮助决策者精准识别供给短板,优先投资兼具社会效益与环境可持续性的基础设施。
第一,扩展基础设施类型,纳入更多环境与社会维度(如供水、医疗、种族、健康脆弱性),完善不平等评估的全面性。
第二,研究多阈值场景,提升特征最优供给水平识别的精准度。
第三,开展敏感性分析,验证模型在不同城市与数据条件下的稳定性。
第四,结合利益相关者参与式评估,将数据驱动结果与本地知识融合,形成更具落地性的规划策略。
Li, B., & Mostafavi, A. (2025). Incorporating environmental considerations into infrastructure inequality evaluation using interpretable machine learning. Computers, Environment and Urban Systems, 120, 102301
以上内容来源于SE-System Lab,为学术分享,仅供科研交流,如有错误/侵权等,请联系修改或删除。联系方式:Novel_2020