德克萨斯农工大学CEUS提出！利用可解释的机器学习方法将环境因素纳入基础设施不平等评估中

📌导读

基础设施是城市的骨干，但不平等的供给会长期影响居民福祉与环境可持续性。现有评估方法存在两大局限：一是仅关注设施数量，忽略其带来的环境负担（如道路增加热岛与污染）；二是权重分配要么采用等权重，要么依赖主观的专家打分（如AHP），易引入偏差。为填补这些空白，本研究提出数据驱动的可解释机器学习框架，以空气质量和极端高温为环境危害指标，用XGBoost+SHAP模型客观量化各基础设施特征对环境的贡献度，并以此作为权重构建环境集成的供给指数。通过对美国五大都市区（休斯顿、达拉斯、洛杉矶、底特律、芝加哥）的应用，研究发现传统方法会高估高环境风险区域的供给得分，且基础设施供给存在显著的空间与收入双重不平等，为城市规划提供了更精准的环境正义评估工具。

论文文件下载链接：

1-s2.0-S0198971525000547-main.pdf

🌍研究背景

充足的基础设施是城市发展的基础，但不平等供给会加剧社会隔离与健康风险。现有研究多假设“设施越多越好”，却忽略过度硬化路面带来的噪音、污染与热岛效应；同时，多设施综合评估时，等权重或主观赋权（如AHP）无法反映不同设施对可持续发展的差异化贡献。例如，道路与铁路可能增加环境负担，而公园与步行性可降低风险，传统方法未区分这些差异，导致评估结果偏离环境正义目标。因此，需要一种客观、动态的评估框架，整合环境成本与设施效益。

🌳研究的科学问题

如何将环境因素纳入基础设施供给评估，纠正传统方法“重数量、轻环境”的偏差？
如何用数据驱动方法客观确定多类基础设施特征的权重，避免主观赋权的局限性？
环境集成的基础设施供给指数在空间（不同城市、不同普查区）和收入层面呈现怎样的不平等特征？

📊研究方法

研究采用三步走流程：① 特征-环境关系解析：用XGBoost模型以6项基础设施特征（高流量道路、铁路、房龄、休闲公园、步行性、POI密度）为输入，预测环境危害（高/低，基于PM2.5超标天数与极端高温天数），通过十折交叉验证与SMOTE处理类别不平衡，优化模型性能；

② 权重与阈值确定：用SHAP方法解释模型，以各特征对环境的贡献度为权重，并通过SHAP依赖图识别特征的“最优阈值”（超过阈值则设施从降低风险转为增加风险）；

③ 供给指数与不平等测量：构建环境集成的供给指数（加权求和各特征与阈值的偏差），与传统等权重指数对比；用Pandey等人提出的不平等指数，测量五大城市普查区间的空间不平等，以及不同收入组的收入不平等。

💬研究结果

基础设施特征的环境贡献具有城市异质性：特征重要性排名因城市而异，例如铁路在芝加哥贡献最高，在达拉斯最低；步行性与POI密度的影响无统一规律，需结合城市结构具体分析。

部分特征存在环境阈值：道路与铁路的贡献随供给增加先降后升，超过阈值（如休斯顿铁路阈值为10.68%）会显著增加环境风险；公园与房龄（新房比例）的贡献始终为负（供给越高，环境风险越低），无阈值效应。

传统方法存在评估偏差：环境集成指数与传统等权重指数的空间分布差异显著——传统方法将67.21%的高供给区域误判为低环境风险，而实际这些区域的环境负担更高。

空间不平等普遍存在：五大城市的不平等指数介于0.277（洛杉矶）至0.352（达拉斯）之间，均为中等程度不平等，达拉斯的空间差异最大，洛杉矶最小。

收入不平等显著：高收入普查区的供给指数比低收入区高27%（洛杉矶），且传统指数未捕捉到这一差异，环境集成指数更能反映低收入群体的环境劣势。

💬研究讨论

第一，研究的五大核心贡献：① 首次将环境因素系统纳入基础设施不平等评估；② 识别特征阈值，纠正“越多越好”的认知偏差；③ 用机器学习捕捉设施与环境的非线性复杂关系；④ 客观权重减少主观性，提升评估科学性；⑤ 揭示空间与收入的双重不平等，完善环境正义评估维度。
第二，研究的局限性：① 受数据限制，未覆盖所有基础设施类型（如供水、医疗）；② 假设每个特征最多一个阈值，实际可能存在多个阈值；③ 模型性能受采样与参数选择影响，泛化性需进一步验证；④ 仅考虑收入不平等，未涵盖种族、健康负担等其他社会维度。

💬研究结论

第一，本研究提出的环境集成基础设施评估框架，有效解决了传统方法忽略环境成本的缺陷，为可持续城市规划提供了数据驱动的工具。
第二，通过可解释机器学习客观确定特征权重，避免了主观赋权的偏差，且识别出的特征阈值可指导基础设施的合理规模，避免过度建设。
第三，基础设施供给存在空间与收入的双重不平等，传统评估方法会误判高环境风险区域的供给水平，掩盖低收入群体的环境不公。
第四，该框架可推广至不同城市，帮助决策者精准识别供给短板，优先投资兼具社会效益与环境可持续性的基础设施。

🔸未来研究展望

第一，扩展基础设施类型，纳入更多环境与社会维度（如供水、医疗、种族、健康脆弱性），完善不平等评估的全面性。
第二，研究多阈值场景，提升特征最优供给水平识别的精准度。
第三，开展敏感性分析，验证模型在不同城市与数据条件下的稳定性。
第四，结合利益相关者参与式评估，将数据驱动结果与本地知识融合，形成更具落地性的规划策略。

原文引用格式

Li, B., & Mostafavi, A. (2025). Incorporating environmental considerations into infrastructure inequality evaluation using interpretable machine learning. Computers, Environment and Urban Systems, 120, 102301

END

以上内容来源于SE-System Lab，为学术分享，仅供科研交流，如有错误/侵权等，请联系修改或删除。联系方式：Novel_2020