社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

德克萨斯农工大学CEUS提出!利用可解释的机器学习方法将环境因素纳入基础设施不平等评估中

生态遥感前沿 • 2 月前 • 137 次点击  

📌导读

基础设施是城市的骨干,但不平等的供给会长期影响居民福祉与环境可持续性。现有评估方法存在两大局限:一是仅关注设施数量,忽略其带来的环境负担(如道路增加热岛与污染);二是权重分配要么采用等权重,要么依赖主观的专家打分(如AHP),易引入偏差。为填补这些空白,本研究提出数据驱动的可解释机器学习框架,以空气质量和极端高温为环境危害指标,用XGBoost+SHAP模型客观量化各基础设施特征对环境的贡献度,并以此作为权重构建环境集成的供给指数。通过对美国五大都市区(休斯顿、达拉斯、洛杉矶、底特律、芝加哥)的应用,研究发现传统方法会高估高环境风险区域的供给得分,且基础设施供给存在显著的空间与收入双重不平等,为城市规划提供了更精准的环境正义评估工具。

论文文件下载链接:

1-s2.0-S0198971525000547-main.pdf

🌍研究背景

充足的基础设施是城市发展的基础,但不平等供给会加剧社会隔离与健康风险。现有研究多假设“设施越多越好”,却忽略过度硬化路面带来的噪音、污染与热岛效应;同时,多设施综合评估时,等权重或主观赋权(如AHP)无法反映不同设施对可持续发展的差异化贡献。例如,道路与铁路可能增加环境负担,而公园与步行性可降低风险,传统方法未区分这些差异,导致评估结果偏离环境正义目标。因此,需要一种客观、动态的评估框架,整合环境成本与设施效益。

🌳研究的科学问题

  • 如何将环境因素纳入基础设施供给评估,纠正传统方法“重数量、轻环境”的偏差?

  • 如何用数据驱动方法客观确定多类基础设施特征的权重,避免主观赋权的局限性?

  • 环境集成的基础设施供给指数在空间(不同城市、不同普查区)和收入层面呈现怎样的不平等特征?

📊研究方法

研究采用三步走流程:① 特征-环境关系解析:用XGBoost模型以6项基础设施特征(高流量道路、铁路、房龄、休闲公园、步行性、POI密度)为输入,预测环境危害(高/低,基于PM2.5超标天数与极端高温天数),通过十折交叉验证与SMOTE处理类别不平衡,优化模型性能;

② 权重与阈值确定:用SHAP方法解释模型,以各特征对环境的贡献度为权重,并通过SHAP依赖图识别特征的“最优阈值”(超过阈值则设施从降低风险转为增加风险);

③ 供给指数与不平等测量:构建环境集成的供给指数(加权求和各特征与阈值的偏差),与传统等权重指数对比;用Pandey等人提出的不平等指数,测量五大城市普查区间的空间不平等,以及不同收入组的收入不平等。

💬研究结果

  • 基础设施特征的环境贡献具有城市异质性:特征重要性排名因城市而异,例如铁路在芝加哥贡献最高,在达拉斯最低;步行性与POI密度的影响无统一规律,需结合城市结构具体分析。

  • 部分特征存在环境阈值:道路与铁路的贡献随供给增加先降后升,超过阈值(如休斯顿铁路阈值为10.68%)会显著增加环境风险;公园与房龄(新房比例)的贡献始终为负(供给越高,环境风险越低),无阈值效应。

  • 传统方法存在评估偏差:环境集成指数与传统等权重指数的空间分布差异显著——传统方法将67.21%的高供给区域误判为低环境风险,而实际这些区域的环境负担更高。

  • 空间不平等普遍存在:五大城市的不平等指数介于0.277(洛杉矶)至0.352(达拉斯)之间,均为中等程度不平等,达拉斯的空间差异最大,洛杉矶最小。

  • 收入不平等显著:高收入普查区的供给指数比低收入区高27%(洛杉矶),且传统指数未捕捉到这一差异,环境集成指数更能反映低收入群体的环境劣势。

💬研究讨论

  • 第一,研究的五大核心贡献:① 首次将环境因素系统纳入基础设施不平等评估;② 识别特征阈值,纠正“越多越好”的认知偏差;③ 用机器学习捕捉设施与环境的非线性复杂关系;④ 客观权重减少主观性,提升评估科学性;⑤ 揭示空间与收入的双重不平等,完善环境正义评估维度。

  • 第二,研究的局限性:① 受数据限制,未覆盖所有基础设施类型(如供水、医疗);② 假设每个特征最多一个阈值,实际可能存在多个阈值;③ 模型性能受采样与参数选择影响,泛化性需进一步验证;④ 仅考虑收入不平等,未涵盖种族、健康负担等其他社会维度。

💬研究结论

  • 第一,本研究提出的环境集成基础设施评估框架,有效解决了传统方法忽略环境成本的缺陷,为可持续城市规划提供了数据驱动的工具。

  • 第二,通过可解释机器学习客观确定特征权重,避免了主观赋权的偏差,且识别出的特征阈值可指导基础设施的合理规模,避免过度建设。

  • 第三,基础设施供给存在空间与收入的双重不平等,传统评估方法会误判高环境风险区域的供给水平,掩盖低收入群体的环境不公。

  • 第四,该框架可推广至不同城市,帮助决策者精准识别供给短板,优先投资兼具社会效益与环境可持续性的基础设施。

🔸未来研究展望

  • 第一,扩展基础设施类型,纳入更多环境与社会维度(如供水、医疗、种族、健康脆弱性),完善不平等评估的全面性。

  • 第二,研究多阈值场景,提升特征最优供给水平识别的精准度。

  • 第三,开展敏感性分析,验证模型在不同城市与数据条件下的稳定性。

  • 第四,结合利益相关者参与式评估,将数据驱动结果与本地知识融合,形成更具落地性的规划策略。


原文引用格式

Li, B., & Mostafavi, A. (2025). Incorporating environmental considerations into infrastructure inequality evaluation using interpretable machine learning. Computers, Environment and Urban Systems, 120, 102301



END


以上内容来源于SE-System Lab,为学术分享,仅供科研交流,如有错误/侵权等,请联系修改或删除。联系方式:Novel_2020

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/195214