社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【文献分享】基于大数据和机器学习探索城市环境特征与跑步、骑行的多尺度关系

GISer last • 昨天 • 15 次点击  



LITERATURE DELIVERY


文献分享


《Exploring multiscale relationships between environmental characteristics and recreational trail-based activities in urban natural areas: A regional study leveraging user-generated big data and machine learning》

《探索城市自然区域中环境特征与基于休闲步道活动之间的多尺度关系:一项利用用户生成的大数据和机器学习的区域研究》


1、摘要

        人类在自然中的休闲行为代表了与情境和规模相关的现象。可持续的城市规划和自然资源管理需要针对当地情境的有效干预措施,这需要对人与自然的相互作用有深入的理解。然而,现有的研究未能同时研究这些关联中的多个空间尺度、非线性和空间变化。本研究利用大数据(即 Strava 用于跑步和骑自行车的运动跟踪数据)和先进的机器学习技术(部分依赖图和地理加权随机森林)来解开环境特征与休闲活动之间的复杂关系。我们研究的主要发现包括:(1)环境变量对跑步和骑自行车的影响在感知尺度上有所不同,以基于路线和基于调查的导航为代表;(2)此外,特定尺度更适合描述这些关系;(3)在当地和整个地区都确定了对跑步和骑自行车重要的变量。我们的研究提出了用于建模和理解环境特征影响的多尺度方法。结果强化了城市规划中针对特定情境策略的需求。为城市自然区域的规划和设计提供了实际考虑,以促进基于休闲步道的活动。


Nature-based exercise 

基于自然的运动

Geographically weighted random forest:

地理加权随机森林模型空间变异 

Spatial variations:

空间变异 

Trail planning:
步道规划


2、基本内容

研究区域:这篇文章的核心内容是探索城市自然区域中环境特征与基于休闲步道活动之间的多尺度关系。研究利用用户生成的大数据(如Strava运动追踪数据)和机器学习技术(如地理加权随机森林),以丹麦哥本哈根大区为研究对象,分析了跑步和骑行活动与环境特征之间的复杂关系。研究结果强调了在城市规划中考虑环境特征对促进休闲步道活动的重要性,并为城市自然区域的规划和设计提供了实际建议。

研究利用用户生成的大数据(如Strava运动追踪数据)和机器学习技术(如地理加权随机森林),以丹麦哥本哈根大区为研究对象,分析了跑步和骑行活动与环境特征之间的复杂关系。

  1. 在考虑不同尺度效应的情况下,环境变量与步道活动水平(跑步和骑行)之间的关系是什么?

  2. 在分析步道网络各个路段的使用水平时,哪些尺度最适合代表解释环境变量?

  3. 根据对多尺度效应的评估,哪些解释环境变量在不同地点和整个区域对步道活动水平的贡献最大?


研究使用了Strava平台的数据来揭示步道活动,并选择了哥本哈根大区作为研究区域。研究方法包括:

1.变量处理:将解释变量分为“尺度变量”(考虑不同感知尺度)和“非尺度变量”(直接聚合到路段的变量)。

2.部分依赖图(PDPs):用于可视化解释变量与目标变量(休闲活动水平)之间的非线性关系。

3.地理加权随机森林(GRF):用于量化解释变量的局部贡献,并识别每个网格单元中最重要的变量。

4.缓冲区大小的选择:通过应用不同大小的缓冲区来捕捉人们在路线和调查导航中对环境的不同感知尺度。


1. 休闲跑步和骑行强度的空间模式

跑步:跑步活动主要集中在城市内部的自然区域,显示出较强的近距离使用模式。


骑行:骑行活动则呈现出从城市延伸到农村自然区域的模式,许多长距离的骑行轨迹穿越多个自然区域,尤其是在靠近水体和沿海地区。


2. 部分依赖图(PDPs)揭示的非线性关系

邻近道路长度:对于骑行活动,邻近道路的总长度在小尺度(100米)上具有积极影响,但在大尺度(1000米)上影响减弱。对于跑步活动,邻近道路的总长度在大尺度上影响较小。


水体面积:水体的存在对跑步和骑行活动都有积极影响,且这种影响在大尺度(1000米)上更为显著。


树冠密度:高树冠密度区域对跑步和骑行活动都有积极影响,尤其是在小尺度(100米)上。但在大尺度(1000米)上,这种影响减弱。


阔叶树比例:阔叶树比例在小尺度上对跑步和骑行活动有负面影响,但在大尺度上影响减弱。

树龄:古老树木(超过70年)对跑步活动有显著的积极影响,但在中等树龄(30-70年)区域影响较小。


可见性:高可见性区域对跑步和骑行活动都有积极影响,尤其是在大尺度(1000米)上。


物理可达性:对跑步活动有显著的积极影响,但对骑行活动影响较小。


休闲设施:对跑步和骑行活动都有积极影响,但在一定数量后影响减弱。


3. 适当的尺度大小

树冠密度:500米

水体面积:跑步活动为250米,骑行活动为1000米

阔叶树比例:1000米

树龄:1000米

可见性:1000米

邻近道路长度:100米


4. 局部重要变量的分布

跑步活动:重要的变量包括树龄、树冠密度、水体面积、阔叶树比例和物理可达性。

骑行活动:重要的变量包括树冠密度、可见性、道路表面类型、阔叶树比例和水体面积。


【1】环境变量的影响随尺度变化:环境变量对跑步和骑行活动的影响在不同的感知尺度上有所不同。小尺度(如100米)主要影响路线选择,而大尺度(如1000米)主要影响地点选择。.

【2】特定尺度的重要性:研究确定了每个环境变量在不同尺度上的重要性,这有助于更准确地理解和预测步道活动。

【3】多尺度建模方法的有效性:通过地理加权随机森林(GRF)模型,研究能够捕捉到环境变量对步道活动的局部影响,强调了在城市规划中考虑多尺度效应的重要性。

【规划建议】

跑步活动:规划跑步步道时,应考虑高树龄区域、高树冠密度区域、靠近水体的区域以及物理可达性高的区域。

骑行活动:规划骑行步道时,应考虑高树冠密度区域、高可见性区域、良好的道路表面类型以及靠近水体的区域。




  1. 用户偏见:Strava数据主要来自中年男性和热衷于分享和自我监测运动数据的用户,这可能导致样本偏差。研究结果可能不完全适用于其他人群,如女性和不使用Strava的用户。

  2. 活动类型偏见:研究仅关注跑步和骑行活动,未涵盖其他类型的休闲活动,如徒步旅行、野餐等。这可能限制了研究结果的普适性。

  3. 时间模式的缺失:研究未考虑活动的时间动态性,如不同时间段(白天、夜晚、周末、工作日)的活动模式。时间因素可能对环境特征的影响产生显著差异,未来研究可以进一步探索这一点。

  4. 社会文化背景的缺失:研究主要关注环境特征对步道活动的影响,未充分考虑社会文化因素(如社区参与、文化背景、社会网络)的影响。这些因素可能在不同地区和人群中起到重要作用。


  1. 多尺度分析方法:

            尺度效应的全面考虑:文章首次同时考虑了多个空间尺度(100米、250米、500米、1000米)对环境特征与休闲步道活动关系的影响。这种多尺度分析方法能够更准确地捕捉到环境变量在不同感知尺度上的影响,填补了以往研究的空白。

            地理加权随机森林(GRF)的应用:通过GRF模型,研究不仅考虑了全局关系,还捕捉了局部空间异质性。这种方法能够识别出在不同地点对步道活动影响最大的环境变量,为局部化的规划提供了科学依据。


  2. 大数据与机器学习的结合:

            用户生成的大数据:利用Strava平台的运动追踪数据,研究能够获取高时空分辨率的休闲步道活动数据。这种大数据的使用为研究提供了丰富的实证基础,能够更全面地反映人们的实际行为模式。

            机器学习技术:部分依赖图(PDPs)和GRF等机器学习技术的应用,使得研究能够处理复杂的非线性关系和空间异质性,揭示了以往传统统计方法难以发现的复杂关系。

欢迎关注【保护地与绿色生态】 公众号



图片来源:

10.1016/j.ufug.2025.128869


小编 |余承超

审核 |朱里莹


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182944
 
15 次点击