Py学习  »  机器学习算法

【Landsc Urban Plan】在复杂景观中利用地理空间分析和机器学习技术揭示土地细分的驱动因素和空间模式

景观及规划前沿 • 10 月前 • 135 次点击  


【Landscape and Urban Planning】

在复杂景观中利用地理空间分析和机器学习技术揭示土地细分的驱动因素和空间模式

01

摘要

    土地细分,尤其是农村地区的土地细分,对世界许多地区的可持续发展构成了重大威胁。在复杂的景观中,理解这个问题尤其具有挑战性,因为许多生物物理和人类驱动因素在没有必要的土地监管指导的情况下相互作用。我们将核密度分析和机器学习建模相结合,以揭示土地细分的空间模式及其驱动因素之间的复杂关系。我们以智利南部的洛斯拉各斯地区为研究案例,因为它是全球生物多样性热点地区,土地细分不断增加。我们确定了细分的显著增长趋势。我们的建模方法显示了R2为 0.727,RMSE 为 5.109,偏差为 −0.009。靠近城市地区、靠近海岸、靠近电源、人口结构以及靠近保护区是土地细分的重要预测因素。肥沃的土地,尤其是城市中心附近的土地,已成为细分的主要目标,加剧了城市发展与农业可持续性之间的冲突。我们强调了受威胁生态系统和高产土壤上越来越多的细分。我们讨论了驱动因素之间的相互关系,并得出结论,细分主要与传统的城市扩张有关,尽管在某些地区也可以观察到其他城市化现象。这些发现为全球空间规划和与生物多样性保护的和谐提供了挑战和机遇。

02

研究结果

    2002 年至 2021 年间,洛斯拉各斯地区登记了 51,886 份细分申请,占全国总数的 10.95%。正如 Mann-Kendall 趋势检验所表明的那样,观察到已注册土地细分请求的统计显着上升趋势(智利趋势的 p 值 = 4.7684e-06,洛斯拉各斯地区的 p 值 = 1.1921e-05)。在这两种情况下,斜率在 2014 年之后都变得更加明显(图1)。

图1 智利(黑线)和洛斯拉各斯(蓝线)的房产细分请求趋势

    核密度估计器通常显示 Chiloé 岛内陆地区周围的细分集中点,特别是在卡斯特罗市的邻近地区(图2)。此外,在 Calbuco 市的内陆沿海地区和 Puerto Montt 市区观察到高度集中。这三个区域具有最高的细分属性的明确密度(每单位面积的细分接近度)。然而,也有其他区域可以找到细分,但更加分散。较浅的区域具有较低的细分集中度。

图2 观测 (a) 和预测 (b) 洛斯拉各斯地区财产细分核图

    基于树的回归模型使用 6 个变量进行训练(图3),因为这个数字提供了最佳性能和更大的可解释性(减少了变量的数量,改善了性能关系)。该模型产生了一个 R2为 0.727,RMSE 为 5.109,偏差为 -0.009(图3a),其中最重要的变量是到城市地区的距离,其次是到大海的距离和人口的平均年龄。属性面积变量在所有预测变量中获得的重要性最低,值小于 5%(图3b)。测试集的准确率对应于 0.702。

图3 a)使用精度指标细分的所有属性的预测和观察到的内核平均值的散点图。b) 决策树模型的拟合属性是预测因子的重要性 (%)

    图2b 中的预测地图成功地识别了主要的细分热点,但从视觉上看,尽管在用细分宗地验证模型时获得了较低的偏差值,但从视觉上看,它几乎高估了几乎整个领土,这是相对较低的。同样,预测值高的预测值和观测值不同的区域可能证明区域具有很高的细分潜力,因为它们满足图4中确定的因果领土特征。这表明公共当局可以集中精力解决这一现象及其对景观和生物多样性高度地区的潜在影响。主要观察到的区域对应于位于蒙特港以西的 Los Muermos 和私人保护区所在的 Chiloé 岛西南部地区。

图4 回归树的一段显示了解释属性细分的较高值的条件

    预测地图还证明了明显的空间离散化,这主要是由于存在一些选定变量的规模(人口普查区规模的平均年龄和领土面积),这些变量具有离散的局限性。此外,在基于决策树的回归模型中,预测值对应于在每个终端节点处获得的子样本的平均值;因此,如果一个宗地具有某些阈值条件,则其平均值将与位于相同阈值内的另一个连续宗地相同,从而证明离散图块。

    但是,对决策树的目视观察提供了有关显示某些细分预测值必须满足的条件的其他信息。例如,由于决策树模型为数据集生成布尔细分,因此可以解开这些细分序列以表征感兴趣的观察子集。由于研究的范围是具有高密度细分的属性,因此对到达高价值叶节点的节点子集进行了表征。产生高密度值的树子集的逻辑条件如图 6 所示,其中最相关的特征是最接近根节点的特征,这些特征可以创建多个拆分。在这里,城市地区小于 4,625 m 的地块、沿海地区小于 7,965 m 的地块以及平均人口年龄小于 38.7 岁的地区显示出较高的预测细分集中值。

    通过 Kernel 方法获得的绘图估计值表明,最高值对应于相关性较高的生态系统,如图 7 所示,非常高、中和低相关性组之间存在显着差异(阈值 p = 0.05)。树决策模型获得的预测显示出类似的模式,但对预测值进行了系统性高估,这可能表明鉴于一般模型确定的内容,存在潜在的包裹化风险。

图5 按生态系统相关性细分的内核估计值和预测属性值的箱形图

    同样,根据非参数 Kruskal-Wallis 中位数比较检验,具有更大农业利益的土地利用类别(由 CIREN 确定的 I、II、III 和 IV 类)的核密度细分中位数在统计学上高于具有非耕地土壤的区域(V、VI、VII),中位数分别为 3.08 和 0.54。这表明,财产细分的集中不仅发生在与生态系统高度相关的地区,而且发生在具有重要农业价值的地区(见图6)。

图6 按土壤类别细分的内核估计值和预测属性值的箱形图

论文信息

标题:Land subdivision in the law's shadow: Unraveling the drivers and spatial patterns of land subdivision with geospatial analysis and machine learning techniques in complex landscapes

作者:Jorge Herrera-Benavides, Marco Pfeiffer, Mauricio Galleguillos

时间:14 May 2024

DOI:https://doi.org/10.1016/j.landurbplan.2024.105106

本文只是笔者对论文的浅薄理解,不代表原论文观点。如果您感兴趣,请点击文末【阅读原文】阅读文献



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177874