摘要 Abstract
一些最新地理空间人工智能(GeoAI)模型有助于补充人工智能(AI)和空间分析之间的差距。但是,现有模型难以处理大面积空间预测任务的小样本量。对于探索性空间数据分析 (ESDA),它们容易受到局部异常值的扭曲,并且缺乏考虑因果关系的可靠可解释性方法。本研究提出了地理图注意力网络 (GeoGAT),这是一种基于空间(地理)相似性原理的空间深度学习模型。设计了该模型的两种变体,即用于空间预测的GeoGAT-P和用于 ESDA 的GeoGAT-E使用美国选举数据和凶杀案数据的案例研究表明,与现有模型相比,GeoGAT-P可以在小样本量下在大空间范围内实现更准确的预测。与现有模型相比,GeoGAT-E可以获得不错的性能,并理解复杂的空间关系。我们的研究展示了空间相似性如何与最新的深度学习模型相结合,为 GeoAI 研究的未来方向提供有价值的见解。
关键词 Keywords
深度学习;ESDA;GeoAI;空间预测;空间相似性
文章的目标和贡献
本研究提出了用于空间预测和 ESDA 的 GeoGAT,分别为 GeoGAT-P 和 GeoGAT-E。GeoGAT-P 通过空间相似性进行校准和扩展,在大面积小样本的空间预测中表现出出色的性能,如美国选举和凶杀案数据集所示。GeoGAT-P 的预测性能优于 SRGCNN 和 GNNWR,两者都针对空间依赖性和空间异质性进行了校准,表明空间相似性比空间依赖性和空间异质性更适合校准用于小样本预测的 AI 模型。GeoGAT-E 通过空间异质性和空间相似性进行校准以构建局部模型,并使用因果注意力机制来捕获和解释空间关联,为 GeoAI 的可解释性和 ESDA 提供了新的见解。GeoGAT-E 在复杂的美国凶杀案数据集中的性能超过了 SRGCNN 和 GRF,并且明显优于 MGWR,证明了 GeoAI 在 ESDA 中空间相似性的前景。
GeoGAT 为相关领域的学者提供了新的空间分析工具,这些工具能够处理复杂的空间预测和 ESDA 任务。作为 GeoAI 方法的一项努力,我们的工作结合了流行的 GAT 模型和关键的空间相似性原则,为空间相似性在 GeoAI 模型和应用中的作用提供了新的见解。未来的工作包括提出一个全面的框架来验证和评估通过因果调整获得的可解释结果,以及将模型推进到空间因果推理。
模型局限性
首先,尽管GeoGAT-E可以区分因果特征和混杂特征,但它仍然无法解决空间混杂问题。空间混杂是指协变量和空间效应之间的共线性,导致估计效应中的显著偏差,未来的工作可以采用受限空间回归的框架来解决 GeoGAT-E 中的空间混杂问题。其次,尽管 GeoGAT-E 的可解释性有理论基础并得到先前研究的支持,其可解释性的精确准确性仍需要进一步验证。由于模拟数据缺乏理论基础,因此难以验证。本文使用因果干预损失作为衡量因果特征分离有效性的指标,但该指标可能存在偏差。未来的工作需要提出一个全面的框架来评估通过因果调整获得的可解释结果。最后,GeoGAT-E 采用两个独立的图注意力卷积层分别提取因果特征和快捷特征。虽然这种方法在增强模型的可解释性和泛化能力方面很有效,但它还没有发展成一个因果推理模型。下一步应旨在实现其因果推理能力,参考复杂系统理论。
实验验证和应用
本研究采用美国选举和凶杀案的公共数据集进行实证案例研究,这两个数据集均从 GeoDa Lab 的网站 (https://geodacenter.github.io/data-and-lab/)下载。由于凶杀案数据集中存在全局异常值,我们使用了三个标准差来排除它们。本文使用 Pearson 相关系数来排除相关性大于 0.7 的变量。数据集分为 10% 训练集、10% 验证集和 80% 测试集。此策略可帮助我们在大面积数据稀疏情况下模拟空间预测。为避免随机样本分区带来的潜在偏差,我们使用每个模型 10 次运行的平均值作为评估指标。
重要图表
图1 GeoGAT-P 中使用的空间相似性框架
图2 GeoGAT-P 用于空间预测的整体工作流程
图3 GeoGAT-E 的整体工作流程
图4 U.S. Elections 数据集中因变量的映射
图5 美国凶杀案数据集中因变量的映射

图6 残差映射:(a) Elections 数据集的残差地图。(b) Homicides 数据集的残差地图
图7 凶杀案的全局特征重要性

图 8 凶杀案的局部特征重要性

图 9 全局特征选取的重要性

图10 Homicides 的全局特征重要性

图11 数据集上 epoch 的因果干预损失:(a) 选举数据集;(b) 凶杀案数据集

图12 GeoGAT-P 在不同权重下对邻域的性能
图13 GeoGAT-P 在两个数据集上的性能随着相邻要素数量的变化而变化:(a) 选举数据集;(b) 凶杀案数据集
DOI
https://doi.org/10.1111/tgis.70029
源代码开源地址
https://github.com/Josephjiao7/GeoGAT
本文内容转载并翻译自 Transactions in GIS,如有不当或冒犯之处请及时沟通联系。
论文仅代表作者观点,与本公众号无关,版权归原作者所有。
原文标题:Geographical Graph Attention Networks: spatial Deep Learning Models for Spatial Prediction and Exploratory Spatial Data Analysis