本期推荐武汉大学杨敏教授、艾廷华教授和同济大学晏雄锋助理教授合作完成的综述论文。该文章概述了利用深度学习解决地图综合任务所取得的成就,重点回顾了过去五年的研究进展,涵盖了地图目标空间模式识别、地图综合算法设计、综合过程控制和综合结果质量评估等方面,还探讨了大模型等先进深度学习技术在地图综合中的最新发展趋势,总结了未来潜在的研究方向。
相关成果凝练为学术论文:Deep learning in automatic map generalization: achievements and challenges发表于国际SCI期刊 Geo-Spatial Information Science(https://doi.org/10.1080/10095020.2025.2480815)上。
论文第一作者为同济大学晏雄锋助理教授,通讯作者为武汉大学杨敏教授,合作者包括武汉大学艾廷华教授。
欢迎扫码阅读原文:
Yan, X., Yang, M., & Ai, T. (2025). Deep learning in automatic map generalization: achievements and challenges. Geo-Spatial Information Science, 1–22. https://doi.org/10.1080/10095020.2025.2480815
地图综合一直是地理信息科学(GIS)领域过去几十年中的热点研究主题。学者们致力于利用技术进步带来的机遇,推动地图综合从传统手工模式向人机交互模式快速转变,并进一步向自动化模式发展。深度学习(DL)以其强大的数据处理和模式识别能力,为实现自动地图综合带来了新机遇。研究人员积极采用深度学习方法,并探索其机制以提升地图综合的自动化水平。然而,当前关于这一方面的研究相对分散,需要进行系统性的总结和深入的分析。本研究概述了利用深度学习解决地图综合任务所取得的成就,重点回顾了过去五年的研究进展,涵盖了地图目标空间模式识别、地图综合算法设计、综合过程控制和综合结果质量评估等方面。此外,我们还探讨了先进深度学习方法(特别是大模型(LMs))在地图综合中的最新发展趋势,总结了未来潜在的研究方向。我们期待这项工作有益于推动自动地图综合领域的新一轮技术进步。
关键词:地图学;地图综合;深度学习(DL);大模型(LM);人工智能(AI)
在过去的三十多年中,机器学习技术被广泛应用于地图综合,显著提升了其自动化水平。从对人工投入依赖程度和模型自动化水平的角度,我们划分了三种类型的自动地图综合方法:基于规则的方法、传统机器学习方法和深度学习方法,如表1所示。
表1. 地图自动综合的三种方法
基于规则的综合方法是通过分析专家如何处理综合任务,并参考不同比例尺下的地图表示规范,获取综合知识并将其形式化表达为规则或者约束。这些规则和约束可用于指导各种算法和控制模型的建立,以实现自动地图综合。然而,由于地图综合过程的复杂性,利用有限的规则或者约束难以建立完备高效的地图综合模型。此外,规则的刚性导致模型的适应性不强,难以依据实际场景自适应调整参数,最终综合效果往往不尽如人意。
使用传统机器学习技术设计地图综合方法强调从样本数据中获取地图综合知识,在某种程度上解决了基于规则方法的局限性,包括人为定义规则引入的主观性。然而,这些方法的表示和拟合能力有限,面对复杂综合场景难以取得最佳的综合结果,并且通常依赖专业人员手动定义特征。
深度学习方法具有更深的网络层、更复杂的架构和更强的学习能力,能够直接从原始数据中提取特征,减少对手工工作的依赖。随着深度学习模型性能的提高,地图综合过程中对人工操作和领域知识的依赖将不断减少,地图综合的效率得到提升。例如,Courtial,Touya和Zhang报告了一种基于深度学习模型的地图综合工具,名为“DeepMapScaler”,专门设计用于地形图的综合处理。尽管该软件工具无法达到人机交互模式下的综合效果,但其表现优于传统的自动化地图综合方法。
深度学习模型是对人脑的模拟,由数百万个相互连接的神经元协作学习和处理信息。神经元是对计算过程单元的数学描述,构成了神经网络(NN)的基础。这些神经元有多种类型,例如McCulloch-Pitts(MP)、基于网格和基于图的计算神经元,如图1所示。
图1. DL模型中神经元的设计:
(a)mp神经元
(b)基于网格的计算神经元
(c)基于图的计算神经元
M-P模型通过多个连接接收输入信号,表示为[x1,x2,⋯ ,xn],每个连接具有一个权重,表示为[w1,w2,⋯ ,wn]。所有输入信号通过加权累积进行整合,输出信号Y由激活函数f(.)决定,表达式如下:
y=f(∑i=1nwixi−b)
其中,n表示神经元的数量,b表示偏置。
对于网格数据,使用较小尺寸、相同维度的卷积核对输入信号执行卷积操作,输出值aI的表达式如下:
aI=f(aI−1×W+b)
其中,f(.)是激活函数,W表示卷积核的参数,b表示偏置。由于网格结构的平稳性,二维卷积的概念可以扩展到一维和三维卷积,从而支持不同维度的数据处理。
对于图结构数据,可以通过展开所有节点并将每个节点视为神经元来直接构建神经网络,但是面临两个主要挑战:(1)节点数量庞大导致网络参数众多,形成规模庞大但学习能力有限的网络;(2)图节点的位置信息及其之间的连接可能会丢失。
另一种方法将整个图视为一个神经元,采用不同的操作(如图卷积)来构建神经网络。转换过程可以表示为:
Hl+1=f(∑k=0KθijkLkHl+bl)
其中,f(.)是激活函数,Hl+1和Hl分别表示第(l+1)层和第l层的图特征。Lk是变换矩阵,使用图的拉普拉斯矩阵的切比雪夫多项式计算,θijk和bj分别表示第l层的可训练系数和偏置。
神经元可以通过多种方式组合和排列,从而形成一个计算框架,称为学习架构。在不同学习架构下组合神经元可以构建深度学习模型。在地图综合任务中,不同的神经元可以处理以不同方式组织的地图目标,而各种学习架构的运用可以完成多样化的分析和决策工作。
分类任务是地图综合中最常见的任务之一。图2展示了一个用于地图综合中建筑物群模式分类的典型神经网络架构。该神经网络架构采用分层设计理念。每一层由多个神经元组成,各层之间的神经元相互连接形成网络,模型的输出是整个图被预测为不同类别的概率。通过组合不同类型的神经元,可以构建各种神经网络架构,例如反向传播神经网络(BPNN)、卷积神经网络(CNN)和图卷积神经网络(GCNN)。监督学习是神经网络架构的主要训练方法。学习过程涉及迭代更新模型参数,以最小化模型预测与标签之间的差异。
图2. 用于地图综合中建筑物群模式分类的GCNN架构
包含两个交织的图卷积和池化层以及一个全连接层
标签m×n中的m和n分别表示节点数量和每个节点的特征数量
表示任务涉及将对象或数据的基本特征抽象和编码为适合处理、分析或可视化的格式。它使得基于表示的信息能够进行有效的决策和计算操作,以支持地图综合。表示任务主要通过自动编码器架构完成,通常包括五个部分:输入、编码器、编码、解码器和输出。编码器负责对输入进行编码,解码器使用该编码重构输入。解码器和编码器的结构可以根据输入数据格式灵活设计。如图3所示,在处理序列数据时,可以使用长短期记忆(LSTM)等模型。对于基于网格的输入,适合使用U-net等架构。对于矢量数据,可以考虑基于图的方法,利用图卷积操作执行特征计算并构建图自动编码器(GAE)模型。自动编码器的主要训练方法是无监督学习,其训练目标是输入和输出之间的一致性。
节点预测任务是图机器学习和网络分析中的核心任务,旨在利用图结构和节点特征预测特定节点的属性、类别或状态。这与地图综合中识别典型空间结构(如识别道路网中的立交桥结构)任务的性质相一致。节点预测最常见的架构之一是图卷积网络(GCN)。如图4所示,典型的GCN包括输入层、隐藏层和输出层。输入层表示待处理的图,其规模较大。隐藏层是图结构中信息的处理层。输出层表示多个隐藏层的计算结果,对应于每个图节点的预测特征。在网络架构方面,GCN可以使用GraphSAGE实现。常见的训练方法是半监督学习,即利用部分节点的标注信息进行监督学习,以预测其它节点的信息。
图4. 为大规模图中的节点预测设计的GCN架构
包括一个输入层、两个卷积层和一个输出层
标签n×m中的n和m分别表示节点数量和每个节点的特征数量
地图综合一般包括四个关键步骤:空间模式识别、算法设计、过程控制和结果评估。空间模式识别,也称为结构识别,揭示地图目标的隐含属性或结构特征,从而能够对这些数据应用适当的尺度变换操作。针对具有不同模式特点的地图目标需要设计相适应的综合算法,并通过过程控制方法以确定这些算法的应用。最后,可视化和评估综合结果,强调分析地图目标的模式特征是否得到了适当保留。
空间模式识别是揭示空间数据中隐含的语义和结构知识的过程。这不仅为综合操作的实施提供重要依据,也是综合结果评估的关键参考信息。
线状或面状目标在地图空间呈现出多样化的模式类型。可以从多个角度对这些模式进行分类,包括基于几何结构或地理意义的模式、面向心理认知的模式以及面向地图综合的模式。基于深度学习的线状或面状目标模式识别方法,一般包含三个基本步骤:数据表示、特征提取和模型构建。对于个体目标的表示通常采用两种类型方法:栅格化和矢量化的表示方法。
栅格化表示需要将线条或多边形转换为栅格图像(图5),涉及两个问题:图像范围和栅格分辨率。图像范围通过计算地图目标的水平和垂直坐标差来确定,并选择较大的值生成正方形区域。栅格分辨率与模型复杂度和表示需求密切相关。对于更复杂的模型,可以使用更高的分辨率以更准确地表示地图目标;而对于能力有限的模型,则可以使用较低的分辨率。
图5. 单个地图目标的栅格化表示方法
(a)线状目标;(b)面状目标
在矢量表示中,线状和面状目标的处理方式有所不同。线状目标的矢量表示涉及将其划分为不同的处理单元,常见的划分方法如图6(a)所示。对于不同类型的处理单元,特征提取方法也有所不同,如图6(b)所示。
图6. 用于识别个体线状目标空间模式的数据表示和特征提取方法
(a)数据表示方法;(b)特征提取方法
对于单个面状目标的空间模式识别,顶点、边或轴线单元均可被用作处理单元,如图7(a)所示。面状目标矢量表示方法中处理单元的描述主要关注结构特征,如图7(b)所示。用于识别单个地图目标模式的深度学习模型主要分为两类:自动编码器和分类器。在特征计算方面,当前研究正在探索新方法以促进空间特征的分析挖掘,例如基于三角网剖分结构的卷积运算。
图7. 用于识别单个面状目标空间模式的数据表示和特征提取方法
(a)数据表示方法;(b)特征提取方法
在地图空间中,建筑物和湖泊等面状目标通常以特定模式成组分布。因此,在地图综合过程中,识别并保留这些群目标的结构特征至关重要。面状群目标的表示是不规则且非均匀的,即每个目标的邻域数量不固定。基于图的深度学习方法能够通过输入由面状群目标构建的图来识别其空间模式。其中,关键之处在于构建能够表示面状目标以及空间关系的图,主要包括两个步骤:定义图的边和提取节点特征。
以往采用计算几何分析空间模式的研究为面状群目标的图构建奠定了基础。如图8(a)所示,多种几何邻近图可用于生成面状目标间的连接边。此外,面状目标的形状、大小和方向描述特征通常作为图节点的特征,如图8(b)所示。
图8. 用于识别面状群目标空间模式的图构建与特征提取方法
(a)面状群目标图结构生成的几种不同方法;
(b)描述面状目标的特征提取方法。
缩写:最小外接矩形(SBR)、等面积圆(EAC)、墙面统计加权方向(WSWO)、最小外接矩形方向(SBRO)
道路网和水系网在地图空间呈现网络结构分布,识别它们的空间模式对地图综合亦至关重要。道路网和水系网的空间模式多样,并且具有更突出的拓扑特征。现有利用深度学习模型识别网状目标模式特征的工作主要聚焦两个方面。一是利用深度学习模型从网状数据中提取重要的分支结构,包括识别道路网络中的立交桥、提取河网中特定模式的分支结构等,通常通过图节点的特征计算与分类实现。二是将网络数据划分为一系列独立的子单元,然后运用深度学习模型实施分类识别,如判别局部河网和道路结构的分布模式。子单元可以采用图9(a)所示不同方法划分得到,并运用栅格化或图模型等不同方法建模表示。其中,子单元的图表示存在原始图和对偶图两种策略,如图9(b)所示。此外,弧段的几何、拓扑和形状上下文特征通常提取作为图节点特征,如图9(c)所示。
图9. 用于识别网状目标模式特征的数据表示和特征提取方法
(a)网状目标子单元的生成方法
(c)网状数据的图表示方法
(d)网状目标处理单元的特征描述方法
在识别地图目标(群)空间模式后,相关综合操作的算法设计至关重要。地图综合最重要的两个操作分别是选取和化简,控制地图目标在尺度变换过程中的数量和质量变化。深度学习在两种综合操作的算法设计方面已经产生了积极的影响。
选择操作通过移除次要的地图目标以保证比例尺变小后地图内容表达的清晰性。具体到每个地图目标而言,选取操作可以视为二元分类,即保留或删除。因此,传统机器学习方法被广泛用于构建和训练选择决策模型,以地图目标的几何、拓扑和语义等特征作为输入。深度学习也可以应用于这一二元分类任务,常用的学习框架如表2所示。
表2. 基于深度学习的选取算法研究
化简操作通过移除线状目标或面状目标边界的次要细节以简化形态表达。表3总结了近期使用深度学习方法的化简算法研究。这些算法大致分为两类:基于矢量表达的化简方法和基于栅格的化简方法。前者主要通过取舍节点或者线段实现化简目标,并运用深度学习方法构建决策模型;后者从图像形态学角度,结合深度学习方法检测并处理局部栅格单元以实现化简目标。
表3. 基于深度学习的化简算法研究
运用深度学习设计其它综合操作的算法也受到关注。例如,采用GCN模型实现建筑物目标分组,从而支持建筑物群的合并操作。Beglinger(2023)分析了三种深度学习架构,即GCNN, autoencoder和RNN (recurrent neural network ),在道路数据尺度变换任务中的应用潜力。值得注意的是,这是一种端到端的生成式解决方案,基于样本学习生成新的、更简化的道路网表示,可以实现包括化简、合并、夸张等多种综合操作。
综合过程的控制涉及不同层次的决策任务,包括综合操作的确定、综合算法的选择、不同综合操作执行次序以及相关参数的调整。以往该项工作需要人工交互完成,在深度学习方法的支持下,相关研究提出了综合过程控制的新策略。图10展示了在综合过程中确定合适算法的两种典型策略:模式驱动策略和结果导向策略。前者基于地图目标模式特征的理解确定适宜的综合算法,后者基于对多种综合算法产生候选结果的评估继而选择最佳算法。
图10. 使用DL控制综合过程的两种策略
(a)模式驱动策略;(b)结果导向策略
综合结果的评估涉及如何有效评价地理特征和空间关系在尺度变换过程中得到保持。该项研究一直是文献关注的焦点,至今仍具有挑战性。相似性度量是综合结果评估面临的主要问题之一,不仅用于综合前后地图数据的比较分析,也用于综合结果与定量标准之间的对比。对于线状、面状、网状等不同类型地图目标,使用深度学习进行相似性度量的方法各不相同,如表4所示。
表4. 使用DL进行相似性测量的研究总结
深度学习推动自动地图综合研究取得较大进展。然而,作为一个快速发展的领域,不断出现新的深度学习模型和方法。例如,最近出现的大模型(LMs)迅速引发了跨学科的广泛兴趣。大模型包含大量参数并具有更强的知识理解和推理能力,目前主要应用于自然语言处理(NLP)、计算机视觉(CV)和遥感图像处理等相关任务。以ChatGPT为代表的大模型为GeoAI和制图学带来了新的机遇,是深度学习技术应用于自动地图综合的最新发展趋势。
将大模型引入地图综合任务可以通过两种潜在方式实现。首先,利用成熟大语言模型的通用知识和生成能力处理与文本相关的综合任务。地图综合任务涉及大量的文本信息,如专业人员口头表达或书面总结的综合规则、各种地图制图标准和规范。大语言模型具有强大的文本处理能力,可以用来提取和总结地图综合知识。此外,大语言模型可以用于分析地图目标的多源文本描述信息,通过整合这些信息助力语义特征分析以及多层次表达的生成。
其次,考虑到地图综合是一项面对图形语言的生成任务,探索面向地图图形语言的大模型技术对于推动自动地图综合具有重要意义。围绕该目标,需要在数据表示、样本数据集和迁移机制等多个方面开展研究:
目前,当使用深度学习模型处理地图综合任务时,地图目标以栅格或矢量格式表示。然而,单一的栅格和矢量表示都存在其局限性。此外,地图的图形语言中隐含几何、语义和拓扑等信息。因此,如何将与地图图形语言相关的各类信息封装,并组织为适应大模型输入规范的数据形式是一个重要课题。我们相信,引入此类输入信息可以增强地图数据潜在特征的提取。此外,从数据表示角度设计新的数组组织结构以降低学习任务的难度,也是值得研究的方向。
大多数使用基于深度学习方法的综合任务或子任务依赖高质量和大规模样本的训练,尤其是大模型的训练或微调。因此,开放、标准化、高质量标注的地图综合样本集在推动基于深度学习的自动地图综合模型应用中至关重要。尽管一些研究发布了一些样本,但这些样本主要面向模式识别任务。因此,为地图综合的各类任务或子任务建立标准化样本的收集和管理方法是当前重要的研究工作。
在大模型的训练中,通用学科的语料数据远远超过专业学科,导致模型在执行地图综合这一专业任务时,倾向于回答通用学科知识而非专业内容。因此,平衡大模型的通用性与地图综合的专业性之间的差异是不可避免的。为此,需要深入研究迁移学习的机制,包括理解不同学科之间的相似概念和相似任务的共性。如果大模型能够提取相似任务之间的共同知识并通过少量参数调整适配地图综合需求,这将是一项重大进步。此外,模型的可解释性也是重要的研究内容。
深度学习为自动化地图综合带来了新的发展机遇。本文系统理了近五年来深度学习技术在地图综合领域的应用进展,重点围绕地图目标空间模式识别、地图综合算法设计、综合过程控制和综合结果质量评估等核心环节展开分析。本文指出,现有研究主要集中于地图目标的模式识别任务,而在综合算法设计优化、过程控制和质量评价等方面的探索仍显不足。本文还探讨了基于大模型等前沿深度学习技术的地图综合方法研究思路,包括建立面向地图图形语言的数据组织模型、构建大规模高质量标注样本集、开发高效预训练与微调方法。这些创新方向有望推动自动化地图综合技术实现质的飞跃。
晏雄锋,同济大学测量与地理信息学院助理教授。研究兴趣是制图和深空探索。
杨敏,武汉大学资源与环境科学学院教授。研究兴趣包括地图综合、深度学习和空间大数据分析。
艾廷华,武汉大学资源与环境科学学院教授。研究兴趣包括空间数据的多尺度表示和空间认知。
制作 | 徐怡泉 编辑 | 王晓醉 审核 | 杨敏 张淑娟
