社会经济发展经常导致大规模的城市人口迁移,目前已有复杂的网络和人口迁移算法来评估这一现象,并对城市网络进行了大量的研究,但许多研究只对历史或当前的城市网络进行描述和分析,而对前瞻性地预测未来城市网络的变化不够重视,预测未来城市网络的转移仍然具有挑战性。研究旨在通过扩展传统的二维城市结构感知,将城市的地理信息投射到高维的未来维度,以更深入地洞察和感知其未来维度的本质,助力更有效的城市管理。
通过拓展应用深度引力模型(Deep Gravity Model),从城市地理特征与人口流动关系角度,预测未来城市网络。将中国大陆(除海南岛外)进行网格划分,得到126个有效区域,共364个城市。以城市质心象征城市并随机划分到邻域网格,将包含两个及以上城市的区域认定为城市集群。赋予研究区内各城市其地理特征,将研究区随机分为训练集和验证集,同时结合实际人口迁移数据对DG模型进行训练,得到可以推广的预测模型。以京津冀、长三角、珠三角城市群为对象,基于其8个城市特征构建Holt-Winter模型,预测2025年的地理参数。最后通过各城市地理特征及人口数据,基于DG模型生成2025年三个城市群内部城市网络。
1 研究数据
研究使用的数据可分为三大类:地理信息数据、区域人口数据和人口迁移数据。地理信息数据源于OpenStreetMap,包括土地利用、铁路、道路、建筑、POI、运输、交通和地点,提供了有关城市发展和基础设施以及可能影响人口流动的全面信息。区域人口数据包括2025年的官方人口预测和2020年的历史区域人口数据,同时选取高德迁移数据作为城市之间的历史流动性数据,包括人口流入、流出城市的信息以及相应的迁移指数等信息,反映特定时期城市间人口流动的模式和动态。
2 研究方法
(1)Holt-Winter模型,是广泛用于预测时间序列数据的技术,通过将该模型应用于2014-2022年的时间序列数据集,捕捉城市特征的潜在趋势,预测2025年相关数值。
(2)人口流动计算,将产生人口流动的区域分为若干流出地和流入地。流的生成表述为已知流出地的总流出量,生成区域内从流出地到流入地的流量。同时使用通勤者的共同部分(Common Part of Commuters , CPC)来评估流量生成模型的性能。
(3)深度引力模型(Deep Gravity Model)。引力模型(Gravity Model)是被广泛接受的预测流动量的模型,该模型认为两个城市之间的流动量与两个城市的人口成正比,与两个城市之间的距离成反比。为扩展其适用性,研究采用DG模型,引入了隐藏层和非线性层,将产生人口流动城市的地理特征集作为输入向量,输出一个与两地之间的流量值相关的标量。
1 模型实验及精度
在新冠肺炎疫情爆发的2020年第一季度,中国城市之间的城市网络可能经历了不可避免的中断,导致总体人口迁移比往年有所减少。为了评估疫情数据对未来预测的潜在负面影响,验证DG模型的预测能力,基于2021年实际人口迁移数据,输入2020年相关数据对DG模型进行训练,并对城市网络进行实验预测,得到验证数据集的分类精度系数(Classification Precision Coefficient)值为0.76,显著超过了Simini 等人进行的原始DG模型实验的性能。考虑到地形特征和迁移可能性,采用一系列预测评价指标,检验2021年1月至3月实际数据与预测数据之间的差异,结果显示,使用Holt-Winters方法的预测结果与实际数据的偏差最小,且模型的预测结果与实际人口外流数据的差异很小。此外实验表明在预测模型中加入非线性层可以显著提高预测性能。
表1 Holt-Winter模型2021年预测评估结果

模型实验表明,模型预测结果能准确地反映城市间复杂的人口流动网络,较少受到流行病或家庭隔离政策等外部因素的影响,证实了该模型在预测中国城市网络时具有强大的地理和时间可转移性。
表2 DG模型2021年预测值与实际值评估结果
2 城市人口流动网络结构与迁移预测
基于实验检验的DG模型,生成2025年第一季度三个城市群的人口迁移网络,将2025年的预测网络与2020年的实际模式进行比较,以解释不同城市之间的城市网络引力效应及其未来变化。

图2 2020年和2025年中国三大城市群的大规模人口流动格局
其中,弧度越大,颜色越深,表明外流人口占该地区总人口的比例越大。a-1)2020年京津冀实际人口流动网络 a-2)2025年京津冀人口流动网络预测 b-1)2020年长三角实际人口流动网络 b-2)2025年长三角人口流动网络预测 c-1)2020年珠三角实际人口流动网络c-2) 2025年珠三角人口流动网络预测
2020年,每个城市群的内部城市之间人口流动性水平较高,人口普遍流向附近城市,呈现明显的多中心结构。城市群中的中心城市(北京、上海、广州、深圳)与周边城市形成了紧密的网络联系,并伴有明显的局部集聚效应,大型城市群的整体集聚效应不明显。
图3 2020年和2025年中国三大城市群主要人口流动网络
a-1)2020年京津冀实际人口流动网络 a-2)2025年京津冀人口流动网络预测 b-1)2020年长三角实际人口流动网络 b-2)2025年长三角人口流动网络预测 c-1)2020年珠三角实际人口流动网络 c-2)2025年珠三角人口流动网络预测
2020年,京津冀呈现出以北京为中心城市的单中心城市网络,对周边城市的吸引力显著,形成了一个紧密相连的集聚中心,外围集聚区内部流动活跃,而与中心城市互动相对较弱。长三角边缘城市网络表现出较强的流动性,而内部城市之间较弱。珠三角呈现出明显的多中心结构,其中西北部的广州、佛山和肇庆联系紧密,东北部的深圳、东莞、惠州的人口流动性强,南部的珠海和中山也有很强的互动性,形成了与珠三角地区城市发展实际相适应的流动网络。
2020年和2025年,京津冀城市网络都受到中心城市的影响,带动周边城市的发展。预计到2025年,这种影响将进一步扩大到外围城市。安阳和邯郸等城市之间的城市网络预计将大幅增长,石家庄和保定、天津和廊坊、常州等城市之间的互动也有望增加,表明京津冀城市群仍处于开发建设阶段,到2025年,天津将成为另一个重要的中心城市,周边城市将逐步减少对北京的依赖。总体来看,京津冀城市群结构正从单中心向多中心演变。
预计2025年长三角城市群边缘城市的联系将减弱。例如,西部的合肥与安庆之间的联系预计将大幅减弱,南部的杭州与周边城市的人口流动也将下降。这表明到2025年,城市群内多中心的两极分化将逐渐减弱,城市网络将趋于完善。
珠三角城市群中,预计2025年广州和深圳两个中心城市之间的相互作用会很强。具体而言,肇庆和广州将建立更强的城市联系,形成广州-佛山-肇庆城市群。随着东莞的发展壮大,其与深圳、惠州的联系预计会减弱,而与广州的联系预计会逐步加强。南部的“珠江口西岸都市圈”也预计解体,形成以中部城市为中心的城市网络。总体而言,预计2025年珠三角城市群将从2020年分散的多中心集群向集中化转变,广州和深圳形成的强大的区域核心将继续推动区域内周边城市的紧密联系。
通过对2020年和2025年三个城市群人口流动网络的对比,可以明显看出,每个城市群的长距离跨城迁移预计都将增加。这一趋势表明,城市网络内部的两极分化效应正在减弱,大城市对周边中小城市的吸引力将下降。因此,未来城市之间的互动将变得更加平衡。
1 讨论
研究利用DG模型预测人口流动性,从人口迁移的角度构建和预测未来的城市网络,未来的研究可以使用更多的数据来源,引入更多样化的视角,使用更先进的模型来探索高维城市结构。同时,目前的研究主要集中在城市级的空间尺度和年际的时间尺度上,适于研究城市群未来的人口流动模式,后续在充分的数据支持下,可以进行更精细的时空尺度研究(街道、网格)。此外,研究提出利用Holt-Winter拟合来预测未知的城市特征,是一种简单有效的方法,事实上,拟合和预测城市特征方法很多,在处理具体的问题时,选择合适的拟合方式将更使结果加有效和准确。最后,尽管DG模型与传统模型相比有了很大的改进,但在处理时空序列数据方面仍然存在一些不足,仍然需要接收静态数据作为输入,而不是时间序列数据,这使得在预测未来机动性之前有必要预测这些特征,如果能从输入端对时空预测模型进行增强,将是未来时空预测模型更大的突破。
2 结论
研究扩展了对城市二维结构的传统理解,加入了时间维度,通过分析中国城市地理信息数据与实际城市人口流动网络的关系,揭示了城市网络内部的引力效应及城市发展的规律性。研究结果表明,2025年城市网络的分布将更加均衡,少数优势城市的集中度将降低,这一转变标志着中国三大城市群的资源、机遇和发展将朝着更加均衡的方向发展,有望培育一个更具可持续性和包容性的城市格局。
使用DG模型进行的模拟预测与实际的城市人口流动网络贴合度较高,表明其能够捕捉城市网络随时间的变化。同时,该训练模式对训练参数要求低,可以根据城市规划和研究问题进行灵活的调整和扩展。将开源地理数据与强大的深度学习模型相结合,可以实现更准确的人口流动模式预测。
许多采用复杂网络和人口迁移算法针对城市网络的研究只对历史或当前的城市网络进行描述和分析,文章将城市结构研究从过去-现在维度拓展到未来维度,从城市地理特征与人口流动关系角度,构建了具有较强地理和时间泛化性的流量预测模型,预测未来大型城市群的流动性模式。研究发现主要城市群的城市网络将变得更加公平,集中度将降低,同时为未来的快速城市交通提出了前瞻性的城市规划解决方案。
文章采用多元和非线性层构建了一个深度学习模型,将移动性预测模型与开源数据结合起来,在超大规模区域实现了较高的准确性,为相关研究提供了新的研究思路和分析视角。利用深度引力模型来预测人口流动性,与传统引力模型相比,该模型通过深度神经网络增强了非线性关系拟合性能,具有良好的地理泛化性和有效性,同时通过进一步优化模型的数据划分模式,拓宽了模型的时间泛化能力。
https://www.sciencedirect.com/science/article/pii/S0264275123004924