Py学习  »  机器学习算法

HA.247 [冰川湖制图与深度学习]基于深度迁移学习和标注冰川湖数据集的冰川湖制图

走天涯徐小洋地理数据科学 • 4 月前 • 140 次点击  


作者简介|PROFILE

PROFILE

马东晖,南方科技大学环境学院2024级博士研究生,导师为姜丽光助理教授。

主要研究方向:机器学习在地表水监测中的应用。

联系方式:cuyi1457189zhi@163.com


引文链接|CITATION


Ma D, Li J, Jiang L. Efficient glacial lake mapping by leveraging deep transfer learning and a new annotated glacial lake dataset[J]. Journal of Hydrology, 2025: 133072. 

https://doi.org/10.1016/j.jhydrol.2025.133072


关键词|KEYWORDS


冰川湖制图;机器学习;深度迁移学习;标注数据集


摘要|ABSTRACT


冰川湖作为冰冻圈的重要组成部分,被广泛视为气候变化的重要指示器。尽管卫星影像为监测其动态变化提供了一种便捷的手段,但传统方法往往依赖人工解读,存在主观性强、效率低下等问题。近年来,深度学习技术展现出广阔的应用前景,然而其发展受到标注冰川湖数据集稀缺的限制。

    针对这一问题,我们构建并发布了首个公开可用的冰川湖图像数据集(Glacial Lake Image Dataset, GLID)。该数据集包含18,367对样本,来源于包括WorldView-2、Sentinel-2、Landsat-8和高分二号在内的36景遥感图像,覆盖整个喜马拉雅地区。基于GLID数据集,我们提出了一种可迁移的深度学习网络用于冰川湖提取,并在多个不同区域(如北美、南美、格陵兰和高山亚洲)中均展现出良好的迁移能力。

    本研究创建了覆盖整个喜马拉雅地区的标注冰湖数据集GLID(图1),冰湖根据其相对于母冰川的位置关系或根据其形成机制分为四种类型。如图2所示,冰前湖通常与冰舌直接相连,而冰上湖则形成于冰川表面;非相连冰湖不与冰川直接接触,而冰缘湖则分布在冰川边缘。 GLID采用的影像源包括WorldView-2、Sentinel-2、Landsat-8和Gaofen-2等。与现有的冰湖数据集不同,GLID既包括标注后的冰湖,也包括对应的影像。


图1. GLID 数据集中标注的冰川湖位置


图2. GLID 数据集中四种冰川湖的影像及其对应的标签


由于冰湖标记数据集有限,为了最大化我们的GLID数据集的价值并减少模型训练开销,我们采用了迁移学习框架(图3)。即先用水体(不包括冰湖)作为标签预训练深度神经网络,然后再以GLID为标签对预训练模型进行微调。如图3(目标域,橙色框)所示。


图3. 基于深度迁移学习的冰川湖提取框架


     为了进一步测试本文方法的可迁移性,我们在格陵兰岛、南美洲、北美洲和高山亚洲区域分别选择了三个冰川湖。如图4所示,本文方法可以准确提取冰川湖的边界,并且对山体阴影(如图4a和d所示)和薄冰覆盖(如图4g和l所示)表现出良好的鲁棒性。值得注意的是,这里评估的模型没有针对来自这些区域的任何新数据进行微调。这表明本研究提出的方法具有良好的泛化和可移植性。


图4. 模型迁移实验结果(格陵兰岛、南美洲、北美洲和高山亚洲)


总结:本研究构建了一个人工标注的冰川湖数据集 GLID,旨在推动深度学习在冰川湖制图领域的应用。GLID 数据集的空间分辨率范围为 2 米至 30 米。总共包含 18,367 个样本。此外,提出了一种用于冰川湖泊测绘的深度迁移学习方法,在准确率指标方面优于同类方法,没有明显的误分类或遗漏错误。在格陵兰岛、南美洲、北美洲和高山亚洲的进一步验证表明,我们的方法具有良好的空间泛化性。


相关推荐|RECOMMENDATIONS


数据集:

https://zenodo.org/records/14838695


撰稿: 马东晖 | 编辑: 吕 桐 | 校稿: Hydro90编委团

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181866
 
140 次点击