Py学习  »  机器学习算法

利用机器学习从印度喜马拉雅地区的卫星图像时间序列中生成开放获取的农田地图

GEE遥感训练营 • 1 年前 • 498 次点击  


目:Using machine learning to generate an open-access cropland map from satellite images time series in the Indian Himalayan region

期刊:Remote Sensing Applications: Society and Environment

第一作者:Danya Li

发表单位:瑞士联邦材料科学和技术实验室

发表日期:2023年




1. 摘要 

研究背景:农作物地图对于农业监测和食品管理至关重要,而且还可以支持特定领域的应用,如在发展中国家设置冷供应链基础设施。然而,在发展中国家获取地面真实数据进行监督学习尤其困难,因为由于小农和地理分散的因素,这通常导致缺乏农作物类型地图甚至可靠的农田地图。

拟解决的科学问题:本研究旨在解决以下科学问题:1. 如何利用机器学习技术从卫星图像时间序列中提取农田信息。2. 如何生成准确且开放访问的农田地图,以满足农业管理和土地利用规划的需求。3. 如何评估生成的农田地图的准确性和实用性。

创新点:这项研究的创新点在于,它使用机器学习模型和哨兵-2卫星图像时间序列生成了一个开放访问的二进制农田地图,这对于农业监测和食品管理以及设置冷供应链基础设施等特定领域的应用具有重要意义。此外,研究者使用空间交叉验证来考虑局部空间自相关性,这是一种新的评估模型泛化能力的方法。

    



2. 研究方法 

本研究采用了以下方法:

1. 首先,收集了研究区的卫星图像时间序列数据,生成哨兵-2卫星图像时间序列,以生成成本效益高和空间分辨率高的农田地图。

2. 然后,研究了两种基于像素的监督分类器,支持向量机(SVM)和随机森林(RF),这两种分类器用于对每个像素的时间序列进行二进制农田映射。

3. 通过空间交叉验证训练和验证模型,以考虑到局部空间自相关性。他们选择了RF模型,因为其整体上的鲁棒性和计算成本较低。他们通过在每个地区的保留测试集上计算准确率、召回率、精度和F1得分来测试所选模型的泛化能力

基于像素的农田分类模型的管道。它包括三个主要的块:数据预处理、特征提取和农田分类




3. 研究结果 

使用机器学习成功构建了一个分类管道,根据 Sentinel-2 卫星图像的时间序列生成 10 m 分辨率的农田掩模。用它创建了 2020 年多个地区地区的二值地图。通过采用空间交叉验证方法来选择模型,解决了可靠地面实况数据有限的挑战(发展中国家偏远地区经常出现这种情况)以及空间自相关的挑战。空间交叉验证证明是提高模型泛化能力的有效技术。评估了支持向量机(SVM)和随机森林(RF)分类器,并选择随机森林作为最终模型,因为其具有与 SVM 相当的良好精度,但推理时间要短得多。还对特征工程进行了消融研究,并分析了特征重要性,确认了上下文特征在解释作物分类模型性能方面的相关性,特别是在苹果收获季节的 NIR 波段(主要使用三个测试集验证了该模型,研究区域的每个地区各一个。总体而言,提出的 RF 方法在准确率、召回率、精确度和 F1 分数的三个方面的加权平均方面取得了超过 87% 的性能。
最后,提出了最终的农田地图,将预测农田像素的海拔可视化,以便通过检查其通常的生长海拔来定位特定作物物种时使用它我们的农田地图比现有农田地图(例如哥白尼土地覆盖图(100米)和GFSAD(30米)农田图)具有更高的空间分辨率(10米)。解决地图问题,研究表明本研究提供了视觉上更准确的农田地图,同时具有更高的空间精度。本地图可通过农业用谷歌地球引擎公开访问组织、政府、农民生产者团体和供应链利益相关者。

在印度喜马偕尔邦(绿色)的研究区域的位置:库鲁、曼迪和希姆拉区(黄色)

2020年以上的43SFR瓷砖上的遥感样本的真彩色图像。每张图像的比例为100×100平方公里。 以看到地球表面也在相应地演变

数据预处理步骤的影响的例子,包括大气校正、云掩模(均为单个时间步长)和常规时间采样

研究区域签分布在Kullu有一个大型的训练和验证区域(a),在Kullu、Mandi和Shimla有三个小型的测试区域(b,c,d)

在训练和验证区域上的农田和非农田多边形的平滑平均NDVI周剖面(时间序列上的缺失数据之前已经用线性插值填充)。阴影区域代表一个标准差

执行空间交叉验证的步骤

最终随机森林模型在三个测试集上的排列特征的重要性。误差条代表一个标准差

使用我们的RF模型、哥白尼土地覆盖图(布赫霍恩,2020)和GFSAD农田图(Phalkee,2017)对我们测试集中的三个示例区域进行定性比较。其中包括谷歌基础图图像(2016年12月30日),以供参考。我们还包括了在这些位置上标记的地面真实多边形(注意,不一定是全面的)。白色像素表示农田预测,黑色像素表示非农田预测(除了地面真相,其中黑色表示未标记)

2020年,印度喜马偕尔邦的库尔卢、曼迪和希姆拉地区的耕地预测图。该地图是根据海拔高度绘制的,以便于瞄准不同的作物,考虑到他们的生长海拔范围。关于更高分辨率版本的地图,请参考提供的谷歌地球引擎脚本

    



4. 结果与讨论 

通过利用机器学习技术,本研究成功地从卫星图像时间序列中提取农田信息,并生成了一份准确且开放访问的农田地图。实验结果表明,生成的农田地图与现有的农田地图相比具有更高的准确性和实用性。

    

参考文献:Danya L ,Joaquin G ,Michele V , et al.Using machine learning to generate an open-access cropland map from satellite images time series in the Indian Himalayan region[J].Remote Sensing Applications: Society and Environment,2023,32

- 往期回顾 -
1.GEE 去云专题与数据下载详解
2.利用GEE和遥感数据对未来城市网络容量和土地利用/土地覆盖模拟进行建模
3.STEPSBI:具有粗、细分辨率尺度变换误差和基于像素合成基础图像对的快速时空融合


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/165769