Py学习  »  机器学习算法

基于时空交互深度学习模型的全球陆地粗模态气溶胶(cAOD)遥感反演研究

气象学家 • 4 月前 • 67 次点击  

  第一时间获取气象科研资讯

气象学家公众号交流群

加入


陆地粗模态气溶胶主要来自于粗颗粒物(>1 µm)的贡献。粗模态气溶胶光学厚度(cAOD)可以用于表征粗模态气溶胶的量级,特别是沙尘的辐射效应及其对空气质量和云形成的影响至关重要。目前,长时间(>20年)高精度cAOD数据十分有限,已经不能满足研究需求。202310月发表于《Environment Science & Technology》的 " Exploring Global Land Coarse-Mode Aerosol Changes from 20012021 Using a New Spatiotemporal Coaction Deep-Learning Model" 一文提出了全新的时空交互深度学习模型(SCAM),基于MODISERA5再分析和地基观测数据反演得到了2001-2021年的全球陆地cAOD500nm)的数据,并研究了全球21cAOD的时空特征。SCAM cAOD相较现有的cAOD产品具有与地基观测更好的一致性,且空间覆盖度高,在捕捉快速发生的沙尘事件上具有优势。

传统机器学习模型忽视时空因子交互变量的影响,而这种交互对于cAOD存在着显著影响。如图1所示,传统深度学习模型仅考虑单个空间或时间变量对目标的影响。然而,以中国为例,北京的冬季与河北的冬季相比,对空气污染的贡献有明显的差异。这是因为北京供暖使用的清洁能源比例(>95%)大于河北。同样,cAOD的地理位置信息和时间信息也存在着交互作用,但如何在模型中刻画时空交互作用是一个巨大挑战。

      

1(a) 提供全球cAOD数据的卫星传感器的重访时间和时间覆盖的比较。颜色对应于大约1天(蓝色)、3-6天(黄色)和大约16天(绿色)的重访时间。(b) 时空交互的概念示意图。

针对研究现状,本研究基于MODIS遥感产品(包括TOA反照率、AOD、地表亮温和反照率以及地表分类)、ERA5气象再分析资料(2m温度、地表气压、相对湿度、10m风速以及边界层高度)以及AERONET站点的cAOD观测,构建时空交互作用的深度学习模型SCAM(图2),采用了线性与非线性联合训练的深度学习架构(代码已开源,详见后文),实现全球范围2001-2021年的逐日、空间分辨率0.5ºcAOD反演。

2. 时空交互深度学习模型(SCAM)框架。

在模型训练与验证中,本研究模型的训练和验证基于site-based独立验证,即随机将全球AERONET站点分为80%的训练站点(272个),10%的验证站点(72个)和剩余10%的测试站点(78个)。模型通过训练站点和验证站点进行训练和超参数调试,最终cAOD预测结果基于未参与训练的测试站点进行验证。模型的训练和验证基于site-based独立验证,即随机将全球AERONET站点分为80%的训练站点(272个),10%的验证站点(72个)和剩余10%的测试站点(78个)。模型通过训练站点和验证站点进行训练和超参数调试,最终cAOD预测结果基于未参与训练的测试站点进行验证。

模型通过训练站点和验证站点进行训练和超参数调试,最终cAOD预测结果基于未参与训练的测试站点进行验证。基于site-based的逐日cAOD验证结果显示,SCAM cAODAERONET cAOD的整体一致性较好(R=0.82, RMSE=0.04)(图3)。

3. (a) 2001-2021年日均SCAM cAOD与日均 AERONET cAOD的密度散点图。黑色实线是1:1线,红色虚线是线性拟合线,黑色虚线为± (0.05 + 15%)的误差区间。(b) SCAM cAODAERONET cAOD之间的相关系数(R)和标准化均方根误差(NRMSE)随年份的变化。(c) SCAM cAODAERONET cAOD在每个AERONET站点的标准化均方根误差(NRMSE)分布。

研究进一步对比了SCAM cAODFMF间接反演得到的cAOD [Phy-DL cAODcAOD=AOD*(1-FMF)]以及三种卫星遥感产品的cAOD,体现了SCAM cAOD具有与地面AERONET观测结果一致性更高以及准确捕捉快速发生的沙尘事件的优势。其中,Phy-DL FMF是一套基于物理-深度学习融合的全球FMF产品(Yan et al., 2021ESSD),但基于这一产品得到的Phy-DL cAOD产品精度(R=0.64)不及SCAM cAODR=0.74),且无法像SCAM cAOD一样捕捉到日尺度的沙尘事件(图4)。

4. (a-d)撒哈拉地区的沙尘事件(2010422日)的真彩色图像,来自MERRA-2的沙尘AOD分布,以及由Phy-DL cAODSCAM cAOD分布;(e-h)与(a–d)相同,但为澳大利亚地区的沙尘事件(2010422日);(i–l)与(a–d)相同,但为中国华北地区的沙尘事件(2010312日);(m–p)与(a–d)相同,但为阿拉伯半岛的沙尘事件(20101212日)。红色圆圈表示具有沙尘含量较高的热点区域。

基于SCAM cAOD,研究进一步探索了全球2001-2021年的cAOD时空分布特征。cAOD高值区域(>0.2)主要分布于沙漠地区(图5a),如位于北非的撒哈拉沙漠,印度北部的塔尔沙漠,以及中国东北部的戈壁和塔克拉玛干沙漠的cAOD均显著高于其他地区。由于21年间cAOD趋势可能有所变化,因此研究计算了不同时期cAOD的滑动窗口趋势,以更好地体现cAOD趋势变化的时间节点(图5c-h)。结果显示,撒哈拉沙漠西部和中部的cAOD主要在2010年后显著下降,而撒哈拉沙漠东部的cAOD2008年左右就开始显著下降。塔尔沙漠的cAOD主要在2010年前显著下降,特别是2001–2004年间。

5. (a) 2001-2021年的年均cAOD空间分布。 (b) 利用月均SCAM cAOD计算的2001年至2021年的全球cAOD线性趋势(单位:10-3/年)。趋势的计算要求每一像元具有大于18年、每月至少80%有效的日均cAOD值,且通过95%的显著性检验。 (c–h) 六个主要沙漠地区(单位:10-3/年)的cAOD滑动窗口趋势,其中x轴和y轴分别表示趋势计算的窗口长度和起始年份。趋势的计算要求窗口长度内至少有80%有效月均cAOD数据。在滑动窗口趋势图中,颜色表示线性趋势大小和方向,黑色点表示趋势计算通过95%的显著性检验。

本研究基于SCAM模型的cAOD反演体现了深度学习模型中考时空因子的交互具有重要性意义,时空交互因子的引入补充了现有研究对于时间与空间变量交互影响的忽略。反演得到的SCAM cAOD时间分辨率达到逐日,空间覆盖度高,在捕捉发生的沙尘事件上具有优势。

全球2001-2021逐日cAOD数据获取https://doi.org/10.5281/zenodo.7829679

本研究原文https://doi.org/10.1021/acs.est.3c07982

3种开源深度学习架构,欢迎使用与改进https://github.com/RegiusQuant/ESIDLM

代码教程https://esidlm-tutorial.readthedocs.io/en/latest/

双任务协同反演深度学习模型https://doi.org/10.1016/j.envpol.2023.121509

线性与非线性联合训练深度学习模型https://doi.org/10.1016/j.envpol.2021.116459

时空可解释深度学习模型https://doi.org/10.1016/j.envint.2020.106060

本文第一作者为北京师范大学地理科学学部研究生臧洲,通讯作者为北京师范大学地理科学学部晏星副教授,合作单位还包括首都师范大学和香港理工大学。

来源:大气环境研究中心





声明:欢迎转载、转发本号原创内容,可留言区留言或者后台联系小编(微信:gavin7675)进行授权。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请后台联系小编处理。


往期推荐

 获取ERA5-Land陆面高分辨率再分析数据(32TB)

 1942-2022年中国地面气象站观测数据免费分享

 获取全球GPM降水数据,半小时/逐日(4TB)

  获取1998-2019 TRMM 3B42逐日降水数据

★ 获取最新版本CMIP6降尺度数据集30TB

★ 获取ERA5常用变量再分析数据26TB

 EC数据商店推出Python在线处理工具箱

★ EC打造实用气象Python工具Metview

★ 机器学习简介及在短临天气预警中的应用

★ Nature-地球系统科学领域的深度学习及理解

★ 采用神经网络与深度学习来预报降水、温度

★ 灵魂拷问:ChatGPT对气象人的饭碗是福是祸?

★  气象局是做啥的?气象局的薪水多少?

★ 一位气象学家尝试ChatGPT复现Nature子刊的研究,他真的会面临失业吗?!


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/165353
 
67 次点击