气溶胶的垂直分布在大气科学中具有重要意义,不仅影响能见度、地面空气质量和辐射收支,还深刻作用于云–气溶胶相互作用,从而对气候、天气和公共健康产生重要影响。传统的被动遥感卫星主要提供柱积分指标(如气溶胶光学厚度,AOD),难以区分近地面与高空颗粒物的贡献;相比之下,主动激光雷达观测(如 CALIPSO)能够获取高质量的气溶胶垂直廓线信息,但其轨道覆盖有限、时间分辨率不足,难以满足区域小时尺度的连续监测和应急响应需求。与此同时,城市化、工业排放与温室气体变化驱动的边界层演变,以及野火等突发强源事件,使气溶胶的垂直与时序结构更为复杂,并呈现显著的昼夜变化。这些过程对人群暴露评估与污染成因解析至关重要。基于此,我们团队提出了一种可解释的深度学习集成方法,融合多源主被动遥感信息,实现高时空分辨率(小时级、公里级)的气溶胶垂直分布反演,从而弥补现有观测在时空覆盖与垂直分辨率方面的不足,为污染防治和科学研究提供更具实用价值的数据支撑。
本研究提出了一种全新深度学习集成框架,将大语言模型结构(LLM)的 Transformer与全连接神经网络(FCNN)有效结合,用于融合主被动多源遥感观测及辅助数据,实现小时级、2 km分辨率的不同高度气溶胶消光系数(AEC)反演(图1)。在模型结构上,Transformer编码器作为局部特征提取器,能够有效捕捉输入数据的时空上下文与长距离依赖关系;随后,其输出被输入至多层 FCNN,以学习全局非线性映射关系,并最终预测三个高度层(0.01-1 km、1-2 km、2-3 km)的 AEC。在样本构建方面,本研究以CALIPSO激光雷达剖面作为“真值”标签,配对静止轨道卫星Himawari-8观测、极轨卫星MODIS地表BRDF双向反射信息及多源辅助数据,形成涵盖多种情景(如城市雾霾、野火等)的训练与测试数据集。在模型训练过程中,采用均方误差(MSE)作为主要损失函数,同时引入层间平滑正则化与早停策略以抑制过拟合,并结合Adam优化器与学习率衰减策略以提升训练效率与收敛速度。此外,我们构建了多层次的验证体系,对模型性能开展系统评估,包括基于样本、时间与空间的十折交叉验证,以及小时留一和行政区留一等多种交叉验证方法。为了增强模型的可解释性,研究进一步引入可解释人工智能,对输入特征的重要性进行定量评估,解析不同高度层预测结果的驱动因子,从而在保障预测精度的同时,提升对气溶胶垂直分布物理机制的理解。
图1.气溶胶层高深度学习集成反演框架
我们基于 6S 辐射传输模型开展正演模拟(图2),设定了四种理想化气溶胶剖面:H1(全部粒子位于基准高度 H)、H2(1/3 位于 H,2/3 位于 H+0.24 km)、H3(1/2 位于 H,1/2 位于 H+0.24 km)和 H4(2/3 位于 H,1/3 位于 H+0.24 km)。其中,+0.24 km 的垂直偏移用于模拟下对流层常见的小尺度高度变化对卫星遥感信号的影响。模拟结果表明,随着颗粒物高度由 H1 向 H4 增加,卫星大气顶层反射率(TOA)也发生显著变化,其方向与幅度受波长和地表反射率(LSR)的共同影响:当LSR < 0.2时,TOA 反射率随气溶胶高度增加而上升;但在某些情况下(如LSR = 0.2),由于气溶胶散射与地表亮度的耦合作用,TOA反射率可能出现下降。在四类剖面中,高层粒子占主导的H4产生的卫星信号最强,而全部位于低层的H1最弱。不同波段对高度变化的敏感性存在差异。短波波段(如B1和B2)对高度变化更敏感,而长波波段(B3、B4)在高度增至约3 km时响应趋于收敛。不过,B1在不同剖面间仍保持明显区分度,显示短波波段对垂直分布的敏感性更强。总体而言,将气溶胶推向更高层会增强短波反射,部分原因在于高层散射增强以及在O2-A(760 nm)和O2-B(687 nm)等通道中吸收效应的相对减弱。为检验观测几何条件变化是否会干扰高度信息,进一步对B1和B4波段在不同太阳天顶角(20-60°)、观测天顶角(20-60°)及相对方位角(10-150°)下进行了模拟。结果显示,虽然在单一波段上,不同几何条件下的TOA反射信号可能存在一定重叠,但多波段组合响应仍能有效区分不同垂直剖面。这些结果验证了利用多波段卫星遥感数据开展气溶胶垂直分布反演的物理可行性。
图2.气溶胶垂直分布对多光谱卫星观测信号的影响模拟
AI模型可解释性分析
我们基于XAI-SHAP方法对TF-FCNN模型进行了可解释性分析(图1)。结果显示,在近地面层(0.01-1 km),短波波段(B1和B2)的表观反射率对模型输出的平均贡献约为 24%,这归因于短波段对气溶胶具有更强烈的消光效应(包括散射与吸收)。热红外波段(B14)的贡献约为9%,反映了其对高浓度气溶胶如沙尘和烟雾,以及边界层温度结构的敏感性。此外,多波段BRDF特征的累计贡献约为19%,表明地表双向反射分布函数在有效表征地表与太阳辐射相互作用、进而区分地表反射与大气信号等方面发挥了重要作用。观测几何中的天顶角(VZ)贡献约为11%,这与其在静止卫星观测中变化范围较大且对大气顶层辐射(TOA)影响显著密切相关。其余变量的总贡献约为37%,说明土地覆盖与辅助变量在降低模型输出不确定性、提升泛化能力方面仍然发挥着关键作用。在中层(1-2 km)和上层(2-3 km),各要素的重要性分布总体较为一致:B1+B2波段反射率的贡献分别增至33%和40%,B14分别为22%和17%,BRDF分别为14%和13%,VZ分别为8%和12%,其余变量合计约为25%和18%。整体上,短波表观反射率、热红外亮温以及BRDF特征三者的累计贡献高达63%,凸显了联合多光谱通道与地表反射特性在气溶胶垂直信息反演中的关键作用。
反演结果精度验证
基于样本的十折交叉验证结果表明,我们的模型在澳大利亚不同气溶胶高度层(0.01–1 km、1–2 km、2–3 km)反演均表现优异,分别有62%、61%和62%的1°×1°网格样本在交叉验证中达到了较高的决定系数(CV-R² > 0.7)且均方根误差(RMSE)低于0.1。总体来看,0–1 km 层的气溶胶消光系数AEC反演结果与 CALIPSO 测量高度一致(CV-R² = 0.903,RMSE = 0.037);而在 1–2 km 和 2–3 km 层,反演精度略有下降(CV-R² = 0.87 和 0.81,RMSE = 0.031 和 0.041)。进一步的 1° 格网空间交叉验证显示模型具有较强的空间预测能力。在研究区中,不同高度层超过 60% 的格点均表现良好(CV-R² > 0.5 且 RMSE < 0.1),其中低层(0–1 km)预测效果最佳,平均 CV-R² 达 0.64;中层与高层预测精度相当(CV-R² 分别为 0.58 和 0.51)。基于年积日的时间交叉验证揭示了模型在时间维度上的稳健表现:约 60% 的格点在各高度层均满足 CV-R² > 0.5 且 RMSE < 0.1,总体 CV-R² 范围为 0.68–0.78。更独立的“留一小时”验证进一步表明模型在不同时段均能保持一致性(相关系数 R = 0.64–0.79,RMSE = 0.05–0.08),说明其时间泛化能力强且对昼间采样偏差不敏感。最后,留一区域验证结果显示,在不同行政区条件下,模型与 CALIPSO 观测仍保持中等至较高相关性(R = 0.41–0.77),且不确定性相对较低(RMSE = 0.07–0.15)。综上所述,多种验证实验一致表明,我们的模型在澳大利亚不同气溶胶高度层均具备稳健的空间与时间预测能力。
城市人为污染与野火排放对气溶胶垂直分布具有显著但不同的影响。基于 TF-FCNN 模型反演的澳大利亚小时尺度连续气溶胶廓线结果显示:在城市情景下(以 2022-02-14 为例,图4),特别是雾霾,近地面层(0.01–1 km)的气溶胶负荷明显高于中高层(1–2 km、2–3 km)。全国平均值分别为 0.14 ± 0.05、0.11 ± 0.04 和 0.07 ± 0.03,反映出地面人为源(如工业、交通排放)向上输送导致的低层富集特征。在堪培拉等主要城市,这种层间差异更加突出:0–1 km 与 2–3 km 的相对差异可达 71%。此外,近地面层的昼间相对变化幅度(约 20%)也显著高于中层(约 17%)和上层(约 5%)。以堪培拉核心区(10×10 像元窗口)为例,0–1 km 层的平均气溶胶消光系数(AEC)在 02:00 从 0.17 降至 07:00 的 0.08,降幅超过 52%;相比之下,1–2 km 和 2–3 km 层的降幅分别约为 35% 和 21%。这表明城市排放主要在近地面层积累,并随时间逐渐扩散至周边区域,从而造成更强烈的昼间变化。
图4.澳大利亚城市地区气溶胶垂直分布小时变化
相较之下,野火情景(以 2022-02-07 为例,图 5)呈现出更为剧烈的时空与层间动态变化。受大规模燃烧源影响,各高度层的气溶胶消光系数(AEC)均显著升高,其中低层增幅最为突出。火点附近(10×10 像元窗口),0.01–1 km 层在 02:00–07:00 UTC 期间的平均 AEC 比 1–2 km 层高约 30%(后者约为 0.16 ± 0.04),而 2–3 km 层则下降约 25%。从时间演变来看,火情初期(05:00 前)各层变化相对平稳(低层约 5%,中层约 7%,上层约 4%);但在 04:00–05:00 出现显著突增(0–1 km 增加 29%,1–2 km 增加 22%,2–3 km 增加 21%)。此后,低层和中层继续累积(累计增幅分别达 36% 和 39%),而上层则因扩散、沉降和烟羽抬升受限而下降 53%。相比于 CALIPSO 每日仅 1–2 次的过境观测,TF-FCNN 模型能够提供逐小时的气溶胶剖面,清晰捕捉野火引发的剧烈昼内变化。总体而言,我们的模型不仅能够识别城市排放导致的近地面富集与昼内衰减特征,还能揭示野火造成的低中层快速累积与显著时变过程。这表明该模型在解析不同来源和不同高度的气溶胶动态演化方面具有重要应用价值,也为未来地面 PM 反演的改进与提升提供了有力支持。
本研究提出并验证了一种融合 Transformer 与全连接神经网络的深度学习集成框架,综合利用主动激光雷达(CALIPSO)与被动光学传感器(Himawari-8、MODIS)多源卫星数据,并结合可解释人工智能方法(SHAP)揭示输入与输出变量的物理关联,实现了小时尺度、空间连续的气溶胶垂直分布反演。结果表明,模型能够有效识别不同污染源引发的垂直结构差异。该研究为复杂情景下气溶胶垂直扩散过程的观测与分析提供了新的数据来源和技术手段,展现出重要的科学价值与应用潜力。
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编(微信:qxxjgzh)处理。

