1.建模性能和交叉验证
在一台配备I7-9750H处理器、16GB内存、运行Ubuntu19.04的机器上,对每个小时温度场进行动态降尺度的平均计算时间为9分24秒。这一时间仅指从5km(域2)到1km(域3)分辨率的降尺度计算。在相同配置的机器上,统计降尺度的平均时间约为0.4秒。统计方法的这一显著加速性能优于LeRoux等人(2018年)使用支持向量机对农业地区进行温度降尺度的结果。
训练阶段模拟了120个分辨率为5km的温度场。交叉验证的平均值分别为0.89℃、0.87℃和0.87℃,MSE、RMSE和R2分别为0.89℃、0.87℃和0.87℃。这些结果表明气温与所用自变量之间的关系令人满意。例如,Zhou等人(2020年)在使用随机森林算法生成以色列1km处的温度校园时,发现MAE值介于0.42℃和1.12℃之间,RMSE介于0.65℃和1.58℃之间。
2.利用观测数据进行降尺度验证
与观测数据相比,动态模型和统计降尺度模型的R2、MSE和RMSE值相似,如图4所示。统计方法与观测数据的R2值高于动态方法。动态方法的误差值低于统计方法。
动态方法模拟的日间温度介于23.59至35.80℃之间,而统计过程则介于23.46至35.74之间。两种方法都高估了最小值,低估了最大值。
由于太阳辐射的昼夜变化,城市热岛(UHI)的形状和强度在白天各不相同。UHI的主要驱动因素之一是构造(Mirzaei&Haghighat,2010年)。分别观测夜间时段,动态方法模拟的温度在22.97至30.96℃之间变化;统计方法模拟的温度在23.09至31.31℃之间变化。因此,两种降尺度方法都高估了夜间的最高和最低气温。这种对气温的高估也体现在平均值上。在白天和夜间,动态方法和统计方法得出的平均气温分别为30.3℃±3.1((x)±σ)和25.8℃±1.9,34.4℃±3.1和25.7℃±1.8,而观测值分别为29.3℃±3.1和24.6℃±1.9。
在白天,统计方法高估了平均气温约5℃,高估了动态过程约1℃;在夜间,两种方法都高估了观测温度约1℃。Jandaghian和Berardid(2020年)将SLUCM与其他与WRF耦合的城市地表模式进行了比较,发现该模式估计的多伦多市区平均气温高估了约0.05℃。这些结果表明,WRF/SLUCM高估了城市地区的温度。反过来,统计方法也有类似的行为,在白天会加剧高估。

3.时间和空间UHI估计值
统计方法高估了UHI的平均强度,而动态方法则低估了UHI的日间强度(表3)。与统计方法的结果相比,动态方法的结果与观测数据的相关性更为显著。不过,统计方法在白天和夜间的均方根误差值较低。动态过程估计的白天平均UHI强度为负值,但该值与今晚的观测值接近。
降尺度方法准确模拟了观测到的UHI日变化模式(图5)。在白天的大部分时间里,动态方法没有低估UHI,在当地时间上午7点到下午3点之间,UHI达到负值。在夜间的前几个小时,即当地时间下午7点之后,两种降尺度方法都高估了UHI值。在夜间,即当地时间凌晨1点到5点之间,统计方法高估了UHI强度,而动态方法则高估了UHI强度。
统计降尺度方法估计的UHI强度也因城市土地利用类型而异。图6比较了不同土地利用类型的城市热岛强度。可以看出,与观测数据和SLUCM方法相比,XGB方法倾向于高估UHI强度,尤其是在低密度住宅区。在高密度住宅区,SLUCM方法显示出与观测数据更接近的离散性。这表明,SLUCM在估计城市密集区的UHI方面可能更准确,而XGB方法可能需要调整以提高其准确性,尤其是在密度较低的地区。两种降尺度方法估算值的不确定性(以变异条表示)表明,两种降尺度方法都倾向于高估较高的UHI强度,而低估较低的强度。
两种降尺度方法都模拟了MODIS-LST遥感器探测到的UHI中心空间核心(图7)。最大的一个核心位于城市中心区域,向北延伸,那里有大量中高密度的城市区域(图1)。另一个核心则较为孤立,位于海湾东部城市化高度集中的区域。
降尺度方法估算了城市西部地区的UHI核心,MODIS-LST场景中没有观测到这些核心(图7a中以矩形标出)。近几十年来,该地区有高温和UHI核心增加的记录,因此这两种方法的估计值是可信的。值得注意的是,测量中固有的不确定性以及表面UHI和冠层高度UHI之间的差异也会影响MODIS场景。在有海风和山谷风的地区,如MARJ,这些现象的表现会影响与地表的热交换。这可能会增加两类UHI之间的差异。
在空间模式方面,两种降尺度方法估计的UHI形状和强度模式相似。两种方法估算的强度之间存在很高的相关性(R2=0.97)(图7b)。分析动态方法和统计方法平均差异的空间分布(图7c)可以发现,研究区域的西部和东部地区的强度存在正差异(图7c中突出显示)。这两个地区都有相当大的低洼地形(图1)。地形和坡度变量在XGB统计降尺度方法中的影响说明了这些地区存在差异的原因。
与沿海地区的动态过程相比,用统计方法估算的UHI强度更高。动力学方法是利用物理模式共同作用来模拟局地大气边界层(ABL)和地表湍流交换,从而影响空气温度。在沿海地区,海岸线上的局地大气会对海风等海洋-大气现象产生更强烈的影响,增加了模拟局地温度的复杂性。在这种情况下,这些沿海站点的热岛观测会受到影响。
图8显示了两种降尺度方法在UHI强度阈值为1到4◦C时估算出的UHI面积的每小时变化情况。两种方法,即统计方法(XGB)和动态方法(SLUCM),在一天中对马尔代夫的城市热岛(UHI)面积的变化具有相似的模式。白天热斑块的扩张和收缩与图5中观察到的UHI强度变化一致,尤其是在较高阈值(3◦C和4◦C)时。然而,在估计值和变异性的大小上出现了差异。动态方法(SLUCM)在一天中的大部分时间都有较大的UHI区域,但下午6点之后除外,因为此时的强度更高(图5),而XGB则呈现出相同或稍高的值。这种反演表明,XGB所捕捉到的非线性关系在强度较高的时段能更好地估计出UHI的持续性,尽管在其他情况下也经常出现低估。
此外,XGB全天的标准偏差较大,但在UHI高峰时段除外,这两种方法的标准偏差相似。这种稳健性的提高可能是由于该算法能够捕捉数据中的非线性关系并建立模型。另一方面,由于地形崎岖且临近海洋,SLUCM对每小时的波动(如风力或湿度变化)非常敏感,因此变异性较大。这些差异可能会影响两种方法的应用范围。SLUCM可能更适用于实时物理过程分析,而XGB则在用于预警的业务极端预报方面具有优势,这对于像MARJ这样城市化程度高的沿海大都市的减灾工作至关重要。
4.全局特征贡献
如图9所示,在统计降尺度过程中,每个变量在提升梯度算法中的权重全天都在波动。不过,地形和土地利用变量的贡献最大。在当地时间5点之前的早期时段,土地利用比地形更为重要。从当地时间7时起,出现了反转现象,一直持续到中午前后,土地利用变量的作用又变得更加突出。MARJ具有当地的特殊性,如复杂的地形、城市内部植被茂密的区域以及靠近海岸,这些反过来又影响了地表在一天中早期的升温方式。在日照的最初几个小时,城市内部山丘造成的遮挡导致入射太阳辐射强度不同,增加了城市地表的异质加热。在这一时期,机器学习算法中地形对气温的影响比土地利用的影响更为显著。此外,在此期间,纬度的影响也会增大。
如果只考虑统计模型中土地用途的影响,则每种土地用途在白天的贡献率也存在差异。在白天时段,城市用途类别的影响最为显著。然而,在上午10时至下午3时期间,城市用途类别的影响力逐渐减弱,而植被类别,尤其是高植被类别的贡献率则有所上升。该算法的这种行为可能与MARJ内存在茂密的热带森林区有关。这些植被增加了当地的湿度,加剧了蒸散作用,从而影响了能量平衡,尤其是在一天中最热的时段,此时这类植被在算法估算中的重要性增加。下午5点以后,城市土地利用对模型的影响更大。这种行为与统计模型的UHI面积估计值一致(图8),其估计值与动态方法的估计值趋同。

5.局部特征贡献
空间位置也会影响算法中的特征贡献。在SHAP分析中,地形是白天和夜间对模型贡献最大的特征(图8)。值得注意的是,SHAP值与温度之间存在线性反比关系(图8b)。这表明地形高度越低,气温越高。这一特征印证了垂直温度曲线的预期变化模式,即地表温度通常较高,随着向对流层顶移动,温度逐渐降低。
图10a中的左长尾表明,高海拔地区比低海拔地区的贡献更大。海拔500米以下,城市网格点的地形SHAP值较高(图10b)。然而,在海拔500米以上,城市地形的SHAP值较低。这一现象表明,在XGB的运行过程中,地形与城市使用之间存在相互作用。
城市使用特征的贡献因时间而异(图10)。在白天(图10),城市使用的SHAP值接近于零,表明该变量对模型的贡献较低。然而,在夜间,SHAP值增加,城市使用具有正贡献。这一结果与以下认识相吻合,即在白天结束和夜晚开始时,城市地区由于储存了热量,需要比农村地区更长的时间来降温,从而增加了UHI强度。这一行为与第3.3项中分析的估算UHI强度的统计方法的结果一致。
通过观察纬度的空间分布SHAP值,可以明显看出海岸线具有很强的负贡献(图11)。纬度越低的区域表明越靠近海岸带。随着纬度的增加,网格点进一步深入大陆,地形崎岖,与气温上升的直接关系减弱。这表明,尽管纬度这一变量的梯度减小,但中尺度过程对纬度的重要性影响很大。
由于临近大西洋,研究区域白天的地表变暖效应因水蒸气的存在而减弱。这一现象导致形成南北方向的热振幅梯度。在海洋地区,表层的高比热值和剧烈混合造成了巨大的热惯性,从而减少了白天的气温变化。在机器学习模型训练过程中也可以观察到这一点。
土地利用作为二进制变量被纳入模型,因此图11中显示的结果考虑了每个网格点存在(1)或不存在(0)特定土地利用的情况。值得注意的是,在白天,如果网格点没有城市覆盖,则该变量对任何分析算法都没有影响。这种现象可能与土壤—大气能量通量之间相互作用的时滞有关。换句话说,在白天,城市地表由于比热较低而升温较快,而大气则通过与地表接触层的传导和对流升温较慢。这种热量共享有利于蓄热而非对流。相反,农村地区往往湿度较大,导致潜热通量增加。因此,在一天中较暖的时段,城市地表的存在会导致空气温度比农村地区温和。
在白天结束和夜晚开始时,城市覆盖物由于储存了热量,往往需要比农村环境更长的时间来降温,从而增加了UHI强度。SHAP分析表明,网格点的城市化会导致夜间温度升高(图10)。
此外,在本研究中,即使在涉及崎岖地形和海岸效应的复杂地形中,极端梯度增强算法也成功地模拟了城市供暖区域。不过,要探索该算法的稳健性,还应在其他类型的地形中以及使用不同时空尺度的信息进行检验。本文介绍的统计方法可以通过在回归模型中插入新的自变量来改进,这可能会带来更好的降尺度结果。例如,城市建筑高度和人口密度对形成UHI有很大影响,因此,将这些信息纳入降尺度统计方法,有望改善模型在城市地区的性能。
机器学习算法可以整合来自多个不同来源的数据,包括计算模型和遥感数据,如本研究中所探讨的,从而可以通过综合数据库对城市地区的气候进行研究。整合原地传感器的数据可进一步增强降尺度系统,从而更准确地估计温度场。此外,机器学习算法为研究特高气温影响提供了宝贵的能力,如从现有数据中提取新的见解和识别组织模式。
此外,可解释性技术或可解释性机器学习算法的应用和发展也能让对UHI的研究受益匪浅。这些技术有助于理解热岛的形成过程,使统计降尺度方法(如本工作中介绍的方法)更有助于进行综合分析。

