Py学习  »  机器学习算法

四川大学Remote Sens. Environ发文,基于机器学习揭示中国植物水源分布的时空动态!

生态遥感前沿 • 1 月前 • 176 次点击  
近日,四川大学水利水电学院的孙向阳副研究员,在SCI环境科学期刊《Remote Sensing of Environment》(IF=11.1)发表题为Spatial and temporal dynamics of plant water source distribution in China”研究论文,揭示了中国植物水源分布的时空动态!
论文信息:
Hongjiang Chen, Genxu Wang, Juying Sun, Li Guo, Chunlin Song, Xiangyang Sun. Spatial and temporal dynamics of plant water source distribution in ChinaRemote Sensing of Environment, 2025, 328, 114843
论文链接:

https://doi.org/10.1016/j.rse.2025.114843

图片

1

文章摘要

植物水分利用策略在调节土壤水分、介导植物 - 气候反馈以及影响物种竞争和共生关系中起着关键作用。然而,缺乏关于植物水源的长期大规模研究,严重限制了对植物水源时空变化及其对生态水文过程影响的全面评估
为应对这一挑战, 本研究整合了中国210个研究区域的文献数据,并应用多元随机森林模型生成了2001-2022年中国0.25°×0.25°空间分辨率的植物水源分布地图。模型估算了植物从不同土壤深度和地下水的吸水比例,分析了不同植被类型的水源差异,以及影响植物水源的关键因素
模型结果与现有实验研究吻合良好,证明了其捕捉植物水源时空分布和趋势的可靠性。全国范围内,植物平均34.64±6.45%的水分来自浅层土壤(0-30厘米)24.60±3.42%来自中层土壤(30-60 厘米),32.68±6.74%来自深层土壤(>60 厘米),8.08±4.7%来自地下水。
中国南方与半干旱北方地区的植物水源存在显著差异,南方地区植物主要依赖浅层和中层土壤水,而西北地区植物对深层土壤水和地下水的依赖度更高。
土壤含水量、降水与植物水源变化的相关性更为显著,具体而言,浅层土壤含水量和降水与植物吸收浅层土壤水的比例呈正相关,与深层土壤水吸收比例呈负相关
2001-2022年,全国范围内植物从浅层和深层土壤层的吸水比例呈增加趋势,而从中层土壤和地下水的吸水比例则有所下降
本研究填补了中国植物水源大规模综合研究的关键空白,为相关科学研究提供了有价值的数据和方法参考。研究结果还有助于理解植被增强对环境变化的适应能力,为生态水文模型模拟提供重要驱动数据,并为更准确评估当前极端气候变化背景下的生态系统适应和水资源变化提供重要数据支持

2

文章引言

植物水分利用策略对调节生态系统水文过程与稳定性至关重要。通过根系吸水策略,植物有效调控土壤水分分布、蒸散过程及生态系统水循环,这对水资源管理和生态系统服务的实现具有重要意义。气候显著影响植物水分利用策略,植物可通过调整吸水策略适应不同环境条件,增强对气候变化的抗性。随着气候变暖改变植被特征,深入理解植物水源成为预测生态系统响应的关键。植被在调节水 - 碳 - 能量交换中扮演重要角色,优化水分分配对提升生态系统韧性不可或缺,因此解析植物水源动态有助于预测其对水热条件变化的响应,支撑环境管理与气候适应策略

稳定同位素技术是揭示植物水源的重要工具,现有研究多基于样地或流域尺度。样地研究通常聚焦小范围单一或少数树种,流域研究则侧重蒸散或水流通量分析。 尽管有学者从生物群落、物种及降水格局等角度开展了整合分析,但全球范围内缺乏时空代表性充分的大规模植物水源研究。时间上,传统分析方法耗时,多数研究限于数周内的数据,长期连续观测匮乏;空间上,原位数据分布不均,尤其在区域和全球尺度,不同气候带和植被类型的综合研究不足。中国作为全球绿化的重要区域,构建全国尺度的植物水源分布图谱,对理解植物环境适应机制和生态系统可持续性至关重要。

机器学习方法的引入与研究目标 机器学习算法在整合多源数据、预测环境变量方面表现出色,随机森林因预测能力强而被广泛应用于土壤、水文属性制图,但在植物水源预测中应用较少。传统水文模型缺乏植物水分利用模块,基于同位素的耦合模型受限于长时序数据不足,而机器学习为克服现有生态水文建模缺陷提供了新路径。本研究旨在利用多元随机森林模型,结合环境变量,构建2001-2022年中国0.25°×0.25°分辨率的植物水源分布图谱,具体目标包括:整合全国植物水源研究数据作为模型输入,预测并绘制水源空间分布格局,分析其时空趋势及驱动因素为水资源管理和植被恢复提供科学依据。

3

研究方法

31、数据采集与处理

1、植物水源数据

通过关键词检索中国生态与水文领域195篇文献,提取2001-2023年210个样地的植物木质部水与土壤水、地下水的同位素数据(δ¹⁸O、δ²H)及水源比例(利用 IsoSource和MixSIAR模型计算)。

通过层次聚类分析统一土壤分层标准(浅层0-30cm、中层30-60cm、深层>60cm),并保留文献中地下水深度的原始定义。 

2、环境预测变量

整合17个环境变量,包括6个气象指标(降水、温度、蒸散等)、7个土壤指标(粘粒/砂粒含量、有机碳等)、2个植被指标(植被类型、根系深度)及2个地形指标(海拔、地下水位)。

所有数据通过双线性插值统一为0.25°×0.25°分辨率,确保时空一致性。 

3、植被分区数据

基于植被地理学原则,将中国划分为8个植被区(如寒温带针叶林区、温带草原区等),用于空间分异分析。

3.2、多元随机森林模型构建

1、模型原理与优势

采用多元随机森林(MRF)回归模型,同时预测浅层、中层、深层土壤水和地下水的吸水比例,利用变量间相关性提升预测精度。

模型通过Bootstrap抽样构建多棵决策树,以投票机制生成结果,有效处理非线性关系和过拟合问题。 

2、数据预处理:

时空匹配:采样点数据与对应时段气象数据(前7天均值)匹配,预测时使用月均气象数据生成连续时间序列;结合ESA CCI植被分类数据提升空间预测精度。 

标准化处理:对自变量进行标准化/归一化,消除量纲差异影响。 

3、超参数优化

通过网格搜索(GridSearchCV)确定最优参数,n_estimators=600,max_depth=10,min_samples_split=6,确保模型泛化能力。 

4、变量重要性评估

基于决策树节点分裂时的杂质减少量,量化各环境变量对水源比例的影响程度。

3.3、模型评估与趋势分析

1、性能验证

将数据划分为70%训练集、15%测试集、15%独立验证集,结合10折交叉验证,采用 R²、RMSE、MAE评估预测精度,确保模型可靠性。 

2、时空趋势分析

趋势检测:利用Theil-Sen斜率分析水源比例的时间变化趋势,通过Mann-Kendall检验验证显著性。

波动特征:基于变异系数(CV)划分水源比例的波动等级(低变率至高变率)。

3、驱动因素分析

通过偏相关分析,控制其他变量后量化降水、温度、土壤含水量等因素与水源比例的独立相关性,并通过主成分分析(PCA)消除多重共线性,t检验验证显著性。

图片

图1. 本研究整合分析的195篇文献中的210个野外样地分布。 数据点显示在中国植被分区图(a)、中国植被类型图(b)和Whittaker生物群系图(c)。植被分区包括:R1:寒温带针叶林区,R2:温带针阔叶混交林区,R3:暖温带落叶阔叶林区,R4:亚热带常绿阔叶林区,R5:热带季风雨林区,R6:温带草原区,R7:温带荒漠区,R8:青藏高原高寒植被区。MAP:年均降水量,MAT:年均温。

4

研究结果

4.1、模型性能与关键驱动因素

多元随机森林模型在验证集和测试集上表现稳健,R²分别为0.57和0.56,RMSE与MAE误差范围在6.48%–8.23%,表明模型具备跨时空预测植物水源分布的能力。

变量重要性分析显示,蒸腾量(Et)、地下水位(WTD)和土壤含水量(SWC)是影响植物水源比例的核心因素,降水和温度的作用次之,凸显气候因子与土壤水分对植物吸水策略的主导性。

图片图2. 多元随机森林回归模型中预测变量的重要性排序。

4.2、全国尺度水源分布及时空趋势

2001–2022年全国植物水源平均比例为浅层土壤水(34.64%)、中层(24.60%)、深层(32.68%)和地下水(8.08%)。

空间上呈现显著分异:南方及东北林区依赖浅层水,西北干旱区和青藏高原植被更依赖深层水与地下水。

时间趋势显示,浅层和深层土壤水利用比例显著上升,中层水和地下水占比下降,其中 2014–2015 年深层水与地下水比例波动较大。

北方黄土高原、内蒙古草原等地水源比例变异系数较高,反映其水源利用的不稳定性。

图片图3. 2001-2022年中国植物水源平均分布图。a)浅层土壤水,b)中层土壤水,c)深层土壤水,d)地下水。

图片 图4. 2001-2022年中国植物水源比例变化趋势及显著性a)浅层土壤水,b)中层土壤水,c)深层土壤水,d)地下水。左下角插图:柱状图表示2001-2022年全国植物吸水量显著(不显著)增加或减少的比例,对应下方和左侧坐标轴;折线图表示2001-2022年植物吸水比例的年均变化,对应上方和右侧坐标轴,蓝色线条为拟合线。

图片图5. 植物利用不同水源比例的变异系数(CV)。a)浅层土壤水,b)中层土壤水,c)深层土壤水,d)地下水。

4.3、植被类型与水源利用差异

不同植被区水源策略差异显著:热带季风雨林区(R5)浅层水利用比例最高(37%),温带荒漠区(R7)最低(30%);深层水利用在 R7 区达34%,R5区仅 25%。

针叶林和阔叶林主要依赖浅层水,但西南山区转向深层水;灌木在西北干旱区依赖中层水,西南山区依赖深层水;草地普遍利用浅层水,但青藏高原草地侧重中深层水。

农田在东北平原依赖浅中层水,华北平原则依赖深层水与地下水,体现湿润区与干旱区植被对水分的适应性分化。

图片图6.不同植被分区植物利用不同水源的年均比例。R1:寒温带针叶林区,R2:温带针阔叶混交林区,R3:暖温带落叶阔叶林区,R4:亚热带常绿阔叶林区,R5:热带季风雨林区,R6:温带草原区,R7:温带荒漠区,R8:青藏高原高寒植被区。

图片图7. 不同植被分区植物利用不同水源比例的年际变化趋势。a)浅层土壤水,b)中层土壤水,c)深层土壤水,d)地下水。

4.4、气候与土壤水分的驱动机制

偏相关分析表明,土壤含水量对水源利用的影响高于气象因子和NDVI。

浅层土壤水(0–28 cm)与浅层吸水比例正相关,深层土壤水(28–289 cm)则驱动中深层吸水及地下水利用。

降水与浅层水、地下水利用正相关(尤其东南地区),与中深层水负相关;温度与浅层水负相关,与深层水及地下水正相关(西南及高原区显著)。

蒸散量在北方促进浅层水利用,在南方则呈负相关。NDVI 与浅中层水利用弱正相关,整体驱动作用有限。

图片图8.植物水源利用与降水、温度、蒸散量、NDVI 和土壤含水量的偏相关分析。 a)浅层土壤水,b)中层土壤水,c)深层土壤水,d)地下水。

5

研究讨论

5.1、中国植物水源时空动态与生态影响

本研究利用多元随机森林模型发现,2001 - 2022年中国植物水源以土壤水为主,浅层土壤水利用占比最高且呈上升趋势,地下水利用最少。

空间上,南方植被依赖浅层水,西北干旱区则更多取用深层土壤水与地下水。这种变化蕴含重要生态意义,如西南、东北地区对浅层水依赖下降可能加剧水资源竞争,西北植被转向深层水源则是对干旱环境的适应。

不同气候区植被与水之间的复杂反馈机制,也凸显了掌握植物用水策略对生态管理的关键作用。

5.2、植物水源利用的关键驱动因素

气象变量与土壤含水量是影响植物水源利用的核心要素。降水增加促使植物更多依赖浅层土壤水,高温则迫使植物取用深层水源或地下水,体现了气候与土壤水分交互作用对植物吸水策略的塑造。

同时,植物自身生理结构(如根系深度)、农业开发及城市化进程,也在不同区域显著影响其水源选择。例如,华北平原因农业过度开采地下水,导致植被对浅层和中层土壤水的利用显著增加。

5.3、研究不足与未来方向

研究存在数据与方法层面的局限。原始数据异质性、植被年龄动态缺失、土地覆盖分类不精细及地下水数据静态化,影响模型准确性;0.25°×0.25°的空间分辨率难以刻画复杂植被区的水源细节;模型还存在过拟合问题。

未来需借助数据增强、深度学习等技术优化模型,同时政策制定者应依据区域特性制定水资源管理策略,提升生态系统适应气候变化的能力。

6

研究结论

本研究利用多元随机森林模型,整合中国植物水源实地观测数据,创新性绘制了 2001-2022年中国植物水源分布图谱,填补了大规模综合研究的数据空白

模型整体R²为0.56,结果可靠,有效捕捉了植物水源的时空分布与趋势:全国范围内浅层和深层土壤水利用比例显著上升,中层土壤水和地下水利用呈下降趋势。

空间差异明显,南方植被主要依赖浅中层土壤水,西北半干旱区则更依赖深层土壤水和地下水

气候变量中,土壤含水量对植物水源影响最强,与浅层水利用呈正相关降水与浅层水利用正相关、深层水利用负相关,温度和蒸散量影响相对较弱

研究结果 为中国水资源管理、规划及生态保护(尤其应对气候变化)提供了关键支撑,未来需通过精细化数据和方法优化进一步提升预测精度

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182974
 
176 次点击