温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
随机
森林
模型
黄土高原
时空
格局
未来
演变
趋势
模拟
刘欢欢
第40卷第1期2023年1月Vol.40No.1Jan.2023干 旱 区 研 究ARIDZONERESEARCHhttp:/DOI:10.13866/j.azr.2023.01.13基于随机森林模型的黄土高原草地净初级生产力时空格局及未来演变趋势模拟刘欢欢1,陈印1,刘悦1,刚成诚2,3(1.西北农林科技大学草业与草原学院,陕西 杨凌712100;2.西北农林科技大学水土保持研究所,陕西 杨凌712100;3.中国科学院水利部水土保持研究所,陕西 杨凌712100)摘要:准确估算草地净初级生产力(Net Primary Productivity,NPP)是了解草地生态系统碳循环过程和科学评估草地对气候变化响应与适应机制的关键。以黄土高原草地生态系统为研究对象,基于1788个草地生物量数据及19个环境因子数据(包含气候、植被、土壤和地形因子),利用随机森林模型模拟了20022020年黄土高原草地NPP的时空动态,并估算了共享社会经济路径(Shared Socioeconomic Pathway,SSPs)4个未来气候情景下,黄土高原草地NPP的未来演变趋势。结果表明:(1)随机森林模型的模拟精度较好,可用于黄土高原草地NPP估算;(2)黄土高原草地NPP在空间上整体呈现“东南高西北低”的空间分布特征,年均值为276.55 g Cm-2,其中陕西关中地区草地NPP最高;(3)20022020年,黄土高原草地NPP总体呈现增加趋势,其中55.01%的区域草地NPP增加,主要集中在陕西关中地区、甘肃西部地区以及山西北部地区;(4)在气候暖湿化背景下,到本世纪末,黄土高原草地NPP均呈增加趋势,其中SSP585情景下草地NPP增加最多,SSP126情景下增加最少。利用随机森林模型能够较好模拟黄土高原草地NPP时空格局及未来演变趋势,为黄土高原草地生态系统保护及可持续发展提供数据支持。关键词:草地生态系统;净初级生产力;随机森林;共享社会经济路径;黄土高原草地是陆地生态系统主要组成部分之一,约占陆地面积30%1。草地生态系统在维持生态系统功能以及服务社会经济中均发挥重要功能,包括保护生物多样性、水土保持以及减缓温室效应等2。植被净初级生产力是衡量生态系统固碳能力的重要指标之一3。草地净初级生产力(Net Primary Production,NPP)不仅能够直接反映草地生态系统生产力的高低,而且是评价草地生态系统碳收支及调节草地生态过程的主要因子4。因此,科学评估草地NPP及其时空动态对草地生态系统管理及草地资源保护至关重要。传统野外采样估算草地 NPP的方法虽然结果较为准确,但由于其需要耗费大量的人力、物力和财力,在大空间尺度草地NPP的估算中较少使用。遥感技术和生态模型的发展为此提供了重要的方法和技术手段。遥感技术通过利用遥感指标数据与草地生物量的相关关系来估算草地NPP,如马文红等5基于NDVI以及地上生物量数据模拟了19822006年中国北方草地生物量空间分布及动态;王莺等6利用EVI与草地干物质产量回归模拟了20062008年甘南草地NPP变化。模型模拟同样是大空间尺度草地NPP估算的常用方法,如Guo等7利用 CASA 模型模拟了 20012018 年内蒙古草地NPP;张赟鑫等8利用CASA模型和Miami模型模拟了中亚草地 NPP;Zhang等9利用 BIOME-BGC模型模拟了呼伦贝尔草原NPP。近年来机器学习方法在植被生产力估算中亦有广泛的应用。Jung等10利用机器学习中模型树集成算法模拟了全球总初级生产力;Yao等11利用模型树集成算法模拟了19822015年中国0.1空间分辨率的总初级生产力。随收稿日期:2022-05-26;修订日期:2022-08-13基金项目:陕西省自然科学基金(2021JQ-171);青海省防灾减灾重点实验室开放基金(QFZ-2021-Z06);国家自然科学基金项目(31602004);国家科技基础条件平台建设项目(2005DKA32300)作者简介:刘欢欢(1999-),男,硕士研究生,研究方向为草地生态遥感.E-mail:通讯作者:刚成诚.E-mail:123131页40卷干旱区研究机森林(Random Forest,RF)是基于决策树的集成机器学习算法,目前已被应用于全球12、我国西北地区13及青藏高原14不同类型草地NPP的估算。黄土高原是世界上最大的黄土覆盖区,气候干旱,水土流失严重,生态环境极其脆弱15-16。随着退耕还林还草工程等生态工程的实施,黄土高原植被变化及其环境效应备受关注17。目前,在黄土高原草地NPP时空动态及驱动力分析方面已开展了一定的研究18-19。但由于黄土高原地区地形复杂,不同研究结果之间存在较大差异。在全球变暖背景下,黄土高原草地NPP未来的演变趋势仍不清楚。因此,本研究基于气候、植被、土壤和地形因子,利用随机森林模型模拟了20022020年黄土高原草地 NPP 的时空动态,并基于共享社会经济路径(Shared Socioeconomic Pathway,SSPs)4 个未来气候情景数据,估算了黄土高原草地NPP的未来演变趋势,以期为黄土高原草地生态系统管理及可持续发展提供科学依据。1研究区概况与方法1.1 研究区概况黄土高原地处我国黄河流域中部,地理位置位于 1005411433E,33434116N,总面积达63104km2 20(图1),横跨陕西、甘肃、宁夏、山西、青海、河南以及内蒙古 7个省份,是我国四大高原之一,同时也是世界上最大的黄土覆盖区15。黄土高原包括了干旱、半干旱以及半湿润气候区,年降雨量在150800 mm,海拔在2003000 m,不同区域在气候上有着明显差异21。黄土高原的植被类型以森林、草地以及灌木地为主,草地面积约占总面积60%22。1.2 数据获取及处理通过文献、国家地球系统科学数据中心数据以及GEDI生物量数据(https:/daac.ornl.gov/)获取黄土高原草地地上生物量数据1788个,根据根冠比估算地下生物量,使用草地生物量乘以转换系数(0.475)估算草地NPP(g Cm-2),作为实测NPP数据23。为训练模型,选取19个特征参数包括土壤理化因子(S)、地形因子(T)、气象因子(A)和植被因子(B)4类。气象因子中温度和降水数据来源于国家地球系统科学数据中心-黄土高原分中心(http:/),根据月平均温度数据合成年平均温度(TEM)数据以及年生长季平均温度(TEM4-10)数据,根据月最低温度数据合成为年最低温度(TMN)数据,根据逐月降水量数据合成年降水量(PRE)数据以及年生长季降水量(PRE4-10)数据24。数字高程模型(DEM)数据来自 NASA 的 SRTM 数据(http:/srtm.csi.cgiar.org/),坡度(Slope)数据由DEM数据通过ArcGIS计算得来。土壤理化因子数据均来自世界土壤数据库(https:/data.isric.org/)。日光诱导叶绿素荧光(SIF)数据来自 GOSIFv2 数据25(https:/globalecology.unh.edu),植被有效光合辐射吸收比例(FPAR)数据、归一化植被指数(NDVI)以及蒸散量(ET)来自 MODIS 数据产品(https:/modis.gsfc.nasa.gov/)。未来降雨量和温度数据来源于 WorldClim(https:/www.worldclim.org/)。黄土高原空间范围数据以及黄土高原草地分布数据来自中国科学院资源环境与数据中心(https:/ km。以上数据分辨率均通过ArcGIS重采样为1 km,采用D_WGS_1984投影。本文所有环境因子见表1。SSPs情景在典型浓度路径(RCPs)情景基础上发展而来,用于定量描述气候变化与社会经济发展路径之间的关系,反映未来社会面临的气候变化适应 和 减 缓 挑 战26。本 研 究 分 别 选 择 SSP126、SSP245、SSP370 和 SSP585 4 个情景下,ACCESS-ESM1-5、BCC-CSM2-MR、CanESM5、CMCC-ESM2和CNRM-CM6-1,共计5个气候系统模式20212040年(2030s)、20412060 年(2050s)、20612080 年(2070s)、20812100 年(2090s)4 个时间段的降水图1 研究区概况及采样点分布Fig.1 Study area and sampling points1241期刘欢欢等:基于随机森林模型的黄土高原草地净初级生产力时空格局及未来演变趋势模拟量和温度作为输入数据,利用RF模型预测未来不同气候情景下黄土高原草地NPP的演变趋势。RF模型中的其他环境因子仍使用2020年数据。1.3 研究方法1.3.1建模方法本研究采用 RF进行建模,RF是基 于 分 类 和 回 归 树(Classification and RegressionTree,CART)而开发的集成算法,可用于分类问题以及回归问题27-28。RF的主要原理为通过结合多个决策树,并平均其结果使得决策树泛化误差收敛从而产生更好的预测结果29。RF可广泛用于预测问题,并且应用简单,无需复杂地调整参数,通过调整RF中回归树的数量以及决策树每处节点预测变量的数量来优化模型,提高预测精度29。此外,RF具有处理高维特征空间数据的能力,在遥感应用中已有较多研究30。RF模型性能通过决策系数(R2)以及均方根误差(RMSE)评价其拟合能力以及预测性能。本研究使用R 4.0.5进行随机森林建模、参数优化、预测以及空间可视化。1.3.2 Theil-Sen Median趋势分析和Mann-Kendall检验Theil-Sen Median 趋势分析是一种稳健的非参数统计趋势计算方法31,计算公式如下:Senslope=Median()xj-xij-i,i,j=1,2,N(1)式中:xj和xi为样本数据值。当Senslope0时,表明该数据在此时间序列呈增长趋势,反之则表示呈下降趋势。Mann-Kendall检验方法是一种非参数统计检验方法,用于判断趋势的显著性30。计算公式如下:S=i=1n-1j=i+1nsign()xj-xi(2)ZMK=S-1var()s,S00,S=0S+1var()s,S0(3)P=21-cdf()|ZMK(4)式中:S 为 Mann-Kendall 检验需要构建的统计量,ZMK是标准正态变量。本文在置信度水平=0.05上来检验NPP变化趋势的显著性。当P小于0.05时表示NPP变化显著,反之则表示不显著。表1 随机森林(RF)中使用的环境因子Tab.1 Environmental factors in RF类别SSSSSSSSTTAAAAAABBB环境因子CLAY_SCLAY_TSILT_SSILT_TSAND_SSAND_TSOC_SSOC_TDEMSlopeTEMTEM4-10TMNPREPRE4-10ETSIFFPARNDVI解释030 cm黏粒含量30100 cm黏粒含量030 cm粉粒含量30100 cm粉粒含量030 cm 砂粒含量30100 cm砂粒含量030 cm土壤有机碳含量30100 cm土壤有机碳含量数字高程模型坡度年均温(20022020)410月均温(20022020)年最低温度(20022020)年降水量(20022020)410月降水量(20022020)蒸散量(20022020)日光诱导叶绿素荧光(20022020)植被有效光合辐射吸收比例(20022020)归一化植被指数(20022020)分辨率250 m250 m250 m250 m250 m250 m250 m250 m30 m30 m1000 m1000 m1000 m1000 m1000 m500 m0.05500 m1000 m数据来源https:/data.isric.org/https:/srtm.csi.cgiar.org/http:/https:/modis.gsfc.n