温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
四川省
降水
实况
分析
产品
影响
因素
综合
评估
吴薇
第 41 卷 第 1 期2023 年 2 月Vol.41 No.1February,2023干旱气象Journal of Arid Meteorology四川省降水实况分析产品影响因素综合评估吴薇1,2,黄晓龙1,2,徐晓莉1,2,李施颖1,2,杜冰1,2,蒋雨荷1,2(1.四川省气象探测数据中心,四川 成都 610072;2.高原与盆地暴雨旱涝灾害四川省重点实验室,四川 成都 610072)摘要:国家气象信息中心基于多源观测数据,利用数据融合与同化技术研制的实况分析产品已通过业务准入评审并发布。为保证实况分析产品评估结果的客观性和真实性,对参与实况分析产品检验评估的数据源地面站点资料的代表性进行研究。选取2020年58月四川省地面气象站点经度、纬度、坡度、坡向、数据可用性等10个降水影响指标,利用相关分析、主成分分析,在指标筛选基础上,通过确定各影响指标的权重,形成各地面站点的综合影响指标,并对其进行分级检验。结果表明:10个影响指标经过筛选保留5个指标,其权重从大到小依次为数据可用性、设备稳定性、坡度变率、地表粗糙度、海拔高度;四川盆地内站点综合影响指标值大部分在0.9以上,综合影响指标值较低的站点主要分布在四川省甘孜州、阿坝州和凉山州,这与上述区域地形复杂、站点代表性较差密切相关;通过综合影响指标的分级评估,将指标值在0.8以上的站点数据作为降水实况分析产品评估的“真值”数据源较合理。关键词:降水;实况分析产品;主成分分析;评估文章编号:1006-7639(2023)01-0143-09 DOI:10.11755/j.issn.1006-7639(2023)-01-0143中图分类号:P426.6 文献标志码:A引 言随着精细化智能网格预报的发展,对高质量时空连续的格点化气象数据产品需求越来越迫切。格点化的数据产品综合了多源观测数据的优势,能有效弥补地面站点分布不均及观测空白区等问题。国家气象信息中心利用数据融合与同化技术(Jacobs et al.,2008;Xie et al.,2011),研发了高分辨率的格点实况分析产品,包括降水、气温、相对湿度、风、能见度、三维云等(师春香等,2019)。通过在全国及部分区域不同时空尺度的适用性评估,发现实况分析产品在大部分地区具有一定的适用性,但对灾害性天气的描述能力及在地理地形环境复杂区域的准确性有待提高(孙靖等,2021;吴薇等,2019;吴薇等,2021;俞剑蔚等,2019;张玮等,2020)。实况分析产品在复杂地形条件下应用的局限性,主要归结于两方面:一方面格点化的实况分析产品受地理地形因素、气象条件等影响,不能准确反映近地面大气状况及变化;另一方面参与检验的站点数据的代表性问题对客观评价实况分析产品的精度存在影响。在以往实况分析产品检验评估中,大都以全国气象资料业务系统(Meteorological Data Operational System,MDOS)质控正确的地面站点数据作为“真值”数据源,未考虑站点的地理位置、地形特征以及观测设备稳定性等影响因素,这势必影响实况分析产品评估结果的真实性。四川地处中国西南腹地,地势起伏大,东西海拔落差近7 000 m,地形复杂多样,全年降水充沛,且区域分布不均,暴雨洪涝灾害频发。本文围绕作为实况分析产品检验评估的数据源站点数据的代表性问题展开,以四川天气预报、气候分析重点关注的气象要素降水为例,在前期对实况分析产品充分评估分析基础上,根据站点属性特征确定主要影响指标(经度、纬度、拔海高度、台站级别、坡度、坡向、坡度变率、地表粗糙度、数据可用性、设备吴 薇,黄晓龙,徐晓莉,等.四川省降水实况分析产品影响因素综合评估 J.干旱气象,2023,41(1):143-151,WU Wei,HUANG Xiaolong,XU Xiaoli,et al.Comprehensive assessment of influencing factors of precipitation real-time analysis products in Sichuan J.Journal of Arid Meteorology,2023,41(1):143-151,DOI:10.11755/j.issn.1006-7639(2023)-01-0143收稿日期:2021-09-23;改回日期:2022-04-05基金项目:四川省科技厅重点研发计划项目(2022YFS0541)、高原与盆地暴雨旱涝灾害四川省重点实验室科技发展基金项目(SCQXKJYJXMS202221)、中国气象局创新发展专项项目(CXFZ2021Z007)和西南区域多源融合实况产品研究创新团队项目(西南气中201813号)共同资助作者简介:吴薇(1981),女,高级工程师,主要从事资料处理与应用。E-mail:。41 卷干旱气象稳定性),利用相关分析和主成分分析,对参与降水实况分析产品检验评估的站点数据影响因素进行综合分析,以期遴选出质量更高、更具代表性的站点数据作为实况分析产品的评估数据源,从而使实况分析产品评估结果客观真实。1资料与方法1.1资料及来源本文参与分析检验的资料包括四川辖区内国家站和区域站站点经度、纬度、拔海高度、台站级别、坡度、坡向、坡度变率、地表粗糙度、数据可用性、设备稳定性以及降水实况分析产品。由于区域站未安装称重降水仪器,冬半年高原站点因积雪进行“软加盖”,降水数据质量无法完全统计,故本文研究时间段选取 2020年 58月,各数据来源信息如表1所示。文中附图涉及地图基于四川省测绘地理信息局审核批准的审图号为川S(2021)00009号的标准地图制作,底图无修改。1.2方 法首先利用相关分析和主成分分析,结合主观判断,对10个影响指标进行筛选;对筛选出的指标在数据标准化的基础上,通过主成分分析确定各影响指标权重,形成各站点的综合影响指标,并对综合影响指标进行分析检验。1.2.1数据预处理为提高数据处理速度和精度,在数据分析前需进行数据预处理。数据预处理一般包括数据清洗、数据集成、标准化处理等(成珂等,2021)。本文用到的数据都是业务化数据,数据完整性较好、质量较高,经合并处理后共得到4 483站的完整数据。数据通常是有单位的,为消除量纲影响,在数据分析前需进行标准化处理。同时本文最终需形成综合指标,各影响指标的变化趋势应保持一致,因此采用极差标准化方法对数据序列x1,x2,xn,进行标准化处理,极差标准化转换函数如下:yi=xi-min1in ximax1in xi-min1in xi(1)yi=max1in xi-ximax1in xi-min1in xi(2)式中:max为样本数据的最大值;min为样本数据的最小值。根据影响指标的变化趋势,将其分为正、负向指标,正向指标表示指标值越大越好,负向指标则是越小越好。根据定义,正向指标采用公式(1)进行数据标准化处理,负向指标采用公式(2)进行数据标准化处理。1.2.2主成分分析法主成分分析法的基本思想是降维,将线性相关的多变量数据转化为少数不相关的综合指标,消除各因子的信息重叠,关于主成分的计算原理(吴洪宝和吴蕾,2010),本文不再阐述。通过对标准化数据进行主成分分析,得到相应的多个主成分,通过各主成分的方差贡献率,计算各影响指标的权重,具体计算步骤和方法如下(陈健翎等,2021;张武龙等,2021):(1)计算第i个影响指标在第j个主成分线性组合中的系数aij;aij=ijj(3)式中:ij为第i个指标对应第j个主成分的因子载荷;j为第j个主成分的特征值。表1数据源信息Tab.1The information of data source名称经度、纬度、海拔高度及台站级别坡度、坡向、坡度变率及地表粗糙度数据可用性设备稳定性降水实况分析产品数据来源四川省站网管理平台90 m数字高程模型(Digital Elevation Model,DEM)数据MDOS系统天元系统气象数据通信系统气象站点数量/个5 8995 8115 210说明选取平台2020年1月1日前启用的有降水观测的站点;台站级别设置5级:国家站为1级,骨干站为2级,区域站国家级考核、省级考核、非考核分别为3级、4级和5级利用ArcMap软件,提取各站点的地形因子数据(郭佳等,2020;刘军等,2009;许宝荣等,2015)用数据可用率(质量控制为正确的数据个数/总数据个数)来表征用稳定运行率(正常时次/应到时次)来表征空间分辨率0.05o0.05o,基于地面-卫星-雷达三源融合的“中国气象局多源降水分析系统(CMA multi-source precipitation analysis system,CMPAS)中逐小时降水产品(CMPAS-hourly)”144第 1 期吴薇等:四川省降水实况分析产品影响因素综合评估(2)计算第 i 个影响指标的综合得分模型系数bi;bi=j=1naijjj=1nj(4)式中:j为第 j个主成分的方差贡献率;n为主成分个数。(3)计算第i个影响指标的权重ii=bii=1Nbi(5)式中:N为影响指标个数。1.2.3指标筛选方法两个指标之间的相关系数越大,相关性越高。基于相关分析的指标筛选,可以避免指标信息重复,从而简化指标。主成分分析中,每个主成分的方差贡献率反映该主成分所占信息总量的比重,每个指标的因子载荷反映指标对评价结果的影响程度(高燕俐等,2020),所以方差贡献率高的主成分中的因子载荷绝对值越大,表示指标对评价结果影响显著,应保留,反之则应删除。本文将两种方法相结合,既可剔除信息重复的指标,同时保证筛选出重要指标,兼顾指标所包含信息的全面性、代表性和简洁性(张辉和赵秋红,2013)。1.2.4检验评估方法首先,利用各指标的权重与对应标准化数据值相乘后累加,得到各个站点的综合影响指标;其次,运用最邻近插值算法,将降水实况分析产品插值到对应站点,并与站点观测值进行相关系数(Correlation Coefficient,COR)、平均误差(Mean Error,ME)和均方根误差(Root Mean Square Error,RMSE)等评估指标统计;最后,对综合影响指标进行分级,对不同等级下各评估指标变化情况进行分析。COR=i=1N(Gi-G)(Oi-O)i=1N(Gi-G)2i=1N(Oi-O)2(6)ME=1Ni=1N(Gi-Oi)(7)RMSE=1Ni=1N(Gi-Oi)2(8)式中:Oi为站点观测值;Gi为实况分析产品插值到站点的数值;N为参与检验的总样本数(站次数)。2结果与分析2.1影响指标筛选从10个影响指标间的相关系数(表2)看出,各影响指标间有不同程度的相关性,说明各影响指标间存在部分信息重叠。两两之间相关系数绝对值大于0.500且通过=0.01的显著性检验的有坡度与地表粗糙度、经度与海拔高度、坡度与坡度变率,其中地表粗糙度、坡度变率均与坡度具有较强的相关性,存在较大信息重叠,而经度和海拔高度在四川地理信息表现上也存在信息冗余。在主成分分析前,首先需要通过 KMO 检验和Bartlett球形检验(陈健翎等,2021)判断数据是否适合做主成分分析。KMO用于检查变量间的偏相关性,取值为 01,KMO值越接近于 1,变量间的偏相关性越强,因子分析效果越好。Bartlett球形检验用于判断相关矩阵是否是单位阵,即各变量是否有较强的相关性。在实际应用中,通常认为KMO值大于表2影响指标间的相关系数Tab.2Correlation coefficients between impact indicators纬度经度海拔高度台站级别坡度坡度变率坡向地表粗糙度数据可用性设备稳定性纬度1.0000.360*-0.0280.068*0.0180.031*-0.0020.0200.007-0.035*经度1.000-0.736*-0.088*-0.195*-0.187*0.048*-0.199*0.101*0.062*海拔高度1.0000.200*0.344*0.332*-0.0260.29