温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
网格
化多源异构
数据
台风
灾害
杆塔
受损
数量
预测
侯慧
第 49 卷 第 3 期:1205-1212 高电压技术 Vol.49,No.3:1205-1212 2023 年 3 月 31 日 High Voltage Engineering March 31,2023 DOI:10.13336/j.1003-6520.hve.20220566 2023 年 3 月 31 日第 49 卷 March 基于网格化多源异构数据的台风灾害下杆塔受损数量预测 侯 慧1,刘 超1,陈 希1,吴细秀1,魏瑞增2,何 浣2(1.武汉理工大学自动化学院,武汉 430070;2.广东电网有限责任公司电力科学研究院广东省电力装备可靠性重点实验室,广州 510080)摘 要:台风灾害下受灾区域杆塔受损数量预测对提高电网公司防灾减灾能力具有重要意义。为此从全新的统计学习角度出发,基于气象数据、电网数据、地理数据等多源异构数据原始样本,对数据进行分类变量处理、特征筛选、标准化等预处理,并以网格内的杆塔受损数量为响应变量,基于梯度提升决策树算法构建台风灾害下杆塔受损数量预测模型,对台风灾害下配网 10 kV 杆塔受损数量进行预测。利用广东省徐闻县的数据样本对模型进行训练测试与验证,仿真结果表明所提方法可较为准确地预测台风灾害下配网杆塔受损数量,为电网公司的灾前风险量化评估、制定应急方案等提供辅助决策参考。关键词:台风;杆塔受损数量预测;多源异构数据;统计学习;梯度提升决策树 Prediction on Number of Damaged Towers Under Typhoon Disasters Based on Gridded Multi-source Heterogeneous Data HOU Hui1,LIU Chao1,CHEN Xi1,WU Xixiu1,WEI Ruizeng2,HE Huan2(1.School of Automation,Wuhan University of Technology,Wuhan 430070,China;2.Guangdong Key Laboratory of Electric Power Equipment Reliability,Electric Power Research Institute of Guangdong Power Grid Co.,Ltd.,Guangzhou 510080,China)Abstract:The prediction of the damaged number of towers in typhoon-affected areas is of great significance to improving the disaster prevention and mitigation capacity of power grid.From a perspective of brand-new statistical learning,based on the original samples of multi-source heterogeneous data such as meteorological data,power grid data,and geograph-ical data,we pre-process the data such as classification variable processing,feature screening,standardization,etc.Taking the damaged number of towers in the grid as the response variable,we construct the prediction model of damaged number of towers under typhoon disasters based on the gradient lifting decision tree algorithm,and predict the damage quantity of 10 kV tower in distribution network under typhoon disasters.The model is trained,tested and verified by using the data samples of Xuwen County,Guangdong Province,China.The simulation results show that the proposed method can be adopted to accurately predict the number of damaged distribution towers under typhoon disasters,and provide auxiliary decision-making reference for pre-disaster risk quantitative assessment and emergency plan-making.Key words:typhoon;tower damage prediction;multi-source heterogeneous data;statistical learning;gradient boosting decision tree 0 引言1 台风灾害会对电网造成重大破坏,灾前电网受损风险量化评估等是电网公司防灾减灾的重要研究方向1-3。台风灾害下电网设备风险研究主要分为两方 基 金 资 助 项 目:中 国 南 方 电 网 有 限 责 任 公 司 科 技 项 目(GDKJXM20198441(036100KK52190053);GDKJXM20210044(036100KK52210047)。Project supported by Science and Technology Project of China Southern Power Grid Co.,Ltd.(GDKJXM20198441(036100KK52190053),GDKJXM20210044(036100KK52210047).面:一是单个设备层面的设备损毁概率研究,主要侧重于物理建模分析;二是区域整体层面的设备损毁预测评估研究,主要侧重于统计学习与预测等。在单个设备层面,文献4基于应力强度干涉效应建立输电线路损毁风险预警模型,文献5考虑杆塔在台风发展中的累计损伤因素构建了杆塔累计损伤风险预警模型,文献6细化考虑“塔线”效应,并分析该效应在飓风下对大停电发生的影响。但以上文献在考虑风速时仅考虑风速大小这一单一因素,未对风向等加以细致考虑。文献7加入风速风向联1206 高电压技术 2023,49(3)合分布构建杆塔在大风灾害下的损毁概率模型。此外,倒塔还受到微地形、设备老化等影响,文献8-9考虑地理信息与微地形因素建立了输电杆塔失效概率曲线,文献10在损毁风险理论模型的基础上加入气象信息、电网信息、地理信息等多因素对模型进行修正,虽然考虑因素较全面且提高了模型准确性,但模型的复杂度增加。总体来说,当前大多数从物理模型出发对杆塔在台风灾害下的损毁风险研究考虑的因素有限。对于电网来说,杆塔等设备数量庞大,且每个杆塔的参数不一,会存在因杆塔之间参数不同、理论参数与实际参数存在差异等原因造成的较大误差,因此单个设备层面建模分析在实际应用中受限。另一方面,随着大数据处理及人工智能等技术的发展,文献11从统计学习与预测的角度出发对区域整体的设备损毁预测评估,相比之下考虑的因素可更加全面。文献12从统计学习的角度对设备实时运行状态监测、未来发展态势预测,为防灾减灾提供技术决策支持。文献13整合台风信息、杆塔信息及微地形信息等数据,利用逻辑回归算法建立单个杆塔损毁概率预测模型。文献14从数据统计分析的角度出发建立了一种含数据层、知识提取层、可视化层等组成的输电杆塔风险评估模型。文献15基于多源异构信息数据库,应用多种机器学习算法,并基于不等权拟合优度法建立杆塔风险预警组合模型。文献16利用极值 I 型分布结合蒙特卡洛模拟风场并利用随机森林构建杆塔损伤混合预测模型,但主要针对主网杆塔。文献17利用改进随机森林算法进行数据挖掘分析,提出针对配电网杆塔的风险预警模型。文献18以单个杆塔为样本,利用机器学习算法实现台风灾害下配网杆塔受损空间分布预测以及每个杆塔的受损概率预测等。但以上文献只是针对区域整体设备的损毁概率评估,未对受损数量进行研究。而实际应急管理中,受损数量的预测比设备的损毁概率预测本身对于灾前应急策略制定具有更重要的参考价值。文献19-21利用网格划分方法提取气象信息、电网信息、地理信息等 3 类样本数据,基于随机森林、梯度提升树算法等分别对台风灾害下的停电用户空间19-20及停电用户数量21进行预测,但未涉及杆塔受损数量预测。文献22提出了一种基于支持向量机以及网格化数据的杆塔受损数量预测方法,网格尺度为 3 km3 km,在进行特征提取时范围太大会对模型准确性造成影响。可见现有研究虽从统计学习角度对电网的受损风险进行了部分研究,主要包括设备损毁概率预测、受损空间分布、停电用户空间及停电数量预测等,但针对杆塔受损数量预测的研究尚少。鉴于现有研究较少涉及配网整体层面 10 kV 等级杆塔受损数量预测,对杆塔受损的研究多从物理模型角度出发而从统计学习角度出发较少,少量从统计学习角度出发的研究存在数据网格划分较大、预测精度有待提高等缺陷。因此,本文以 1 km1 km网格作为单位提取精细化数据样本,基于气象数据、电网数据、地理数据等多源异构数据,以网格内的杆塔受损数量预测为目标,利用梯度提升决策树算法,从全新的统计学习角度出发,构建台风灾害下配网杆塔受损数量预测模型,实现了台风灾害下精细化网格配网 10 kV 杆塔受损数量预测。1 台风灾害下区域杆塔受损数量预测框架 本文基于研究区域网格化提取的样本数据,提出一种台风灾害下区域杆塔受损数量预测模型,实现框架如图 1 所示。首先,在样本数据收集阶段,考虑到台风灾害下杆塔受损事件由多方面因素共同作用,对研究区域进行 1 km1 km 网格划分,以网格为单位收集包括气象数据、电网数据、地理数据等多源异构样本数据。然后,对收集到的样本数据进行预处理,主要包括:分类变量处理、特征筛选、数据标准化等。再然后,将预处理后的数据按 4:1 进行训练集与测试集的划分23,利用训练集与测试集对模型进行训练以及超参数优化24寻找最优参数,得到最终的预测模型,利用验证集对所得到的最终预测模型在 图 1 杆塔受损数量预测实现框架 Fig.1 Realization framework for predicting the number of damaged poles and towers 侯 慧,刘 超,陈 希,等:基于网格化多源异构数据的台风灾害下杆塔受损数量预测 1207 实际台风下的杆塔受损数量进行预测。最后,对预测结果在地图上进行可视化。2 原始样本数据收集与预处理 2.1 原始样本数据收集 以 1 km1 km 为划分尺度,对研究区域进行网格划分,以网格作为样本收集单位,能保证所收集的样本数据精度及预测精度。本文基于已有数据,以广东省徐闻县 2014 年的两次历史台风“威马逊”和“海鸥”的数据作为原始样本数据,具体数据特征如表 1 所示。所收集的原始样本数据中,共包含 19 个特征变量和 1 个响应变量,其中气象数据有 7 个特征变量,电网数据有 5 个特征变量,地理数据有 7 个特征变量,而本文要建立的是台风灾害下配网杆塔受损数量预测,因此选择每个网格内的配网杆塔受损数量 N 为响应变量。原始样本数据的特征较多,若同时作为特征变量,一方面可能造成特征冗余,另一方面,其中某些特征之间可能存在强相关性,具有强相关性的特征变量会在模型训练中占据虚