分享
不平衡数据集下海量配电网量测终端故障诊断方法_于海平.pdf
下载文档

ID:2362532

大小:1.26MB

页数:9页

格式:PDF

时间:2023-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
不平衡 数据 下海 配电网 终端 故障诊断 方法
电 力 系 统 及 其 自 动 化 学 报Proceedings of the CSU-EPSA第 35 卷 第 4 期2023 年 4 月Vol.35 No.4Apr.2023不平衡数据集下海量配电网量测终端故障诊断方法于海平1,吴雪琼1,杜天硕2(1.国网电力科学研究院有限公司,南京 211100;2.天津大学电气自动化与信息工程学院,天津 300072)摘要:配电网量测终端设备的大规模接入,往往伴随着突发性、多样性的故障,其故障类型的精准判断对合理的运维检修策略制定与配电系统可靠运行具有重要意义。为此,以量测终端中的智能电表为典型,提出一种基于卷积神经网络-长短时记忆模型的故障分类方法。首先,考虑实际场景中智能电表故障数据不平衡以及存在分类特征的情况,通过 K-prototypes 算法对少数类故障类别进行聚类,在簇中心附近通过 SMOTE-NC 过采样技术生成智能电表故障数据;其次,将平衡后的故障数据通过卷积神经网络提取更高层次的特征信息作为长短时记忆网络的输入以实现智能电表的故障分类。最后,基于浙江省各市区智能电表故障分拣数据进行算例分析,结果表明本文所提出方法具有可行性和有效性。关键词:不平衡数据;智能电表;聚类;卷积神经网络;长短时记忆;过采样中图分类号:TM933文献标志码:A文章编号:1003-8930(2023)04-0032-09DOI:10.19635/ki.csu-epsa.001047Fault Diagnosis Method for Massive Distribution Network Measurement Terminals withUnbalanced Data SetYU Haiping1,WU Xueqiong1,DU Tianshuo2(1.State Grid Electric Power Research Institute Co.,Ltd,Nanjing 211100,China;2.School of Electrical andInformation Engineering,Tianjin University,Tianjin 300072,China)Abstract:The large-scale access of measurement terminal equipment to distribution network is often accompanied bysudden and diverse faults.Accordingly,the accurate judgment of fault category is of significance for the formulation ofreasonable operation and maintenance strategies and the reliable operation of the power distribution system.Under thisbackground,a fault classification method based on convolutional neural network-long short-term memory(CNN-LSTM)model is proposed by taking the smart meter in the measurement terminal as a typical example.First,considering theimbalance of smart meter fault data and the existence of classification features in the actual scene,the K-prototypes algorithm is used to cluster a minority of fault categories,and the SMOTE-NC over-sampling technology is used to generate the smart meter fault data near the cluster center.Then,the balanced fault data is extracted through CNN to extractthe higher-level feature information as input to the LSTM network,thus realizing the fault classification of smart meters.Finally,an example analysis is carried out based on the fault sorting data of smart meters in various urban areas of Zhejiang Province,and results show that the proposed method is feasible and effective.Keywords:unbalanced data;smart meter;cluster;convolutional neural network(CNN);long short-term memory(LSTM);over-sampling配电网量测终端设备的大规模接入,为配电网电力数据的获取提供了有力保障。以智能电表为例,据统计,在中国已经安装超过5.4亿台智能电表1,庞大的安装数量伴随着繁重的运维检修工作。同时,随着终端设备供应厂商逐渐增多,其制造工艺、元器件以及安装环境中的磁场、震动、湿度、温度等多模态影响因素耦合导致了复杂多变的故障类型,依靠人工经验已经难以实现故障类型的精准判断。因此,通过分析量测终端的历史故障数据信息,采用有监督学习方法将其相关属性与故障类型标签进行映射,以实现故障类型的识别,可有效提高运维检修效率,对电力系统稳定运行具有重要意义。随着机器学习的发展,多分类技术已经成为智收稿日期:2022-05-05;修回日期:2022-07-08网络出版时间:2022-07-19 09:22:19基金项目:国网公司总部科技项目(5400-202112149A-0-0-00)于海平等:不平衡数据集下海量配电网量测终端故障诊断方法于海平等:不平衡数据集下海量配电网量测终端故障诊断方法33第 35 卷能终端设备故障分类领域的重要研究方向之一,主流的分类方法包括支持向量机SVM(support vectormachine)2、决策与回归树CART(classification andregression tree)3-4以及神经网络5-6等。由于单个分类器性能已经难以满足大数据样本下的精度需求,所以一些学者考虑将不同分类模型进行融合以提高分类效率,文献7基于分类准确率构建决策函数,将不同分类模型进行融合,一定程度上提高了故障分类的准确率;文献8提出了一种将输出为概率值和类标签的不同分类模型进行融合的方法,通过设置准确率阈值与融合标记,有效提高了智能电表故障分类的准确率。上述研究针对智能电表的故障数据信息提出了一定有效的故障分类方法,但是通常是以分类准确率为依据对不同分类器进行简单的加权融合,难以充分发挥不同模型的优势。长短时记忆LSTM(long short-term memory)网络具有强大的时序数据处理能力,主要应用于文本分类、语音识别领域,能够对输入信号逐层抽象并提取时间特征信息,但是由于智能电表故障数据具有数据量大、特征相关度低、噪声数据多等特点,若直接应用LSTM进行故障诊断则会导致计算量大、精度较低等问题,因此,通过卷积神经网络 CNN(convolutional neural network)提取更高层次的特征信息,并进行参数降维作为LSTM的输入,对两种神经网络的优势进行结合可以避免该类问题,有效提高故障诊断准确率。此外,智能电表在实际应用过程中不同故障出现的频次相差较大,甚至可达几个数量级,所以在进行智能电表故障分类的过程中,常常出现样本极不平衡的情况,导致分类模型对多数类样本较为敏感,故而无法识别出训练样本数量较少的故障类别,使分类模型的泛化能力变差。因此,如何在数据集不平衡情况下对智能电表故障进行准确分类是我们目前研究的另一重点。为解决样本的不平衡问题,我们通常聚焦于原始数据集,根据样本特点对其进行过采样9(少数类生成样本)或者欠采样10(多数类删除样本),典型的欠采样方法包括随机欠采样、聚类欠采样11等,其删除数据的操作容易导致多数类样本的重要信息缺失。典型过采样方法包括随机过采样ROS(random over-sampling)和合成少数类过采样 SMOTE(synthetic minorityover-sampling technique)12等,其中ROS容易导致过拟合,SMOTE算法仅适合连续数据,同时对于类别边界敏感度较低,容易产生噪声样本。针对以上问题,本文将以配电网量测终端设备中的智能电表为典型,综合考虑智能电表故障类别数据之间的不平衡问题与分类算法的适应性,提出一种基于CNN-LSTM的智能电表故障分类方法,为配电网量测终端设备的故障诊断分析提供思路方法,主要研究内容如下:(1)为缓解智能电表的故障数据的不平衡性,提出一种基于K-prototypes和SMOTE-NC的聚类过采样方法;(2)为处理高维度、特征相关度低的智能电表数据,提出一种基于CNN-LSTM的智能电表故障分类方法;(3)为避免分类模型性能评估偏向于多数类样本,采用一种综合考虑每个类别的准确率与召回率的分类模型性能评估指标,为模型的评价和优化提供可靠依据。1故障诊断框架在本文中,针对量测终端设备中的智能电表进行重点研究,提出了一种基于 K-prototypes 聚类、SMOTE-NC过采样、CNN-LSTM分类策略的智能电表故障诊断方法。该方法的整体包括两大部分:第1部分为智能电表不平衡数据处理;第2部分为基于CNN-LSTM的故障分类模型。各部分的实现过程如下:第1部分:智能电表不平衡数据处理。该部分包含 3 个步骤:数据集的划分;采用 K-prototypes聚类算法对训练集中智能电表故障数据信息的少数类故障进行聚类;对靠近簇中心的数据通过SMOTE-NC过采样技术处理,得到均衡的训练数据集。第2部分:基于CNN-LSTM的智能电表故障分类。该部分包含3个步骤:CNN对智能电表的故障数据进行特征提取,得到更高层次的特征信息;特征提取后的数据作为LSTM的输入,以实现时空特征提取结合,完成故障分类模型构建;通过测试集完成模型性能评估。2不平衡数据处理理论2.1K-prototypes 聚类K-means聚类算法仅适用于连续数据13,为解决混合类型数据聚类问题,Huang等14提出了著名的混合数据聚类算法,其目标是以最小化损失函数将数据集X=x1,x2,xn划分为k个簇:电 力 系 统 及 其 自 动 化 学 报34第 4 期E(U,Q)=l=1ki=1nuild(xi,Ql)(1)式中:E(U,Q)为损失函数;Ql为第l个簇的原型;uil是划分矩阵U的元素,若第i个样本属于第l个簇则uil为 1,否则为 0;n 为进行聚类的总样本数量;d(xi,Ql)为相异性度量函数为d(xi,Ql)=j=1md(xij,qlj)(2)d(xij,qlj)=l(xij,qlj),xij为分类数值(xij-qlj)2,xij为连续数值(3)式中:m为特征个数;xij是第i个样本的第j个特征数 值;当xij=qlj时(xij,qlj)=0,当xijqlj时(xij,qlj)=1;l为第l个簇分类变量的权重;当xij为连续数值时,qlj为第l个簇中第j个连续变量的均值;当xij为分类数值时,qlj为第l个簇中第j个分类变量的众数。具体步骤详述如下

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开