温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
改进
朴素
贝叶斯
模型
电力变压器
故障
定位
中的
应用
范慧芳
第59卷第2期:019001972023年2月16日High Voltage ApparatusVol.59,No.2:01900197Feb.16,2023改进朴素贝叶斯模型在电力变压器故障定位中的应用范慧芳1,咸日常1,王涛2,高鸿鹏1,陈蕾1,张冰倩1(1.山东理工大学电气与电子工程学院,山东 淄博255049;2.国网山东省电力公司枣庄供电公司,山东 枣庄277000)摘要:电力变压器故障能否精准定位一直是制约其状态检修有效开展的技术瓶颈。文中针对目前已有故障定位模型存在的不足,借助变压器故障类型与特征状态量之间的内在关系,将朴素贝叶斯网络模型进行特征属性加权改进,并将其扩展为改进的双层朴素贝叶斯网络模型应用至电力变压器故障定位中。在这一过程中,考虑到特征属性与类别之间和各特征属性之间的依赖关系,采用ReliefF算法和相关系数法分别对特征属性进行加权处理,构造出改进的朴素贝叶斯网络模型,并在MATLAB软件中进行了诊断对比预测,得到了较好的预测结果,文中最后利用实际案例进一步验证了所提模型与分析方法的有效性,可为电力变压器故障诊断提供技术指导。关键词:电力变压器;朴素贝叶斯;属性加权;故障定位;ReliefF算法Application of Improved Naive Bayes Model in Fault Location of Power TransformerFAN Huifang1,XIAN Richang1,WANG Tao2,GAO Hongpeng1,CHEN Lei1,ZHANG Bingqian1(1.College of Electrical and Electronic Engineering,Shandong University of Technology,Shandong Zibo 255049,China;2.State Grid Shandong Electric Power Company Zaozhuang Power Supply Company,Shandong Zaozhuang 277000,China)Abstract:Accurate location on fault of power transformer has always been a technical bottleneck constraining the effective development of its state maintenance.In view of the shortcoming of the presently existed fault location model,the inherent relationship between the type of transformer fault and the characteristic state is used to improve the characteristics attribute weight of the Naive Bayes network model,is expanded into an improved twolayer Naive Bayesnetwork model and applied to the fault location of power transformers.During this process,considering the dependency between feature attributes and categories and between each feature attributes,the ReliefF algorithm and the correlation coefficient method are used to weight the feature attributes respectively and to construct an improved NaiveBayesian network model.The model is diagnosed,compared and predicted in MATLAB software and good predictionresults are obtained.Finally,the actual cases are used to further verify the effectiveness of the proposed model andanalysis method,which can provide technical guidance for fault diagnosis of power transformer.Key words:power transformer;Naive Bayes;attribute weighting;fault location;ReliefF algorithm0引言大型油浸式高压变压器是电力系统中的重要设备之一,其故障影响涉及程度与范围都比较大1-3,所以电力变压器一旦发生故障,及时对其准确高效定位、防止故障范围进一步扩大就显得尤为重要4-5。如何在变压器运行时快速对故障进行监测与诊断,一直颇受国内外学者关注。目前广泛使用的方法大致可分为传统诊断和智能诊断两种。对于传统诊断方法,针对变压器所发生故障性质的不同,又可分别采用预防性试验或DGA方法来进行判断。由于预防性试验所施加电压较低,不易发现内DOI:10.13296/j.10011609.hva.2023.02.026_收稿日期:20220811;修回日期:20221025技术讨论范慧芳,咸日常,王 涛,等.改进朴素贝叶斯模型在电力变压器故障定位中的应用部潜伏性故障部位,从而致使其继续发展影响供电可靠性6。传统的DGA方法虽在多种试验规程中皆列众多检测项目首位,但是该方法本身也存在一定的局限性7。针对上述不足,智能方法被引入至变压器故障诊断中。在中国,大多数学者通过建立基于二叉树的支持向量机(SVM)故障定位系统8-11,将变压器故障分为多个层次进行逐层分析,直至定位出故障发生的具体部位。采用上述方法虽取得了一定成效,但系统在实现过程中需建立多个SVM模型,程序复杂不易实现。除此之外,还有学者将朴素贝叶斯网络引入至变压器故障定位研究中12-13,但是在选择特征属性时,普遍采用粗糙集进行约简,从而将某些重要属性删除,最终导致诊断结果不理想。文中是在前人的基础上,借助变压器故障与特征状态量变化之间的关系,将朴素贝叶斯(naiveBayes model,NBM)网络模型利用ReliefF 算法和相关系数法进行特征属性加权改进,并将其扩展为双层NBM网络模型,进而实现对所发生故障的位置以及具体故障类型的精确识别;该模型充分挖掘了故障特征属性与类别间的依赖关系,削弱了特征属性间的耦合关系,提高了故障预测的准确率。文章最后,利用具体实例验证了所建模型与分析方法的有效性。1基于改进的NBM模型1.1贝叶斯模型在概率论中,贝叶斯定理是指在已知的某些条件下某一事件发生的概率14,可用式(1)表示P(B|A)=P(B)P(A|B)P(A)(1)式(1)中:P(B|A)表示事件A发生的条件下事件B发生的概率,被称作后验概率;P(A|B)表示事件B发生的条件下事件A发生的概率,被称作条件概率;P(B)表示事件B的先验概率;P(A)表示事件A的先验概率。朴素贝叶斯分类器是基于贝叶斯定理和属性条件独立假设的简单概率分类器15,其分类的基本依据是:对于要分类的给定项,在该事件发生的条件下哪一类别出现的概率最大,则认为该事件属于哪一类别。其模型分类流程图见图1,具体实现步骤如下:1)设特征向量X=x1,x2,.,xn是一个待分类项,每一个xi代表X的一个特征属性;图1贝叶斯网络算法流程图Fig.1Flowchart of Bayesian network algorithm2)假设有类别Y=y1,y2,.,yn,其先验概率Pyi可表示为Pyi=DyiD(2)式(2)中:Dyi表示类别yi的个数;D表示训练样本总数。3)确定条件属性P(X|y1),P(X|y2),.,P(X|yn),其计算式为P(X|yi)=DX,yiDyi(3)式(3)中:DX,yi表示在类别yi下X出现的次数;Dyi表示类别yi的总个数。4)确定P(y1|X),P(y2|X),.,P(yn|X),即待分类项X属于每一类别的后验概率,其计算式为P(yi|X)=Pyii=1nP(X|yi)(4)5)若P(yk|X)=maxP(y1|X),P(y2|X),.,P(yn|X),则认为X属于第k类。对于一个待分类项,考虑到若某个特征属性在训练集中未出现过,那么将会导致整个分类概率变为零,使得最终分类结果不合理16。所以为了解决零概率问题,文中引入拉普拉斯(Laplace)平滑处理方法对类别先验概率和条件概率公式进行修正,即将式(2)和式(3)变为式(5)和式(6)Pyi=Dyi+1D+N(5)1912023年2月第59卷第2期式(5)中:Dyi、D含义同式(2);N表示总分类数。P(x|yi)=Dx,yi+1Dyi+Ni(6)式(6)中:Dx,yi、Dyi含义同式(3);Ni表示特征属性可能的取值个数。1.2NBM模型改进NBM分类器的前提是假设属性变量间没有依赖关系,即条件独立性假设,而现实中事物之间以及事物属性之间常常具有明显的关联性,因此条件独立性假设太过苛刻。为了对属性之间的这种耦合关系进行松弛,目前已有学者借助粗糙集约简的方法对故障特征属性进行简化处理,目的是消除冗余属性,进而弱化特征间的相关关系。采用这种方法进行处理虽取得了一定成效,但毕竟是去掉了部分代表评估对象状态的特征,故在某些情况下会使得预测结果大打折扣。针对上述缺点,文中采用属性加权的方法对所选特征进行加权处理,其贝叶斯公式将由式(4)变为式(7)P(yi|X)=Pyii=1nP(X|yi)i(7)式(7)中,i表示特征属性i的权值。属性加权的NBM分类方法的关键是属性权值的确定。给每个特征属性分配合适的权值不仅可以区分特征之间的预测能力,还能减小条件独立性假设所带来的影响,提高NBM模型的分类准确率,因此文中从两个方面考虑特征属性的权值:利用ReliefF算法确定属性与类别之间的权值;然后再利用相关系数法确定属性间的权值,以此削弱条件独立性的前提假设。1.2.1ReliefF特征属性加权算法ReliefF算法最早是由Kononeill所提出的一种多分类特征选择方法,这种算法是根据属性值在区分相互靠近的样本能力上对属性的质量进行评价17。在处理多类问题时,从训练集中每次随机取得N个样本,然后在训练集中找出与N同类的k个最近邻样本,记作Hj;从与N不同类的样本集中找出k个最近邻样本,记作Mj(c)(j=1,2,.,k,cclass(N)18。属性i的权值(i)的更新依赖于样本N和与N同类的最近邻样本以及和N不同类的样本Mj(c),各属性值的大小可根据式(8)通过编程语言得到1i=(i)-j=1kdiff(A,N,Hj)mk+cclass(N)P(c)1-P(class(N)j=1kdiff(A,N,Mj(c)mk(8)式(8)中:diff(A,N1,N2)表示样本N1和N2在特征i上的距离;P(c)表示该类别的概率;P(class(N)表示为随机选取某样本类别的概率;Mj(c)表示第c类目标中的第j个最近邻样本;m表示抽样次数。1.2.2相关系数加权算法在最佳特征属性子集中,单个属性不一定是与类别关联程度最大的,所以特征属性与类别间的相关度并不能全面衡量各特征属性对分类意义的大小,故还应考虑属性间的关联性对分类的影响19。文中采用相关系数法来衡量特征属性之间的相关性程度,具体为=Cov(Ai,Aj)D(Ai)D(Aj)(9)式(9)中:Ai和Aj代表两个不同的特征属性;