分享
基于Tri-trainin...算法的电力系统暂态稳定评估_卫志农.pdf
下载文档

ID:2577650

大小:1.54MB

页数:7页

格式:PDF

时间:2023-08-01

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 Tri trainin 算法 电力系统 稳定 评估 卫志农
第 43 卷 第 7 期2023 年 7 月电 力 自 动 化 设 备Electric Power Automation EquipmentVol.43 No.7Jul.2023基于Tri-training-SSAE半监督学习算法的电力系统暂态稳定评估卫志农1,李超凡1,丁爱飞2,3,孙国强1,黄蔓云1,臧海祥1,方熙程4(1.河海大学 能源与电气学院,江苏 南京 211100;2.国电南瑞吉电新能源(南京)有限公司,江苏 南京 211106;3.国电南瑞科技股份有限公司,江苏 南京 211106;4.国网江苏省电力有限公司扬中市供电分公司,江苏 镇江 212200)摘要:基于机器学习的暂态稳定评估方法主要采用监督学习方法,为了解决监督学习方法所需的有标签样本难以获取的问题,提出基于三体训练-稀疏堆叠自动编码器(Tri-training-SSAE)半监督学习算法的电力系统暂态稳定评估方法。构建基于堆叠稀疏自动编码器的暂态稳定评估模型;在传统的三体训练过程中加入伪标签样本置信度判断,以减小噪声数据对模型训练的影响;以堆叠稀疏自动编码器为基分类器构建三体训练-稀疏堆叠自动编码器模型,利用大量的无标签样本提高模型的泛化能力。通过IEEE 39节点系统与华东某省级电网进行分析验证,结果表明,所提方法在有标签样本数较少时具有更高的评估准确度。关键词:暂态稳定评估;机器学习;半监督学习;三体训练算法;堆叠稀疏自动编码器中图分类号:TM712 文献标志码:ADOI:10.16081/j.epae.2022120090 引言随着区域大电网之间的互联,电力系统的网络结构及运行特性日益复杂,暂态稳定性分析的难度进一步增大。在实际电网中,严重的停电事故通常由系统暂态失稳导致,而故障发生后暂态过程的持续时间通常为秒级,若不及时发现故障并进行有效处理,则会造成更严重的事故,影响电力系统的安全稳定运行12。因此,快速准确地进行暂态稳定评估(transient stability assessment,TSA)对电力系统的稳定运行具有极其重要的意义。传统的暂态稳定分析方法包括时域仿真法34、直接法56等,但这些方法在面对复杂电网时无法同时满足计算精度和速度的要求。基于数据挖掘的机器学习方法无需建立具体的数学模型,将TSA视为分类问题,建立系统特征量与暂态稳定性之间的映射关系,通过离线仿真获得大量样本进行训练,在线应用时能进行快速的稳定评估7。在深度学习算法的发展还未成熟时,支持向量机(support vector machine,SVM)8、人工神经网络910、决策树1112等浅层模型应用于TSA中,但浅层模型对数据的挖掘能力有限,出现了泛化能力较差、评估准确率较低等问题。深度置信网络13、堆叠自动编码器1415、卷积神经网络16、门控循环单元17等深度学习模型相较于浅层模型具有更强的特征提取能力,在TSA方面有更好的表现。上述深度学习模型大多采用的是监督学习方法,在训练时需要大量的有标签样本,否则会出现模型过拟合的现象,给模型的准确率造成影响。电力系统在绝大多数情况下处于正常运行状态,难以从历史数据库中获取 TSA的有标签样本。现有方法主要通过暂态稳定时域仿真的方式批量生成有标签样本数据,而这需要准确的模型且会耗费大量的时间进行仿真计算。为此,文献 18 提出基于深度置信网络的TSA方法,使用大量的无标签样本对网络进行无监督学习,提高了模型在小样本情况下的准确率;文献 19 采用堆叠自动编码器,利用无标签样本实现了对数据的降维处理,在小样本情况下同样有较好的表现;文献 20 采用主动学习的方法来降低样本标注的代价,提升了训练效率,但是主动学习样本的标注需要人工干预且所选取的分类模型为浅层模型,准确率较低。半监督学习是监督学习与无监督学习相结合的一种学习方法,能够在有标签样本较少的情况下利用无标签样本进行训练,相较于监督学习与无监督学习对有标签训练样本数的要求更低,因此,本文基于半监督学习中的三体训练(Tri-training)算法对暂态稳定进行评估。基于上述分析,本文提出基于三体训练-稀疏堆叠自动编码器(Tri-training-stacked sparse auto-encoder,Tri-training-SSAE)半监督学习算法的 TSA 方法,在安全域视角下,判定系统在发生预想故障时是否发生暂态失稳,指导系统进行安全预防控制。首先,将故障前的稳态潮流量作为原始特征,构建基于堆叠稀疏自动编码器(stacked sparse auto-encoder,SSAE)的分类模型以判别系统暂态稳定情况;然后,以SSAE模型为子模型,通过Tri-training半监督学习算法生成大量的伪标签样本,并利用这些样本进行收稿日期:20220601;修回日期:20221101在线出版日期:20221213基金项目:国家自然科学基金资助项目(U1966205)Project supported by the National Natural Science Foundation of China(U1966205)110第 7 期卫志农,等:基于Tri-training-SSAE半监督学习算法的电力系统暂态稳定评估模型训练;最后,集成输出子模型的 TSA 结果。IEEE 10机39节点系统与华东某省级电网算例结果验证了本文所提方法在有标签样本不足的情况下具有较高的TSA准确率。1 算法原理介绍1.1基于机器学习的TSA原理从机器学习的角度而言,电力系统的TSA实际是一个二分类问题,通过对大量样本的学习建立输入特征与稳定类别之间的映射关系。给定样本(xi,yi)(i=1,2,n),其中:输入特征xiRm由电力系统的量测装置测得,m为实数域维数;yi0,1表示暂态稳定类别,标签1表示暂态稳定,标签0表示暂态失稳;n为样本数。系统的暂态稳定情况根据式(1)所示的暂态稳定指标(transient stability index,TSI)进行判定。ITSI=360-|max360+|max(1)式中:ITSI为TSI;max为任意2台发电机功角差的最大值。对于每个样本:如果ITSI值为正,则系统稳定;如果ITSI值为负,则系统失稳。1.2SSAE算法原理自动编码器是一种输入和输出相同的无监督式神经网络,其结构如附录A图A1所示,由编码器与解码器构成,自动编码器通过编码和解码最小化输入向量X与输出向量X?间的重构误差J(X,X?),将隐藏层向量H作为降维后的特征。自动编码器的节点之间采用全连接的方式,通过式(2)将输入向量X转化为隐藏层向量H,再通过式(3)将隐藏层向量H还原为X?,重构输入向量。H=f(WX+b)(2)X?=g(W?H+b?)(3)式中:W、W?分别为编码层、解码层的权值矩阵;b、b?为偏置向量;f()、g()为Sigmoid激活函数。稀疏自动编码器在自动编码器的基础上加入稀疏约束项,抑制隐藏层神经元的激活程度,防止过拟合,提高泛化能力。本文采用库尔贝克-莱布勒(Kullback-Leibler,KL)散度作为惩罚项,即:DKL(?j)=ln?j+(1-)ln1-1-?j(4)式中:DKL()为KL散度;为稀疏正则化参数;?j为隐藏层第 j 个神经元的平均激活程度。当?j=时,DKL(?j)=0;当?j偏离 时,DKL(?j)的值增大。损失函数中加入稀疏项的约束,可以使?j接近趋近于0的常数,从而抑制神经元的激活程度14。因此,稀疏自动编码器的训练目标是通过调整式(2)与式(3)中的网络参数使式(5)所示的损失函数JSAE()最小化,从而使输入与输出接近。JSAE()=J(X,X?)+j=1lDKL()?j(5)式中:=W,W?,b,b?为网络参数;重构误差J(X,X?)采用平方误差函数12ni=1n x?i-xi22,x?i为重构数据;为稀疏惩罚项的权重;l为隐藏层神经元数。SSAE结构图如附录A图A2所示,SSAE是将多个稀疏自动编码器进行级联,并由编码器与softmax分类器组合而成的有更强拟合高维非线性函数能力的深度网络模型。SSAE通过编码器网络完成输入量测数据的特征提取后将其连接到softmax分类层,输出在该量测对应工况下系统的暂态稳定性辨识。softmax分类层能输出样本所属类别的概率,假设分类问题包含k个类别,softmax分类层的输出函数h()为:h(xi)=|P()yi=1|xi,P()yi=2|xi,P()yi=k|xi,=1j=1keTjxi|eT1xieT2xieTkxi(6)式中:P()|yi=j xi,(j=1,2,k)为在网络参数下softmax分类层将样本xi归为类别 j 的概率,其中概率最大的类别可认为是该样本从属的类别,即为该样本的标签;j为第 j 个输出类别的权重。SSAE的训练由2个阶段组成:第1阶段为无监督预训练,通过对无标签样本的学习将预处理后的电力系统中的量测数据进行重构,得到输入特征的降维表达;第2阶段对网络参数微调,输入有标签样本进行训练,通过反向传播法更新整个评估模型的参数,在微调过程中,训练的目标是最小化模型分类结果与样本真实类别间的误差,对于仅含2种类别的电力系统TSA问题,采用如式(7)所示的交叉熵函数LSSAE()作为误差函数。LSSAE()=-1ni=1n yilnpi+()1-yiln()1-pi=-1ni=1n|yilneT1xij=12eTjxi+()1-yilneT2xij=12eTjxi(7)式中:pi为样本xi为稳定的概率,由式(6)输出,第1类别为稳定,第2类别为失稳。1.3Tri-training-SSAE半监督学习算法原理基于分歧的方法是半监督学习算法的一个重要分支,协同训练算法是这类方法中的一种重要代表方法。在标准协同训练算法中,数据样本必须能由111电 力 自 动 化 设 备第 43 卷2个完全独立的特征子集进行描述,并且每个特征子集必须能够代表数据样本的特征分布,但在电力系统的TSA问题中,若仅选取1类数据(如仅选取电压幅值或线路有功功率)作为输入特征,则此时的输入特征不能代表样本数据的特征分布,训练出的模型性能很差,且不是完全独立的。文献 21 对标准协同训练算法进行改进,提出Tri-training法,该算法综合半监督训练与集成学习的思想,在提升模型性能的同时,对数据集没有严格的要求,也无需使用不同类型的模型,能更好地应用于电力系统TSA问题中22。因此,本文采用Tri-training半监督学习算法,算法流程如附录B图B1所示。假设通过仿真生成或历史数据库得到初始少量暂态稳定有标签样本集L=()x1,y1,()x2,y2,()xn,yn,利用bootstrap重复抽样法获得3个训练子集L1 L3,用训练子集分别训练3个具有差异的网络,得到3个不同的分类器H1 H3。假设暂态稳定与否未知的无标签样本集为U,若H2和H3对无标签样本xi的 TSA 结果H2(xi)和H3(xi)一致,则可以将样本xi标记上伪标签并生成伪标签样本,将伪标签样本集S1加入H1的训练集形成H1的新训练集L1,如式(8)所示。L1=L1S1=L1xi|xiU,H2()xi=H3()xi(8)同理,将H2和H3的训练集分别扩充为L2和L3,再对3个分类器重新进行训练,重复迭代,直至分类器H1 H3均没有变化或迭代次数达到设定值,完成训练。显然,在伪标签样本生成的过程中,如果H2和H3同时对xi分类错误,则会贴上错误的标签,可通过在H1的训练集中引入噪声影响训练结果。文献 21证明,引入噪声所带来的负面影响可以被大量未标记样本正确标记所带来的正面影响抵消,即在一定条件下累积的标记噪声可以通过大量未标记数据进行补偿。为了进一步提升伪标签样本的质量,本文在生成伪标签样本时加入置信度阈值判断,提高伪标签样本的置信度,进一步减少噪声的引入。对于只有稳定与失稳2个类别的电力系统TSA问题,引入置信度指标R,如式(9)所示。R=maxP(yi=0|xi),P(yi=1|xi)(9)R可由softm

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开