温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
支持
向量
电力系统
调度
数据
异常
检测
方法
刘震宇
控制理论与应用Control Theory and Applications自动化技术与应用2023 年第 42 卷第 6 期Techniques ofAutomation&Applications基于支持向量机的电力系统调度数据异常检测方法刘震宇(国网冀北电力有限公司承德供电公司,河北 承德 067000)摘要:以准确检测电力系统调度数据异常模式为目的,提出基于支持向量机的电力系统调度数据异常检测方法。在分析电力自动化调度运行结构的基础上,构建调度数据的时间序列模型,识别并去除异常数据时间序列中的噪声数据与缺失数据。针对处理后的数据集合,利用孤立森林提取其异常特征,再将提取出的特征输入到支持向量机中,识别其中的异常特征模式,从而完成对电力系统调度数据异常的检测。实验结果验证:该方法在检测异常数据时,能够充分发挥数据预处理、数据特征提取、异常特征模式识别三大功能,具有较好的应用效果。关键词:支持向量机;电力系统调度;数据异常检测;特征提取;孤立森林中图分类号:TP391文献标识码:A文章编号:1003-7241(2023)06-0024-05Anomaly Detection Method of Power System Dispatching DataBased on Support Vector MachineLIU Zhen-yu(State Grid Jibei Electric Power Co.,Ltd.,Chengde Power Supply Company,Chengde 067000 China)Abstract:In order to accurately detect the abnormal patterns of power system dispatching data,an abnormal detection method of power sys-tem dispatching data based on support vector machine(SVM)is proposed.Based on the analysis of automatic dispatching opera-tion structure of electric power,a time series model of dispatching data is constructed to identify and remove noise data and miss-ing data in abnormal data time series.For the processed data set,the isolated forest is used to extract its abnormal features,andthen the extracted features are input into the support vector machine to identify the abnormal feature patterns,so as to completethe abnormal detection of power system scheduling data.Experimental results show that this method can give full play to thethree functions of data preprocessing,data feature extraction and abnormal feature pattern recognition when detecting abnormaldata,and has a good application effect.Keywords:Support Vector Machine;power system dispatching;data anomaly detection;feature extraction;isolated forest收稿日期:2022-02-23DOI:10.20033/j.1003-7241.(2023)06-0024-05.1引言目前,我国电力系统的规模逐渐增大,网络结构、电网线路也逐渐多元化,系统的工作状态会遭到多种因素干扰。在此前提下,电力系统的调度数据具有大数据化、复杂化特征,这对电力系统调度数据异常检测存在负面影响1-4。李新鹏5等人提出使用孤立森林算法检测电力调度流数据中异常数据,虽然检测效果较好,但是并不能实现异常数据分类;姜丹6等人提出的电力运行数据异常检测示警方法对电力运行数据异常检测也存在较好的应用效果,但抗干扰性有待测试。为此,本文针对此问题进行研究后,提出了基于支持向量机的电力系统调度数据异常检测方法。2电力系统调度数据异常检测方法2.1电力系统自动化调度系统电力系统自动化调度系统的应用主要是为了防止电力系统运行状态出现故障,通过一系列自动化调度手段,防止出现大停电事故。电力系统运行的生产调度主要由调度计划自动化设计、调度运行自动化、调度监控自动化三个环节构成,如图1所示。图1电力系统自动化调度系统的运行结构24自动化技术与应用2023 年第 42 卷第 6 期控制理论与应用Control Theory and ApplicationsTechniques ofAutomation&Applications由图1看出,电力系统自动化调度系统运行结构属于4级梯度式自动化调度模式7-8。由4级梯度式自动化调度模式可知,电力系统自动化调度的最终目的是检测电力系统是否存在异常,在此环节设计基于支持向量机的电力系统调度数据异常检测方法,具体检测模式如图2所示。图2检测模式2.2电力系统自动化调度数据预处理方法2.2.1构建电力系统自动化调度数据的时间序列模型设置电力系统自动化调度数据集合O中,数据时间序列是Y,则t时刻的数据时间序列是:(1)式中,(A)、(A)分别是光滑算子与可逆算子;是延迟算子A数值同 1 之间的差值;t是噪声序列点,其符合正态分布。设置Xt属于一种已知具备噪声点、缺失值的数据时间序列,那么,在t时间段中,含有噪声点、缺失值的电力系统自动化调度数据集合O存在两种调度数据子时间序列模式:(1)持久性时间序列设置在时间段t中,Xt的存在具有持久性,那么此序列表达成:(2)(3)式中,是可表达时间段t时,电力系统自动化调度数据集合中是否具有异常时间序列的指标函数;是持久性数据序列的影响因子。(2)独立性时间序列时间T中,独立性数据时间序列是Lt:(4)2.2.2去除异常数据时间序列中噪声数据与缺失数据电力系统自动化调度中,具有持久性、独立性的调度数据对电力系统自动化调度状态数据时间序列的影响运算方法是:(5)式中,时间序列的拟合误差、残差影响的算子分别是ct、i;ct+i是t时间段中,电力系统自动化调度状态数据时间序列第i次拟合的误差值;m是拟合时间总值。电力系统自动化调度状态数据中,噪声数据与缺失数据的检测能够使用下式获取:(6)(7)(8)式中,、依次是Xt、Lt的检验统计量;a是ct的序列方差。如果、在初始时刻大于状态阈值D,那么此状态数据序列中不存在噪声数据与缺失数据,反之去除此类数据。2.3基于孤立森林的调度数据异常特征提取方法电力系统自动化调度数据集合经2.2小节预处理后,采用基于孤立森林的调度数据异常特征提取方法,将电力系统自动化调度数据异常值设成调度数据的异常特征,在数据挖掘的角度提取电力系统自动化调度数据异常特征。2.3.1建立电力自动化调度数据的孤立树与孤立森林针对2.2小节预处理后的电力系统自动化调度数据集合O,假设其存在m条调度数据样本y、个特征,电力系统自动化调度数据集合O的孤立森林分为多个孤立树9,孤立树的构建步骤如下:(1)在O中任意选取一个特征Q;(2)任意选取特征Q中的单个异常值P;(3)结合特征Q,将各个电力系统自动化调度数据实施二叉树分割,如果特征Q里随机一个属性记录值小于Q,将其归入子左节点,反之归入右子节点;(4)以递归的模式建立左子节点、右子节点,设计电力系统自动化调度数据特征的孤立树,当各个电力系统自动化调度数据样本特征均具有孤立性,或者树的高度为最大值,便完成孤立树的建立10-11。孤立森林由多个孤立树构成,将电力系统自动化调度数据集合O中的数据特征孤立树都建立完毕后,便可组成孤立森林。2.3.2获取电力系统自动化调度数据异常分值特征25控制理论与应用Control Theory and Applications自动化技术与应用2023 年第 42 卷第 6 期Techniques ofAutomation&Applications孤立树与孤立森林建立完毕,便能够输出各个调度数据特征的异常分值,针对一个电力系统自动化调度数据集合O中,一个数据样本y而言,特征异常分值的运算方法是y在所有孤立树的遍历深度均值,此值较小,表示孤立时间更早,异常分值便较大,深度均值较大,则异常分值较小12。在各个孤立树中对y的特征实施深度量化,设置异常分值量化方法是:(9)每个数据y的孤立森林异常分值是:(10)式中,d()是量化数值;、k(y)依次是欧拉常数、y的路径长度,此路径长度是指电力系统自动化调度数据特征孤立森林的根节点至被孤立点边的数值,Fk(y)是孤立树中平均路径长度。i(y)越接近于1,表示此数据特征Q异常的越显著。2.4基于支持向量机的调度数据异常特征模式识别方法将2.3小节提取的异常特征实施归一化,以此处理原特征值的量纲差异问题。把M个电力系统自动化调度数据异常特征QM使用式(11)实施归一化处理:(11)式中,VM是QM的正交特征向量。归一化处理后,将各个电力系统自动化调度数据异常特征通过拉格朗日函数变换成线性可分的形式,使用支持向量机识别电力系统自动化调度数据异常特征模式,判断电力系统调度数据的故障来源,实现异常检测。此时支持向量机分类间隔最大化问题描述成:(12)式中,、依次是第j个、第i个电力系统自动化调度数据异常特征、的拉格朗日乘子;E是惩罚因子,其值大于0;是权重值;是映射函数。拉格朗日乘子中,非零的系数b就是支持向量,求解能够获取最佳分类函数:(13)式中,H(,)是核函数;是电力系统自动化调度数据异常特征的拉格朗日乘子。(14)式中,是内核函数的参数,其值0。在选择核函数之后,误差惩罚因子E与 核函数参数直接影响支持向量机的分类识别效果。E能够均衡决策结果的难度与精度,E较小,便可准许训练样本里存在分类错误的样本,以此能够防止出现过拟合现象,分类模型的泛化性能得以提升13-15。核函数参数能够均衡QM的分布复杂度。综上所述,基于支持向量机的电力系统自动化调度数据异常特征模式识别流程如下:(1)通过误差惩罚因子E和核函数参数、QM建立初始种群;(2)初始化参数,运算个体适应度值:(15)式中,(j)、(i)依次是QM的实际异常类型、支持向量机分类结果;(3)把QM导入支持向量机中实施训练;(4)按照适应度值多次优化支持向量机的误差惩罚因子E和核函数参数,获取支持向量机的最优超平面,分类识别QM所属异常特征模式。3实验与分析实验主要对本文方法的应用效果进行测试,测试指标分别为:电力系统调度数据异常特征提取效果、电力系统调度数据异常检测效果、电力系统调度数据预处理效果。(1)电力系统调度数据异常特征提取效果为了测试本文方法对电力系统调度数据异常特征提取的效果,在提取电力系统调度数据异常特征时,以某地区某工厂2种日负荷曲线为例,使用本文方法对此地区2种日负荷数据进行特征提取并分析,结果如图3、图4所示。图3中,第1类日负荷曲线存在显著的峰值特征,早高峰特征主要集中在8:3012:30,午高峰特征集中在15:0018:30。第一类日负荷数据中,早高峰、午高峰的功率过大,属于工厂白班供电模式,此时电力系统供电断电概率大,需要合理调度。26自动化技术与应用2023 年第 42