温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
智能
电网
环境
下窃电
行为
检测
计算机与现代化JISUANJI YU XIANDAIHUA2023年第3期总第331期文章编号:1006-2475(2023)03-0060-06收稿日期:2021-09-27;修回日期:2021-12-05基金项目:国家自然科学基金面上项目(61772246)作者简介:张芸(1983),女,陕西西安人,高级工程师,硕士,研究方向:计算机技术,E-mail:;白开峰(1979),男,山西运城人,高级工程师,硕士,研究方向:电子信息,E-mail:;王星(1978),男,四川遂宁人,高级工程师,硕士,研究方向:信息系统工程,E-mail:;仓甜(1983),女,陕西西安人,高级工程师,硕士,研究方向:网络安全,E-mail:;周通(1987),男,陕西西安人,工程师,本科,研究方向:计算机科学,E-mail:;段锦文(1978),女,陕西长安人,高级工程师,本科,研究方向:通信工程,E-mail:;苏晗(1990),女,陕西宝鸡人,工程师,硕士,研究方向:软件工程,E-mail:。0引言伴随着经济模式的演化以及技术产业的升级,近年来国内外各类窃电情况频发,并且严重侵犯了用电用户财产、危害到供电系统运行以及人身安全。因此,通过各类有效的技术模型对用电行为进行用电异常可能性的监测判断,对治理各类用电异常事件,维护国家电网运行安全具有重要意义。在电力损耗研究领域中,损耗被分为非技术性损耗(Non-Technical Losses,NTL)以及技术性损耗(Technical Losses,TL)。通过非法篡改线路等方式引发的电力能源损耗是本文重点描述的各类检测算法的应用场景。据不完全统计,我国每年存在15万起左右窃电事件并造成超过200亿元人民币的经济损失1。而愈发隐蔽和复杂化的恶意窃电方式给防范和监测工作带来巨大挑战2。无独有偶,国外的各类窃电事件所造成的经济损失也金额庞大。比如美国每年的窃电事件造成经济损失40亿美金3。而在巴基斯坦,恶意窃电甚至使整个国家陷入电力供应短缺的困境4。这类恶意的异常用电行为不仅给电网公司和国家带来了巨大的经济损失,且对电网运行安全造成了极大的隐患,如电网施工事故、局部区域的供电瘫痪、电气设备设施的异常损坏、电气火灾5等。由于窃电事件常发生于人口居住密集的城中村、城乡结合等区域,所以可能引发的一系列连锁反应将造成重大的安全性和经济性事件。得益于智能化电力设备的推广和应用,针对异常用电行为的监测手段已由人工抽检的方式逐渐过渡到基于数据挖掘的离群点检测、机器学习、深度学习以及混合模式。智能电网环境下窃电行为检测张芸,白开峰,王星,仓甜,周通,段锦文,苏晗(国网陕西省电力公司西安供电公司,陕西 西安 712042)摘要:用户恶意窃电造成的用电侧非技术性损失一直是全球各国电力公司期望解决的问题之一。随着人工智能算法的快速发展和智能电表的普及,通过对窃电行为建模和检测将有效减少这类情况的发生。本文首先介绍用电行为数据收集、处理、采样手段。其次,就面向用电异常行为挖掘的离群点检测、机器学习方法和深度学习方法,分析对比各类算法的特点,对已有工作进行总结。最后,通过讨论智能化手段在窃电检测研究中出现的问题和未来研究工作为该领域的研究人员提供一些借鉴。关键词:智能化电网;窃电行为检测;机器学习;深度学习中图分类号:TP311文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.03.011Review of Electricity Theft Detection in Smart Grid EnvironmentZHANG Yun,BAI Kai-feng,WANG Xing,CANG Tian,ZHOU Tong,DUAN Jin-wen,SU Han(State Grid Xi an Electric Power Supply Company,Xi an 712042,China)Abstract:The non-technical loss(NTL)on the power consumption side caused by malicious power theft by users has alwaysbeen one of the problems that power companies around the world expect to solve.With the rapid development of artificial intelligence algorithms and the popularization of smart meters,modeling and detection of electricity theft will effectively reduce the occurrence of such situations.Firstly,this article introduces the methods of collecting,processing,and sampling electricity consumption behavior data.Secondly,it analyzes and compares the characteristics of various algorithms and summarizes existingwork on outlier detection,machine learning methods,and deep learning methods for mining abnormal electricity behavior.Finally,by discussing the problems of intelligent methods in the research of electricity theft detection and future research works,itprovides some reference for researchers in this field.Key words:smart grid;electricity theft detection;machine learning;deep learning2023年第3期本文主要就用电行为数据特征和预处理手段以及窃电行为建模检测方法3个方面展开详细描述,并在文章的最后简述该项工作未来的发展方向。1用电数据采样及处理手段经过多年的应用和发展,信息采集系统作为保障我国电网公司运行安全的关键系统,它由电网智能调度管理系统、电网营销系统、故障信息管理系统、电网通信管理系统、智能电表系统、电网运维管理系统6-7组成,主要涉及电流电压监控数据、系统日志数据、用户数据、电力设备数据等。鉴于电网的巨大规模、持续化长期运营、繁杂环节、复杂运行条件等因素,由此产生了海量的电力运行数据。因此,通过充分学习数据特征,并采用机器学习和深度学习方法对历史数据和实时数据的分析和挖掘,实现监测预防用户窃电成为可能。1.1数据特征及采集经过大量的调研,本文将目前的电力运行数据分为3类:电网运行日志数据、营销系统数据以及企业管理数据。以上数据的特征可概括为以下4点:1)数据规模庞大。由于目前自动化采集和计量设备在电力管理领域的应用以及电网的实时运行,可以说每一秒产生的电力数据量都是巨大的。2)数据分散。由于我国电网公司各部门各层级之间分工明确,但是涉及多平台、多部门、多层级、多系统。因此数据的先期收集并不容易,需要跨部门跨系统的通力合作和一致协调。这对解决用电异常行为检测提出了更高的要求。3)用电异常数据密度低。目前电网运行总体平稳、正常,因此要在大规模的异常数据中筛选出有效的用电异常数据显得尤为困难。4)数据形式、情况多样。由于用电异常行为检测研究过程中所需数据来源于多系统、多部门、多环节和多设备,因此数据形式不仅多样,而且存在缺失、重复、错误的数据问题。在我国,针对窃电行为的检测研究工作主要是由国家电网公司以及各省市公司联合各高校和科研院所合作展开的,从电力、电气工程以及计算机科学的角度入手进行针对性的区域用电异常行为研究。因此,研究所涉数据集主要来源于国家电网公司(SGCC)。在国际上,如印度、美国、加拿大等国家,由于研究中所需的电力运行和营销数据涉及国家安全和个人隐私问题,获取这些数据并不容易。因此,研究人员会使用公开的数据集,比如获得广泛应用的来自爱尔兰电力和可持续能源管理局于2012年1月发布的能源消费数据8,它包含了2009年和2010年超过5000家的爱尔兰本地家庭用户和小型商业用户所安装的来自于智能电表536天的用电消费信息,其数据采集周期是30 min一个点位。众所周知,深度学习模型的训练工作大多依赖于足够的训练数据集,因此在实际数据有限的情况下,研究者们也会通过一些有效的手段获得更多的模拟数据。Kong等人 9 便采用了通过将一维Wasserstein生成对抗网络得到的模拟数据应用于低电压用电异常行为检测的工作中。文献 10 基于筛选后数据也模拟了短时间跨度用户用电记录并用于后续的模型训练和测试。1.2数据处理及采样无论是公开数据集还是源于电网公司的用户实际用电消费原始数据,都存在相当一部分数量的“脏数据”,即数据缺失、数据错误、数据为空或是数据不平衡。数据缺失、错误问题会出现在数据清洗前后。一般可通过设置筛选规则,实现数据的检验工作。然而完成数据清洗之后,该情况可能依然存在,包括空值数据。因此,为了使得预测方法或模型更好地实现对用户用电行为数据的特征表示,常需要分析比较采用线性插值、拉格朗日插值、最邻近插值等数据补全方法的结果,并根据实际情况确定适合的数据补全方案。对于零值数据,需要研究人员根据实际情况,决定数据采纳、数据模拟或是不处理等方式,最大程度降低对建模或是特征学习过程中的影响。此外,数据集不平衡即正负样本比例失调导致的数据倾斜问题也会对建模过程中的特征学习造成影响。因此,在采样过程中,会考虑采用欠采样和过采样的方式使数据及内部达到相对平衡11-13。2类方法均有优缺点,欠采样简单,但易丢失关键信息,而过采样处理易引发过拟合问题。所以,在实际应用场景中,需要综合考量真实数据情况,并制定适合的采样方案和机制。文献 14 设计了一种基于K-means算法 改 进 的 K-SMOTE(Synthetic Minority Oversampling Technique)方法,实现对用电异常数据的插值,以达到平衡整个数据集的目的。2窃电行为检测算法目前,常见的窃电行为检测算法主要是基于人工抽检和基于数据挖掘的方法。人工抽检方法是在小范围数据内,通过熟悉片区用电情况的专业人员或简单的数据判读方式,检出疑似窃电用户,并派遣网格协查员实地考察验证,所耗人力、财力成本高,已不太适用于智能化电网的发展需求。基于数据挖掘的检测算法主要涉及基于离群点检测算法、传统的机器学习、深度学习、混合模型。本章将重点就这部分的内容进行详细介绍。2.1基于离群点检测的窃电行为检测方法离群点检测在数据挖掘领域扮演着重要的角色,如图1所示的局部离群因子表示,其核心思想是从所有被检对象中寻找与绝大多数对象显著不同的若干个体。由于其相对稳定的表现,发展至今,技术成熟,并且在各工作领域得到广泛推广,应用包括网络安全、体育竞技、金融风险评估等工作。目前,应用程度较高的方法可大致归为4类:统计方法检测、临近度检测、密度检测和聚类检测。张芸,等:智能电网环境下窃电行为检测61计算机与现代化2023年第3期图1局部离群因子表示基于统计模型的能源盗窃行为检测方法主要通过对数据集可能遵循的统计规则进行假设验证,并建立对应的模型,通过寻找与模型拟合程度低的个体筛选出异常点。文献 15 在引入了分类变量和检测系数后,设计了基于线性回归的算法实现对能源盗窃的评估。通过该模型可检测到被恶意篡改的智能电表。此类方法存在异常点的显著不同,当出现用电异常