温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
融合
卷积
循环
居民
用电
短期
负荷
预测
方法
李坤奇
第 卷第期 年月太原理工大学学报 引文格式:李坤奇,孟润泉,李凤莲融合聚类卷积门循环的居民用电短期负荷预测方法太原理工大学学报,():,():收稿日期:基金项目:山西省科技重大专项资助();国家自然科学基金资助项目()第一作者:李坤奇(),硕士,()通信作者:孟润泉(),教授,主要从事电力负荷预测的研究,()融合聚类卷积门循环的居民用电短期负荷预测方法李坤奇,孟润泉,李凤莲(太原理工大学 电气与动力工程学院,信息与计算机学院,太原 )摘要:对居民用电进行准确的短期负荷预测是电力部门合理制定每日调度计划的重要依据。提出了一种基于 ()聚类算法卷积神经网络(,)门控循环单元(,)的短期电力负荷预测方法。根据智能电表采集的历史负荷数据,该方法首先采用 聚类算法分析不同用户的用电习惯,将用户聚类为多个用户群;然后构建由负荷数据和时间以及气候信息组成的多特征时间序列数据集,并采用训练集进行 预测模型构建。训练集首先输入到基于一维卷积层设计的 网络,以提取不同特征变量之间的非线性关系;之后将数据输入 网络,以提取数据在时间维度上的时序特性,最后由全连接层输出短期负荷预测结果。以爱尔兰能源管理委员会提供的公开数据集作为实际算例,以 网络、网络及 网络为对比模型,实验结果表明,所提出方法的平均绝对百分比误差达到了 ,有较高的预测精度和较快的模型训练速度。关键词:短期负荷预测;卷积神经网络;门控循环单元;聚类算法中图分类号:文献标识码:文章编号:(),(.,.,):(),(),(),(),(),:;在碳中和与新能源占比不断提升的背景下,发电侧和用电侧的峰谷差逐年增大,居民用电短期负荷预测问题有着较高的研究价值。高效准确的负荷预测有助于电力系统调度工作的稳定性和经济性,提升用电效率,减少能源浪费。在对居民用电负荷进行预测时,传统方法是基于居民区整体的负荷数据进行预测。但随着智能电表的普及,用户用电行为的数据精度更高、粒度更细、特征更多。基于用户层面的深度数据挖掘可以使预测模型学习到更多规律,有助于进一步提升负荷预测精度。对用户进行聚类分析有助于提升负荷预测精度。如文献 在建立预测模型前,根据用户的用电行为特性,采用 聚类算法对用户进行聚类分析,验证了聚类分析在负荷预测任务中的可行性和有效性,有助于负荷预测模型学习到不同用户群的用电趋势信息。已有方法通常是对用电数据采用聚类分析得到用户群信息后,针对每个用户群分别建立预测模型,导致预测模型数量偏多,且各模型只能学习到相应用户群的用电信息,无法学习到其他用户群的用电信息,因此也无法获取不同用户群用电规律之间的潜在联系。另外,以及层次聚类算法等为常用的时间序列聚类算法。算法简洁高效,但算法性能易受初始聚类中心的影响。算法属于层次聚类算法,其性能不受初始聚类中心影响,通过生成一棵具有层次结构的聚类特征树,聚类结果有更好的可解释性,且性能更优,灵活性更强。因此,为克服已有方法缺陷,本文提出了一种基于 ()聚类算法融合单预测模型的居民用电短期负荷预测方法,首先采用 聚类算法进行用户用电量的聚类分析,以得到多个具有不同用电习惯的用户群,挖掘不同用户群的用电规律之间的潜在联系,构建可更精确反映用户用电特性的多特征时间序列用电数据,为后续预测模型构建提供更优质的特征属性数据,并有助于降低预测模型数量。在居民用电负荷预测模型构建方面,目前用于短期负荷预测的方法主要包括指数平滑法和多元线性回归等统计方法,以及分类和回归(,)决策树、支持向量机(,)、人工神经网络(,)和深度学习等机器学习方法。统计方法采用传统的统计学思想,预测模型有较好的解释性,但模型较为简洁,在数据量较大的情况下无法充分利用数据中的非线性信息。决策树算法采用自顶向下递归结构建树,较适合高维数据,但模型性能易偏向多值属性数据,且忽略了属性之间的相关性。能较好地处理非线性问题,且泛化性能较好,但存在对大规模训练样本较难实施缺陷。人工神经网络及基于神经网络的各种深度学习模型,在非线性数据量较大的情况下,性能更优,近年来在负荷预测领域应用广泛。作为深度学习常用结构,()是包含卷积计算的神经网络,可高效实现输入特征的提取,被广泛应用于图像识别、语音识别及居民用电量负荷预测等领域。在居民用电预测领域,在提取高维特征和压缩时间窗上有较好效果。如文献 在构建负荷预测模型之前,采用 网络预先对输入数据进行处理,取得了较高的预测精度。另一种常用结构是 (),由于 在网络中引入了循环结构,因此能更好地学习动态时间序列数据的时序特性,预测精度更高。()和 ()是 的两种改进模型,由于添加了门结构,从而能更有效地挖掘时间序列包含的潜在规律。如文献 将 应用于单个居民用户的短期负荷预测,取得了较高的预测精度。太 原 理 工 大 学 学 报第 卷针对上述研究现状,本文提出了一种 聚类算法融合 预测模型的居民用电短期负荷预测方法(简写为 )所提出方法,首先基于 聚类算法对用户用电数据进行聚类分析,以构建包含用户群负荷数据的多特征时间序列数据集,接着进行 预测模型训练,最后,基于居民用电公共数据集进行预测性能分析,验证了本文方法的有效性。居民用电短期负荷预测框架设计居民用电短期负荷预测方法设计思路由于智能电表的广泛部署,在未来智能电网的情境下,每个居民用户都可以被采集到一条负荷曲线。本文用表示用户在第时段的用电量,假设用户数为,用电记录点数为,则第个用户的负荷曲线为,;同一居民区的历史用电情况可以由式()所示,矩阵的一行代表一个用户的历史负荷数据,一列代表同一时段所有用户的用电负荷:()图给出了本文提出的一种新型的居民用电短期负荷预测方法设计框架。首先,根据用户的用电习惯特征,将用户聚类为个用户群,.根据聚类结果,每个用户群分别聚合得到一条负荷曲线。若用电记录点数为,则用户群的负荷曲线为,的计算方式如式()所示:,()聚合后的负荷信息可以由式()表示:.()基于聚合结果,将多个用户群的负荷数据、融合时间以及气候等特征信息,得到多特征时间序列数据集,用于后续预测模型训练及性能测试。相比于传统方法,本方法的优势在于:由于输入数据中不仅有总负荷曲线,也有不同用户群的负荷曲线。预测模型不仅可以学习到不同用户群的用电规律,而且可以学习到不同用户群用电趋势之间的潜在联系,因此预测精度更高,拟合速度较快,使得训练模型的时效性更高。图 预测方法 多特征时间序列数据集构建除了历史负荷数据外,居民用户的用电行为与时间因素、气候因素也有较强相关性。季节、时刻、节假日等因素会显著影响居民的用电行为,因此本方法采用月、日、星期、时刻、以及是否为节假日等个时间变量。气候因素的变化会影响居民用电需求。本方法选取与用电负荷相关性较高的平均温度、平均湿度等两个气候变量。综上所述,本方法构建了包含时间变量、气候变量以及负荷变量种特征的居民用电数据集,具体如表所示。表多特征时间序列用电数据集结构 因素特征变量描述时间月月份,日日期,星期一周内的第几天,时刻一天内的第几个 分钟,是否为节假日布尔型变量,气候平均温度单位:平均湿度单位:负荷第组用户群总负荷第组用户群总负荷台区总负荷单位:融 合 聚 类 算 法 及 预测模型的负荷预测方法本文提出的 负荷预测方法第期李坤奇,等:融合聚类卷积门循环的居民用电短期负荷预测方法融合了 聚类算法,以及 预测模型。其中 聚类算法用于对居民用电量进行聚类分析,对聚类分析后的用户群用电量进一步融合时间以及气候信息以得到居民用户群用电数据特征,将用户群用电特征数据划分为训练集、验证集及测试集,其中训练集用于构建 预测模型,验证集用于对模型性能进行验证及优化,并用测试集对模型性能进行评估。基于 聚类算法的居民用电多用户群构建本文所提方法采用归一化的平均日负荷用电量来表征每个用户的用电模式,若负荷数据采样频率为 ,则用户日负荷用电量由一个长度为 的向量表示,即对应 维空间中的一个点,之后采用 聚类算法根据点之间的欧式距离对用户负荷用电量进行聚类分析,将用户聚为不同的用户群,每个用户群包含多个用电习惯类似的用户。聚类结束,可得到用户所属的用户群类别。为了提高预测性能,本文采用 聚类算法结合最优轮廓系数准则寻优得到最佳居民用电用户群数量。寻优时,将居民用电用户群数量设置为一个动态寻优范围,此处设置为,则 聚类算法分别运行次,得到组聚类结果,其中的最优轮廓系数对应的聚类数即为最佳居民用电用户群数量。聚类分析的具体步骤如下所示:)求每个用户的平均日负荷用电量。对用户的日负荷用电量的历史数据求平均值,得到每个用户的平均日负荷曲线,并以平均日负荷用电量表征用户的用电习惯。若负荷采样间隔为 ,则用户的平均日负荷用电量为,)归一化。对平均日负荷用电量进行归一化,以准确提取用户的日内用电趋势,避免不同用户的用电总量差异对聚类结果产生影响。归一化公式如式()所示。()式中:为用户归一化后的平均日负荷用电量;为用户平均日负荷用电量;、分别为该用户平均日负荷用电量中的最大值与最小值。)根据实际情况,设定聚类数目的参数空间。对每一个聚类数目,采用 聚类算法对数据集进行聚类分析,得出每一个聚类数目对应的聚类结果。其中,聚类算法特征树的每个节点由包含个元素的聚类特征(,)表示,如式()所示。,.()式中:为簇内样本点的数量,对应本文为同一用户群用户数量。为样本点的表征向量,对应本文为用户归一化后的平均日负荷用电量。为簇内所有点的代数和,为簇内所有点的平方和。)求各聚类结果的轮廓系数。轮廓系数用于衡量聚类的效果,以确定最优聚类数。轮廓系数的计算方式如式()所示。()()(),(),(),().()式中:为样本点的总数;()用于量化簇内的凝聚度,即样本到簇内各样本点距离的均值;()用于量化簇间分离度,即样本到其他簇样本点距离的均值。为样本所在簇的样本点个数,为样本所在簇的其他样本点;为样本所在簇外的样本个数,为样本所在簇外的样本点。)采用最大轮廓系数对应的聚类数目和聚类结果作为最优类簇数和最终聚类结果,每个用户归属于一个用户群。轮廓系数越大,聚类效果越好,以本文实际应用为例,更大的轮廓系数代表用户群内用户的用电习惯更加相似,不同用户群的用户用电习惯更加不同。)每个用户群内,用户的历史负荷数据相加,汇总得到每个用户群的历史负荷用电量。居民用电短期负荷 预测模型构建为了对多特征时间序列用户群数据进行充分学习,本文进一步提出了 居民用电量预测模型。模型结构主要包括 层、层和全连接层,整体网络结构如图所示。模型中每层描述如下:太 原 理 工 大 学 学 报第 卷图 网络结构 )层。本模型的 层包含一个卷积层和一个池化层。卷积层用于挖掘各用户群负荷数据与气候和时间等变量之间的潜在关系,并提取高维特征。以表示用户群数量,则表征居民用电信息的输入数据包含()个时间序列,每个时间序列包含 个时刻的历史数据,因此单个输入样本为()的矩阵。卷积层通过个卷积核,将居民用电信息映射为个时间序列,输出 的矩阵至池化层。之后池化层通过最大值池化将居民用电信息映射为 的矩阵,从而在保留有效信息的同时,压缩时间序列的长度,减少后续 网络的训练时间。)层。本模型搭建了双层 结构,以充分 学 习 居 民 用 电 负 荷 数 据 的 时 序 特 性。基 于 层输出的 的用电信息矩阵,由第一层 提取时序特性,并传递相同格式的用电信息矩阵至第二层 ,第二层 再进一步提取时序信息后,由最后一步神经元输出格式的表征居民用电信息的向量至全连接层。单元的基本结构如图所示,数学描述如式()所示。在图中,箭头所指方向为数据流动方向。(,),(,),(,),().()图和式()中,为矩阵的数乘,为激活函数 函数,为激活函数,“”表示该链路向前传播的数据为.和为更新门和重置门的输出,为输入,为上一隐藏层的输出,为隐藏层的输出。图 网络基本单元 )全连接层。包含个神经元的全连接层对 网络提取的居民用电信息做进一步非线性映射,最后由包含单个神经元的输出层输出负荷预测结果。全连接层及输出层的计算公式如式()所示。()()式中:为居民用电负荷预测值,为 网络输出的表征居民用电信