温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
CNN
编码
LSTM
智慧
家庭
用电量
预测
技术研究
书书书 ,基金项目微型电脑应用 年第 卷第期基金项目:国家自然科学基金项目()作者简介:张硕(),男,硕士,研究方向为智能楼宇能耗预测;周小林(),男,博士,副教授,研究方向为智能楼宇与智慧城市;张宇(),男,本科生,研究方向为智能楼宇能耗预测;唐钧(),男,本科生,研究方向为智能楼宇能耗预测。文章编号:()基于 编码 解码混合神经网络的智慧家庭用电量预测技术研究张硕,周小林,张宇,唐钧(复旦大学,信息科学与工程学院,上海 )摘要:用电量预测是智能电力系统合理安排发电、输电和配电的必要前提。为了提高用电量预测的精度,提出一种基于 编码 解码的混合神经网络模型。该模型先采用 编码器提取特征变量之间的有效信息并编码为定长矢量,再采用 解码器对时间序列进行建模并解码定长矢量为变长序列。考虑到用电量在不同时间分辨率下的特点,分别在每分、每时、每日、每周的不同采样率下进行用电量预测。以法国巴黎某家庭的实测数据作为实例进行实验,结果表明,与其他模型相比,所提出的模型不论在何种时间分辨率下均具有更高的预测精度。关键词:用电量预测;编码器解码器中图分类号:文献标志码:,(,):,:;引言近年来,由于人口的不断增长和科技的飞速发展,建筑能耗总量及其比重持续上升,其中,住宅能耗占建筑能耗总量的四分之三。住宅能耗主要来自居民家用电器。随着社会对电力系统运行的安全性、稳定性以及经济性要求的不断提高,用电量预测的重要性也日益突出。然而,住宅用电量具有明显的趋势性、季节性和随机性,而且还与居民的日常生活和工作规律相关,再加上数据采集时可能出现异常、缺失、冗杂等影响,准确地对其进行预测并非易事。利用传统的、等统计方法对用电量进行预测已越来越不能满足实际应用的需求。、随机森林、等多种传统的机器学习方法也只能提取较浅层的特征,且缺少对时间序列的分析。近几年,随着 和 算法分别在图像识别和语音识别等方面取得的巨大成功,它们的应用范围也越来越广泛。许多研究者也开始将这两种模型相结合应用在建筑能耗预测领域中。鉴于 强大的数据特征提取能力以及 出色的时间序列分析能力,本文将其结合,并应用于可以处理变长序列的编码器解码器结构中,提出了一种基于 编码 解码混合神经网络的住宅用电量预测模型(以下简称 模型)。编码器用于提取特征变量之间的关系,并将其编码为定长矢量。解码器用于对时间序列进行建模分析,并解码定长矢量为变长序列。最后,通过实例分析,将该模型与其他竞争基准模型进行对比,结果表明,模型具有更高的准确性和有效性。,基金项目微型电脑应用 年第 卷第期 编码 解码混合神经网络 原理结构卷积神经网络()的基本结构包括卷积层、池化层和全连接层。卷积层的主要功能是通过卷积单元进行卷积运算提取不同的输入特征。池化层的功能是对输入变量进行二次采样,将卷积层得到的特征的维度降低,以防止出现过拟合的现象。全连接层可以将卷积层或池化层提取的局部特征整合成全局特征。原理结构长短期记忆网络()能够学习长期依赖关系,有效解决 中存在的梯度消失问题。它增加了一个记忆细胞,细胞主要由遗忘门、输入门和输出门构成,如图所示。遗忘门用于控制丢弃或保留多少前一时刻记忆细胞中的信息,输入门用于控制当前时刻多少信息能被输入和保存到记忆细胞中,输出门用于控制记忆细胞中哪些信息会在当前时刻输出。图 结构示意图 编码器解码器原理结构编码器解码器()是一类模型框架,并非特指某一种具体的算法。在这个框架下,输入和输出的内容可以是任意的文字、语音、图像、视频数据等,所以可以使用各种不同的算法来解决不同的任务。它主要应用于序列到序列()问题的求解。如图所示,由一个编码器将输入序列转化成一个定长矢量,再由一个解码器将定长矢量转化成输出序列。图编码器解码器框架图 基于 模型的住宅用电量预测流程本文提出的利用 编码 解码()模型预测住宅用电量的流程如图所示,可分为以下三个步骤。()数据预处理:先进行缺失值填补,然后划分训练集与测试集。()模型 训练:将训练集的数 据 输 入 模 型 进 行 训 练。编码器用于提取特征变量之间的关系,并将其编码为定长矢量。解码器用于对数据进行时间序列的建模分析,并解码定长矢量为变长序列,最后通过两个全连接层输出预测数据。()结果评估:将训练好的模型在测试集上进行预测,使用性能评估指标对预测值和真实值的拟合度进行度量。图 模型流程图算例分析为验证所提出模型的准确性和有效性,本文采用法国巴黎某家庭 年 月 日至 年 月 日采集的数据集进行分析。该数据集是一个多变量时间序列数据集,采样速率为分钟,总共 条数据。数据预处理)缺失值填补原数据集中存在两种数据缺失情况。一种为数据在某一时刻或短时间内存在缺失(缺失时间不超过小时),另一种为数据在某一很长的时间段内连续缺失(缺失时间长达天)。针对第一种情况,由于在短时间内,用电量具有一定的趋势性,可以近似为一条直线,所以我们可以用缺失值之前最后个和其后第一个有效值的线性内插值进行填补。但上述方法并不适用于第二种情况,因为这样会导致用电量曲线长时间保持为一条特定的直线,与实际情况不符。而对于一个普通家庭来说,不考虑节假日、住户生病等特殊情况的影响,每周同一天的用电量曲线基本会保持较高的相似度,所以我们可以用缺失值的上周同一时刻的数据进行填补。)划分训练集与测试集本文将前年的数据作为训练集,剩下的作为测试集。模型参数设置本实验程序使用 编写,基于 深度学习工具的 框架来搭建模型,训练过程中使用“”作为激活函数,均方误差()作为损失函数,优化算法 为 算法,评 价 指 标 为 平 均 绝 对 误 差()。如图所示,编码器由两组卷积池化层和一层平坦层组成,卷积核数目依次设为 和。解码器由两层 网络层组成,各层神经元数量依次为 和 。由于 解码器的输入是时序数据,即有多个时间步,而 编码器只输出一个定长矢量,和 的输入要求不匹配,所以我们使用 函数作为适配器,将输入重复次,这样就可以简单地将 编码器固定的输出与 解码器期望的输入相匹配。此外,我们在最后 ,基金项目微型电脑应用 年第 卷第期一个全连接层之前使用 方法随机地在神经网络中放弃 的神经元,以降低模型过拟合的风险。实验结果分析本文使用了种常见的性能评估指标:均方误差()、均方根误差()、平均绝对误差()和平均相对误差()对预测值和真实值的拟合度进行度量。它们的数学公式在式()式()中给出。(yy?)()(yy?)()yy?()yy?y()()式中,y为用电量真实值,y?为模型预测值,为预测次数。图为 模型的预测曲线图。从图中我们可以看出,模型的预测结果精度较高,与实际曲线变化趋势基本一致。图 模型的用电量预测结果此外,我们在原数据集以每分钟采样的基础上,又按每时、每日、每周等不同时间单位进行重采样,并且与其他适用于同一数据集的竞争基准模型进行了比较,以验证 模型在不同时间分辨率下的性能。表表总结了不同时间分辨率下各种竞争基准的性能评估指标。结果表明,不论在何种时间分辨率下,不论是哪种性能评估指标,我们表每分分辨率下不同模型的性能比较模型 表每时分辨率下不同模型的性能比较模型 表每日分辨率下不同模型的性能比较模型 表每周分辨率下不同模型的性能比较模型 所提出的 模型的预测误差均明显小于其他模型,各项指标均有大幅度下降,在每分、每时、每日、每周分别为 、,预测精度极大提高。总结本文提出了一种基于 编码 解码混合神经网络()的住宅用电量预测模型。模型充分利用了 强大的特征提取能力和 出色的时间序列分析能力以及编码器解码器结构独特的变长序列处理能力,具有更强的泛化能力和更高的预测精度。实验结果表明,与其他竞争基准模型相比,模型不依赖于时间分辨率,任意一种性能评估指标的比较都表明该模型的预测误差最小,证明了其有效性和优越性。参考文献 ,(),:,:,():,():,():,():(收稿日期:)