温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
机器
学习
智慧
负荷
预测
算法
中国科技信息 2023 年第 8 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Apr.2023-74-两星推荐园区源网荷储建设的重要课题。智慧设计园是数字化转型的重点项目,定位为数据驱动的生活和管理的新型园区。园区内用电负荷主要为空调、照明和电梯负荷,受到工作日、办公时间、使用人数的影响,负荷数据具备明显的周期属性,符合负荷预测的基本规律。本文选取三种经典的负荷预测方式,支持向量机回归预测、反向传播神经网络(BP)和长短时间记忆网络(LSTM)算法对园区的负荷数据进行预测应用。算法模型SVR 支持向量机回归算法支 持 向 量 机 回 归(Support Vector Machine Regression)是一种非常流行的回归算法。它是支持向量机算法的一种扩展,与分类问题不同的是,SVR 的目标是通过一个最优的超平面拟合数据,使得训练样本与该超平面的间隔尽可能小,并且避免过拟合。支持向量机回归的原理与 SVM 相似,但是对于连续的输出变量,支持向量机回归不再寻找一个分类平面,而是寻找一个回归平面,使得所有实例到这个平面的距离尽可能小,并且小于等于给定的阈值,这个阈值就是支持向量机回归中的容错率即支持向量机回归试图在每个样本点的预测值与真实值之间实现最大化间隔。在支持向量机回归中,首先需要确定一个核函数,用于将数据从输入空间映射到特征空间。然后,通过训练数据集中的样本点,寻找一条超平面(或曲面),将所有的样本点映射到特征空间中,并将数据分为不同的类别。这个超平面被称为支持向量机,因为它仅仅由那些离超平面最近的数据点来决定。这些点被称为支持向量。对于支持向量机回归,如果一个样本点位于支持向量的间隔内,那么它就是被正确分类的。如果一个样本点位于支持向量的外面,那么它就是被错误分类的。因此,支持向量机回归需要将错误分类的样本点的分类误差最小化,同时最大化正确分类的样本点与超平面之间的间隔。分类误差大小被表示为松弛变量的值,松弛变量代表着误分类样本的度量。支持向量机回归最常用的核函数是径向基函数(RBF),这个核函数可以将数据映射到高维空间,并且可以处理非线性关系的数据。除了径向基函数,支持向量机回归还可以使用多项式核函数、线性核函数等。不同的核函数在不同的数据集上的表现也是不同的,需要根据具体情况进行选择。支持向量机回归是一种非常有用的回归算法,它可以处理非线性的数据关系,并且具有良好的泛化性能。行业曲线开放度创新度生态度互交度持续度可替代度影响力可实现度行业关联度真实度基于机器学习的智慧园区负荷预测算法张 凌张 凌上海勘测设计研究院有限公司张凌(1996-),硕士,助理工程师,研究方向:大数据、人工智能。在国家“双碳”总体战略目标和数字化引领的时代浪潮下,园区的绿色发展和能源低碳化转型是国家高质量发展、优化产业结构、重塑能源形态的重点攻关对象,源网荷储的一体化管控则是深化能源改革、构建微电网体系、实现低碳园区的主要手段。电力负荷预测是智慧园区源网荷储专项规划的基础和重要组成部分,通过负荷预测可以科学地对用电计划进行管理,从而减少能耗和发电成本,便于更加合理地安排园区电网运行方式,并有利于更好地实现低碳园区的目标,增加园区的经济效益和社会效益。因此,对于负荷预测的研究,是智慧-75-CHINA SCIENCE AND TECHNOLOGY INFORMATION Apr.2023中国科技信息 2023 年第 8 期两星推荐BP 反向传播算法BP(Back Propagation)神经网络算法是一种广泛应用的神经网络算法。它是一种有监督学习算法,可以应用于分类和回归问题。BP 算法的目标是最小化神经网络输出的预测值与真实值之间的误差。BP 算法的核心思想是反向传播误差,即从输出层开始,计算误差梯度,然后向后逐层传播,直到达到输入层。最后,根据误差梯度更新神经网络的权重和偏置。整个算法包括了神经网络的正向传播以及反向传播,共分为三大层:输入层、隐藏层以及输出层,其中隐藏层可由多层复杂的神经元搭建。以简单的神经网络为例,一层输入层两个输入神经元,一层隐藏层三个神经元,一层输出层两个输出神经元。图中黑线箭头是神经网络正向传播过程,而红线箭头则表示反向传播修改权重过程。以途中神经网络正向传播为例:z1=x1wx1 z1+x2wx2 z1z2=x1wx1 z2+x2wx2 z2z3=x1wx1 z3+x2wx2 z3神经元中还会通过激活函数得到最终神经元中的值,例如ReLU,Sigmod等。从隐藏层到输出层计算方式相同。现在可以根据损失函数求出当前神经网络的误差。而反向传播的过程就是利用计算误差与各权重的导数,找出减小误差最大的方向,再根据设置的步长对权重进行调整。调整后再进行正向传播,如此反复直至误差函数收敛稳定到一个范围,则训练完成。BP算法的优点包括对非线性问题的适应性强、可用于多类别分类、可处理连续和离散型数据、容易并行化实现等。但是,BP 算法也存在一些缺点,如收敛速度慢、容易陷入局部最优解、对初始权重和偏置的依赖性强等。LSTM 长短期神经网络算法长短期记忆网络简称LSTM,他是周期神经网络提升后的线性网络。周期性神经网络由链式重复神经元构成,其神经元结构非常简单,例如图 2 中仅单层ReLU层。周期神经网络应其神经元仅通过单层网络对输入值进行修改,因此在整条网络链中,无法做到信息跨越多个神经元进行传递。相比于周期性神经网络,长短期神经网络有着更为复杂的神经元结构。如图 3 长短期记忆网络核心部分由一条线贯穿即Ct-1至Ct,C代表 cell 即神经元,t代表第t个神经元。这条和线上仅做一小部分的线性计算包括点乘与加,因此信息能够跨越多个神经元进行长距离的保留。ft为遗忘系数,将前一个神经元的输出ht-1、当前神经元的输入xt与f的权重计算的结果通过Sigmod函数转换到 0 到 1 的范围内,由核心部分进行点乘运算来遗忘上一个神经元的部分内容。ft的计算公式如下:ft=Sigmod(Wtht-1,xt+bf)it为更新系数,同样是前一个神经元的输出ht-1、当前神经元的输入xt与i的权重计算结果经过函数Sigmod转换到 0到 1 的范围内。计算公式如下:it=Sigmod(Wiht-1,xt+bi)Ct则是通过上一个神经元的输出ht-1与当前神经元输入xt通过tanh层得出当前神经元的更改量,在于系数it相乘获得最终修改值。计算公式如下:Ct=tanh(WCht-1,xt+bC)最后通过核心线中加法计算得出下一个神经元的初始值即Ct。神经元最核心部分Ct-1至Ct计算便能够得出:Ct=ft Ct-1+it Ctot是输出系数,由上一个神经元的输出ht-1、当前神经元的输入xt与o的权重计算结果经过函数转换到 0 到 1 的范围内。计算公式如下:ot=Sigmod(Woht-1,xt+bo)Ct通过tanh层并乘上输出系数ot,得出当前神经元输出ht。公式如下:ht=ottanh(Ct)这也就是整个长短期记忆神经网络中单位神经元发生的所有流程计算。但并非所有长短期神经网络都有着同样的神图 1 神经元图 2 单层 ReLU图 3 长短期神经网络中国科技信息 2023 年第 8 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Apr.2023-76-两星推荐经元,他们可以不同的系数修改方式,以及使用不同的网络层。但总体思路都是对历史数据进行部分遗忘并根据新输入添加记忆部分,从而做到能够跨越多个神经元不丢失特征。也正是因为长短期神经网络这种特殊的记忆机制,对于时序数据处理而言,有着卓越的表现。根据前期调研研究,选定作为实验应用的算法之一。负荷预测实验应用数据集本次实验所采用的数据来自某一园区 2010 年至 2015年间的电力负荷数据,包含了 2 202 条数据,采样间隔为15 分钟。值得注意的是,数据中存在部分空数据情况,而本次实验旨在针对连续的时序数据进行预测,因此不能简单地将空数据删除,需要使用数据插值方法对缺失值进行填补。数据处理后,我们将连续三天的数据作为输入,来预测后三天的电力负荷结果。将所有数据分为训练集和测试集,其中训练集包含了 1 400 条数据,而测试集包含了 600 条数据。制作实验数据集的目的在于,通过使用一部分数据来训练模型,然后使用另一部分数据来测试模型,以此来评估模型的性能。在实验过程中,使用了多种数据插值方法对缺失值进行填补,例如线性插值法、三次样条插值法、Kriging 插值法等方法。这些方法的应用可以帮助我们更好地利用现有的数据,从而提高模型的准确性和预测性能。实验应用中,我们将连续的三天数据作为输入,预测后三天的负荷结果。这种方式可以更好地考虑到负荷的季节性和周期性变化,从而更准确地预测负荷结果。实验设定编程环境为 Python3.5。评估函数为均方差(MSE),均方根误差(RMSE)。评估函数的计算公式如下:实验将上文提及算法一一应用。各算法模型按照评估函数计算结果如下:SVRLSTMBPMSE0.0920.0380.046RMSE0.3030.1940.214图 4 分别为三种算法模型输入同一三天时间,所输出的后三天最终预测结果。根据评价指标以及预测结果图,可发现长短期神经网络对于短期时序数据的预测的表现最好。三种算法预测出的负荷波动均与真实负荷的波动相吻合,但支持向量机回归对于波谷的预测较差,反向传播神经网络对波峰的预测还有不小的误差。结语针对源网荷储智慧园中电力负荷预测的需求,本文提出了三种可用的算法模型。通过某一园区的历史数据实验应用分析得出如下结论。长短期记忆神经网络相对于支持向量机回归以及反向传播神经网络,对于智慧园区中的负荷情况的预测不仅在评估指标上更优异,而且对于波峰波谷的预测也更准确。面对国内各智慧园区的建设以及技术的飞速发展,未来针对不同的园区应将各种方法进行逐一尝试以及验证,选取合适的方法。针对选择算法的改进是下一步研究工作的重点,可以选择尝试提升算法精度以及提高训练效率。图 4三种算法模型