温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
分解
分量
集成
学习
负荷
预测
方法
张子森
计算机与现代化JISUANJI YU XIANDAIHUA2023年第3期总第331期文章编号:1006-2475(2023)03-0096-06收稿日期:2021-11-19;修回日期:2021-12-21基金项目:上海市科委项目(115105024)作者简介:张子森(1994),男,安徽临泉人,硕士研究生,研究方向:人工智能数据挖掘,E-mail:;徐晓钟(1964),男,高级工程师,研究方向:人工智能数据挖掘,计算机软件架构设计,E-mail:xxz_。0引言随着社会的发展,全球能源消耗呈指数增长,合理的能源需求管理对于经济和环境可持续发展至关重要1。负荷预测是能源需求管理领域的热点,准确地预测负荷对于规划者和决策者有着重要的意义。根据不同的管理需求,负荷预测分为以年为单位的中长期负荷预测,以月、周、天为单位的短期负荷预测,以及以时、分为单位的超短期负荷预测2。本文以电力能源为例,对短期负荷预测进行研究。短期负荷同时具有周期波动性和增长性的二重趋势,使得负荷的变化呈现出复杂的非线性组合特征3。以某地区一段时间内每日同一时刻的电力负荷值为例,该类型数据具有以年为单位的周期波动性,以及随时间推移的增长趋势,如图1所示。图1电力负荷时间序列针对短期负荷,目前预测方法主要分为3种:1)传基于分解和多分量集成学习的负荷预测方法张子森,徐晓钟(上海师范大学信息与机电工程学院,上海 201418)摘要:能源负荷时间序列具有周期波动性和增长性两重趋势。一般梯度提升树 GBDT 通过集成多个分类与回归树CART,能够很好地拟合周期波动性趋势,但是对于增长性趋势拟合较差。相关研究先分解再使用组合模型预测,而本文研究在分解后使用多分量集成学习进行预测。首先分解出负荷的2种趋势分量及残差分量,将CART的叶节点改为3个预测模型,使其能够对3个分量进行预测。同时优化CART损失函数为各分量预测结果的误差平方总和,使其能够考虑3个分量预测模型的损失。然后基于梯度提升重构预测结果,使其能够以多分量集成学习的方式拟合负荷的两重趋势。最后提出基于分解和多分量集成学习的负荷预测方法,该方法在某地区电力负荷预测实验中,相比其它预测方法,各项误差评价指标均有所下降。实验结果表明,本文提出的方法在两重趋势性负荷的预测中具有更好的表现,同时也为GBDT预测其它类型数据提供了改进思路。关键词:负荷时间序列;STL分解;梯度提升树;多分量预测;负荷预测中图分类号:TP301.6文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.03.017Load Forecasting Based on Decomposition and Multi-component Ensemble LearningZHANG Zi-sen,XU Xiao-zhong(College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai 201418,China)Abstract:The time series of energy load has a dual trend of periodic fluctuation and growth.By integrating multiple classification and regression trees(CART),the existing gradient boosting tree(GBDT)can well fit the periodic fluctuation trend,but it ispoor for the growth trend.The related researches decompose the load first,and then use the combined model for prediction.Thispaper studies the prediction using multi-component ensemble learning after decomposition.Firstly,the two trend componentsand residual components of load are decomposed,and the leaf node of CART is changed into three prediction models,so that itcan predict the three components.At the same time,the CART loss function is optimized as the sum of the square errors of theprediction results of each component,so that it can consider the loss of the three component prediction models.Then,the prediction results are reconstructed based on gradient boosting,so that it can fit the dual trend of load in the way of multi-componentensemble learning.Finally,a load forecasting method based on decomposition and multi-component ensemble learning is proposed.In a regional power load forecasting experiment,compared with other forecasting methods,the error evaluation values ofthe proposed method are reduced.The results of experiments show that in the prediction of double trend load,the method proposed in this paper has better performance,and also provides an improvement for GBDT to predict other types of data.Key words:load time series;STL decomposition;gradient boosting decision tree;multi-component prediction;load forecastingd2023年第3期统预测方法,如回归分析方法4、时间序列方法5等;2)单个人工智能预测方法,如神经网络6、支持向量机7等;3)组合预测方法,通过模型互补的方式优化单个模型存在的问题,如用遗传算法优化改进后的神经网络初始参数8、使用蚱蜢优化算法评估支持向量机参数9、使用分解方法后再对各分量单独预测10等。但目前的预测方法都存在一定局限性,如传统预测方法对初始数据要求高,未考虑其它影响负荷的因素等11;人工智能方法在提升预测精度的同时,也存在最终解过于依赖初值、收敛速度慢、网络的隐节点数难以确定等问题12;组合预测方法虽然弥补了单个模型的不足,但模型数量增加使整个预测过程变得复杂。针对以上局限性,可以在梯度提升树GBDT13的基础上,研究二重趋势性负荷预测的方法。GBDT是一种有着良好泛化能力和稳定性12的集成学习算法,可以用来对负荷进行预测。同时,相较于其它组合方法,GBDT可以通过组合多个简单模型以获得一个性能更优的模型14,避免单个人工智能预测方法的局限性。现有GBDT方法对负荷的周期波动性趋势拟合效果良好,但是对负荷的增长性趋势拟合较差。该算法以分类与回归树CART15作为弱学习器,通过梯度提升法将多个弱学习器组合成强学习器。其中CART对基于历史数据的均值进行预测,可以很好地预测具有明显周期波动性趋势的数据16。但这种预测方式不能灵活地对输入数据进行线性变换17,因此无法外推历史数据的增长性趋势,从而造成GBDT对负荷的增长性趋势拟合较差。现存文献中暂未对GBDT拟合负荷增长性趋势较差进行研究,但有相关研究证明,对于复杂的负荷时间序列,可以先进行分解再对各分量单独预测,最后重构预测结果。刘成龙等人18先对负荷进行了VMD分解,然后建立了3个随机森林模型对分量进行组合预测,最后重构预测结果;Qiu等人19先对负荷进行了EMD分解,然后使用深度信念网络DBN对各分量进行了预测,最后重构预测结果;Li等人20先对负荷进行了EEMD分解,然后使用多元线性回归模型MLR和长短期记忆神经网络模型LSTM对分量进行了组合预测,最后重构预测结果。基于以上分析,本文提出在GBDT中先分别预测趋势分量再重构预测结果,使其能够实现对周期波动性和增长性两重趋势的拟合。先对负荷进行STL分解,得到增长分量、周期分量及残差分量,其中增长分量和周期分量对应负荷的2种趋势,残差分量对应负荷去除2种趋势后的余项;然后改进CART的损失函数和预测方式,提出能够对3个分量同时预测的LT-CART方法;最后基于LT-CART进行梯度提升,提出多分量集成学习的GB-LT-CART方法,实现对周期波动性和增长性两重趋势的拟合。其中,对于增长趋势分量,在初始化时以二次回归模型的方式完成增长趋势的外推,后续再在LT-CART中进行梯度提升。基于 STL 分解和 GB-LT-CART 方法,本文提出一种用于二重趋势性负荷的预测方法。该方法首先对负荷进行 STL 分解,然后建立 GB-LT-CART 模型对各分量同时进行预测,最后输出负荷预测值。以某地区电力负荷数据进行验证,并与GBDT、神经网络ANN和支持向量机SVM进行对比,结果表明本文提出的方法具有更好的表现。1相关方法1.1负荷时间序列STL分解本文选用STL分解21算法对负荷时间序列进行分解。原因是相比较于小波分解22、经验模态分解23等其它时间序列分解算法,STL分解可以将时间序列按加法模型分解成趋势分量、周期分量和残差分量。其中,趋势分量和周期分量对应负荷的增长性和周期波动性,残差分量对应负荷去除2种趋势后的余项。因此,STL分解更符合本文要求。STL分解算法以鲁棒局部加权回归方法将时间序列进行分解。首先需要确定周期参数,对负荷时间序列,可设定周期参数为365 d(年周期)。计算过程由内外环2个循环嵌套而形成,在内循环中计算更新趋势分量与周期分量,在外循环中基于当前结果计算残差分量并识别异常值,然后对异常值通过设置稳健性权重以减小其在下一次内循环中的影响。假定对于v=1,2,N,S(k)V和T(k)V分别是第k次迭代后的周期分量和趋势分量,下一轮内循环主要计算步骤为:1)去趋势,计算Y-T(k),然后取每个周期相同位置的样本点组成周期子序列。2)对周期子序列做Loess平滑处理,得到临时周期子序列C(k+1)V。3)对临时周期子序列进行低通过滤,提取低通量L(k+1)V。4)将临时周期子序列减去低通量,计算得到新的周期序列,即:S(k+1)V=C(k+1)V-L(k+1)V(1)5)去周期,YV-S(k+1)V。6)对去周期后的序列做Loess平滑得到趋势序列T(k+1)V。外循环主要计算内循环完成后的残差分量,并对残差分量中较大的异常值,在下一次内循环的步骤2和步骤6中进行Loess权重的调整:RV=YV-TV-SV(2)最终,外循环和内循环都完成计算后,时间序列被拆分成3个分量:y=ytre+ysea+yres(3)对图1中负荷时间序列进行STL分解,得到增长分量、周期分量及残差分量,如图2图4所示。图