CS
算法
优化
VMD
BiLSTM
AM
功率
预测
俞敏
CS 算法优化 VMD-BiLSTM-AM 的光伏功率预测俞敏,王晓霞(华北电力大学计算机系,保定071003)通信作者:俞敏,E-mail:摘要:针对光伏发电功率的波动性与随机性对调度部门的负荷预测以及电网安全运行带来的严峻挑战,提出了一种基于变分模态分解(VMD)和布谷鸟搜索(CS)算法优化的双向长短期记忆网络(BiLSTM)光伏发电功率预测方法.首先使用 VMD 将光伏功率序列分解成不同频率的子模态,通过皮尔逊相关性分析确定影响各模态的关键气象因子.其次分别构建注意力机制(AM)和 BiLSTM 混合的光伏发电功率预测模型,利用 CS 算法获取网络最优的权重和阈值.最后,将不同模态的预测结果相叠加,得到最终的预测结果.通过对亚利桑那州地区光伏电站输出功率进行预测,验证了所提模型的有效性.关键词:双向长短期记忆网络;变分模态分解;布谷鸟搜索;注意力机制;光伏功率预测引用格式:俞敏,王晓霞.CS 算法优化 VMD-BiLSTM-AM 的光伏功率预测.计算机系统应用,2023,32(2):347355.http:/www.c-s- Power Prediction Based on VMD-BiLSTM-AM Optimized by CS AlgorithmYUMin,WANGXiao-Xia(DepartmentofComputer,NorthChinaElectricPowerUniversity,Baoding071003,China)Abstract:Fortheseverechallengesbroughtbythefluctuationandrandomnessofphotovoltaicpowergenerationtotheloadpredictionofthedispatchingdepartmentandthesafeoperationofthepowergrid,thisstudyproposesaphotovoltaicpowerpredictionmethodofbidirectionallongshort-termmemory(BiLSTM)optimizedbyvariationalmodaldecomposition(VMD)andcuckoosearch(CS)algorithm.Firstly,VMDisemployedtodecomposethephotovoltaicpowersequenceintosub-modeswithdifferentfrequencies,andPearsoncorrelationanalysisisadoptedtodeterminethekeymeteorologicalfactorsaffectingeachmode.Secondly,thehybridphotovoltaicpowerpredictionmodelsofattentionmechanism(AM)andBiLSTMareconstructed,andtheCSalgorithmisutilizedtoobtaintheoptimalweightandthresholdofthenetwork.Finally,thepredictionresultsofdifferentmodesaresuperimposedtoobtainthefinalpredictionresults.TheeffectivenessoftheproposedmodelisverifiedbypredictingtheoutputpowerofphotovoltaicpowerstationsinArizona.Key words:bidirectionallongshort-termmemory(BiLSTM);variationalmodaldecomposition(VMD);cuckoosearch(CS);attentionmechanism;photovoltaicpowerprediction随着有限化石燃料日益枯竭和碳减排需求转趋刚性,光伏发电等可再生能源发电技术发展迅猛1.然而,受太阳辐照度和气象影响的光伏输出功率的变化也给电网的运行带来了严峻的挑战.随着光伏渗透率逐年递增,准确预测光伏发电功率可以有效提高电网实时控制性能和经济效益2.计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(2):347355doi:10.15888/ki.csa.008921http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041收稿时间:2022-06-21;修改时间:2022-07-18;采用时间:2022-07-29;csa 在线出版时间:2022-09-08CNKI 网络首发时间:2022-11-16ResearchandDevelopment研究开发347为提高光伏发电功率预测精度,学者们展开了大量研究.统计模型通过时间序列法3、回归分析法4、神经网络法5等建立历史数据与输出功率的映射关系估算发电量,因建模简单,广泛应用于光伏发电功率短期预测中.其中深度神经网络因泛化能力强、能深入挖掘时间序列间的关联性,为光伏发电功率预测提供了强大支撑.文献 6 通过量化天气类型与主成分分析(PCA),使用长短期神经网络(longshort-termmemory,LSTM)网络提高光伏预测精度.文献 7 采用 PCA 对相似样本提取主成分作为神经网络的输入,简化网络结构.然而上述预测方法只考虑了历史信息对时序预测的单向影响,忽视了未来数据信息流与当前时刻的双向联系.双向长短时记忆(bidirectionallongshort-termmemory,BiLSTM)网络通过双向 LSTM 提取时序数据的正反向特征来挖掘时序数据的前后联系,能有效提高光伏功率的预测精度8.日前光伏序列属于非平稳序列,针对其随机性强、表现出复杂的日周期性等特性,文献 9,10 分别使用经验小波变换与变分模态分解(variationalmodedecomposition,VMD)将原始非平稳光伏序列分解成相对平稳的子序列,并对各子序列分别预测后再组合,有效提高预测精度.此外,日前光伏预测作为多步预测问题,使用深度神经网络训练与预测不仅需要占用大量建模时间和计算资源,还容易陷入局部最优,因此需对神经网络的权重和阈值进行优化.文献 11 将相似日理论和蝙蝠算法优化最小二乘支持向量机 LSSVM 相结合,避免LSSVM 陷入局部最优从而提高预测精度.文献 12 用遗传算法对 BP 神经网络的连接权值进行优化,以达成对网络的改进.但上述优化算法需要参数较多且耗时长,布谷鸟搜索(cuckoosearch,CS)算法参数更少且具有较好的参数智能寻优性能13.因此,本文提出 CS 算法优化的基于变分模态分解和添加注意力机制(attentionmechanism,AM)的 BiLSTM 日前光伏发电功率预测模型(VMD-BiLSTM-AM-CS).首先,针对光伏序列波动性较大,使用 VMD 将日前光伏序列分解为相对平稳的子模态,结合皮尔逊相关系数分析法选取影响各模态的关键气象因子共同作为预测模型的输入.其次,使用 BiLSTM 充分学习时序数据的正反向特征,添加注意力机制,赋予网络隐藏层单元不同的权重,使得预测模型从长时间序列输入中关注重点信息.最后,采用CS 算法对网络层的权系数与偏置进行优化,解决神经网络易陷入局部最优的问题.实验结果表明,本文所提模型有效提高日前光伏预测精度.1日前光伏功率预测模型构建VMD-BiLSTM-AM-CS 日前光伏功率预测模型如图 1 所示,步骤如下.光伏功率时间序列相关性分析确定模态数量模态 1模态 2模态 KBiLSTM-AM-CSBiLSTM-AM-CS预测输出 1预测输出 2预测输出 K叠加重构PearsonPearsonPearson预测结果VMD 分解BiLSTM-AM-CS图 1VMD-BiLSTM-AM-CS 光伏功率预测模型(1)对原始光伏功率序列进行数据清洗,去除离群值和缺失值后利用 VMD 方法进行分解,结合相关性分析确定模态数量,得到 K 个模态.(2)将各模态光伏序列进行归一化处理,结合皮尔逊相关系数筛选出影响不同模态的关键气象因子.(3)针对分解后的 K 个模态与关键气象因子分别构建 BiLSTM-AM 预测模型,使用 CS 算法优化网络参数.(4)将各分量的预测结果叠加,重构得到待预测日光伏功率的预测值.1.1 VMD 分析光伏发电序列具有明显的日周期性和强烈的波动性,属于非平稳序列.VMD 算法作为一种新的非递归、自适应、准正交的信号分解方法14,将光伏出力计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第2期348研究开发ResearchandDevelopment数据从时域转化到频域内进行分解,可以有效捕捉光伏发电功率的非线性特征.其步骤如下.(1)建立变分约束问题minuk,kKk=1t(t)+jt)uk(t)ejkt22s.t.Kk=1uk(t)=f(t)(1)f(t)uk=u1,u2,ukk=1,2,k(t)其中,*为卷积运算符,为光伏出力序列,、为分解后 K 个频带分量和对应的中心频率,为脉冲函数.(2)无约束变分求解引入拉格朗日乘子 和二次罚因子,用于求解上述变分问题,增广的拉格朗日算子如下所示:L(uk,k,)=Kk=1|t(t)+jt)uk(t)ejkt|22+|f(t)Kk=1uk(t)|22+(t),f(t)Kk=1uk(t)(2)ukk采用交替方向乘子法得到式(1)的最优解,其中模态分量和中心频率为迭代过程为:un+1k()=f()ik ui()+()21+2(k)2(3)n+1k=0|uk()|2d0|uk()|2d(4)拉格朗日算法的算子 迭代过程如式(5):n+1()n()+f()Kk=1 un+1k()(5)其中,为噪声容限.当满足迭代精度时停止,即:Kk=1 un+1k unk22/unk22(6)1.2 气象因子选取R(X,Y)在光伏电站的内部技术参数基本保持不变的情况下,从外部气象因素(如辐照度、温度、湿度等)中筛选出影响光伏输出功率的主要因素至关重要.需要对这些影响变量与光伏序列各模态进行相关性分析,利用皮尔逊相关系数计算两个变量 X 与 Y 之间的线性相关程度:R(X,Y)=ni=1(XiX)(YiY)?ni=1(XiX)2ni=1(YiY)2(7)由式(7)可知,相关系数的绝对值越大,相关性越强.1.3 BiLSTM 模块itotftLSTM 网络是循环神经网络的变形15,由 3 个存储门组成,即输入门()、输出门()和遗忘门().其结构如图 2 所示.ht1ht+1ht1ht1ht+1ht+1hthtftitOtxt1xt+1xtCt1Ct+1Cttanhtanh图 2LSTM模型结构xthtCtLSTM 不仅可以挖掘光伏功率的时序特征,还可以学习长期依赖关系,降低在模型训练时梯度失控的风险.、分别表示 t 时刻的输入与输出,表示 t 时刻 LSTM 隐藏节点状态,其更新过程如下所示:ft=(Wfht1,xt+bf)it=(Wiht1,xt+bi)ot=(Woht1,xt+bo)?Ct=tanh(Wcht1,xt+bc)Ct=ftCt1+it?Ctht=ottanh(Ct)(8)WfWiWoWcbfbibobctanh其中,、为权重矩阵,、为对应偏置,为 ReLU 激活函数,为双曲正切函数.LSTM 通过挖掘历史光伏序列信息来预测下一时刻的输出,然而某一时刻的输出往往同时依赖历史与未来时刻的状态信息.BiLSTM 结构图如图 3 所示,其由正反向两个 LSTM 网络组成,可以分别利用时间序列的前后变化规律进行双向预测16,预测更具全局性与整体性,有效提高光伏预测精度,具体计