温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
VMD
PSO
LSTM
模型
径流
预测
DOI:10.12170/20220208001王秀杰,王玲,滕振敏,等.VMD-PSO-LSTM 模型的日径流多步预测 J.水利水运工程学报,2023(4):81-90.(WANG Xiujie,WANG Ling,TENG Zhenmin,et al.Research on multi-step forecast of daily runoff based on VMD-PSO-LSTM modelJ.Hydro-Science and Engineering,2023(4):81-90.(in Chinese)VMD-PSO-LSTM 模型的日径流多步预测王秀杰1,王 玲1,滕振敏2,田福昌1,袁佩贤3,苑希民1(1.天津大学 水利工程仿真与安全国家重点实验室,天津 300072;2.崇左市左江治旱工程管理中心,广西 崇左532200;3.北京城建设计发展集团股份有限公司,北京 100032)摘要:为了弱化径流时间序列的非线性和非平稳性,提高不同预见期的日径流预测精度,提出了一种新的VMD-PSO-LSTM 多步预测组合模型。首先采用变分模态分解(VMD)方法将原始日径流序列分解为子序列,通过粒子群优化算法(PSO)对长短期记忆(LSTM)模型参数进行优化,对各子序列建立 PSO-LSTM 模型,各分量的预测值重构集成预测结果。将 VMD-PSO-LSTM 模型应用于黄河下游花园口和利津站的日径流多步预测,采用 Nash sutcliffe 效率系数(ENS)、相关系数(R)和均方根误差(ERMS)3 个定量评价指标对模型预测结果进行评价。结果表明:在预见期为 1、2、3 d 的情况下,两个测站的 Nash sutcliffe 效率系数和相关系数均在 0.90 以上。与 CEEMD-PSO-LSTM 和 PSO-LSTM 模型的预测结果对比表明,该模型能够有效提高日径流多步预测精度,是一种高效稳定的径流预报模型。关键词:非平稳序列;日径流多步预测;长短期记忆模型;变分模态分解方法中图分类号:TV124 文献标志码:A 文章编号:1009-640X(2023)04-0081-10 准确可靠的径流预测对合理利用水资源、提升防洪减灾能力及充分发挥水库的综合效益具有重要意义。但受气候变化和人类活动等因素的综合影响,径流变化具有较强的非线性和不确定性,为水文预报带来困难。因此,提高水文预报精度一直是水文水资源领域的研究重点和难点。目前,常用的基于数据驱动的径流预测方法有线性预测模型和机器学习模型。线性预测模型基于线性回归理论,结构简单,难以应对复杂非平稳的径流信息1。机器学习的发展为复杂径流的预测提供了新思路,其中传统浅层的机器学习方法虽然能够成功进行复杂非平稳的径流预测,但其精度仍需进一步改进2。随着人工智能技术的不断发展,深度学习被引入预测领域。其中长短期记忆(LSTM)模型具有较强的非线性预测能力、较快的收敛速度和捕捉时间序列长期相关性的能力,是一种具有特殊门控设计的循环神经网络(RNN),可以长时间保留历史有用信息3,已有研究4-5证明了其在径流预测中的优势。虽然机器学习模型在水文预报领域已经取得了丰硕成果,但传统单一的神经网络模型学习过程易产生局部最优和过拟合问题6。为解决此问题,一些学者采用自适应调节人工蚁群(ARACS)、灰狼优化算法(GWO)、PSO 等算法优化神经网络参数,如白继中等7提出的自适应调节人工蚁群-径向基函数神经网络混合预测模型(ARACS-RBF),径流预测效果明显优于RBF 模型;王立辉等 8提出灰狼优化的长短期记忆模型(GWO-LSTM),将其应用于径流预测,结果表明泛化性能较好;郑恺原等9提出的粒子群算法-加权随机森林模型(PSO-WRF),与 WRF 模型相比,PSO-收稿日期:2022-02-08基金项目:国家重点研发计划资助项目(2018YFC1508403);科技部重点领域创新团队项目(2014RA031);国家自然科学基金委创新团队项目(51621092)作者简介:王秀杰(1973),女,辽宁葫芦岛人,副教授,博士,主要从事水文系统预测与模拟研究。E-mail: 通信作者:田福昌(E-mail:)第 4 期水利水运工程学报No.42023 年 8 月HYDRO-SCIENCE AND ENGINEERINGAug.2023WRF 模型优化效果显著,具有良好的预测精度和泛化能力。由于径流序列高度的非线性与非稳定性,使得运用单一模型对径流序列进行预测,难以完全捕捉径流序列中的非线性因素。利用适当的时频信号分解技术分解原始水文时间序列建立集成模型,可有效提取水文时间序列中的有效信息,提高时间序列的平稳性和可预报性,从而提高模型的预报精度。许多学者对“分解-预测-重构”的组合预测模型进行了大量研究。周婷等10提出了小波分解-支持向量机-PSO 算法(WD-SVM-PSO)混合预测模型,基于淮河流域响洪甸水库 19592014 年径流过程进行年径流预测,验证了时间序列分解预处理的有效性;孙娜等11提出了一种将 EEMD、样本熵(SE)和正则化极限学习机(RELM)相结合的非平稳日径流预测方法(ES-RELM),基于金沙江下游控制站屏山站 20002010 年的日径流实测数据进行日径流预测,表明分解后的模型预测精度更高;王文川等12采用具有自适应序列特征的时变滤波经验模态分解(TVF-EMD)与 LSTM 耦合,构成 TVF-EMD-LSTM 预测模型进行洛河流域长水水文站月径流预测;黄景光等13提出一种小波分析-支持向量机(WD-SVM)特征分类组合预测模型,基于宜昌站 20132017 年日径流序列进行预测,结果表明相对于单一模型,新模型预测精度和稳定性明显提高;He 等14建立了变分模态分解(VMD)-深度神经网络(DNN)混合预测模型预报水库径流,预测性能优于 EMD-DNN 和EEMD-DNN 等模型。小波分解需要根据经验预先设定母波函数及分解层数,受人为影响大;EMD、EEMD则可根据时间序列的局部特征自适应将序列分解为一系列固有模态分量,与 WT 相比更具有普适性,但是容易存在伪分量和模态混叠问题,制约了预测精度的提高;VMD 是一种自适应维纳滤波器组,相比 EMD 的递归筛选模式,VMD 是一种完全非递归的变分模态分解,能减少伪分量和模态混叠,并具有比 EMD 和EEMD 更好的噪声鲁棒性15,是分解复杂非线性非平稳时间序列的一种有效手段。从以上研究可以看出,目前径流预测研究多是单步预测,利用“分解-预测-重构”方法对日径流多步预测的研究并不多见,而考虑不同预见期的径流预测模型能够对流域的防洪减灾起到更好的预防警示作用。常用的多步预测方法包括递推多步预测和直接多步预测。递归多步预测通过单步预测模型多次迭代来实现,将存在误差的单步预测输出作为下一步预测的输入,因此,随着多步预测的推进,预测误差不断放大,且在滞后较大的动态非线性系统中误差更为显著。而直接多步预测,根据模型直接得到多步预测值,不存在误差传播的问题,预测精度较高。如 Atiya 等16对比了递推多步预测和直接多步预测的预测效果,结果表明直接多步预测比递推多步预测的预测效果更好、精度更高。综合以上各研究方法的优势,本文将 VMD 分解方法与 LSTM 结合,并基于 PSO 算法优化 LSTM 模型参数,进行不同预见期下的日径流直接多步预测研究。1 研究方法 1.11.1变分模态分解(VMD)VMD 是一种自适应、非递归的变分模态信号分解方法,其自适应性体现在可以根据输入信号的特性确定所给序列的模态分解个数 k,并匹配每种模态的最佳中心频率和有限带宽,以便平衡处理序列各部分存在的噪声17。VMD 的目标是将一个原始输入信号分解成一组离散的具有特殊稀疏性的子信号(模态),在保证分解序列各模态的带宽之和最小的前提下,所有模态之和与原始输入信号相等,对模态函数进行希尔伯特(Hilbert)变换并进行变分约束,表达式如下:minuk,wkk?t(t)+jt)uk(t)ejwkt?22使kuk=f(1)(t)式中:uk和wk分别为原信号分解得到的所有模态及其中心频率的集合;t 为时间变量;为狄拉克函数;82水 利 水 运 工 程 学 报2023 年 8 月uk(t)f(t)+jt)uk(t)uk(t)为分解序列模态调幅调频(AM-FM)信号;为径流序列;是的希尔伯特变换结果。对式(1)进行重构,同时引入拉格朗日系数,转化为非约束变分问题,扩展的拉格朗日表达式为:L(uk,wk,)=k?t(t)+jt)uk(t)ejwkt?2+?f(t)kuk(t)?22+(t),f(t)kuk(t)(2)ukwk式中:为拉格朗日乘子;为惩罚因子。将上述拉格朗日函数进行时-频域变换,并进行相应的极值求解,即可得到模态分量及中心频率的频域表达式:un+1k(w)=f(w)i,k ui(w)+(w)21+2(wwk)2(3)wn+1k=w0w|uk(w)|2dww0|uk(w)|2dw(4)un+1k(w)f(w)i,k ui(w)wn+1k uk(w)uk(t)ukwk式中:相当于当前剩余量的维纳滤波;为当前模态函数功率谱的重心,对进行傅里叶逆变换,实部则为。最后,在迭代子优化序列中运用乘子交替方向法(ADMM),不断更新和得到最优解,进而求解分解层数 k 与各模态分量。1.21.2长短期记忆网络(LSTM)LSTM 神经网络是一种特殊的 RNN 网络,LSTM 通过其独特的门控设计,克服了传统 RNN 学习长期依赖关系的问题,适合于处理和预测时间序列中间隔和延迟非常长的重要事件18。在原始 RNN 中,只有一种内部状态 ht,对于短期序列的输入比较敏感,LSTM 的循环单元更为复杂,与 RNN 简单的 tanh 层相比,其拥有 4 个相互交替的网络层,如图 1 所示。遗忘门AA1ht1ht+1Xt+1Xt1ht1Ct1+tanhtanhXtOtitCtfthtCtht23输入门输出门图 1 LSTM 网络结构Fig.1 LSTM network structure diagram LSTM 每一个循环单元都有一个新增的单元状态 C,将前期输入信息长期保留,这是 LSTM 更适用于长期序列的原因。在 t 时刻,网络的输入包括 t-1 时刻的输出值 ht-1、t 时刻的输入值及 t-1 时刻的单元状态Ct-1;网络的输出包括 t 时刻的单元状态 Ct和输出值 ht。LSTM 的关键是对长期状态 C 的控制,LSTM 的神经网络模块使用了一种“门”(gate)结构,包括:输入门、遗忘门和输出门。输入门可将前序单元的信息输入到长期状态 C 中长期保留;遗忘门控制前一状态Ct-1中被遗忘的元素;输出门控制长期状态 C 在 t 时刻 LSTM 模块中的输出。第 4 期王秀杰,等:VMD-PSO-LSTM 模型的日径流多步预测83ft 1.2.1遗 忘 门遗忘门 通过读取上一时刻输出值 ht1及当前时刻输入值 xt,输出 0 到 1 之间的数值用于决定上一时刻单元状态 Ct1中信息保留比重。1 表示完全保留,0 表示完全舍弃。计算式如下:ft=(Wfht1xt+bf)(5)ftWfht1xt式中:为遗忘门的输出;为 sigmoid 函数;为遗忘门的权重;为上一时刻输出值;为当前时刻输入值;bf为遗忘门的偏置项。CtCt 1.2.2输 入 门输入门 it确定了当前输入的单元状态中用于更新当前时间步的最终单元状态 Ct的信息。其中,是由上一时刻输出 ht1和当前时刻输入 xt计算得出的当前输入下的单元状态信息,Ct取值范围为(1,1),it取值范围为(0,1),计算式如下:it=(Wiht1xt+bi)(6)Ct=tanh(W cht1xt+b c)(7)Ct=ftCt1+itCt(8)itWiW cCtb cCtCt1式中:为输入门的输出;为输入门的权重矩阵;bi为输入门的偏置项;为单元状态的权重矩阵;为单元状态的偏置项;Ct为当前时刻的单元状态;为