分享
基于自适应时序分解的空气污染物浓度预测_凌德森.pdf
下载文档

ID:2258861

大小:1.03MB

页数:10页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 自适应 时序 分解 空气 污染物 浓度 预测 凌德森
书书书数据采集与处理测控技术2023 年第 42 卷第 1 期收稿日期:2021 12 23基金项目:山西省重点研发项目(高新技术领域)(201803D121102)引用格式:凌德森,王晓凯,朱涛 基于自适应时序分解的空气污染物浓度预测 J 测控技术,2023,42(1):83 91LING D S,WANG X K,ZHU T Prediction of Air Pollutant Concentration Based on Adaptive Time Series DecompositionJ Measurement Control Technology,2023,42(1):83 91基于自适应时序分解的空气污染物浓度预测凌德森,王晓凯*,朱涛(山西大学 物理电子工程学院,山西 太原030006)摘要:为准确、有效地预测空气污染物浓度,建立了基于自适应完整集成经验模态分解(CEEMDAN)和排列熵(PE)的门控循环单元(GU)空气污染物预测模型。首先利用 CEEMDAN 算法对非线性信号的自适应分解能力将原始序列分解为一组不同频率、复杂度的固有模态函数(IMF)和一个残差分量(EC),其次根据 PE 算法将复杂度相近的 IMF 分量和 EC 一起进行重新组合,最后将重组后的子序列分别使用 GU 模型进行预测,并将子序列预测结果相加得到最终预测结果。实验结果表明,基于CEEMDAN-PE-GU 模型预测的误差明显低于其他模型,验证了该模型对空气污染物浓度预测的有效性。关键词:空气污染物浓度预测;自适应完整集成经验模态分解;排列熵;门控循环单元;神经网络中图分类号:TP391文献标志码:A文章编号:1000 8829(2023)01 0083 09doi:10 19708/j ckjs 2022 03 248Prediction of Air Pollutant Concentration Based on Adaptive Time SeriesDecompositionLING De-sen,WANG Xiao-kai*,ZHU Tao(College of Physics and Electronic Engineering,Shanxi University,Taiyuan 030006,China)Abstract:In order to accurately and effectively predict the concentration of air pollutants,a gated recirculationunit(GU)air pollutant prediction model based complete ensemble empirical mode decomposition with adap-tive noise(CEEMDAN)and permutation entropy(PE)is established Firstly,the CEEMDAN decompositionalgorithm is used to decompose the nonlinear signal adaptively,and the original sequence is decomposed into aset of intrinsic mode functions(IMF)of different frequencies and complexity and a residual difference compo-nent(EC),and then according to the PE algorithm,the IMF components and residual components with simi-lar complexity are recombined Finally,the reorganized sub-sequences are respectively predicted by using theGU model,and the sub-sequence prediction results are added to obtain the final prediction result The experi-mental results show that the prediction accuracy of the CEEMDAN-PE-GU model is significantly higher thanother models,which verifies the effectiveness of the model for predicting the concentration of air pollutantsKey words:air pollutant concentration prediction;CEEMDAN;PE;GU;neural networks随着城市化和工业化的快速发展,能源需求量不断增加,大量的污染物被排放到大气中,导致了严重的空气污染问题1。空气污染物浓度的超标可能会诱发呼吸系统病变等疾病,进而制约社会、经济的发展2。因此,建立一个准确可靠的空气污染物浓度预测模型对人们规避空气污染危害和政府制定减排政策38具有重要意义。空气污染物浓度预测是一个复杂的非线性问题,目前,其研究方法分为确定性模型、统计模型和神经网络预测模型三类3。确定性模型是以空气动力学理论和物理化学过程为基础,通过模拟大气的物理和化学环境对空气污染物浓度进行预测4。最常使用的方法是高斯模型5 和多尺度空气质量模型6。然而,确定性模型需要关于污染物来源以及大气的物理化学特征的可靠信息,数据不便收集,并且需要大量时间来完成预测7。相比较于确定性模型,统计模型更简单、更快捷、更有效,常使用的方法有自回归综合移动平均模型8(Autoregressive Integrated Moving AverageModel,AIMA)和多元线性回归9(Multiple Iinear e-gression,ML)。人工智能的发展为空气污染物浓度预测研究提供了新的机会。当人工神经网络(Artifi-cial Neural Network,ANN)被证明在污染物浓度的预测上能够取得良好的性能后10,ANN 被广泛应用于空气污染物浓度预测中11。然而,人工神经网络存在难以提取时间序列和相关的时序特征问题12。随后递归神经网络(ecurrent Neural Network,NN)的出现在一定程度上解决了该问题,并在时序问题的分析中表现出更强的适应性。长短期记忆(Long-Short TermMemory,LSTM)网络是 NN 的一种变体,具有特殊的门结构加强了数据间长期依赖关系的获取,解决了NN 在训练过程中的梯度消失问题以及无法获取数据之间长期依赖关系13 的问题。门控循环单元(Ga-ted ecirculation Unit,GU)神经网络是 LSTM 网络的进一步改进,在具有 LSTM 神经网络相同效果的同时降低了网络结构的复杂度。空气污染物浓度序列是典型的非线性、非平稳时间序列,若将收集到的数据直接进行预测实验,会使得模型预测精度不高。于是丁子昂等14 采用补充总体经验模态分解(ComplementaryEnsemble Empirical Mode Decomposition,CEEMD)方法将 PM2 5浓度序列进行分解,并利用皮尔逊相关(Pear-son)算法进行筛选,增强了数据中体现的时序特征,做到了快速、有效地预测 PM2 5浓度。Jin 等15 提出一种混合深度学习模型,利用经验模态分解(EmpiricalMode Decomposition,EMD)算法和卷积神经网络(Con-volutional Neural Network,CNN)对 PM2 5浓度数据进行分解和分类,实验结果表明,经过数据处理,可以提高预测的准确性。因此,为了提高模型预测精度,本文采用自适应完整集成经验模态分解(Complete Ensemble EmpiricalMode Decomposition with Adaptive Noise,CEEMDAN)、排列熵(Permutation Entropy,PE),以及 GU 神经网络组合的空气污染物浓度预测模型。CEEMDAN 算法将空气污染物浓度数据分解为不同尺度的子序列,利用PE 算法计算分解后的子序列复杂度,按子序列复杂程度重新组合成新的子序列,降低模型的运算规模,最后利用 GU 神经网络对重新组合后的新序列进行预测,以提高模型对空气污染物浓度的预测精度。1理论方法及预测模型构建1 1CEEMDAN 分解算法EMD 是由 Wu 和 Huang 提出的一种用于处理非平稳、非线性序列的时空分析方法16,可以在不知道的任何先验知识的情况下,依据序列自身时间尺度特征来进行信号的自适应分解处理。EMD 算法分解步骤如下。在给定的时间序列 x(t)中,找到其所有的极值点,分别拟合极大值点和极小值点的包络线 xmax(t)和xmin(t),并计算出极值点包络线的平均值 x(t),再用时间序列 x(t)减去平均值 m(t),即得到本征模态。h(t)=x(t)m(t)(1)判断 h(t)是否满足极值点包络平均值为零,局部极值点和过零点的数目相差在 1 以内,若满足则h(t)即为序列的本征模态,否则,重复步骤直到h(t)满足条件为止。重复步骤和步骤,直到时间序列 x(t)分解剩余的残差分量 r(t)为单调序列或常序列为止。这样可得到经过 EMD 算法分解后的时间序列 x(t)。x(t)=Ni=1IMFi(t)+r(t)(2)式中:N 为分解得到的子模态数。CEEMDAN 算法是在 EMD 算法的基础上改进得到的,不仅拥有对非线性信号的自适应分解特性,即能够根据非线性序列自身的特征进行信号的自适应分解,而且解决了 EMD 算法分解中存在的模态混叠问题。算法分解具体步骤如下。在待分解的污染物浓度时间序列 y(t)中,加入正负成对的高斯白噪声(1)qwn(t)(q=1,2),得到新序列 x(t)。x(t)=y(t)+(1)qwn(t)(3)式中:为白噪声的标准差;wn(t)为标准正态分布的高斯白噪声。对新序列 x(t)进行 EMD 模态分解,得到本征模态分量 IMFi1和残差序列 r1()t 为Ei(y(t)+(1)qwn(t)=IMFi1+r1(t)(4)式中:Ei()为经过 EMD 分解后的第 i 个本征模态分量;IMFi1为序列经过第一次 EMD 分解后的第 i 个本征模态。对得到的 N 个本征分量进行平均得到 CEEM-48测控技术 2023 年第 42 卷第 1 期DAN 分解后的第一个本征模态分量:IMF1=1NNi=1IMFi1(5)计算去除第一个本征模态后的残差序列为r1(t)=x(t)IMF1(6)在剩余残差 r1(t)中加入正负成对的高斯白噪声,得到新的序列,将新序列进行 EMD 分解得到本征模态分量 IMFi2和残差序列 r2(t)。Ei(r1(t)+(1)qwn(t)=IMFi2+r2(t)(7)对步骤中得到的本征模态进行平均得到CEEMDAN 分解后的第 2 个本征模态分量:IMF2=1NNi=1IMFi2(8)计算去除第二个本征模态后的残余序列为r2(t)=r1(t)IMF2(9)同理,由上述步骤 步骤可以得到第 k 个残差序列和第 k+1 个子模态。rk(t)=rk 1(t)IMFk(10)Ei(rk(t)+(1)qwn(t)=IMFik+1+rk+1(t)IMFk+1=1NNi=1IMFik+1(11)重复步骤 步骤,当残差序列为单调函数时,无法再分解出新的子模态,算法结束,此时原始序列为y(t)=Kk=1IMFk+(t)(12)式中:K 为最终得到的本征模态数量;(t)为分解剩余残差分量。1 2排列熵算法PE 算

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开