温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
DCNN
LSTM
单站逐
时气
预报
方法
李晶
李晶,唐全莉.基于1DCNN和LSTM的单站逐时气温预报方法J.热带气象学报,2022,38(6):800-811.文章编号:1004-4965(2022)06-0800-12基于1DCNN和LSTM的单站逐时气温预报方法李晶1,唐全莉2(1.宁波工程学院经济与管理学院,浙江 宁波 315000;2.昆明理工大学理学院,云南 昆明 650500)摘要:针对海量气象观测数据间存在大量的物理噪声、与气温无关的冗余特征以及时间相关性,提出了一种将一维卷积神经网络(1DCNN)和长短期记忆神经网络(LSTM)相结合的多信息融合气温预报方法。首先,运用差分法对气象观测数据进行预处理,得到平稳时间序列数据;其次,运用1DCNN提取与气温变化相关的特征变量作为神经网络模型的输入变量;最后,运用 1DCNN 和 LSTM 构建多信息融合气温预报模型 1DCNN-LSTM,并以云南省昆明市历史气象观测数据为例,与传统的LSTM、1DCNN和反向传播神经网络(BP)对未来24小时的逐时气温预报进行了比较研究。研究结果表明,1DCNN-LSTM的均方根误差(RMSE)相较于LSTM、1DCNN 和 BP 最大降低了 5.221%、19.350%和 9.253%,平均绝对误差(MAE)最大降低了 4.419%、17.520%和8.089%。为气温的精准预报提供了参考依据。关键词:1DCNN神经网络;LSTM神经网络;多信息融合;气温预报;单站逐时预测中图分类号:P456.4文献标志码:ADoi:10.16032/j.issn.1004-4965.2022.074收稿日期:2021-04-13;修订日期:2022-08-08基金项目:浙江省统计局重点项目(22TJZZ25);国家自然科学基金(71964018);云南省社会科学基金(YB2019036);昆明理工大学学生课外学术科技创新基金(2020YB207)共同资助通讯作者:李晶,女,河北省人,副教授,博士,从事数据科学、质量管理工程研究。E-mail:第38卷 第6期2022年12月热 带 气 象 学 报JOURNAL OF TROPICAL METEOROLOGYVol.38,No.6Dec.,20221 1 引引言言气温是影响气候最主要的参数之一,其变化可导致财产损失,甚至会威胁人类生命。因此,精准的气温预报在人类的经济活动、地质灾害防控、医疗实践等众多领域具有重要意义1-5。因此,有效挖掘地面气象观测站中的时间序列数据,预知未来气温的动态变化,受到国内外专家学者的高度重视6-8。早期的气温预报方法大多运用数值预报方法9和传统的统计学预报方法10。张金秀等11运用统计学方法系统分析了河西走廊东部强降温的时空分布、强度等气候特征,并利用Press准则和逐步回归方法对预报因子进行初选和精选,构建了一种基于最优子集回归的各地月最低气温预报方法,为强降温预报和预警提供了客观有效的参考依据。张颖超等12基于气温在空间上的相关性,运用粒子群算法进一步改进了多面函数内插算法,进而构建了一种基于地面逐时气温观测资料的多站联网质量控制方法,该方法具有较强的地区适应性和气候适应性。李江峰等13基于偏最小二乘回归能完全消除多重共线性的特点,构建了水汽和地面气温多模式集成预报模型,进一步改善了比湿和地面气温多模式集成预报的效果。虽然这些方法在气温预报上都取得了良好的预报效果,但因受制于较大的计算代价、大量物理噪声以及与气温无关的冗余特征对气温变化的影响,传统的统计学气温预报方法无法有效地学习气象观测数据间的时间相关性,在气温预报精度上仍具有一定的提升空间。随 着 深 度 学 习 的 发 展,人 工 神 经 网 络(Artificial Neural Networks,ANN)凭借超强的自学习能力,可深度学习海量数据间隐藏的复杂关系,第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法在气象领域已取得一定的应用成果14-18,例如小波神经网络(Wavelet Neural Network,WNN)19、反向传播神经网络(Back Propagation,BP)20、长短期记忆神经网络(Long Short-Term Memory,LSTM)以及 一 维 卷 积 神 经 网 络(One-DimensionalConvolutional Neural Network,1DCNN)等。其中,1DCNN神经网络的表征学习能力,可挖掘时间序列数据中存在的长期依赖关系,进而提取高阶特征21;LSTM神经网络利用遗忘门、输入门和输出门,被证实在时间序列任务中具有较好的预报效果22。倪铮等23将LSTM深度神经网络用于精细化气温预报,在空军T511数据模型产品的试用过程中,发现该模型对转折天气具有较好的气温预报效果。陶晔等24利用随机森林(RandomForest,RF)可度量特征重要性的特点,将 RF 与LSTM模型相结合,构建了RF-LSTM气温预报模型。然而,尽管LSTM神经网络对时间序列数据具有较好的预报能力,但由于海量气象观测数据间存在大量的物理噪声和与气温无关的冗余特征,因此,仅运用LSTM模型对气温进行预报存在训练时间长、易过拟合等缺陷。鉴于此,本文基于1DCNN能够进行特征提取的特点和LSTM较强的时间序列数据处理能力,构建了一种多信息融合气温预报方法 1DCNN-LSTM。该方法可有效地挖掘气象观测数据间存在的时间相关性,剔除与气温变化无关的物理噪声和冗余特征,降低数据维度和时间复杂度,进而可提取出与气温高度相关的潜在特征,进一步提高气温预报精度。2 2 研究方法概述研究方法概述2.1 1DCNN神经网络模型1DCNN 神 经 网 络 是 卷 积 神 经 网 络(Convolutional Neural Network,CNN)的一种特殊结构,具有强大的表征学习能力,能够从输入信息中提取高阶特征25。一个典型的 1DCNN模型通常包括输入层、若干个交替的卷积层和池化层、全连接层和输出层这5个部分。其中,卷积层可对输入数据进行特征提取26。卷积层。卷积层通过卷积运算从输入数据中提取子序列,以达到从局部输入中提取高阶特征,提高特征鲁棒性的目的,卷积公式如式(1)所示。为了提高1DCNN模型的稀疏性,减少参数之间的依 存 关 系,通 常 采 用 线 性 整 流 函 数(RectifiedLinear Unit,ReLU)作为卷积层的激活函数,数学表达式如式(2)所示,xlj=f()i Mjxl-1i wlij+bj(1)al+1i()j=f()yl+1i()j=max0,yl+1i()j(2)其中,xlj为卷积操作的输出值,f为激活函数,Mj为输入的特征矢量,xl-1i为待卷积区域,wlij为卷积核(权重),bj为相应的偏置系数。yl+1i()j为卷积操作的输出值,al+1i()j为yl+1i()j的激活值。池化层。池化层在卷积层之后,利用最大池化方法对卷积层的输出执行池化操作,如式(3)所示,pl+1i()j=max()j-1 W+1 t jWqli()t(3)其中,pl+1i()j为池化操作的输出值,qli()t为第l层第i个特征矢量中第t个神经元的值,W为池化区域的宽度。2.2 LSTM神经网络模型LSTM 神经网络是递归神经网络(RecursiveNeural Network,RNN)的 一 种 变 体,是 SeppHochreiter和Jrgen Schmidhuber专门研究梯度消失问题所提出的重要研究成果27。该方法提出了一种可携带信息跨越多个时间步的设计,因此,能够挖掘数据间存在的时间相关性,有效避免传统RNN模型由于无法学习数据间的时间依赖关系而面临的梯度爆炸和梯度消失问题。其单元结构如图1所示。图1LSTM单元结构图htCtCtCt-1ht-1XththtftitottanhtanhC?t801热 带 气 象 学 报第38卷由图1可看出,LSTM是由多个结构完全相同的单元构成,利用遗忘门、输入门和输出门的相互作用来调节单元状态。遗忘门、输入门和输出门的具体调节步骤如下。(1)通过遗忘门从单元状态中找到需要丢弃的信息,如式(4)所示,ft=()Wfht-1,xt+bf(4)其中,ft为遗忘门,为sigmoid激活函数,ht-1和xt分别为前一时刻的输出值和当前时刻的输入值,Wf和bf分别表示遗忘门的权重矩阵和偏置项。(2)通过输入门决定加入新状态的时间。通过sigmoid层找到需要更新的单元状态;通过双曲正切函数(tanh)层创建一个新的单元状态值;将旧单元状态更新到新单元状态,具体计算步骤如式(5)式(7)所示,it=()Wiht-1,xt+bi(5)C?t=tanh()Wcht-1,xt+bc(6)Ct=ft Ct-1+it C?t(7)其中,it、C?t、Ct-1和Ct分别表示输入门、当前输入的单元状态、旧单元状态和跟新后的新单元状态,Wi和bi分别表示输入门的权重矩阵和偏置项,Wc和bc分别表示单元状态的权重矩阵和偏置项。(3)通过输出门将新单元状态和输入数据相结合,确定 LSTM 模型的输出值。首先,利用sigmoid层确定需要输出的信息,如式(8)所示;其次,将tanh层和sigmoid层相乘,得到最终的输出值,如式(9)所示,ot=()Woht-1,xt+bo(8)ht=ot tanh()Ct(9)其中,ot表示输出门,ht表示LSTM模型最终的输出,Wo和bo分别表示输出门的权重矩阵和偏置项。3 3 基于基于1 1DCNNDCNN和和LSTMLSTM的多信息融的多信息融合气温预报模型构建合气温预报模型构建3.1 研究区域本文研究区域为云南省昆明市。由于其独特的地理位置,经常出现倒春寒、洪涝、干旱等多种气象灾害,以及由气象灾害引发的泥石流、山体滑坡等地质灾害,该地区时常遭受经济和人员等重大损失。因此,本文将通过挖掘云南省昆明市气象观测数据间的隐藏特征,进而提高气温预报精度,增强气象灾害预防能力。3.2 预报时间范围气温变化易受到各种不可控因素的影响,随着预报时间的增加,预报误差逐渐累积,进而导致气温预报模型的预报精度不断降低。因此,预报时间越长,气温预报误差就越大。基于此,本文拟运用过去一周(即7天)的历史气象观测数据来预测云南省昆明市未来24小时的逐时气温,进一步探究多信息融合气温预报模型1DCNN-LSTM在未来24小时中的气温预报效果,为中长期气温预报的研究提供理论基础。3.3 数据收集传统的气温预报方法主要基于单变量的气温预报,即仅考虑了气温这一气象要素,忽略了其他气象要素对气温变化的影响。因此,导致气温预报模型的输入变量过少,时间序列数据之间关联信息不足,进而降低传统气温预报方法的精度。基于此,本文将构建多信息融合的预报方法对气温变化进行深入探究。通过运用文献分析法,得出影响气温变化的主要因素有气温(T)、气象站气压(PO)、海 平 面 气 压(P)、相 对 湿 度(RH)、风 向(WD)、风速(WS)以及水平能见度(VV)。其单位分别为摄氏度()、hPa、hPa、百分率(%)、罗盘方向、米/秒(m/s)、千米(km)。其中,T 为本文的预测值(y),PO、P、RH、WD、WS以及VV为特征值(x)。根据以上影响因素,本文将收集云南省昆明市地面气象站2017年1月1日00时2019 年12月31 日23时(北京时间,共计1 095天)的每小时气象观测数据(共计26 280条)进行实证研究。同时,运用差分法对气象观测数据进行预处理,将预处理后的数据集中的前80%作为训练集,后20%作为测试集,并随机抽取训练集中的20%作为验证集。3.4 数据预处理由于本文所收集到的气象观测数据具有明显的季节性变化,且其中的的风向数据属于文本数据,因此,本文的数据预处理主要包括以下3个方面:(1)运用地面气象电码将风向中的文本数据转换成对应的风向电码(数值数据),得到适用于神经网络模型的数据集;(2)运用差分法对转换后的气象观测数据集进行去季节化处理,剔除季节性变802第6期