温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
组合
预测
研究
疫情
民航
客运量
影响
陈宗楠
本栏目责任编辑:唐一东人工智能Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)基于组合预测研究新冠疫情对民航客运量的影响陈宗楠(东北大学,辽宁 沈阳 110004)摘要:新冠疫情的暴发,很大程度上影响了人民的生产生活,民航业是受其影响最直接的行业之一。量化研究新冠疫情对民航客运量的影响,能帮助我国民航业在新冠疫情影响下更好地把握行业发展趋势。选取我国20092019年民航客运量月度数据,建立组合预测模型并通过验证,通过该组合模型预测新冠疫情后的20202021年客运量,并与实际数据作比较。试验结果显示,新冠疫情对我国民航业的影响是显著的,民航客运市场恢复至疫情前的规模尚需时日。关键词:新冠疫情;民航客运量;组合预测;SARIMA预测模型;BP神经网络中图分类号:G642文献标识码:A文章编号:1009-3044(2023)03-0016-03开放科学(资源服务)标识码(OSID):1 引言新冠病毒自2019年12月被发现以来,迅速蔓延至全球,给全世界的经济发展带来了不容小觑的影响,民航业是受疫情冲击最大的行业之一。吴婷婷等将新冠疫情与非典疫情作比较,提出新冠疫情短期内对交通运输行业会产生较大不利影响1。在新冠疫情的冲击下,我国民航市场受到了较大的损失,基于预测的角度研究疫情对民航业的影响,将为后疫情时代我国民航客运市场的恢复提供帮助。钱名军等运用GARCH模型对SARIMA预测模型的残差部分进行拟合,其构建的组合预测模型解决了残差的异方差性,预测精度更高2。Andreas K等比较了ARIMA模型与深度学习神经网络模型对民航需求预测的效果,研究结果显示航空客运量具有明显的季节趋势,神经网络模型进行的预测更全面3。本文选取SARIMA模型与BP神经网络模型构建并联式组合预测模型,追溯预测了疫情后的民航客运量,与实际数据进行比较,实现量化新冠疫情对民航客运市场影响的目标。2 方法介绍2.1 SARIMA模型季节差分自回归移动平均模型(SARIMA)由ARIMA模型衍生而来,对具有季节波动特征的时间序列进行季节差分处理,可以转化为ARIMA模型4。(1)自回归移动平均模型ARMA(p,q)AR(p)自回归模型可以理解为线性预测方法,即时间序列Xt当前时刻的观测值xt与过去p个时刻的观测值存在着线性关系。表达式如下:xt=0+1xt-1+pxt-p+t(1)MA(q)移动平均模型为时间序列Xt当前时刻的观测值xt可以由过去q个周期的随机扰动项的加权平均表示。表达式如下:xt=+t-1t-1-qt-q(2)ARMA(p,q)模型是AR(p)和MA(q)的叠加,时间序列Xt当前时刻的观测值xt不仅与过去p个时刻的观测值有关,还与该时间点前q 个周期的随机扰动项有关。(2)自回归求和移动平均模型ARIMA(p,d,q)ARMA(p,q)模型要求时间序列数据是平稳的,但实际数据大多是不平稳的。对原始时间序列数据进行差分处理所建立的模型称为自回归求和移动平均模型,一般结构如下:()B dxt=()B tE()t=0,Var()t=2E()xst=0,s 0.05,说明该时间序列不平稳。先通过1阶差分(d=1)消除时间序列的上升趋势,差分后的时间序列ACF图显示在延迟12、24、36阶时有明显的突出,说明一阶差分处理后仍没有消除季节波动,因此再通过1次12步的季节差分(D=1,s=12)消除季节波动。平稳化处理后的时间序列ADF检验P0.5,正态性检验Shapiro=0.97869,该模型可用。3.2 BP神经网络模型取SARIMA模型2009-2018年拟合值及相应客运量实际值作为训练样本对神经网络进行训练,该部分建模通过Matlab软件实现。首先对数据进行预处理,由于民航客运量样本数据为单一时间序列,选择输入层节点数为 6,输出层节点数为 1,依次将 6 个月的SARIMA拟合值作为输入向量,后1个月的客运量实际数据作为输出滚动排列,归一化处理通过mapminmax函数实现。隐含层节点数的设定对神经网络的性能影响较大,通过经验公式只能大致确定隐层节点数的范围9。图2 平稳化处理后ACF、PACF检验图17本栏目责任编辑:唐一东人工智能Computer Knowledge and Technology电脑知识与技术第19卷第3期(2023年1月)第19卷第3期(2023年1月)取不同节点数进行试验,当节点数10 时可以达到10-4的目标精度,因此隐含层节点数取10。隐含层及输出层传递函数分别选择 Log-sigmoid 型及 Purelin型,经过试验发现trainlm训练函数效果较好,学习速率取0.01。对2019年客运量进行预测结果见图3,该模型预测效果较好。图3 BP神经网络预测图3.3 组合预测模型依据三种不同的权重确定方法,以均方误差和平均绝对误差两种评价指标验证不同权重组合预测模型的效果,MSE和MAE两个指标取值越小越好,各组合模型的效果见表1:表1 不同权重的组合模型预测效果表方 法SARIMABP等权重SSE最小SSE倒数权重系数SARIMA100.50.4930.496BP010.50.5070.504MSE18041.917740.311846.9611846.0311846.14MAE119.08113.0499.22998.95199.07由表1可知,组合预测模型的预测效果明显优于单一模型,由误差平方和最小法确定权重的组合预测模型MSE和MAE最小。最终确定组合预测模型如下:Y?t=0.493Y?1t+0.507Y?2t(9)3.4 样本外预测用上文建立的组合预测模型对2020-2021年客运量做样本外预测,同时与真实数据作对比,结果如图4所示。图4可见,20202021年民航客运量的实际数据与预测值相差甚远,客运量平均每月相差2500万人次,该结果表明新冠疫情对我国民航客运量的影响十分显著。受新冠疫情影响,民航客运量断崖式下降在2年内出现了3次:2020年2月最为明显,当月客运量仅为834万人,35月市场持续低迷,客运量实际值不及预测值的50%;第二次断崖发生在2021年2月,随着冬季本土疫情的反弹,民航市场再次受到较大影响,旅客实际运输量仅为预测值的40%;第三次发生在2021年末,因新冠病毒新变种奥密克戎,本土疫情再次出现较大反弹,民航旅客运输量降至3000万人次/月以下,仅为预测值的35%左右。图4 2020-2021年民航客运量组合模型预测值与实际值对比图4 结论本文基于预测的角度,实现了新冠疫情对民航客运量影响的量化,为后疫情时期民航客运市场的发展提供了参考。通过构建时间序列与神经网络的民航客运量组合预测模型,对新冠疫情后的20202021年客运量进行了样本外预测,试验结果表明,我国民航客运量受新冠疫情影响很大。2020、2021年民航全年客运量的预测值分别为70331.0万人次和73499.9万人次,而实际客运量仅为41763.7万人次和44048.3万人次,在新冠疫情的影响下,我国民航实际客运量相较于行业正常发展的情况下降了约40%,我国民航客运市场恢复到疫情前的规模还需要一些时间。参考文献:1 吴婷婷,朱昂昂.新冠肺炎疫情对中国经济的影响及应对策略J.南方金融,2020(5):3-11.2 钱名军,李引珍,阿茹娜.基于季节分解和SARIMA-GARCH模型的铁路月度客运量预测方法J.铁道学报,2020,42(6):25-34.3 Kanavos A,Kounelis F,Iliadis L,et al.Deep learning models forforecasting aviation demand time seriesJ.Neural Computingand Applications,2021,33(23):16329-16343.4 朱文燕.组合预测模型在CPI预测中的应用D.广州:暨南大学,2017.5 赵敬雯.基于ARIMA-BP神经网络模型及其优化模型的南京市PM2.5日均浓度预测研究D.南京:南京师范大学,2020.6 潘显准.基于ARIMA与BP神经网络组合模型的铁矿石价格预测研究D.大连:大连理工大学,2020.7 尧姚,陶静,李毅.基于ARIMA-BP组合模型的民航旅客运输量预测J.计算机技术与发展,2015,25(12):147-151.8 张春露,白艳萍.ARIMA时间序列模型和BP神经网络组合预测在铁路客座率中的应用J.数学的实践与认识,2018,48(21):105-113.9 王嵘冰,徐红艳,李波,等.BP神经网络隐含层节点数确定方法研究J.计算机技术与发展,2018,28(4):31-35.【通联编辑:王力】18