季节性
时间
序列
建模
韩苗
收稿日期2 0 2 1-0 6-1 5;修改日期2 0 2 2-0 6-2 8 基金项目高等学校大学数学教学研究与发展中心教学改革项目(CMC 2 0 2 1 0 4 0 2);江苏省高等教育教改研究立项课题(2 0 1 9 J S J G 3 3 9);国家自然科学基金(7 1 8 7 1 2 1 5)作者简介韩苗(1 9 8 0-),女,博士,副教授,从事金融衍生产品定价、金融数据统计建模等研究.E-m a i l:l u c k h a n m i a o 1 2 6.c o m第3 8卷第6期大 学 数 学V o l.3 8,.62 0 2 2年1 2月C O L L E G E MATHEMAT I C SD e c.2 0 2 2季节性时间序列建模的“教”与“思”韩 苗,周圣武,金子龙(中国矿业大学 数学学院,江苏 徐州2 2 1 1 1 6)摘 要针对季节性时间序列,分别探讨了四种预测模型.以中国国内生产总值季度数据为研究对象,进行统计建模分析.结果表明,四种模型预测误差稍有差异,但总体上都具有较优的预测精度.最后对2 0 2 1年我国国内生产总值四个季度数据进行了预测,为我国国内生产总值预测分析提供参考.在综合建模分析的基础上,着重培养学生统计建模思想和解决复杂问题的综合能力和高阶思维以及在真实情境中所激发的品格、价值观和使命感.关键词季节性时间序列分析;国内生产总值;预测;高阶思维 中图分类号O 2 1 2.1;F 2 0 1 文献标识码B 文章编号1 6 7 2-1 4 5 4(2 0 2 2)0 6-0 0 5 3-0 81 引 言季节变动,是指社会经济现象随着季节的变化而呈现的周期性变动.不分析研究、认识掌握现象的季节变化规律,常常会使模型的预测作用减弱甚至丧失.针对季节性时间序列,一般在统计预测课程教学中,可供选择的方法较多,如温特线性和季节性指数平滑模型、季节性交乘趋向模型、含虚拟变量回归模型、A RMA模型等方法1-2.不同预测模型各具特点,在教学中为了综合比较这几种模型,本文从实际问题出发,探讨模型的应用实践.国内生产总值G D P是衡量经济发展水平的重要指标之一,研究G D P的预测分析问题具有重要的实际意义.很多学者针对不同类型的数据,如季度G D P3-5、年度G D P6及地区G D P7-9等进行分析,追求预测精度更高的模型及算法.由于本文考察的是季节性时间序列建模方法,因此选取我国国内生产总值当季值(亿元)进行研究,基于四种传统的季节性时间序列预测方法进行统计建模,模型易于理解而且预测效果较优,为我国国内生产总值预测分析提供参考.在综合建模分析的基础上,强化应用实践,培养学生解决复杂问题的综合能力和高阶思维.2 预测模型的构建2.1 温特线性和季节性指数平滑模型温特线性和季节性指数平滑模型是描述既有线性趋势又有季节变化序列的模型,一般有两种形式,一种是线性趋势与季节相乘形式;另一种是线性趋势与季节相加形式.这里考虑相乘形式,即H o l t e r-W i n t e r季节乘积模型,预测模型为Ft+m=(St+btm)It-L+m,(1)式(1)中,m为预测的超前期数,且包含时序的三种成分:平稳性(St)、趋势性(bt)、季节性(It).它们都是建立在三个平滑值基础上的,分别为St=ytIt-L+(1-)(St-1+bt-1),01,(2)bt=(St-St-1)+(1-)bt-1,01,(3)It=ytSt+(1-)It-L,01,(4)式中,L为季节周期长度.I为季节调整因子,为三个平滑参数.2.2 季节性交乘趋向模型季节性交乘趋向模型如下:yt=Vtfi,(5)式中,Vt是时间序列的趋势项;fi是时间序列各季的季节指数,且fi=Fi+Fi+T+Fi+m-1 Tm,i=1,2,1 2或i=1,2,3,4,式中,Fi是各期实际的季节指数,由当期实际值除以趋势值得到,T是季节周期的长度,m是季节周期的个数.2.3 含虚拟变量回归模型在回归模型中,一般解释变量即自变量都是连续取值的,但实际问题中,影响被解释变量变化的可能还有一些属性变量.如学历、性别、职业对收入的影响;一些月度或季度数据可能会受季节的影响.为了量化这些因素,通常会根据因素的属性类别,构造只取“0”或“1”的虚拟变量.虚拟变量的引入通常有三种形式:加法形式、乘法形式、加乘同时引入形式.对于一般的一元线性回归模型yt=0+1xt+t,(6)t满足回归模型基本假设.加法形式是将虚拟变量直接加到上面模型中,即yt=0+1xt+Dt+t,(7)式中Dt是虚拟变量,只取“0”或“1”.乘法形式是将虚拟变量与解释变量相乘后引入模型,即yt=0+1xt+Dtxt+t.(8)加法与乘法同时引入的形式(加乘形式)是将虚拟变量直接加到模型中,同时又将虚拟变量与解释变量相乘后引入模型,即yt=0+1xt+Dt+Dtxt+t.(9)2.4 自回归移动平均(A RMA)模型自回归移动平均(A RMA)模型是经典的时间序列分析方法,广泛应用于各个领域.该模型建模步骤主要包括平稳性检验、模型识别、模型建立与选择和预测.如果时间序列包含季节性和趋势性特征,可以通过d阶逐 期差分和D阶 季节差分使 其平稳化,再 建立A RMA模型.通常将模型 记为A R I MA(p,d,q)(P,D,Q)s,具体形式如下:p(B)P(Bs)(1-B)d(1-Bs)Dyt=q(B)Q(Bs)t,(1 0)E(t)=0,V a r(t)=2,E(ts)=0(st),式中,p是自回归阶数;q是移动平均阶数;P是季节性自回归阶数;Q是季节性移动平均阶数.其中p(B)=1-1B-2B2-pBp是p阶自回归算子;q(B)=1-1B-2B2-qBq是q阶移动平均算子;P(Bs)=1-1Bs-2B2s-PBP s是季节性P阶自回归算子;45大 学 数 学 第3 8卷Q(Bs)=1-1Bs-2B2s-QBQ s是季节性Q阶移动平均算子.3 中国国内生产总值预测分析本文采用的数据为2 0 0 0年第1季度至2 0 2 0年第4季度中国国内生产总值当季值(亿元)季度数据,数据来源国家统计局,数据序列如图1所示.从长期来看,季度G D P序列总体呈现上升的趋势,并且具有明显的季节性特征.下面采用前面介绍的四种常用的季节性时间序列建模方法对我国国内生产总值进行预测分析.这里将2 0 0 0年第1季度至2 0 1 8年第4季度数据作为训练样本,用于建立模型,选取2 0 1 9年第1季度至2 0 2 0年第4季度数据作为测试样本以检验模型的预测效果,最终预测2 0 2 1年的季度G D P数据.图1 中国国内生产总值时序图3.1 温特线性和季节性指数平滑模型预测结果建立温特线性季节性指数平滑模型,首先要给定初值,分别选取初值S5=y5=2 4 0 8 6.4,b5=y5-y1 +y6-y2 +y7-y3 34=6 7 1.7 1,初始季节指数可以通过下面公式计算I1=y1y=0.8 5 0 8,I2=y2y=0.9 5 9 0,I3=y3y=1.0 2 5 6,I4=y4y=1.1 6 4 5,其中y=4i=1yi4=2 5 0 7 0.0 2 5.其次,要选取平滑参数,这里通过反复试验,综合比较最终选取平滑参数分别为=0.5,=0.5,=0.6,利用式(1)(4)计算可得各期预测值.最终得到预测结果2 0 0 1年第2季度至2 0 1 8年第4季度预测期内的均方根误差R M S E=1 7 5 9.1 1 5 4 0 4,平均绝对百分误差MA P E=1.5 2 1%;2 0 1 9年第1季度至2 0 2 0年第4季度样本期外的均方根误差RM S E=1 3 6 3 9.8 6 4 2 5,平均绝对百分误差MA P E=4.1 6 6%.3.2 季节性交乘趋向模型预测结果根据季度G D P时间序列的非线性变化特征,建立如下季节性交乘趋向模型:yt=(0+1t+2t2)fi,i=1,2,3,4,式中,0+1t+2t2是G D P时间序列非线性趋势部分.设国内生产总值当季值序列的趋势方程为Vt=0+1t+2t2,采用最小二乘法,得到趋势的估计方程(括号中的数据为对应t检验统计量的值):55第6期 韩苗,等:季节性时间序列建模的“教”与“思”Vt=1 9 2 8 9.1 2+7 5 4.5 6 3 8t(3.9 7 5 8 5 1)+2 7.9 0 8 3t2(1 1.6 8 4 5 8),且可以得到R2=0.9 8 1 9 7 5,接近1,拟合程度高.F检验值为1 9 8 8.4 3,显然F检验通过.D.W=2.0 9 8 1 3 5,表明随机误差项不存在序列相关,趋势方程整体拟合效果较好.下面计算季节指数,yt除以Vt得到的Ft表示各季度由季节影响带来的变动.对序列Ft进行季节平均,得到理论季节指数fii=1,2,3,4 ,以及修正的季节指数fii=1,2,3,4 ,见下表.表1 季节指数与修正的季节指数季节因子季节指数fi修正的季节指数fi10.9 1 3 2 9 4 5 1 70.9 1 0 8 1 2 6 720.9 8 8 1 6 0 7 0 20.9 8 5 4 7 5 4 0 931.0 1 6 1 5 5 3 1 21.0 1 3 3 9 3 9 4 541.0 9 3 2 8 8 9 5 11.0 9 0 3 1 7 9 7 6合计4.0 1 0 8 9 9 4 8 14由上面结果可得yt=1 9 2 8 9.1 2+7 5 4.5 6 3 8t+2 7.9 0 8 3t2 fi.通过计算可得2 0 0 0年第1季度至2 0 1 8年第4季度预测期内的均方根误差RM S E=3 6 9 7.7 4 9 0 9 6,平均绝对百分误差MA P E=4.2 7 6%;2 0 1 9年第1季度至2 0 2 0年第4季度样本期外的均方根误差RM S E=1 4 7 6 7.8 8 0 7 9,平均绝对百分误差MA P E=4.7 1 6%.3.3 含虚拟变量回归模型预测结果这里通过引入虚拟变量来刻画季节性特征,同时因为时间序列具有递增的非线性趋势特征,在二次多项式函数趋势基础上,引入表示季节因素的虚拟变量,分别记作D1=1,第二季度,0,其他季度,D2=1,第三季度,0,其他季度,D3=1,第四季度,0,其他季度.由于引入虚拟变量,区分了不同季度的影响,更好的揭示了变量之间的关系,因此会提高预测精度.对于虚拟变量的引入,本文分别采用加法形式,乘法形式以及加乘同时引入形式模型.通过数值结果分析,模型优化,最终采用乘法形式的虚拟变量回归模型.具体模型如下:yt=0+1t+2t2+3D1tt+4D2tt+5D3tt+t,采用最小二乘法进行参数估计,估计结果见下表.表2 含虚拟变量回归模型参数估计参数012345估计值1 8 6 7 1.3 15 6 5.2 1 6 12 6.8 7 8 8 72 1 5.2 8 1 02 9 2.1 6 3 15 0 3.5 2 1 1标准误1 3 6 8.0 1 98 3.3 6 3 6 81.0 3 3 2 0 72 8.9 1 8 9 02 8.6 6 1 3 02 8.4 2 6 5 0t值1 3.6 4 8 4 36.7 8 0 1 2 42 6.0 1 4 9 87.4 4 4 3 0 21 0.1 9 3 6 51 7.7 1 3 0 9p值0.0 0 0 00.0 0 0 00.0 0 0 00.0 0 0 00.0 0 0 00.0 0 0 0模型整体拟合效果较好,通过预测分析,可得2 0 0 0年第1季度至2 0 1 8年第4季度样本期内的均方根误差RM S E=3 7 1 4.0 4 9 8 6 2,平均绝对百分误差MA P E=4.4 4 1%;2 0 1 9年第1季度至2 0 2 0年第4季度样本期外的RM S E=1 4 0 2 7.0 3 5 2 3,MA P E=3.9 2 1%.3.4 A RMA模型预测结果