温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
国家铁路货运量的时间序列分析研究
交通运输专业
国家
铁路
货运量
时间
序列
分析研究
交通运输
专业
国家铁路货运量的时间序列分析
目录
1. 引言 1
2. 统计预测模型的建立 2
2.1趋势拟合法 2
2.1.1 二次型 2
2.1.2 S曲线模型 3
2.1.3移动平均法 3
2.1.4 指数平滑法 3
2.2 ARIMA模型 4
2.2.1 ARIMA模型建模步骤 4
2.2.2 观察值的预处理 4
2.2.3 模型的识别与检验 5
3.国家铁路货运量预测分析 5
3.1.1二次型模型 6
3.1.2 S曲线型模型 7
3.1.3 移动平均法 7
3.1.5 部分小结与结论 8
3.2 ARIMA模型法 9
3.2.1 数据的处理以及模型的建立 9
3.2.2 模型的判断与选取 12
3.2.3 模型的诊断与检验 13
3.2.4 模型的预测 13
5.总体小结与结论 13
参考文献 14
摘要 本文以国家1978年至2011年中国国家铁路货运量数据为基础.以不同的方法建立不同的模型,并通过所建立的不同样式的模型来对2012至2014年国家铁路货运量进行预测.比较不同样式的模型的预测精确度,最终选择了在经过差分剔除长期趋势以及季节因素后对其残差进行检验和识别.从而建立ARIMA(0,2,1),并根据此模型对2012至2014年国家铁路货运量进行预测,拟合效果良好.
关键词 国家铁路货运量 ;预测精确度;差分;ARIMA模型
Abstract: Based on the national railway freight volume data from 1978 to 2011, this paper establishes a model with different methods, and forecasts the freight volume from 2012 to 2014 by the model. By comparing the prediction accuracy of the different models, the ARIMA function model is finally selected. According to this function model, the forecast of freight volume between 2014 and 2012 is made, and the fitting effect is good.
1. Key Words: National railway freight volume;Prediction accuracy;Difference;ARIMA pattern function.引言
现代数学统计理论在金融学中的应用越来越明显,有关专家指出,统计学、经济理论以及数学这三个对于真正的去了解现代经济生活里蕴含的数量关系来说是很有必要的.数学给经济界带来了全新的视角、理念.如果缺乏统计基础知识要想在市场中有出色而又完美的表现是十分困难的.本文以中国的水路运输为列,通过数理方法对中国水路货运量的发展趋势进行科学性的预测与分析.
自1987改革开放以来中国经济进入了高速发展的时期,其中铁路运输作为交通运输系统的重要组成的部分,为国家GDP的提升做出了巨大贡献,承担着重要的交通运输责任,为我国的经济发展做出了良好的推动与促进作用.铁路运输按性质可以划分为国家铁路、地方铁路以及合资铁路,其主要特点是运量大、成本低、能耗少、投资低、是国内国际重要的运输方式之一,其重要性不言而喻.另外,铁路运输在国民经济发展中具有重要的作用,它将世界各地连成一片,对于经济全球化的发展具有重要的推动作用.所以研究全国的国家铁路货运量对于经济政策的调整与完善具有非常重要的作用.
如何使用科学的统计方法分析与预测国家铁路货运量,将有助于经济的快速发展,解放出大批生产力去从事其它经济建设,从而更好的推动经济的发展.
对于全国国家铁路货运量的分析与预测,更多的是以年度的数据为单位,大多采用长期趋势分析、回归分析、神经网络、灰色预测、指数平滑法等确定性的模型来分析.由于回归分析、灰色预测、长期趋势虽然能对数据进行预测,但是只能提取强劲的确定性信息,对随机信息的浪费比较严重,而且不能对其残差做进一步的分析,不能判断信息最终是否充分提取,所以模型的精度较差.
随机时序分析方法弥补了确定性因素分解方法的不足,本文采用ARIMA模型对未来进行分析与预测,其预测的精确度比之线性模型,指数模型等更好,正文部分将对几种模型的做详细比较.根据全国1978年至2011年国家铁路的货运量数据,用统计方法对数据进行的分析,发现国家铁路货运量具有显著地增涨趋势,在对数据进行二阶差分从趋势中提取出线性趋势后,差分后的序列呈现出了非常平稳的随机波动.在剔除完长期趋势因素后,用随机效应模型ARIMA对二阶差分建模,得到更高精确度的水路货运量的预测模型.
本文所有数据是全国1978年至2011年国家铁路货运量数据作为建模数据,以2012年至2014年这三年的数据作为建模的检验所用,在误差允许的范围内,拟合效果良好.
2. 统计预测模型的建立
时间序列分析是对动态数据进行处理的一种统计方法.这种方法以随机过程理论与数理统计方法为基础,来研究随机的数据序列所遵从的统计学规律,由此来解决一些实际的问题.常用的时间序列分析法有回归分析、灰色预测、长期趋势预测、乘积季节效应模型等.
由于时间序列的变化受到趋势因素、季节因素、周期因素以及不规则变化因素的影响,预测的对象随着时间的变化而呈现出一定的变化趋势,没有非常明显的季节波动,所以这里一方面就可以采用一定的函数曲线来描述这种变化,就能够通过趋势外推法进行预测.这里将分别用二次、S曲线、移动平均法以及单指数平滑法去拟合原来的曲线,通过比较找出最优的函数拟合曲线.需要注意的是选用移动平均法时需要对它的移动平均长度做一定的判断,另一方面也可以采用ARIMA模型来对数据进行分析预测.
2.1趋势拟合法
趋势拟合法是把时间作自变量,把相应的序列观察值当做因变量,从而建立序列的值随时间的变化而变化回归模型的方法.由序列呈现的线性或非线性的特征,从而拟合的方法又可以具体的分成线性与曲线拟合.
2.1.1 二次型
当曲线具有显著地曲线变化时,可以尝试着用二次型曲线来作为拟合模型.模型可以写成:
.
首先令 ,则元模型变换可以写为:
.
再通过线性最小二乘法来对参数参数,,进行估计.
最小二乘法:
设观察值为 .则可令
最小值.
由微分原理有:
.
解方程即可求,,三个参数.
将各个参数值带入原方程,检验参数与方程是否显著,若方程显著而某些参数不显著,那么去掉该参数,再重新拟合新的模型,直到方程和各参数均显著为止.
2.1.2 S曲线模型
S曲线模型又称生长曲线模型,是预测事件观察值随时间变化符合生长曲线的规律. 龚帕兹(生长)曲线是一种常用曲线,模型可写成:
参数a,b,k的求解步骤.
(1)将N个数据划分为三组(假定N=3r).
(2)求个组的对数和,即有:
, ,
(3)利用公式计算a,b,k的值
,,
2.1.3移动平均法
移动平均法是通过使用一组最近的观察值数据来预测未来以后一期或者几期内的产品需求量、产能等常常使用的方法,移动平均法它适用于短期预测,当产品变化不大且不存在季节性的因素时,它可以有效地消除预测里的随机波动.移动平均法可以划分为:简单移动平均和加权移动平均.
2.1.4 指数平滑法
考虑到时间间隔对事件的发展的影响,各期的权重随着时间间隔的增大而呈现指数衰减
.
式中,为指数平滑系数,0<<1
由于
.
故
.
指数平滑法它是对时间序列的过去数据全部同等使用,不考虑较远期的数据,在它进行加权平均时候给近期观察值更大的权重.
指数平滑法的优缺点:
优点: 所需数据少; 兼容了全期间的平均和移动平均的所长.
缺点:给予远期较小的比重,近期较大的比重,故只能进行短期预测.
2.2 ARIMA模型
ARIMA模型它的全称为差分自回归移动平均模型,它是由博克斯(BOX)同詹金斯(Jenkins)在70年代初期提出的序列预测方法.ARIMA模型通常是将非平稳的时间序列转变为平稳的时间序列,在此以后再将因变量仅对它的滞后值以及随机误差项的现值同滞后值进行回归分析所建立的模型.ARIMA(p,d,q)里的AR是自回归,p是回归项,d是差分次数,MA是移动平均,q是移动平均的项数.其ARIMA(p,d,q)模型可定义为:
式中的
为ARMA(p,q)的自回归系数的多项式;
而
为ARMA(p,q)的移动平滑系数多项式.
上述ARIMA模型式子也可简记为
,式中的{εt}是零均值的白噪声序列.
方差齐性对于ARIMA(p,d,q)模型,当d≠0时序列均值和方差都为非平稳的.
2.2.1 ARIMA模型建模步骤
首先需要获得观察值序列,对数据进行平稳性检验.若检验结果为非平稳则进行差分运算,直至数据为平稳序列.然后在对数据作白噪声检验,如果不是白噪声则说明信息提取不充分需要拟合ARMA模型直至为白噪声为止,最后在分析结果.
2.2.2 观察值的预处理
根据时间序列图来判断观察值序列是否始终在一个常数值的附近随机波动,如果是则说明该序列平稳,反之不真.假如观察值呈现出一定的趋势性或者周期性,那么我们可以判定它通常不是平稳序列,需要对其进行差分
来提取序列中隐藏的确定性信息,直至其n阶差分序列{∇ nxt}的时序图呈现一定的随机波动.
对于平稳性的检验通常有两种方法一种是通过时序图与自相关图所显示出来的特征而作出的图检验法,其带有很强的主观色彩;另一种是通过构造检验统计量来进行检验假设.
2.2.3 模型的识别与检验
一个拟合模型的好坏可以从两个方面去考察;一方面是似然函数值,另一方面是从未知参数的个数,其中Akaike(1973)的信息准则(即AIC)是适用性非常广的准则,它是拟合精度和参数个数的加权函数:
AIC=-2(模型极大似然)+2(模型中未知参数个数)
AIC值达最小的模型为最优.定义AIC准则函数为:
.
由此可以发现AIC同时体现了残差的不相关性原则和模型的简洁性原则,并排出了主观因素.由于AIC准则中拟合误差提供的信息容易受到样本容量的放大,为了弥补AIC准则它的不足之处,Schwarts提出了SBC准则:
同时使得BIC最小的模型为最优模型,其中p为最佳阶数.
一个好的拟合模型能够提取出观察值序列中几乎所有有用的样本信息,故模型的显著性检验即是残差序列的白噪声检验,原假设与备择假设分别为
检验统计量为LB(Liung—Box)
~自由度为m的卡方分布,∀m>0.
若拒绝原假设则说明拟合的模型不显著.
3.国家铁路货运量预测分析
将全国自1978—2011年的国家铁路总货运量作为样本数据,利用时间序列分析法对其建立不同模型,并对全国未来三年的货运量即2012,2013,2014年的国家铁路货运量进行预测.
表一 全国水路运输货运量
时间
货运量(吨)
时间
货运量(吨)
时间
货运量(吨)
时间
货运量(吨)
时间
货运量(吨)
1978
107500
1985
127500
1992
152300
1999
157200
2006
245500
1979
109495
1986
132219
1993
156800
2000
166100
2007
262400
1980
108600
1987
136949
1994
157300
2001
179200
2008
275200
1981
104836
1988
140555
1995
159500
2002
1