分享
基于残差修正的ARIMA-BP组合模型在中国戊型肝炎发病预测中的应用.pdf
下载文档

ID:2578239

大小:1.98MB

页数:5页

格式:PDF

时间:2023-08-01

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 修正 ARIMA BP 组合 模型 中国 肝炎 发病 预测 中的 应用
收稿日期 2020-09-19摇 修回日期 2020-11-26基金项目 江苏省高等学校自然科学研究项目(19KJD330001);南京医科大学科技发展基金项目(2017NJMU229);南京医 科 大 学 康 达 学 院 科 研 发 展 基 金 项 目(KD2018KYJJYB014)作者单位 南京医科大学 康达学院,江苏 连云港 222000作者简介 张蓓蓓(1986-),女,硕士,讲师.文章编号 1000鄄2200(2023)05鄄0652鄄05公共卫生基于残差修正的 ARIMA鄄BP 组合模型在中国戊型肝炎发病预测中的应用张蓓蓓摘要目的:探讨基于残差修正的 ARIMA鄄BP 组合模型在中国戊型肝炎传染病流行趋势预测中的作用。方法:对 2004-2017年中国戊型肝炎统计数据采用 SPSS 软件分别建立 ARIMA 和 ARIMA鄄BP 模型,将 2018 年 1-12 月戊肝数据作为对比值,对模型的预测效果进行对比分析。结果:2 种模型的预测结果评价指标中,ARIMA鄄BP 组合模型的 E、ER、MAE、MSE、MAPE 指标整体上均小于 ARIMA 模型。结论:ARIMA鄄BP 组合模型的预测效果优于 ARIMA 模型,可用于我国戊型肝炎发病趋势的早期预测。关键词 戊型肝炎;ARIMA 乘积季节模型;BP 神经网络;组合模型;预测中图法分类号 R 512.6;R 183.1摇 摇 摇 文献标志码 A摇 摇 摇 DOI:10.13898/ki.issn.1000鄄2200.2023.05.023Application of ARIMA鄄BP hybrid modelon incidence prediction of hepatitis E in China based on residual correctionZHANG Bei鄄bei(Kangda College,Nanjing Medical University,Lianyungang Jiangsu 222000,China)Abstract Objective:To explore the role of ARIMA鄄BP hybrid model based on residual correction in predicting the epidemic trend ofhepatitis E infectious diseases in China.Methods:The ARIMA and ARIMA鄄BP models were established by SPSS software based on thestatistical data of hepatitis E in China from January 2004 to December 2017.The data of hepatitis E in China from January 2018 toDecember 2018 were used as the comparison value to analyze the prediction effect of the model.Results:The overall index values of E,ER,MAE,MSE and MAPE of ARIMA鄄BP hybrid model were smaller than those of ARIMA model.Conclusions:The prediction effect ofARIMA鄄BP hybrid model is better than that of ARIMA model,which can be used for the early prediction of the incidence trend ofhepatitis E in China.Key words hepatitis E;multiple seasonal ARIMA model;BP neural network;combined model;prediction摇 摇 戊型肝炎(戊肝)是由戊肝病毒(HEV)引起的以肝脏损伤为主的传染病,在急性病毒性肝炎中的死亡率占首位1。现有研究2表明,HEV 主要经粪-口途径传播,以水型流行最常见,其发病常见于水源污染的资源贫困地区,在发展中国家以流行为主,在发达国家以散发病例为主。据世界卫生组织统计,全球每年约有 2 000 万人感染 HEV,其中约有330 万人出现戊肝症状,2015 年大约导致 5.66 万人死亡。我国是戊肝的主要流行地区之一,掌握戊肝的流行性特征和发病趋势,是采取针对性控制、预防措施不可缺少的依据。戊肝发病多见于雨季或洪水之后,具有明显季节性,其变化趋势一般表现为复杂的非线性特征。对季节性传染病的预测一般采用求和自回归移动平均 模 型(autoregressive integrated moving鄄average,ARIMA),其可以整合趋势因素、周期因素和随机误差的综合影响3-5。BP 神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络,具有很强的非线性映射能力和柔性的网络结构,常用于非线性函数逼近,但往往不能反映时间 序 列 的 自 相 关 性 和 偏 自 相 关 性6-8。将ARIMA 模型与其他非线性预测模型相结合,采用组合模型优化预测效果,能有效提高预测效率和精度,增强预测模型的实际应用价值,是近年来传染病疫情预 测 的 新 方 向。本 文 探 讨 基 于 残 差 修 正 的ARIMA鄄BP 组合模型,通过组合模型与 ARIMA 模型预测效果的对比,验证残差修正的 ARIMA鄄BP 组合模型在我国戊型病毒性肝炎预测中的适用性。现作报道。1摇 资料与方法1.1摇 资料来源摇数据资料来源于中国疾病预防控256J Bengbu Med Coll,May 2023,Vol.48,No.5制中 心(网 址:http:/)提 供 的2004-2018 年全国法定传 染 病 疫 情 报 告,其 中2004-2017年的戊肝疫情数据用于建立时间序列预测模型,2018 年 1-12 月的戊肝疫情数据作为检验模型预测效果的对比值。1.2摇 方法摇1.2.1摇ARIMA 模型摇ARIMA 模型适用于平稳性时间序列的短期预测,对于带有季节周期性的时间序列,需引入考虑季节性的参数构成乘积季节模型ARIMA(p,d,q)(P,D,Q)s,参数 p、q、d 表示自相关函数(ACF)、偏自相关函数(PACF)的阶和差分的次数;P、Q、D 表示季节性自相关、偏自相关函数的阶和差分的次数;s 表示反映季节性的周期8。ARIMA 建模过程分为四个阶段:(1)序列平稳化,通过数据差分、变换等实现非平稳序列平稳化;(2)模型识别与定阶,根据平稳时间序列的自相关和偏自相关函数图,估计模型参数 p、q、P、D 的值;(3)参数估计及模型检验,检验 ARIMA 模型系数显著性、残差的白噪声水平;结合模型拟合系数 R2、最小信息准则等参数,确定最优模型;(4)预测,利用最优模型进行预测,评估预测效果。1.2.2摇 BP 神经网络模型摇BP 神经网络能学习和存贮大量的输入-输出模式关系,具有任意复杂的模式分类能力和优良的多维函数映射能力,由输入层、隐藏层和输出层组成多层前馈神经网络,其中隐含层可以有一层或多层(见图 1)。其算法主要包含两个方面:信号的前向传播和误差的反向传播。前向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态9。1.2.3摇ARIMA鄄BP 组合模型摇ARIMA鄄BP 组合模型的研究中,目前主要分为输入样本替换法、残差修正法和组合权重法三种10-13。其中残差修正法在捕捉时间序列线性趋势方面效果更好,同时通过残差修正能更精准地对目标值进行预测,在传染病预测方面有广泛的应用。将戊肝疫情的时间序列 yt 看作自相关主体 Lt与非线性残差 et 的结合,即 yt=Lt+et,Lt 反映了时间序列的季节性及线性趋势,et 反映残差序列的非线性变化规律。ARIMA鄄BP 组合模型的基本程序为:(1)根据确定的 ARIMA 模型获得时间序列的拟合样本及其残差;(2)提取 ARIMA 模型拟合样本的残差作为 BP神经网络模型的输入值样本,结合时间信息建立二维输入、一维输出的 BP 神经网络模型;(3)由ARIMA 模型对时间序列的目标值进行预测,得到预测样本 Lt;由 BP 神经网络模型对残差序列进行预测得到样本 et,二者结合得到组合模型预测样本 yt;(4)采用多种误差指标对 ARIMA 模型和 ARIMA鄄BP模型的预测效果进行对比分析。1.3摇 统计学方法摇采用 ARIMA 乘积季节模型和BP 神经网络模型。2摇 结果2.1摇 戊肝流行特征分析摇 由 2004-2017 年我国戊肝发病数的时间序列图(见图 2)可知,我国戊肝的发病人数呈现明显的非平稳性和季节性效应(s=12),每年的 2 4 月为发病高峰期,9 10 月份呈现低谷,序列具有明显的线性趋势和非线性特征,为非平稳的时间序列。2.2摇 ARIMA 模型的建立摇2.2.1摇 序列平稳化摇 平稳序列是 ARIMA 模型分析预测的基础14-15,根据图 2 原始序列的数据特征,首先对序列进行自然对数转化以减小异方差,通过一阶差分、一阶季节差分(s=12)消除趋势性和季节性影响,得到处理后的时间序列图(见图 3),序列在 0 附近呈现平稳的小幅上下波动,序列表现为基本平稳。2.2.2摇 模型的识别和定阶摇 由平稳化过程可知,原始数据经过自然对数转化并一阶差分、一节季节差分后,其周期性和季节性基本消失,可确定模型的参356蚌埠医学院学报 2023 年 5 月第 48 卷第 5 期数 d=1,D=1,初步确定模型的基本形式为 ARIMA(p,1,q)(P,1,Q)12。结合平稳后序列的自相关和偏自相关检验图(见图 4),初步判定 p 不超过 2、q不超过 3。参数 P、Q 的取值判定较为困难,根据已有相关文献16研究成果,P、Q 取值超过 2 阶的情况比较少见,故取为 0、1、2 进行校验。基于此,从低阶到高阶对 p、q、P、Q 分别取不同数值建立模型,根据最小信息准则、拟合效果、残差序列、参数估计有关情况综合筛选模型。2.2.3摇 参数估计及模型诊断摇对所有模型进行计算,其中有 ARIMA(1,1,0)(0,1,1)12 和 ARIMA(0,1,1)(0,1,1)12 两个模型的所有参数通过 t 检验,均满足模型要求,参数检验结果见表 1。由 BIC最小信息准则结果可知,模型 ARIMA(0,1,1)(0,1,1)12 结果为 11.441,小于 ARIMA(1,1,0)(0,1,1)12 模型的结果11.469;由拟合优度 R2 结果可知,模型 ARIMA(0,1,1)(0,1,1)12 结果为 0.803,大于ARIMA(1,1,0)(0,1,1)12 模型的结果 0.797。由此可知,模型 ARIMA(0,1,1)(0,1,1)12 对数据拟合效果更好。合格模型的残差应为白噪声序列,模型 ARIMA(0,1,1)(0,1,1)12 的 Ljung鄄Box 统计量 Q=18.825、P=0.278 大于 0.05 的检测水平,表明残差序列之间相互独立。结合 ARIMA(0,1,1)(0,1,1)12 模型残差序列的自相关和偏自相关图(见图 5),二者均位于 2 倍标准误范围内,并表现出无规律的纯随机性,由此可判定残差序列为白噪声序列,模型ARIMA(0,1,1)(0,1,1)12 对原始数列信息的提取比较充分,拟合性较好。摇 摇 由模型 ARIMA(0,1,1)(0,1,1)12 的拟合曲线图(见图 6)可知,拟合结果与实测值的变化规律有良好的一致性,能够较好地模拟原始时间序列的线性趋势和季

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开