温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
组合分析
模型
河北省
粮食产量
预测
研究
产业与科技论坛2023年第22卷 第6期Industrial&Science Tribune2023(22)6基于组合分析模型的河北省粮食产量预测研究殷阿娜 王可心【内容提要】粮食产量是农业生产的基本问题之一它标志着农业生产力的发展水平 以河北省为研究对象选取 年粮食产量和影响因素数据 一方面自单一的粮食产量时间序列入手利用 语言建立线性拟合、两参数指数平滑模型另一方面考虑粮食产量的影响因素建立粮食产量与影响因素之间的逐步回归、岭回归模型 基于组合预测原理以绝对值残差损失函数最小为原则利用 语句计算最优权重最终得到 两参数指数平滑法与逐步回归法组合的最优预测模型 与四种单项预测模型相比其在预测精度上有显著提高【关键词】时间序列多元回归组合预测粮食产量【基金项目】本文为河北地质大学研究生课程建设与教育教学改革研究项目“统计分析与软件应用 示范课”(编号:)阶段性研究成果【作者简介】殷阿娜()女陕西咸阳人河北地质大学副教授硕士生导师博士研究方向:大数据统计王可心()女河北石家庄人河北地质大学经济学院硕士研究生研究方向:数据挖掘方法 “为政之要首在足食”粮食生产是我国政府向来都重视的问题 我国拥有着世界 的耕地面积却是全球生产粮食最多的农业大国 目前为止我国的粮食自给率还有明显的提升空间约在 左右 粮食生产受多种因素制约在我国粮食生产不断向好的过程中同时也存在着一些潜在威胁 未来粮食产量如何变化国家粮食安全能否得到保障是一个非常现实和迫切的问题 河北省作为我国的农业大省粮食总产量连续 年超过 亿斤为国家粮食安全做出了重要保障 因此以河北省为研究对象通过统计分析找到合理有效的预测方法科学把握未来河北省乃至全国的粮食总产量以便为相关部门提供数据支持及时采取措施保障粮食安全一、研究设计(一)变量与数据 通过阅读大量粮食产量预测方面的资料和文献 并结合河北省的实际情况选取 个影响河北省粮食总产量(万吨)的因素:农用机械总动力(万千瓦)、农村用电量(亿千瓦时)、有效灌溉面积(千公顷)、农用化肥施用量(万吨)、受灾面积(千公顷)和粮食播种面积(千公顷)收集年份为 年数据主要来源于 年中国统计年鉴中国农村统计年鉴和河北统计年鉴(二)模型选择 文章基于时间序列和多元回归方法以组合预测理论为主导对河北省粮食产量展开研究 从时序图来看河北省粮食总产量为总体呈现线性上升趋势的非平稳序列白噪声检验显示其一阶差分序列为纯随机的 根据时间序列分析相关理论采取线性拟合法和 两参数指数平滑法拟合文章案例数据 粮食产量和自变量之间均存在一定的线性相关性且系数的正负向与实际定性分析结果相符 其中粮食产量与农村用电量、农用化肥施用量和受灾面积之间的相关程度较高系数绝对值均在 以上因此可尝试采取多元线性回归方法 最终为提高预测精度基于组合预测原理对上述模型按照一定的法则加权处理 目的是充分利用系统内各种样本信息使粮食产量组合预测结果比单一预测模型更加系统全面有效减少随机因素的影响二、粮食产量单一预测模型(一)基于时间序列的粮食产量预测模型 从线性拟合图来看所拟合的趋势线与粮食总产量序列趋势吻合程度较高拟合效果良好 根据输出结果可以得到 年河北省粮食总产量序列的线性拟合方程记为模型一:.()两参数指数平滑的拟合结果优良但存在一定的滞后性 从输出结果可以得到模型二:.().().()(二)基于多元回归的粮食产量预测模型 粮食产量受多方面因素的影响仅从时间序列的变化趋势出发进行预测是不够全面的所以考虑使用多元回归分析方法引入粮食产量的影响因素将数据做取对数预处理 对 与、做线性回归拟合优度检验显示因变量 的变差能够被建立的回归方程所解释 检验显示自变量整体对因变量有显著线性影响 个别变量未通过回归系数显著性的 检验方差扩大因子法、特征根判定法分析结果表明所选取的影响因素之间存在多重共线性进一步尝试采用逐步回归和岭回归方法解决逐步回归结果的拟合优度检验表明所建立的逐步回归方程能够解释因变量 的变差 回归方程显著性的 检验、回归系数显著性的 检验均通过说明逐步回归方程整体具有高度显著性农村用电量、受灾面积 和粮食播种面积 对河北省粮食产量 影响显著 将逐步回归最优子集得到的结果方程记为模型三:.()将数据做标准化预处理对 与、做岭回归经分析应剔除、用 与、2023年第22卷 第6期产业与科技论坛2023(22)6Industrial&Science Tribune进行岭回归 岭参数 在.以后基本趋于稳定当 .时.依旧很大因此可以选取岭参数 .检验结果显示回归方程整体和各回归系数都显著表明拟合效果良好.表示、可以解释粮食总产量.的变差 于是得到标准化岭回归方程:.未标准化的岭回归方程记为模型四:.()三、粮食产量组合预测模型(一)方法设定 组合的简单形式是将各单项预测模型加权平均包括等权组合和不等权组合两种基本形式后者往往能够达到更为准确的预测效果 于是组合的关键便转化为各单项预测模型权重系数的确定目前常用方法有简单加权平均法、最优权数法和方差倒数法 为保证预测的准确性、稳健性和数据计算的简便性拟找到满足相应法则的权重系数分别选取一个时间序列模型和一个多元回归模型加权组合 文章基于普通最小二乘估计思想以绝对值残差损失函数最小原则确定权重 结合组合预测原理和数据特征定义如式()的绝对值残差损失函数 其中为待估计参数分别表示组合预测的两单项预测模型的权重系数 表示河北省粮食总产量的真实值、分别表示选取两单项预测模型的预测值()()(二)预测结果 按类型将所得单项预测模型两两组合比较表 中的绝对值残差损失函数应选择将模型二和模型三组合:.()表 组合模型计算结果对比组合模型模型一、三.模型一、四.模型二、三.模型二、四.运用组合模型对河北省 年粮食产量的预测结果如表 所示 表中相对误差的绝对值均在 以内代表组合模型预测精度极高表 组合预测结果年份残差相对误差().(续表).四、模型评价由于实际问题研究中遇到的数据往往具有不同的特点目前还没有一套适合所有情况的预测评价指标体系 只有通过具体问题的分析才能知道哪些性能评价指标适合当前情况通过对上述模型的分析选取均方根误差、平均绝对误差 和平均绝对百分比误差 作为评价指标 前两者的缺点是未考虑到实际观测值的大小可除以实际值的平均值得到一个百分比分别记为、上述四种单项预测模型及最优组合预测模型的各预测评价指标如表 所示表 预测评价指标模型.从预测误差评价结果来看与其他四种单项预测模型相比组合预测模型的误差评价指标都很低平均绝对百分比误差 仅为.代表其有极高的预测精度 表格最后一列的 表示预测残差绝对值的标准差用于体现模型预测效果的稳健性由此可见组合预测模型达到了预期的效果将.作为最优组合预测模型是合理的 该组合模型相较于时间序列、多元回归的四个单项预测模型在预测精度方面有显著提高并且其预测效果具有稳健性在粮食产量预测领域有重要的应用价值可作为对河北省粮食产量进行中短期预测的一种优良统计方法【参考文献】许垒晶张竞文王妍.河北省粮食产量影响因素多元回归分析.合作经济与科技:孟国庆王芳任力生等.河北省粮食产量预测影响因素关联挖掘分析.河北农业大学学报():杨雨芳赵慧峰.基于计量经济模型河北省粮食产量影响因素分析.农村经济与科技():彭秀国张新仕耿记申等.河北省粮食产量影响因素的实证分析.山西农业大学学报(社会科学版)():张标刘秀丽.河北省分季粮食产量预测研究.农业展望():王燕.时间序列分析 基于.北京:中国人民大学出版社