分享
利于AO-SVR模型预测PM_(2.5)浓度_孟春阳.pdf
下载文档

ID:2290240

大小:762.24KB

页数:6页

格式:PDF

时间:2023-05-05

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
利于 AO SVR 模型 预测 PM_ 2.5 浓度 孟春
第 卷 第期 年月大 地 测 量 与 地 球 动 力 学 ,收稿日期:项目来源:国家自然科学基金()。第一作者简介:孟春阳,硕士生,主要研究方向为 大气探测,:。通讯作者:熊思,博士,讲师,主要研究方向为 气象学,:。:文章编号:()利于 模型预测 浓度孟春阳谢劭峰魏朋志唐友兵张亚博熊思桂林理工大学测绘地理信息学院,桂林市雁山街 号,湖北科技学院资源环境科学与工程学院,湖北省咸宁市咸宁大道 号,摘要:针对支持向量回归(,)模型无法主动选取最优参数和核函数等问题,采用天鹰算法(,)对其进行优化,构建天鹰算法优化支持向量回归模型()。分别构建 、灰狼算法优化支持向量回归()、鲸鱼算法优化支持向量回归()种模型,使用 拉萨、乌鲁木齐、长春、武汉、上海市的大气污染物、气象因素以及天顶对流层延迟(,)的小时数据,分别预测市 的 浓度变化。结果表明,模型的适用性更好,其中,上海的预测值最贴近实际观测值。关键词:支持向量回归;灰狼算法;鲸鱼算法;天鹰算法;海拔;天顶对流层延迟中图分类号:文献标识码:大气颗粒物 能够深入人体肺部,损害肺功能。杨忠等使用粒子群优化算法(,)对支持向量回归模型进行优化,并结合加权因子进行 预测;李建更等通过建立互补集合经验模态分解(,)和 支 持 向 量 回 归 的 组 合 模 型()预测 浓度;谢劭峰等使用()和()种算法对 神经网络模型进行优化;等使用 与 结合的方法对武汉的 浓度进行预测,并与多元线性回归、神经网络、模型预测结果进行对比;王勇等根据 与 之间的联系探究 与 的相关性;查艳芳使用优化后的灰狼算法(,)对支持向量回归模型进行优化,使用武汉市的日均大气污染物及气象数据等建立模型,对 浓度进行预测。上述研究均采用模型优化或结合大气污染资料、气象资料、等多方面因素对 浓度进行建模预测,结果表现良好,但多数研究仅针对单一城市的空气质量进行预测,未考虑到模型在不同城市的适用性。相较于 及其优化模型,及其优化模型的性能更佳,对于高维数据问题具有更强的处理能力。考虑到不同海拔城市 浓度存在差异,且相较于春、夏、秋个季节,冬季的 浓度波动幅度较大、受影响因素较多、预测难度较大,因此本文结合冬季的大气污染物、气象因素、的小时数据资料,选取 及其优化模型预测个不同海拔城市的 浓度变化情况。数学模型 模型 模型的基本思路是:将与预测变量非线性相关的原始输入空间通过非线性映射函数(核函数)映射到高维特征空间上,得到一个尽可能适合拟合训练集样本的模型。常用的方法是在样本标签和模型预测值之间构造一个损失函数,通过最小化损失函数确定函数模型。建立一个考虑输出向量的数据集,的目标是基于给定的数据集找到多元回归函数来预测未知物体的期望输出性质。模型如下:(),()()()()式中,和为满足约束条件的拉格朗日乘数,()和()为非线性映射函数,为回归函数大 地 测 量 与 地 球 动 力 学 年月()的偏移量。模型灰狼优化算法 通过模拟灰狼的狩猎过程搜索代理获取最优值,寻找到灰狼捕猎时的最优位置,从而计算得到最佳参数。将参数代入 模型中建立 模型,获取最优值的具体过程如下。)灰狼首先对猎物进行追踪、包围:?()?()?()?()通过骚扰让猎物停止移动,对猎物发动攻击:?,?,?,?,?()?()式中,?为灰狼和猎物相差的位置距离向量,?、?为随机系数向量,为迭代时间,?为灰狼的位置向量,?为猎物的位置向量,、分别为只灰狼的代号。模型鲸鱼优化算法通过模拟鲸鱼搜索、合围及狩猎等一系列行为在全局中寻找到最优值,进而输出 全 局 最 优 个 体。将 最 优 参 数 代 入 模型建立 模型,具体过程如下。)识别猎物的位置,对猎物进行合围:?()?()?()?()?()通过螺旋搜索,采用环形游动喷出气泡来驱赶猎物,最后游向水面捕食猎物:?()?()?()()式中,?为鲸鱼和猎物相差的位置距离向量,?、?为系数向量,?为当前最优解的位置向量,?为鲸鱼的位置向量,为定义螺旋搜索形状的一个常数,为,中的一个随机数。模型天鹰算法是根据天鹰在捕食猎物过程中的自然行为提出的一种基于种群的优化方法,可以用来搜索模型的最优参数。天鹰狩猎可分为种方式,具体过程如下。)识别猎物区域,采用垂直弯腰高飞的方式选取最佳狩猎区域,进行攻击:()()()()()()从高空发现猎物区域,在猎物区域的上方盘旋,使用短滑翔攻击的轮廓飞行:()()()()(y)()确定猎物区域,准备好着陆和攻击后采用低飞慢降攻击:()()()()()当天鹰接近猎物时,会根据猎物的随机移动规律在陆地行走并抓住猎物:()()()()()式中,()为 下 一 次 迭 代的 解,()为最佳解,()为位置均值,为,的 随 机 值,()为 飞 行 分 布 函 数,()为,的随机解,为上界,为下界,为质量函数,、为跟踪猎物时的各种运动,()为第次迭代时的当前解。根据目标需要选择算法捕获最优参数,将最优参 数 代 入 模 型 中 建 立 模 型。算法优化 模型的基本步骤如下:)导入并读取数据,进行数据预处理,初步建立 模型。)初始化天鹰算法的种群数量及其迭代次数,确 认 惩 罚 参 数和 核 惩 罚 参 数的 取 值范围。)依据天鹰捕猎的种方法选取最优的适应度函数,并作为天鹰捕猎时与猎物的最佳距离,通过搜索确定天鹰捕猎的最佳位置。)根据天鹰捕猎所在的最优位置,获取最优的惩罚参数和核惩罚参数。)将获取到的最优参数值加入到 中,通过多次训练,确定最终优化的 预测模型。)将测试数据分为训练集和预测集导入到优化后的 模型中,将结果与预测集进行对比,分析模型具体误差。算法流程见图。实验数据与分析 数据来源及预处理各个城市间的 浓度具有时空差异性,通常会随海拔的升高而降低,且东部、北部城市的第 卷第期孟春阳等:利用 模型预测 浓度图 算法流程 浓度通常高于西部、南部城市。本文选取海拔呈递减趋势的拉萨()、乌鲁木齐()、长春()、武汉()、上海()等个城市作为实验对象。由于 浓度在冬季波动最大,因此选取 的数据进行建模。使用的数据主要包括:、及 的逐小时大气污染物浓度数据;气温、气压、相对湿度、风级的逐小时气象数据;提供的逐小时 数据。为确定各要素与 之间的相关性,通过 软件对大气污染物、气象因素及 数据进行相关性分析,使用 相关系数进行计算,结果见表和表。表 与大气污染物相关性 城市 拉萨 乌鲁木齐 长春 武汉 上海 注:为 级别的相关性显著,为 级别的相关性显著,下同。表 与气象因素及 相关性 城市温度相对湿度风级气压 拉萨 乌鲁木齐 长春 武汉 上海 由 表 和表 可 知,个 城 市 的 与、相对湿度、气压基本呈正相关,与、温度、风级基本呈负相关;与拉萨、武汉的 呈正相关,与乌鲁木齐、长春、上海的 呈负相关。与空气污染物、气象因素及 的相关性显著,在对 浓度进行建模预测时,可将上述因子作为预测输入。变化规律为探究不同海拔的个城市在 的 浓度变化趋势,将个城市 浓度小时数据组成一个连续时间序列进行整体变化趋势对比(图)。图 变化趋势 由图可 知,在月 份 供 暖 期 间,拉 萨 的 浓度为,空气质量良好;乌鲁木齐、长春的 浓度波动较大,整体浓度偏高,可能是因为 疫情严重,人流量及车流量均有所降低,但供暖及用电量高于往常年份,导致 浓度整体偏高;该时段内武汉疫情封城,浓度降低,短时期内空气质量得到改善;上海在疫情影响下人流量及车流量有所减少,且月中有 降雨,极大改善了空气质量。乌鲁木齐、长春的海拔高于武汉、上海,但在疫情、供暖、天气等因素的影响下,乌鲁木齐、长春的 浓度均高于武汉和上海,且波动变化更为剧烈,说明在冬季仅依靠海拔高低无法准确判断 的变化趋势。通过模型预测不同海拔的城市在冬季的 浓度变化,能为 浓度预测及其变化趋势研究提供借鉴,对未来空气环境治理也具有指导意义。实验结果 变量选择分别 采 用 、和大 地 测 量 与 地 球 动 力 学 年月 四种回归模型对 个城市 的 浓度 进 行 预 测,选 取 表、中 各 城 市 在 级别相关性显著的因素作为因子集,预测模型中每种因子采用的时间长度完全一致,数据采样率为。各城市月份的样本数据集长度均为 ,选取前 的数据作为训练样本集,后 作为校验样本集,使用训练样本集进行建模,将模型预测的 数据与校验样本集 数据进行分析对比。预测结果评价与分析个城市种模型的预测结果与预测相对误差绝对值见图、。图 预测结果 ,图 相对误差 ,由图可见,种模型的预测结果与观测值之间具有相似的变化趋势,但相较于基础 模型,优化后的 模型预测结果的整体趋势更优,其中 模型最贴近实际观测值。从第 卷第期孟春阳等:利用 模型预测 浓度 的数据可以看出,拉萨全天 浓度均为优;乌鲁木齐、长春 浓度在:开始降低并在:左右开始回升,其中,长春的回升幅度更明显,浓度在晚间突破 。查询资料可知,长春常住人口远多于乌鲁木齐,且疫情阶段居家人数增多,供暖需求加大,导致污染加重;武汉、上海在疫情的影响下,人流量和车流量有所减少,但人均用电量增加,使得 浓度值并未出现大幅度降低,均呈现升降升的变化趋势。由图可见,模型预测的相对误差随时间的增长不断增加,模型相对误差的增大趋势最显著,在拉萨和上海市共有的误差比例超过。模型的误差比例基本低于 模型,模型相对误差变化趋势表现最好,整体趋势随时间的增长而降低,在乌鲁木齐的:,相对误差比例仅为 。为 更 好 地 展 示 模 型 的 预 测 结 果,采 用、和 来判断模型的适用性、对比模型的预测精度,各模型预测精度结果见表:(?)?()?式中,为实际观测值,?为模型预测值。表各模型预测精度对比 城市模型 ()()拉萨 乌鲁木齐 长春 武汉 上海 由表可知,对于海拔不同的个城市,种模型的适用性均表现良好,但 、模型的 要显著低于 模型,说明种算法对于 模型都有一定程度的优化,使得误差的离散性减小。由 可以看出,模型的效果最好,相比于 模型,拉萨、乌鲁木齐、长春、武汉和上海的 分别提高 、和 ,其中上海市的优化程度最高。从个城市的 和 指 标 来 看,、模型对于 模型均有一定程度的提升,模型的优化效果要稍优于,其中上海的优化程度最明显。相比于 模型,与 模型的 指标分别提高 和 ,指标分别提高 和 。由整体数据可知,模型在个城市的 预测中表现最为出色,相比于 模型,模型的 和 在拉萨提高 和 ,在乌鲁木齐提高 和 ,在长春提高 和 ,在武汉提高 和 ,在上海提高 和 。由此可见,相较于 模型,模型在个城市的 预测精度均有所提升,武汉、上海的 和 提高最多,可能是由于乌鲁木齐、长春的数据波动幅度相对较大,数据的稳定性以及整体水平对模型预测精度存在一定程度的影响。通过图、和表可 知,相 比 于 模 型,、模型预测精度均有明显改善;模型在个模型中的预测值最贴合实际观测值,在多种因素的影响下,表现出较为优秀的适用性,能展现不同海拔城市冬季 的趋势变化规律。结语本文基于个不同海拔城市的 大气污染物、气象因素以及 的小时数据,利用、四种模型对 浓度进行预测和对比。实验结果表明,模型的预测结果整体精度最高,且对于不同海拔城市 浓度变化的预测均有很好的适用性。本文仅预测了不同海拔城市 的 浓度变化,后续可考虑增加数据量并增加预测时长,对不同海拔城市的 浓度变化趋势作更深入的探究。大 地 测 量 与 地 球 动 力 学 年月参考文献 ,():杨忠,童楚东,俞杰,等加权因子的 区域空气 浓度预报方法计算机应用研究,():(,():)李建更,罗奥荣,李晓理基于互补集合经验模态分解与支持向量回归的 质量浓度预测北京工业大学学报,():(,():)谢劭峰,赵云,李国弘,等基于 神经网络的 浓 度 预 测 大 地 测 量 与 地 球 动 力 学,():(,():),:,():王勇,任栋,郝振航,等一种对流层延迟的 与 浓度相关性 研 究 测 绘 科 学,():(,():)查艳芳基于改进灰狼算法和 的武汉 浓度预测研究武汉:中南财经政法大学,(:,)陈传亮,田英杰,别荣芳基于粒子群优化的 算法与 网络

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开