分享
复杂水环境系统水质预测模型的构建与应用研究_侯云龙.pdf
下载文档

ID:422584

大小:628.50KB

页数:6页

格式:PDF

时间:2023-03-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
复杂 水环境 系统 水质 预测 模型 构建 应用 研究 云龙
2023 年第 2 期水利技术监督理论研究DOI:10.3969/j.issn.1008-1305.2023.02.052复杂水环境系统水质预测模型的构建与应用研究侯云龙(辽宁西北供水有限责任公司,辽宁 沈阳 110000)摘要:为提升复杂水环境系统水质预测的精度,提出基于偏最小二乘法、灰狼优化算法以及支持向量机的 PLS-GWO-SV 水质预测模型。结果表明:偏最小二乘法可解决水质因子的多重共线问题,灰狼优化算法可解决向量机参数选择不确定性问题,而支持向量机则可以较好地解决水环境系统的非线性和不确定性问题;计算分析表明水库的水质因子存在多重共线性问题,确定了采用偏最小二乘法的必要性;PLS-GWO-SV 水质预测模型与 PLS-SV 预测模型、SV 预测模型和 BP 神经网络模型相比,具有更好的泛化能力、参数寻优能力和预测精度。关键词:复杂水环境系统;偏最小二乘法;灰狼优化算法;支持向量机;水质预测模型中图分类号:X824文献标识码:A文章编号:1008-1305(2023)02-0204-06收稿日期:2022-10-21作者简介:侯云龙(1990 年),男,工程师。E-mail:人类的生产生活对江河湖泊、水库港湾等水环境会产生重要影响,大部分地区的水质都在逐渐恶化,导致水资源更加紧缺,严重制约着社会经济的可持续发展,因此有必要对这些重要区域的水环境水质进行准确评价和预测1-3。水库是在防洪、抗旱、发电、供水等方面发挥着不可替代的作用,自新中国成立以来,我国已建成运行各类型水库约 10 万座,产生了较大的社会效益和经济效益。但是,由于水库上游的工农业生产,很多污染物直接流入河道并长期集聚在水库,造成水库的水质变化,从而影响水库的水环境系统。水库水环境系统十分复杂,不仅受到上游生产生活的影响,而且与降雨、水土流失等因素有关,大量泥沙、污染物以及工农业化学残品聚集在水库中,容易导致水库出现富营养现象,因此有必要对水库水质预测展开研究。关于水质预测,许多专家学者提出了自己的模型和方法,如 BP 神经网络模型4、AIMA 模型5、GA-BP 神经网络6、CNN-LSTM 模型7、VMD-LSSV 模型8 等,这些预测模型为水环境水质评估和预测提供了经验方法。但是,由于水库水质因子较多,不同水质因子之间可能会存在多重相关性问题,这会导致信息冗余,从而降低模型预测的准确性,必须要对此进行处理,才能提升模型的预测精度。针对复杂水环境系统水质预测问题,本文提出了基于偏最小二乘法、灰狼优化算法以及支持向量机的 PLS-GWO-SV 水质预测模型,并将其应用到实际案例中,以期能为水库水质的准确评估和预测提供帮助。1水质预测模型构建1.1偏最小二乘法偏最小二乘法(Partial Least-Square method,简称 PLS)是一种对多元线性回归分析、典型相关分析以及主成分分析等多种数学算法进行融合和发展的新型优化算法。PLS 具有如下优势:可以对多重相关性问题进行建模分析;当样本数量 变量数量时仍可适用;在建立的最终模型中将包括所有的自变量;可以对系统信息和非随机性噪声进行辨识和剔除;PLS 回归模型中的回归系数意义更加明确,更易于理解。由于水库监测的水质指标通常包括温度、pH值、溶解氧含量等多个指标,各指标之间可能存在一定的相关性,严重时更是会出现多重相关性,造成不同水质因子产生冗余信息和噪声,从而导致水质预测模型的泛化能力降低,但是单纯依靠逐步回归法对多重线性相关性进行消除,由于指标因子太多,需要输入的参数较多,势必会造成水质预测模402理论研究水利技术监督2023 年第 2 期型运行缓慢,计算分析效率降低。考虑到偏最小二乘法可以解决多重共线问题,因此采用偏最小二乘法对高维度水质因子进行降维,提取输入水质因子和输出水质因子的特征变量,减少水质预测模型的操作步骤,提高计算效率。偏最小二乘法提取水质因子特征流程如图 1 所示。图 1偏最小二乘法提取水质因子特征流程1.2灰狼优化算法灰狼 优 化 算 法(Grey Wolf Optimizer,简 称GWO)按照自然界中灰狼群体的领导层级和狩猎机制进行模拟和分析9,并根据灰狼群体中各自的功能将其划分为 4 个等级:,且等级依次降低,起主决策作用,起辅助决策作用,起领导指挥作用,起攻击猎物作用。GWO 与其他智能算法相比具有以下几点优势:较强的收敛性能、计算参数少、操作易实现,在车间调度、参数优化、图像分类等领域中得到广泛应用。GWO 主要模拟了狼群在狩猎过程中的寻找猎物、包围猎物和攻击猎物等 3 个步骤。灰狼优化算法流程示意如图 2 所示。1.3支持向量机支持 向 量 机(Support Vector Machine,简 称SVM)通过对样本数据的监督学习,并将其进行二元非线性归类的一种方法10,在人像识别、文本分类、机械控制等领域应用比较普遍。分类仅仅是图 2灰狼优化算法流程SVM 的最初用法,随着计算科学的不断进步,SVM逐步被应用于回归领域的计算分析,形成支持向量机回归(Support Vector egression,简称 SV)算法模型,支持向量机回归与其他分类算法不同的是:该算法寻求一个最优超平面,而并非是单纯将不同类的对象进行划分,即寻找的是训练样本数据点离该最优分类面总方差最小的点。SV 算法流程示意如图 3 所示。图 3SV 算法流程1.4模型构建基于上述分析,本文将 PLS 算法、GWO 算法以及 SV 相结合,构建 PLS-GWO-SV 水质预测模型。先将采集到的水质样本数据进行预处理,处理数据缺失和噪声问题,并将数据分为训练集和测试集;然后利用 PLS 算法提取水质因子输入变量的特征并5022023 年第 2 期水利技术监督理论研究将其作为 PLS-GWO-SV 水质预测模型的输入变量;接着利用 GWO 算法对训练集数据进行参数最优寻找,确定最佳参数(C,g);再将最佳参数(C,g)代入支持向量机回归中,建立起 PLS-GWO-SV 水质预测模型;最后,将预处理过的测试数据集代入PLS-GWO-SV 水质预测模型中,对模型的预测准确性和可靠性进行测试。模型构建流程如图4 所示。图 4PLS-GWO-SV 水质预测模型构建流程2水质预测模型应用2.1研究区概况某水库始建于 1951 年 10 月,是集防洪、灌溉、发电为一体的综合性水利工程,库区控制流域面积约为 4.34 万 km2,装机容量为 30000kW,总库容量为41.6 亿 m3,最大坝顶高程为490m。截至目前,水库已累计供水约 420 亿 m3,累计发电量达到 88 亿 kW h,拦蓄泥沙量约为 6.6 亿 m3。2.2水质数据采样选取该水库 2015 年 1 月2020 年 12 月取水口处的监测数据作为分析对象,监测数据包括 12 种,分别 为:水 温、pH 值、氨 氮 含 量、总 磷 含 量(TP)、总氮含量(TN)、氟化物含量、氯化物含量、硝酸盐氮含量、溶解氧含量(DO)、高锰酸盐指数、五日生化需氧量(BOD)以及浊度,采样时间均固定在每月 15 日,将取样的水样本带回实验室进行分析。2.3水质数据处理本次取样共包含 72 组数据,由于监测过程存在许多不确定性(如监测人员疏忽、监测材料不合格、周围环境变化),造成监测到的水质数据部分存在维度缺失或者噪声问题,为减小上述情况对预测模型预测精度的影响,提升水质预测的准确性和科学性,需要采取一定的措施进行处理。针对数据缺失问题,采用 3 次样条插值进行插补,针对数据噪声问题,采用 MATLAB 数值模拟软件中的移动平均滤波器对数据进行平滑处理,然后对各水质因子进行相关性分析,结果见表 1。表 1水质因子相关系数水温pHDO高锰酸盐指数BOD氨氮TPTN氟化物氯化物硝酸盐氮浊度水温1pH0.0541DO0.438 0.0571高锰酸盐指数0.266*0.721 0.453 1BOD0.0410.1410.1660.278*1氨氮0.457 0.0380.540 0.1460.344 1TP0.359 0.418 0.362 0.475 0.361 0.551 1TN0.1700.257*0.1650.0280.814 0.727 0.541 1氟化物0.1120.375 0.603 0.434 0.313 0.644 0.723 0.561 1氯化物0.436 0.368 0.294 0.388 0.355 0.574 0.482 0.533 0.580 1硝酸盐氮0.1550.1400.1510.0850.720 0.793 0.462 0.942 0.527 0.441 1浊度0.355 0.320 0.0030.283*0.300 0.0410.0600.271*0.1260.1770.0941注:*表示在0.05 级别相关性显著;表示在0.01 级别相关性显著602理论研究水利技术监督2023 年第 2 期由表 1 可知,温度与 DO、高锰酸盐指数、氨氮、TP、氯化物、浊度均呈显著性相关,pH 与高锰酸盐指数、TP、TN、氟化物、氯化物、浊度呈显著性相关,DO 与高锰酸盐指数、氨氮、TP、氟化物、氯化物呈显著性相关,高锰酸盐指数与 BOD、TP、氟化物、氯化物、浊度呈显著性相关,BOD 与氨氮、TP、氟化物、氯化物、浊度呈显著性相关,氨氮与TP、TN、氟化物、氯化物、硝酸盐氮呈显著性相关,TP 与 TN、氟化物、氯化物、硝酸盐氮呈显著性相关,TN 与氟化物、氯化物、硝酸盐氮呈显著性相关,氟化物含量与氯化物含量、硝酸盐氮含量呈显著性相关;12 种水质因子之间相互呈中等显著或者强显著相关性,具有高维度的线性共线特征。因此,需要采用 PLS 算法对水质因子进行特征提取,然后再进行参数寻优和优化,得到最佳的预测模型。2.4应用结果分析总氮(TN)和溶解氧(DO)分别是反映水体有机和无机可氧化物质污染的主要关键指标,从上文分析可知,TN 和 DO 与多种水质因子存在显性相关性,同时由于水质因子太多,进行逐一分析会耗费大量时间,因此本文选取 TN 和 DO 作为水体受污染指标,并将前 4a(20152018 年)的监测数据作为训练集,后 2a(20192020 年)的监测数据作为测试集进行分析。将水温、pH、DO、高锰酸盐指数、BOD、氨氮、TP、TN、氟化物、氯化物、硝酸盐氮、浊度等 12 个指标分别用 x1 x12表示,对总氮和溶解氧的监测数据进行特征提取(由于提取过程繁琐,这里仅列出提取结果),结果分别为:总氮:t1t2t3t4=0.040.400.250.010.140.110.320.580.050.420.170.340.010.420.490.140.420.300.280.340.340.140.030.410.250.290.090.120.500.200.250.240.280.270.05 0.030.220.360.470.270.480.190.060.130.120.060.430.29x1x2x3x4x5x6x7x8x9x10 x11x12(1)溶解氧:t1t2t3t4=0.320.060.230.110.390.010.340.190.570.050.580.450.380.070.080.300.020.350.370.250.070.400.470.050.010.340.170.150.540.470.240.320.410.100.040.130.390.300.030.110.400.030.250.170.260.280.190.060.100.190.100.400.150.270.030.040.090.160.290.65x1x2x3x4x5x6x7x8x9x10 x11x12(2)式中,t1 t5第 tn个主成分。将总氮和溶解氧主成分作为预测模型的输入因子,并代入水质预测模型中,选取径向基核函数作为本水质预测模型的 SV 核函数,GWO 算法的种群规模设置为 20,最大迭代次数设置为 200

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开