分享
基于机器学习MLR模型的地下水循环井优化设计_赵思远.pdf
下载文档

ID:2254696

大小:631.08KB

页数:8页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 机器 学习 MLR 模型 地下水 循环 优化 设计 赵思远
引用格式:赵思远,方樟,周睿,等基于机器学习 模型的地下水循环井优化设计安全与环境工程,():,():基于机器学习 模型的地下水循环井优化设计赵思远,方樟,周睿,刘治国,丁小凡,马彦玲(吉林大学新能源与环境学院,吉林 长春 )摘要:针对污染场地地下水循环井(,)的优化设计问题,提出一种基于机器学习多元线性回归(,)模型的优化设计方法。该方法首先利用有限差分法建立不同条件下单个 运行的数值模型,通过运行数值模型,得到不同条件下 的运行效果,从而构建数据集;然后利用 算法对模型进行训练,构建计算多种 运行效果刻画指标的数学模型,并比较各个数学模型的拟合精度,结果显示纵向影响半径()、横向影响半径()模型的拟合程度较好,具有一定的泛化能力;最后根据机器学习所得的数学模型,对某试验场地 进行优化设计,得到最终优化设计方案,通过优化前的设计方案相比,、指标有了一定的提升,验证了方法的有效性。该研究结果可为 前期结构的快速设计提供参考,具有一定的实际意义。关键词:地下水循环井();优化设计;数值模拟;机器学习;多元线性回归模型中图分类号:文章编号:()收稿日期:开放科学(资源服务)标识码():基金项目:国家重点研发计划项目()作者简介:赵思远(),男,硕士研究生,主要研究方向为地下水数值模拟及场地污染修复技术。:通讯作者:周睿(),女,博士,教授,主要从事场地污染控制与修复方面的研究。:,(,):(),(),()(),:();()第 卷第期 年月安 全 与 环 境 工 程 随着经济的不断发展,地下水污染问题日益加剧,地下水污染修复工作成为当今环境领域的热点问 题。地 下 水 循 环 井(,)技术自 世纪 年代开始受到广泛关注。该技术具有修复效果好、对场地扰动小等优点,并可以将吹脱、空气注入、气相抽提、强化生物修复和化学氧化等多种技术结合应用在井中,实现 非 水 相 液 体 及 部 分 无 机 物 的 同 步 去 除。运行时能够形成水平和垂直两个方向的地下水流场,穿透低渗透地层,去除地下水和饱和土壤中的污染物,对于处理挥发性有机化合物()、半挥发性有机化合物()、石油产品以及无机物均有良好的效果。技术的大量研发和使用始于德国 公司。年 技术在欧洲首次进行了商业污染场地修复应用。世纪 年代,该技术在欧美进行了大量的中试研究,对地下水循环原理、的性能、污染物去除机理等有了深入的认识,获得了系统设计、工艺参数等实践经验。世纪 年代后期,技术已经相对成熟。目前 技术已有很多专利,并已市场化,且已经有很多成功的现场工程经验。但目前对于 的研究主要集中在对污染物修复的有效性方面,而对 水力环流特征及结构优化设计的研究还稍显不足。水力循环带的范围是 设计必不可少的考虑因素。水力环流运行效果受水文地质参数、循环井结构参数和运行参数等多个因素的综合影响,且在不同条件下其运行效果差异明 显。的运行效果往往采用影响半径()、捕获区范围()等指标进行刻画。目前对 中地下水运动特征及优化设计的研究方法主要包括室内试验、数值法和解析法。如白静等 通过室内试验,分析地下水初始水位、曝气量、循环井结构等参数对 影响半径的作用,并在二维模拟槽中进行了运行参数优化及修复试验;等 利用数值模拟方法预测了 的水力性能,分析了循环井结构参数、水文地质参数对 运行效果的影响,并将数值模拟的结果应用于污染场地,根据水文地质条件设置筛管位置,通过现场观测数据验证了模型预测的可行性;等 运用解析方法预测了承压含水层中 运行的三维流场,分析了 的水力性能。随着 研究的进一步深入和污染场地等数据的大量累积,可以采用机器学习()的方法,从已有数据中学习总结,形成 运行效果刻画指标与各影响因素之间的函数关系,用于指导污染场地 的优化设计,能够在一定程度上弥补以往研究手段的局限性。机器学习是人工智能的一个分支,通过输入数据,能够自行学习,并解决具体问题。利用机器学习可以通过计算机在海量数据中学习数据的规律和模式,从中挖掘出潜在的信息,广泛用于解决分类、回归、聚类等问题。线性回归算法是机器学习算法的一种,是解决回归问题常用的工具,在处理大量数据和较少数据的特征时,多元线性回归(,)模型是寻找输出参数与输入参数之间关系最常用的模型,模型解释性强,在各领域具有广泛的适用性 。为了确定 运行效果与各影响因素之间的关系,本文提出一种基于机器学习 模型的 优化设计方法。该方法首先利用有限差分法构建数值模型,并在 适用参数范围内,通过给定不同的数值对典型条件下 运行情况进行了数值模拟,从而构建数据集;然后运用 模型得出 影响半径与各影响因素表征参数之间的关系;最后以某典型试验场地为例,对循环井结构、运行参数进行了优化设计,以验证方法的有效性。研究方法本文的研究方法是:首先采用数值模拟的方法建立数值模型,构建单个 运行时各表征参数的数据集;然后通过机器学习线性回归算法进行训练,得出 各运行效果刻画指标与水文地质参数、循环井结构、运行参数之间的函数关系;最后将某试验场地的水文地质参数代入该函数关系,得出可应用于该试验场地的数学模型,从而求得 最优参数组合。地下水循环井及场地概化典型的 由一个不透水的实段分隔两个筛段(抽水筛段、注水筛段)。其中,抽水筛段部分从地下系统中抽取受污染的地下水,经过处理后通过同一口井的注水筛段注入含水层,从而在抽水筛段和注水筛段之间形成垂向循环流,见图。数值模型的建立本文 利 用 软 件 的 模 块 对 水力驱动下地下水流运动进行了数值模拟计算 ,并在地下水流模型的基础上,利用 模块,建立 水力驱动下的粒子示踪模型 ,分析粒子运动轨迹,刻画 驱动地下水第期赵思远等:基于机器学习 模型的地下水循环井优化设计图典型的地下水循环井()运行方式示意图 环流的运行效果。在抽水筛段所在剖分单元格的个面上各设置 个粒子作为粒子迁移的终点(见图),反向追踪至粒子起点,分析其在水力驱动下的运动轨迹,并通过在模型中输入不同的参数观察粒子运动轨迹,进而确定不同参数条件下 的运行效果变化情况。图地下水循环井()粒子投放位置示意图 地下水循环井适用条件和数据集形式 地下水循环井适用条件分析 技术适用于饱和带为 、非饱和带为 、各向异性为 、渗透系数为 、地 下 水流 速 低()的多孔介质中,该条件下更易形成三维椭圆形流场 。数据集形式根据 的适用条件,通过在数值模型中给定不同的参数值并运行模型,来模拟各种条件下 的运行情况,并记录给定的参数及运行效果刻画指标数据,从而构建数据集。数据集包含的变量众多,本文将水文地质参数和循环井结构、运行参数作为自变量。其中,水文地质参数包括含水层厚度()、含水层水平渗透系数垂向渗透系数()、含水层水力梯度()、含水层孔隙度()、含水层给水度();结构参数包括抽注筛段总长度含水层厚度();运行参数为抽注水量()。运行时周围的含水层受其影响可划分为上游捕获带、下游释放带和循环带,本次研究在充分总结了国内外已有研究成果的基础上,提出了用捕集效率()、横向影响半径()、纵向影响半径()、捕获带上部宽度()、捕获带下部宽度()个指标来刻画 的运行效果(见图),并将这些变量作为因变量。数据集所涵盖的介质从粉砂到粗砂,含水层厚度()为 不等,含水层水平渗透系数垂直渗透系数()为 不等,抽注水量()为 不等,变量数值分布均匀、广泛,所涵盖的情形众多(共 套),具有一定的代表性(见图)。图地下水循环井()运行效果刻画指标示意图 回归模型的构建与评估 回归模型构建本次回归模型的构建采用 语言中的 程序包利用线性回归算法训练模型。语言是一种解释性、交互式、面向对象的跨平台语言,语法简洁清晰,代码开发效率高,是 语言中的一个程序包,集成了各种最先进的机器学习算法,可用于解决中等规模的监督和无监督问题 。通过已有数据集训练获取各个因变量与自变量之间的关系,这属于典型的回归问题。安全与环境工程 :第 卷图数据集各参数的分布统计 本文将数据集划分为 的测试集和 训练集,训练集用于模型训练,测试集用于模型评估。采用机器学习线性回归算法进行模型训练,假设线性回归模型试图学得:()()可用 最 小 二 乘 法 对进 行 估 计,损 失 函 数()为()()()()()式中:,可以理解为矩阵;为训练集数据个数。若要求出最佳的拟合方程,则要求出使()达到最小时的,即:()()通过对数据集采用 语言中 程序包的 算法进行训练,可得到表示各因变量与自变量关系的个数学模型。回归模型评估本文采用决定系数对建立的线性回归模型进行评估。表示自变量对因变量的解释程度,值越接近于,表示线性回归模型的拟合程度越好。的计算公式如下:(珔)(珔)()式中:为样本预测值;珔为样本平均值。试验场地地下水循环井参数优化设计本次 结构优化设计的试验场地为陕西省某场地。该地区属暖温带大陆性季风气候,年平均气温为,多年平均降水量为 ,降雨主要集中在每年的月份。根据地下水水位监测及抽水试验结果,该场地地下水流向大致由西北向东南,浅层地下水受季节变化而升降,场地附近地下水水力梯度为。本次研究的目标层位为第四系孔隙潜水含水层,岩性主要为粗砂、中细砂混卵石填充,其上为粉质黏土,下部为致密的粉质黏土隔水层。该潜 水 含 水 层 垂 向 渗 透 系 数()为 ,含水 层 水 平 渗 透 系 数垂 直 渗 透 系 数()为,含水层孔隙度()为 ,含水层给水度()为 ,含水层厚度()为,抽注水量()为 ,富水性良好。根据上述资料,该场地水文地质参数即含水层厚度()、含 水 层 水 平 渗 透 系 数垂 向 渗 透 系 数()、含水层垂向渗透系数()、含水层水力梯度()、含水层孔隙度()、含水层给水度()为已知,优化设计变量为 运行参数即抽注水量()和 结构参数即抽注筛段总长度含水层厚度(),将试验场地的水文地质参数代入通过机器学习训练后的各数学模型,得到适用于该试验场地的数学模型,再根据多元函数微分学,求得各数学模型的最值点,即为针对各种 运行效果刻画指标的优化方案。研究结果与讨论本文利用 测试集对机器学习训练后得到的试验场地各模型进行测试,各模型的预测结果如图所示,利用决定系数对各模型的拟合程度进行评估,其评估结果见表。本文利用训练后的模型构建的试验场地数学模第期赵思远等:基于机器学习 模型的地下水循环井优化设计图试验场地各数学模型预测值与实际值对比 表试验场地各数学模型的评估结果 模型模型模型 模型 模型 模型 模型 型如下:()()()()()()()()()()()()()()()试验场地各数学模型图像,见图。以模型为例求其偏导数,其计算公式如下:()()()()()当对和的一阶偏导数等于,即 、时模型可能取极值,又、,故 、即为该模型的最优解。同理,可求得其余各模型的最优解,即为针对各种 运行效果刻画指标的优化方案和预期可以达到的最佳效果,见表。对于通过机器学习线性回归算法训练获得的多个模型,图展示出了各模型对于纵向影响半径、横向影响半径、捕获带下部宽度、捕获带上部宽度、捕集效率的预测结果,可见、模型的散点在目标线附近的分布较为密集,说明对于、两项指标模型预测的整体精度更高,其余模型的预测精度较低。此外,由表可安全与环境工程 :第 卷图试验场地各数学模型的图像 表试验场地各数学模型的最优解 模型()模型()模型 模型 模型 模型 模型 知,、模型的决定系数为 和 ,相对于、模型值更接近于,说明、模型的拟合程度、泛化能力较好,而、模型的拟合程度、泛化能力相对较差,其主要原因分析如下:()因变量、与自变量之间可能存在某种程度的线性关系,线性回归算法对于拟合此类数据更加适用。()、模型的复杂程度适中,未出现欠拟合和过拟合的现象,在测试集中有相对良好的表现。()通过线性回归算法训练得到的、模型结构较为简单,而因变量、与自变量之间的关系较为复杂,线性回归算法对于复杂映射关系的拟合能力有限,故出现欠拟合的情况。()由于数据集样本数量有限,不足以体现因变量与自变量之间的复杂关系;同时,通过数值模拟构建的数据集存在一定的测量误差,对于小样本数据的影响较大,导致

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开