温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
LightGBM
St
融合
传感器
甲烷
检测
系统
刘小飞
敬请登录网站在线投稿()年第期 基于 模型融合的多传感器甲烷检测系统刘小飞,陈向东,丁星,周龙(西南交通大学 信息科学与技术学院,成都 )基金项目:国家自然科学基金重点资助项目();中央高校基本科研费资助项目()。摘要:利用多传感器检测技术结合集成学习方法,设计了一种基于 模型融合的多传感器甲烷检测系统,其中分别使用恒压供电式催化燃烧型传感器、两路脉冲供电式催化燃烧型传感器和热传导型传感器相结合的方式达到全范围检测的目的。实验结果表明,相比使用单一算法模型,本文所提出的 集成模型在甲烷预测的准确率、均方根误差及决定系数等指标上均有更好的表现。关键词:;集成学习;机器学习;甲烷预测中图分类号:;文献标识码:,(,):,:;引言近年来,气体钻井在国内得到迅速发展,气体钻井比传统钻井速度快得多,但同时也存在一些安全问题。其中可燃气体燃爆问题是当前最大的安全问题之一,当钻井作业过程中碰到气层时,地层产出的甲烷气体与氧气在一定的浓度范围内混合后具有燃烧、爆炸的潜在危险。因此,在气体钻井应用中往往需要准确预测甲烷气体含量和评估钻遇气层的危险程度并提前采取相应的应对措施,为气体钻井提供更有力的安全保障。国内外研究学者深入研究后形成了神经网络、灰色理论、机器学习等多种甲烷浓度预测方法。付华等使用灰色理论方法对深度学习模型进行改进以此构建甲烷预测模 型,实 验 结 果 表 明 该 模 型 的 预 测 精 度 有 所 提 高;等利用神经网络构建时间序列预测模型对甲烷浓度进行预测,其能够全面采集甲烷浓度历史数据的特征。虽然上述算法均用来构建甲烷浓度预测模型,但若使用单一预测模型,存在无法兼顾模型的预测精度高、训练速度快及泛化能力强的问题。针对上述问题,为了实现更高预测精度同时兼顾更快的模型训练速度以及更强的泛化能力,本文使用一种基于 模型融合的方法实现对甲烷浓度的预测。系统框图本文所设计的甲烷检测系统框图如图所示,包含硬件数据采集端和数据处理及模型训练端两部分。硬件数据采集端通过采用恒压供电式和两路恒压脉冲式催化型甲烷传感器以及恒压供电式热导型甲烷传感器实现对甲烷浓度的检测,同时将氧气、二氧化碳等其他环境参数融入到甲烷浓度检测过程,提高检测系统的准确性。本系统将获取的气体信息通过串口传输至数据处理及模型训练端。年第期 图甲烷检测系统框图数据处理及模型训练端将获取的气体信息首先进行数据预处理,其次利用 集成学习模型实现对甲烷浓度的预测,将甲烷浓度预测值、氧气、二氧化碳、温湿度等信息通过上位机实时显示,并存储最终结果以便后续查看。模型融合方法 集成学习模型原理 算法模型是一种分层次的架构设计,每一层都可 以 由 一 个 或 多 个 算 法 模 块 集 成。一 般 情 况 下,模型包含两层架构,第一层含有多个基学习器,第二层将结果进行合并输入至元学习器模型,最终生成预测精度高、预测性能好的 集成学习模型。正是基于以上特点,本文提出一种基于 模型融合的集成学习算法,并将其应用于预测甲烷的浓度。其集成模型框架分为如图所示的两层结构。图 集成模型框架 算法 即轻度梯度提升,该算法最主要的创新为计算速度和内存使用方面均得到了很大的提升。在模拟实验环境中,采集的多传感器数据是连续变化的,而且实验过程中采集到的样本数据集中会包含很多重复的样本,这将会加长模型训练的时间,而 算法使用 节点分裂方法,在当前所有节点中找到所属增益最优的节点,再进行下一次的搜索和分裂。使用直方图算法通过将直方图中的数值进行降序或升序排列,即可迅速找到所需的最优分裂节点。为此本文使用 算法来加快模型的训练速度,使得其在具有较高预测精度的同时,还可以拥有更高的训练效率。算法 即极 端 梯 度 提 升,算 法机理是经过不断迭代生成新的决策树进而拟合之前预测的残差,最终使预测值与实际值之间的残差逐渐减小。其最终预测值可以表示成一种加法的形式,如式():(),()其中,表示最终的预测结果;表示决策树的数量;表示第个子模型;表示第个输入样本值;表示总共的决策树集合。虽然利用 算法加快了模型的训练效率,但可能会出现过拟合的问题,而 算法通过引用泰勒公式与正则项部分对 函数进行展开,不仅有效防止产生过拟合的问题,还加快了其收敛的速度。目标函数如式():()(,()()()()()()()其中,表示样本数据的一阶导数;表示样本数据值的二阶导数;()表示第次迭代模型的正则项。随机森林 算法随机森林 算法的机理在于多次独立取出一部分数据,通过训练生成多棵决策树,再将决策树运算结果组成一个“森林”,结合多颗决策树的结果最终确定输出。其具有两个随机过程:一是以每次放回的方式任意抽取数据信息来决策生成多棵树;二是在分裂决策树左右节点时,任意抽取节点的多个特征信息,并在所抽取的多个特敬请登录网站在线投稿()年第期 征信息中选出最好的特征信息进行切分。经过这两个随机过程,不仅可以进一步提高该算法的泛化能力,还可以增强算法的预测性能。甲烷浓度预测模型的建模流程 数据预处理在采集数据过程中,甲烷、氧气、二氧化碳等特征属性有着不同的量纲,且量纲单位不一致。本文为了将采集的样本数据集中的信息单位统一保持一致,降低对甲烷浓度预测模型的影响,对样本数据集进行统一处理,使各个传感器的数据具有相同量纲级。并经过将多组实验数据进行均值处理,在不影响数据整体趋势的条件下,降低数据之间的波动程度,使数据更加趋于稳定。特征选取本文采集的数据集中有、和各甲烷传感器 值等特征属性。由于随机森林 算法在对特征重要程度选取方面的优势,本文采用该算法对样本数据集信息进行特征选取。通过算法运算得到每个特征的重要程度,并经过综合考虑后,最终选取甲烷、这个属性作为系统最优的特征子集。集成模型训练对样本历史数据集进行预处理和特征选取操作后,需要预设学习模型的参数,然后通过调节这些参数完成对 集成学习模型的训练,集成模型的参数配置如表所列。表模型参数配置算法参数 预设完各基学习器模型的参数之后,采用 集成学习算法进行训练得到甲烷浓度预测模型。本文所提出的 模型训练流程如图所示。此外,为了避免模型产生过拟合的情况,本文引入了折交叉验证方法,其可以描述为以下个过程:将训练集进行切分形成组数据集,每一组数据图 模型训练流程集中又切分为个训练集和个验证集,每个模型分别完成对切分后数据集的训练,然后再分别完成对切分后验证集的预测得到对应的结果,并对测试集进行预测;将每个模型的个验证集最终结果合并形成次级学习器的训练集。将每个模型的个测试集最终结果合并形成次级学习器的测试集,之后利用生成的集成学习模型对甲烷气体进行预测,获得更加准确的浓度值。模型评价指标本文采用均方根误差()、平均绝对误差()及决定系数()来评判提出的基于 模型融合算法的性能。其中 表示模型平方误差的期望值,可以反映出模型的稳定性;表示模型预测结果与实际结果之间的预测误差,其误差值越小,越可以表现出模型预测结果的准确性;表示自变量对因变量变动的解释程度,其值越接近于,说明模型预测的效果越好。实验验证 甲烷检测平台图所示为专用于甲烷检测的模拟实验环境平台,由模拟环境实验箱、服务器端、后台管理系统三部分组成。在进行模拟实验之前,首先将容器完全打开,保证实 年第期 (从机数据采集终端;气体进气口;无刷风扇)图甲烷检测模拟实验环境平台验过程中容器内的气体与外界的空气含量接近,其次使用各个传感器分别采集各自的气体信息,最后通过串口将获取的气体信息经过 集成预测模型得出最终的甲烷浓度预测结果,并将最终的甲烷预测值同其他气体信息数据通过上位机界面实时显示。模型预测结果为了准确检测密闭容器内甲烷气体浓度,使用红外传感器甲烷浓度值作为标准值,通过模拟实验环境平台使用从机采集端获取各气体信息,得到 条数据信息。根据模型验证思路,选取 的(条)数据作为训练集进行 集成模型训练并生成甲烷浓度预测模型,同时将剩余的(条)数据作为测试集来验证该模型的性能和预测准确度。为了更加准确地评价甲烷浓度预测模型的性能,本文将集成学习模型分别与 、和 这种机器学习模型进行对比分析,在总计 个样本点的测试集上进行甲烷浓度预测,本文从中抽取 个样本点,将甲烷浓度的标准值与模型预测值进行效果对比。并使用 节中描述的评价指标对测试集预测结果进行评价分析。集成学习模型和个单一基学习器模型的预测值与标准值对比与差值分别如图、图所示。集成学习模型和个单一基学习器模型的 、及三种指标结果如表所列。从图中可以看出,虽然个单一基学习器模型的预测结果都有较高的精度,但 集成学习模型相较于单一模型,在某些波动较大的点上,预测效果比单一模型高,预测曲线与标准曲线一致性更高。从图可以看出,集成学习模型预测值与标准值之间的差值大多数在 以内,而个单一基学习器模型的预测值与标准值之间的差值大多数在 以上,甚至在某些波动较大的点上差值超过,说明 集成学习模型可以减小模型的预测误差,提高了模 型 的 预 测 精 度。由 表 可 以 看 出,本 文 提 出 的 集成学习模型的整体评价结果较好,其 、和 三 种 指 标 的 值 依 次 为 、和 ,均优于个单一模型的评价指标。其中 集成学 习 模 型 的达 到 ,分 别 比 、和 的 指 标 高 、和 ,说 明 集成学习模型的预测值与标准值曲线的趋势更加接近。预测结果表明,通过将多个单一性能较好的基学习器算法进行 集成对甲烷浓度进行预测,取得了较高的预测精度和较好的模型性能。图标准值与预测值对比图标准值与预测值差值表种模型预测评价指标对比模型 随机森林 敬请登录网站在线投稿()年第期 结语本文提出了一种基于 模型融合的多传感器甲烷检测系统,该系统利用多个传感器对模拟实验环境下的甲烷、氧气、温度、湿度、二氧化碳浓度进行在线检测,同时通过调用生成的 集成学习模型对甲烷浓度进行预测,并将 集成学习模型的最终结果分别与 、三种机器学习模型的最终结果进行比较。可以看出,集成学习模型能够有效结合种单一模型的优点,相比单个模型的预测结果,准确率更高,并且在 、三种模型评价指标上有更好的表现,为甲烷浓度的预测和处理提供更可靠的理论依据。本文提出的甲烷浓度预测模型在防止可燃气体燃爆、提高钻井安全性方面具有潜在应用前景。参考文献姜志环 气体钻井工程实时监测及安全分析系统研究 青岛:中国石油大学(华东),张林伟气体钻井井下燃爆分析西南石油大学学报(自然科学版),():邓霖空气钻井岩屑返出量实时监测技术的研究青岛:中国石油大学(华东),付华,刘汀,张胜强,等 基于改进 模型的煤矿瓦斯浓度预测研究 控制工程,():,()朱晓晨,尹奇志,赵福芹,等基于 的船舶航速预测模型研究 大连海事大学学报,():刘文鹏,陈向东,吴宇尘 基于脉冲供电的催化燃烧式气体传感系统信息技术,():,王飞,黄涛,杨晔 基于 多模型融合的 器件寿命的机器学习预测算法研究计算机科学,():崔逊航基于改进 的风力发电机组叶片故障预测算法研究重庆:重庆邮电大学,:,王晓晖,张亮,李俊清,等 基于遗传算法与随机森林的 改进方法研究计算机科学,():,郑胜洁,徐余明,胡祖翰,等基于随机森林的城市轨道交通桥梁故障预测模型北京交通大学学报,():韩 金 鹏,李 冬 梅,王 嵩基 于 双 向 特 征 选 择 和 设备故障检测计算机系统应用,():韩金鹏 基于随机森林和 设备故障检测方法的设计与实现 沈阳:中国科学院大学(中国科学院沈阳计算技术研究所),史业照,郭斌,郑永军基于 网络的 寿命预测研究 中国测试,():吴宇尘,陈向东,丁星,等基于长短时记忆神经网络硬件加速的燃爆状态监测应用 物联网技术,():,刘小飞(硕士研究生),主要研究方向为信息感知、获取与处理技术;陈向东(教授),主要研究方向为新型传感器与智能信息获取。通信作者:陈向东,。(责任编辑:薛士然收稿日期:),:,():刘军,杨晶东一种基于图像插值的 算法研究信息技术,():,郑明玲,刘衡竹 基于特征提取和机器学习的医学图像分析 计算机学报,():,邓传斌,郭雷,李维基于 的遥感图像配准方法传感技术学报,():,:,:,():