温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
集成
学习方法
燃气
调压器
故障
类型
智能
判断
研究
彭小宝
1城市燃气 2022/12 总第 574 期燃气技术Gas Technology彭小宝,杨铭添,郑燕群,赵 洁上海世昕软件股份有限公司基于集成学习方法的燃气调压器故障类型智能判断研究摘要:调压器作为燃气输配系统中重要的设备,其状态检测及故障诊断尤为重要。本研究基于某燃气公司的调压器预警台账统计数据,收集了2020年至2022年间的9 125条报警数据,引入集成学习的方法,结合调压器进出口压力数据、压力数据特征等变量,基于3种集成学习方法:随机森林、XGBoost(eXtreme Gradient Boosting)、LightGBM(Light Gradient Boosting Machine)构建了调压器故障类型智能判断模型,利用实际检测数据从进出口、故障类型等方面对3种模型分别进行了评价,根据评价结果得出以下结论:针对进口压力报警,LightGBM智能判断模型的表现最好,精度为97%;针对出口压力报警,XGBoost智能判断模型的表现最好,精度为92%,均达到了较高的准确率。关键词:燃气调压器故障类型;集成学习;智能判断doi:10.3969/j.issn.1671-5152.2022.12.0011 绪论调压器在燃气的输配系统中起着调节并稳定管网压力的功能,其稳定的运行是燃气安全的保障。由于调压器设备数量大,监管区域覆盖面广,且对于报警设备的状况排查需要由专业人员进行,不仅工作难度非常大,而且还要耗费大量的人力物力,造成管理成本较高、无法高效合理的安排检维修等问题。目前已经有很多机器学习的方法被引入了燃气行业,许彤1基于北京燃气集团的管线防腐检测结果和相关的数据特征,结合了线性模型、随机森林等机器学习方法,对埋地燃气管线的防腐层绝缘电阻值进行了预测;姜赛赛2选取了长短期记忆网络与深度神经网络两种方式分别建立了中低压燃气调压器故障诊断模型,并对故障类型进行了定性分析;薛钦枥3等人建立了支持向量机模型,结合供热锅炉用燃气调压器的特性,以及绘制出调压器出口压力数据的压力云图以及雷达图对调压器进行了故障诊断。本研究将机器学习中的集成学习方法与燃气行业的应用相结合,利用集成学习方法结合燃气调压器的进出口压力数据实时智能的判断出调压器的故障类型,可以有效提升燃气输配管理的智能化水平,使调压器的检维修流程得到优化。2 研究数据及其预处理2.1调压器故障类型划分本研究基于某燃气公司长期以来的调压器报警数据和专家的经验知识把调压器常见的故障分为了以下6种类型:(1)关闭压力升高关闭压力升高在调压器的故障类型中较为常见,2城市燃气 2022/12 总第 574 期燃气技术Gas Technology其具体表现为出口压力以天为单位呈现规律性升高趋势,且升高幅度较大,超过平均压力的1.2倍,其压力变化趋势如图1所示。(2)运行压力波动大运行压力波动大的主要表现形式为进出口压力在一定时间内规律性剧烈波动,且无法稳定在某一合理范围内。其压力变化趋势如图2所示。(3)运行压力突升运行压力突升的主要表现形式为压力值的范围在某个时间点发生了骤升,上升后的压力平稳运行或图1关闭压力升高的压力变化趋势图图2运行压力波动大的压力变化趋势图3城市燃气 2022/12 总第 574 期燃气技术Gas Technology者一段时间后降回原压力范围。其压力变化趋势如图3所示。(4)运行压力突降运行压力突降的主要表现形式为调压器运行压力突然下降,且下降后的压力平稳运行或者下降之后又回归正常的压力范围。其压力变化趋势如图4所示。(5)运行压力趋零运行压力趋零的主要表现形式为某一段时间内调压器其运行压力值突然接近或等于0Pa,且持续时间超过10min。其压力变化趋势如图5所示。(6)其它一些调压器设备运行压力变化趋势无明显规律,图3运行压力突升的压力变化趋势图图4运行压力突降的压力变化趋势图彭小宝等基于集成学习方法的燃气调压器故障类型智能判断研究4城市燃气 2022/12 总第 574 期燃气技术Gas Technology但其运行时超过了设备设置的报警阈值。其压力变化趋势如图6所示。2.2数据分布及处理本研究通过某燃气公司调压器的预警台账统计数据共提取了2020年至2022年间共9 125条调压器预警设备的报警信息,根据其压力变化曲线结合专家的先验知识人为的对其进行划分为上述6种故障类型,其数据分布如表1所示。可以看出对于全部的故障类型中,关闭压力升高占据报警类型的多数,共有4 931条数据,运行压力图5运行压力趋零的压力变化趋势图图6其它类型的压力变化趋势图5城市燃气 2022/12 总第 574 期燃气技术Gas Technology突升类型最少,仅有131条数据。接下来根据报警日期提取了报警日期及报警日期前一周的调压器进出口压力数据,并对所有数据以5min为间隔进行插值;对同1min多条数据求取平均值;对报警时间一周内进出口压力的最大值、最小值、方差、偏度系数、峰度系数、平均值、最后一天的压力值和之前各天的比值等等一系列特征进行了提取。共得到9 125组特征与故障类型对应关系的数据集,将其中80%的数据作为训练集,20%的数据作为测试集,每组数据包含22个特征自变量和1个故障类型因变量。3 集成学习方法原理集成学习(Ensemble Learning)作为机器学习领域的重要分支,被广泛应用于解决各种分类问题、回归问题、特征选取问题等4,5。相比于单一算法模型,集成学习方法往往具有更强的准确率与泛化能力。3.1集成学习方法集成学习方法的基本思想就是结合多个学习器进行决策。图7显示了集成学习方法的一般结构:先通过现有的机器学习算法产生一组个体学习器,也可称弱学习器,再经由某种方式将它们组合在一起形成表现更好的强学习器。个体学习器多由现有的学习算法从训练数据中产生,比较常用的学习算法包括决策树算法、神经网络算法等。根据个体学习器之间的关系,通常把集成学习方法分为两大类:一类是各个体学习器之间互不影响,可以独立生成的并行化方法,被称为Bagging方法;另一类是各个体学习器之间相互影响,下一个个体学习器需要在上一个个体学习器的基础上生成的串行化方法,被称为Boosting方法。3.2Bagging方法在Bagging方法中,首先从总数据集中有放回的抽样获得n个子数据集,在每一个数据集上训练出一个模型。对于分类问题而言,是通过n个模型来进行共同投票决定最终的类别;对于回归问题而言,是通过计算n个模型预测值的平均值作为最终的预测值。图8展示了Bagging算法的一般流程。Bagging算法的经典代表就是随机森林模型,随故障标签类型样本量(条)关闭压力升高4 931运行压力波动大865运行压力突升131运行压力突降440运行压力趋零2 152其它606表1样本集数据分布情况图7集成学习方法结构示意图图8Bagging方法的流程示意图彭小宝等基于集成学习方法的燃气调压器故障类型智能判断研究神经网络决策树个体学习器1个体学习器2个体学习器3个体学习器n强学习器6城市燃气 2022/12 总第 574 期燃气技术Gas Technology机森林最早由Breiman等6提出,是一种以决策树为个体学习器的集成学习方法。随机森林算法的基本思想是通过大量的决策树组成一个随机排列的森林,森林中的每一棵树得出的结果相互独立,其最终的输出结果由森林中所有的决策树共同决定。3.3Boosting方法Boosting方法是一种可以用来减小监督学习中偏差的机器学习算法。Boosting 模型的训练过程为阶梯状,基模型的训练是有顺序的,每个基模型都会在前一个基模型学习的基础上进行学习,最终综合所有基模型的预测值产生最终的预测结果,其中用的比较多的综合方式为加权法。图9为Boosting方法的具体流程图。Boosting系列的经典算法包括AdaBoost(Adaptive Boosting)和GBDT(Gradient Boosting Decision Tree)算法,以及在GBDT算法基础上优化开发的XGBoost(eXtreme Gradient Boosting)和LightGBM(Light Gradient Boosting Machine)算法。本研究选取了在各方面表现均较好的XGBoost和LightGBM算法用于后续的研究。XGBoost是大规模并行的基于决策树算法的集成学习方法,由Chen等7于2016年提出。XGBoost算法构建决策树的基本思想是:首先,对数据集的全部特征按照特征的数值进行预排序;其次,对各特征寻找最优的分割阈值;最后根据最优的分割阈值将数据划分为左右子树。LightGBM是基于决策树算法的轻量级梯度提升框架8。其核心思想与XGBoost类似,均是在逐一将新的子模型加入迭代的过程中,使得损失函数不断地降低,只是在具体的实施方面与XGBoost有部分不同。当特征维数较高或数据量较大时,LightGBM算法中使用直方图算法(Histogram)替换了XGBoost中的预排序算法去寻找最佳分割点,并提出了两种新的技术,分别为基于梯度的单边采样(Gradient-based One-Side Sampling)算法和互斥特征捆绑(Exclusive Feature Bundling)算法。4 基于集成学习方法的调压器故障智能判断建模4.1特征变量分析及筛选调压器故障的具体类型可以由多个特征变量共同分析得出。本研究采用的特征变量包括调压器进出口压力的最大值、最小值、方差、偏度系数、峰度系数、各百分位数的值、报警日压力的平均值和前一周压力平均值的比值等22个特征;本研究首先对提取出的各个特征变量进行了相关性分析,其目的是衡量各特征之间的相关性大小。并且使用了皮尔逊相关系数对特征进行了评价,皮尔逊相关系数的定义为两个变量之间协方差和标准差的商,其值分布在01之间,值越大代表其相关性越高,其公式为:()()()()12211niiinniiiiXXYYrXXYY=-=-(式1)图9Boosting方法的流程示意图7城市燃气 2022/12 总第 574 期燃气技术Gas Technology其中Xi、Yi分别表示变量中第i个样本,、表示变量的样本平均值,n表示样本数量。皮尔逊相关系数r的绝对值小于或等于1。|r|0.9即表示两个变量之间存在着高度相关的线性关系。本研究对特征变量的相关性分析结果如图10所示,可以看出进出口压力25%、50%、75%的百分位数(V25、V50、V75、H25、H50、H75)和进出口压力的最大值和最小值(Vmin、Vmax、Hmin、Hmax)相关性较高,因此把这些变量移除,以降低构建模型的复杂度,最终本研究选取了共16个特征变量用于模型的构建。4.2基于集成学习方法的调压器故障分类模型构建本研究分别使用了sklearn机器学习库中的Random ForestRegressor方法、xgboost和lightgbm库自带的API构建了随机森林、XGBoost、LightGBM 3种不同的集成学习模型,使用的编程语言为python 3.8。在模型的构建过程中,影响模型精度的主要因素是模型的参数,本研究首先给定了各模型需要调整的参数范围,由网格搜索算法自动对比各种组合方案得出最优的参数组合。并且使用5折交叉验证法对模型结果进行验证,具体的验证过程中,将所有的数据分为5份,每次使用其中的4份作为训练数据集,其中的1份作为测试数据集,5次实验得出结果的平均值作为模型的最终得分。本研究中的3种模型都采用了相同的训练集、测试集从而确保模型结果的可比性。根据人工判断出的故障类型作为模型拟合的Y值,其他特征作为X值。通过训练集中的数据进行模拟训练,将测试集中的数据带入训练出来的模型进行拟合,并将拟合结果与测试集中的故障类型进行比较,计算出相应的准确率指标,用以评价模型对于调压器故障表征图10变量相关性分析结果图彭小宝等基于集成学习方法的燃气调压器故障类型智能判断研究8城市燃气 2022/12 总第 574 期燃气技术Gas Technology类型