温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
改进
随机
森林
算法
钻井
工况
异常
自动识别
研究
刘胜娃
Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)工程应用本栏目责任编辑:梁书E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology电脑知识与技术Vol.18,No.35,December2022基于改进随机森林算法的钻井工况异常自动识别研究刘胜娃,苏兴华,詹胜,何以晴,胡刚,隗崇华(中国石油集团川庆钻探工程有限公司长庆钻井总公司,陕西 西安 710018)摘要:当前钻井工况异常复杂,异常工况特征较多,影响了钻井工况异常识别结果的准确性与全面性,为此,本文提出基于改进随机森林算法的钻井工况异常自动识别方法。布设传感器监测钻柱振动数据,提取数据中的钻井异常参数,使用EMD提取异常工况特征。结合异常工况特征提取结果,利用改进随机森林算法构建钻井工况异常自动识别模型,得到相关的识别结果。实验结果表明,设计方法在钻井工况异常自动识别方面具有极高的可靠性,能够保证工况异常识别结果的准确性与全面性。关键词:随机森林算法;钻井工况异常;异常识别;EMD;异常工况特征中图分类号:TE142文献标识码:A文章编号:1009-3044(2022)35-0087-03开放科学(资源服务)标识码(OSID):钻井工程是一个具有较强不确定性的复杂施工过程1,在钻井施工作业的过程中,受钻井设备、井下环境等异常的影响,时常发生不同类型的钻井异常工况2。这些异常工况威胁着钻井施工的安全性,一旦钻井发生故障,如跳钻和黏滑情况3等,可能直接导致关井等后果,严重影响钻井的工作效率和质量4。研究钻井工况异常的识别方法,对于及时处理异常工况,提高钻井工作效率,降低维护成本具有重要意义5。而传统的钻井工况异常识别方法存在难以提取异常工况特征的局限性,识别结果存在偏差,存在漏识、误识等情况,为此,本文提出基于改进随机森林算法的钻井工况异常自动识别方法,并通过实验验证了本文方法在钻井工况异常识别中的应用性能。1 设计基于改进随机森林算法的异常检测识别模型1.1 布设传感器监测钻柱振动数据为了实现对于钻井工况异常的自动识别,需要在获取大量钻井工作数据的基础上,对异常情况进行分析。所以,需要对钻井设备进行实时监测,以获取工况数据,为异常识别提供重要的数据基础。为此,本文使用振动传感器,对钻井的钻柱进行振动信号的测量。由于在实际的工况中,钻井钻柱的振动方向并不是单一垂直运动的,而是会受到各种反作用力,产生水平振动、垂直振动以及变向振动等。为了数据采集的全面性与完整性,本文还另外添加一台加速度传感器,以满足对于钻柱振动数据的全面测量。同时,为满足数据处理高效率的要求,本文使用云端数据库将收集信号进行实时存储,以便后期进行线上的数据处理。1.2 提取数据中的钻井异常参数在收集好钻井运行时相关的工况数据后,本文对数据进行初步处理,降低信号数据中的干扰因素,并提取其中的钻井异常工况的参数。在此,本文使用聚类算法提取异常参数。假设数据集为A,其中存在的数据对象有N个,那么可以将数据集A表示为A=1,2,.,N。对于任意一个数据对象N来说,都有各自的属性分类B,那么可以将数据根据属性进行划分,使其成为含特定属性B的聚类。在此基础上,选用该聚类簇的平均值C为中心,重新对剩下的数据进行划分,形成新的聚类,重复循环,直到数据划分完成。依据平方误差的计算公式,异常参数的提取公式表示如下:Q=i=1na b|a-Ci(1)式中,n表示的是聚类数量参数,a表示的是数据集中的某一数据对象;b表示的是某一聚类分簇;Ci表示的是该分簇的平均参数。通过上述公式,能够计算出全部数据对象的平方误差参数Q,实现对异常参数的提取。1.3 EMD提取异常工况特征本文在获取钻井异常工况的数据参数后,需要对其中的异常特征进行提取,以更好地分析钻井工况异常的类型与相应特征,从而进行异常工况识别。为了收稿日期:2022-05-25作者简介:刘胜娃(1963),男,甘肃天水人,硕士,高级工程师,主要研究方向:信息系统工程。87DOI:10.14004/ki.ckt.2022.2138Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)本栏目责任编辑:梁书工程应用保证提取效果,本文使用EMD方法,对异常工况的特征进行提取。在钻井向下钻进的过程中,容易出现钻头脱离的跳钻情况,为此本文对钻柱垂直运动方向的数据进行特征提取,以识别钻井的异常工况。利用EMD方法对钻井异常参数进行时域特征的提取。假设异常参数D中,存在极大值dmax以及极小值dmin,通过连接dmax和dmin,使得存在两条贯穿全部异常参数的曲线z、x,那么对于z和x来说,能够求出二者间的平均曲线v,可以得出如下计算公式:g=D-v(2)式中,通过异常参数与平均曲线作差得到异常参数D的特征尺度g。但仅仅计算出g是不能满足特征提取需求的,因此,还需要验证g的数值能够符合特征尺度的条件要求。验证成功后,继续进行下一特征尺度的提取,直到获得n个g值。通过上述方法,能够提取跳钻情况的异常特征,然而在实际钻井运行过程中,出现异常工况的情形是多样的,仅凭一种异常特征,难以识别全部的异常情况。对此,本文还对异常参数的频域特征进行提取,以完善异常工况的特征情况。经过分析历史数据中的异常工况数据,并结合专家经验,本文建立了钻井工况异常特征的关系规律,部分情况如表1所示:表1 部分异常工况特征关系序号1234异常类型井漏井塌钻具故障钻头异物特征立压出口流量扭矩立压出口流量扭矩立压出口流量扭矩立压出口流量扭矩参数急速减小下降正常增大下降大幅波动正常下降波动减小正常上升正常1.4 改进随机森林算法实现异常识别在提取异常特征以后,本文建立了相应的异常特征对比数据库,以满足对于实时获取的钻井运行数据进行匹配,搜寻其中的异常工况信息,利用改进随机森林算法进行钻井工况异常自动识别。我们先构建判断异常特征的决策树。假设传感器捕获的数据集为W,其中对于异常识别的决策特征为E,由于特征类型众多,为每个异常特征进行属性划分,划分出q个属性量,那么对于该数据集来说,能够求出其相关的信息熵R,其公式表示如下:R=i=1ntilog3ti(3)式中,n表示的是数据中的特征数量参数;ti表示的是W根据E进行分类后的数据子集。随机森林算法就是通过特征取值,随后对数据集进行划分,将其分为无数个小子集,形成相应的决策树模型。这种计算过程较为复杂,使得故障识别的运算效率不能满足实际的需求,为此,需要对其进行优化。对此,本文引入步长LMS算法,对随机森林模型进行优化。首先,划分数据的特征。由于已经通过历史数据提取了异常工况的特征参数D,那么可以以此为标准,对数据集W进行预划分。计算出W集合内的特征参数e,将e与标准参数D进行比对,若满足e D这一条件,那么就可以将该特征归为左分支,若满足e D这一条件,则归到右侧分支。按照这一思路,能够对e进行排序,从而得到E=e1,e2,.,en。其次,对构建好的决策树进行离散度的评价,以缩小算法的方差差异。假设标准差参数为r,那么对于集合E来说,其离散程度M的计算公式可以表示为:M=r(4)其中,表示的是集合E的平均参数,通过r与之间的比值,能够分析出数据集W的离散度。最后,使用步长LMS对其进行优化。假设窗口的滑动步长范围为l,且满足l=1,5,从l的最小值1起始,当窗口滑动的过程中,需要确定滑动均值la,然后通过la的大小确定最佳的集合划分点a。以此方式,不断进行划分,直至特征参数被划分完毕。这样,就能够获取优化后的随机森林决策树。通过建立改进后的随机森林构建钻井工况异常自动识别模型,能够判断数据集中异常工况的特征数据,从而在历史数据库中寻找最优解,通过匹配,实现钻井工况异常的自动识别,以此保证识别质量与效果。2 实验论证分析为验证本文设计的基于改进随机森林算法的钻井工况异常自动识别方法的有效性,进行实验论证。在某地的钻井施工过程中进行实验,具体的实验准备以及实验结果如下。2.1 实验准备本文对该地的11号钻井进行工况异常识别的实88Computer Knowledge and Technology电脑知识与技术第18卷第35期(2022年12月)第18卷第35期(2022年12月)工程应用本栏目责任编辑:梁书验,该钻井机为徐工的XSL7/350型钻机,钻孔深度高达700m,并采用履带式驱动,便于进行调度,该钻机采用 CUMMINS QSB5.9-C210 型发动机,功率可达155kw,具有较强的地层适应性。通过安装振动传感器,以此测得了钻井运行过程中,正常工况以及发生异常工况的信号数据,经过分析后绘制了相应的分解图,具体情况如下图1与图2所示:数据点幅值 m/s25010015020025030035040045050065070008000-0.50.5图1 钻井正常工况振动信号分解图数据点幅值 m/s25010015020025030035040045050065070008000-0.50.5图2 钻井异常工况振动信号分解图分析对比图1、图2可以看出,钻井工作时正常情况下振动数据波动较为平稳,上下不会超过0.5m/s2。而发生异常工况时,存在信号波动尖峰,超过正常波动阈值,如图2监测数据点在460左右,超过了0.5,并且数据点在590690之间,存在持续波动段,可见出现跳钻类异常工况,以此能够保证实验的真实性和可靠性。2.2 实验结果本文分别使用传统的随机森林识别方法以及本文设计的改进随机森林的自动识别方法进行异常工况识别,记录两种方法的识别数据。得到了两种方法对于钻井异常工况识别的结果,具体情况如下图 3所示:100600400监测数据点0200300500异常识别结果阈值-505700 800传统方法本文方法图3 两种方法对异常工况识别结果对比图图3中,阈值在0范围内上下波动1表示识别结果为工况正常,达到5左右表示识别结果为异常,-5左右表示为识别结果模糊。由上图3可以看出,随着采样增加,本文方法与实际监测的振动信号结果分析基本一致,较传统方法在识别结果准确性方面具有明显的优势。在前期正常工况时,传统方法与本文设计方法能够保证较平稳识别,而面对瞬时异常时,本文方法能够准确识别异常,传统方法却没有识别出异常情况。同时,在面对持续异常情况时,本文方法能够做到精准及时识别,而传统方法识别存在较大时间差,并且判断结果存在模糊情况。对比证明,本文设计方法更具可靠性,且对于钻井工况异常的识别准确率较高。3 结束语为了保证钻井工况异常自动识别效率与质量,通过改进随机森林算法,实现对于钻井工况异常的自动识别。对比传统识别方法,验证了本文设计方法具有极高的可靠性,能够保证工况异常识别的准确全面,可以在实际中得到广泛应用。参考文献:1 罗光强,李扬,周策,等.深孔智能化钻井参数远程监控及工况识别系统研究J.地质与勘探,2022,58(3):696-702.2 李衍志,范勇,高琳.基于形态流的石油钻井水流异常检测J.计算机应用,2021,41(6):1842-1848.3 刘胜娃,曹湘华.基于决策树的钻井工况智能识别方法J.新型工业化,2022,12(1):28-30.4 李雷,韩烈祥,姚建林.参数耦合在粒子冲击钻井智能决策系统中的应用J.钻采工艺,2020,43(3):4-6,45,1.5 李兵,韩睿,何怡刚,等.改进随机森林算法在电机轴承故障诊断中的应用J.中国电机工程学报,2020,40(4):1310-1319,1422.【通联编辑:张薇】89