采油工程领域的数据清洗方法研究_吴运驰.pdfVIP免费

下载本文档

阅读 1
下载 0
格式 pdf
大小 1.51 MB
约3页
2023-03-20
收藏
评论
点赞(0)
海报
举报

本栏目责任编辑：梁书工程应用ComputerKnowledgeandTechnology电脑知识与技术第19卷第3期(2023年1月）采油工程领域的数据清洗方法研究吴运驰,马庆,宋波,张永峰（大庆油田有限责任公司采油工程研究院，黑龙江大庆163000)摘要：为了进一步提升大数据技术对油田数据分析预测结果的准确性，研究一种具有针对性的数据清洗方法，提高数据质量。通过对油田数据进行相关性分析，并结合以往业务资料进行筛选和补充，剔除无关和低关联数据项，移除空值和噪声数据，填充缺失数据。原本结构松散、空值多、异常值多的油田数据，在数据清洗后得到相关性强，无缺失值、重复值，无噪声数据，格式统一的优质数据样本，能更好地应用于之后的大数据模型计算。对数据进行针对性的数据清洗，提高数据质量，是提升大数据分析的准确性的重要前提。关键词:大数据分析；油田数据；数据清洗；数据质量；贝叶斯反演中图分类号：G642文献标识码：A文章编号：1009-3044(2023)03-0086-03开放科学（资源服务）标识码(OSID)：1引言随着数据存储设备飞速进步，以及分布式计算技术突破性的进展，原本只出现学术领域中的大数据、深度学习和人工智能等技术出现在大众日常生活的各个角落。大庆油田在信息化领域深耕多年，善于利用新技术、新方法提高油田管理水平。将大数据技术与油田数据相结合，指导生产，降本增效，可以进一步促进大庆油田向智能化、智慧化油田方向转型。大数据技术的核心是数据，数据质量直接决定了大数据分析的效果。2油田数据情况大庆油田在信息化建设上已经布局多年，基础设施建设较为完善，建立了涵盖所有数据的统建系统，实现每日的生产数据实时上传，存储的数据量极大，但这海量的油田数据，却不能直接用于大数据分析，因为当前数据存在以下问题：1)低价值数据。随着石油不断产出，地下油层环境会不断变化，多年前的油水井产油产液数据、地质数据对于现在的产油产液量分析参考价值较低。2)数据存储位置分散。在油田公司推行统建系统之前，部分二级单位已经进行了信息化建设，建立了自己的数据库系统和软件系统，并已投入日常使用。在推行统建系统后，存在二级单位继续使用原有数据库的情况，许多数据分别存储在二级单位自建的数据库和统建系统中，数据获取难度较大。3)存在缺失值、异常值。随着大庆油田信息化进程的不断推进，统建系统中数据的完整性、及时性和准确性有了极大提升。但油田信息化早期录入的数据，由于当时操作环境的限制，存在部分数据缺失、数...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容