温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
矿井
建设
知识
图谱
构建
研究
综述
邱云飞
Computer Engineering and Applications计算机工程与应用2023,59(7)矿井建设是矿产资源开发过程中至关重要的工作,它与煤矿的生产能力、安全系数、服务年限和经济技术指标紧密相连。面对矿井建设资料信息大多表现为非结构化1的特征,传统数据库存储和统计分析管理方法的劣势凸显。自然资源部发布的 2021年中国矿产资源报告 指出,推进“互联网+地质资料”工作的发展,对于强化地质资料管理有重要作用。此外,云计算平台2、人工智能3、机器学习4和深度学习5等新一代信息技术的高速发展使矿井建设数据大幅增加,这表明当前对矿井建设的研究已经步入了新阶段,如何发挥矿井建设数据的价值,提升知识的利用效果成为研究热点。知识图谱概念起源于各学科领域,由Douglas Le-nat提出:“把人类的常识编码,建成知识库”,并基于此思想开创了Cyc项目,后期出现的语义网也是知识图谱概念的延伸。实际上知识图谱是涵盖图结构的语义知识层级框架,以节点和边的形式将关联实体和概念之间的语义关系聚合为网络6。这一框架结构使知识图谱可以精确表达知识的变化过程、分析数据间的内部联系、检索现实世界中的信息7,具有高效的资源关联挖掘能力。将知识图谱应用于矿井建设,可以有效地梳理矿井建设知识进行档案智能化管理,对不断更迭的矿井建设数据进行挖掘,打破矿井建设行业间的信息隔阂,为建设“智能化矿山一体化平台”提供底层技术支撑,还可以帮助研究者分析地壳物质运动与演变对矿井的影响、实矿井建设知识图谱构建研究综述邱云飞1,邢浩然1,李刚21.辽宁工程技术大学 软件学院,辽宁 葫芦岛 1251052.辽宁工程技术大学 矿业学院,辽宁 阜新 123000摘 要:目前矿井建设工作中积累了海量数据,运用知识图谱技术可以挖掘这些动态数据间的复杂联系,为管理矿井数据、实现智慧化矿井建设等研究提供有效帮助。通过文献调研分析了矿井建设知识图谱的构建方法及数据特征,为知识图谱在矿井建设领域的落地应用提供了理论支撑;针对矿井建设领域的非结构化数据,系统地总结了知识抽取、知识融合、知识推理等构造知识图谱核心技术的原理与改进方法;最后分析了未来在矿井建设领域应用知识图谱的落地场景及发展趋势。关键词:矿井建设;知识图谱;知识抽取;知识融合;知识推理文献标志码:A中图分类号:TP301doi:10.3778/j.issn.1002-8331.2205-0409Summary of Research on Construction of Knowledge Graph for Mine ConstructionQIU Yunfei1,XING Haoran1,LI Gang21.School of Software,Liaoning Technical University,Huludao,Liaoning 125105,China2.School of Mining,Liaoning Technical University,Fuxin,Liaoning 123000,ChinaAbstract:At present,massive data have been accumulated in the mine construction work.The use of knowledge graphtechnology can mine the complex connection between these dynamic data,and provide effective help for the managementof mine data and intelligent mine construction.Firstly,this paper analyzes the construction method and data characteristicsof mine construction knowledge graph,provides theoretical support for the application of knowledge graph in mine con-struction,then systematically summarizes the principles and improvement methods of knowledge extraction,knowledgefusion,knowledge reasoning.Finally,it analyzes the application scene and development trend of future knowledge graphin mine construction.Key words:mine construction;knowledge graph;knowledge extraction;knowledge fusion;knowledge reasoning基金项目:阜新市矿产资源编制项目(19-2041-1)。作者简介:邱云飞(1976),男,博士,教授,CCF会员,研究方向为自然语言处理、数据挖掘,E-mail:;邢浩然(1999),女,硕士研究生,研究方向为知识图谱、命名实体识别;李刚(1979),男,博士,副教授,研究方向为矿井开采理论与技术、矿山压力与岩层控制。收稿日期:2022-05-20修回日期:2022-11-23文章编号:1002-8331(2023)07-0064-16642023,59(7)现风险预测预警、优化安全生产管理、诊断设备故障等工作。此外,借助图谱可视化工具分析矿井建设领域的科学文献,可以帮助学者理解矿井建设的潜在动力和演变脉络,突出研究热点及前沿发展现状,助力矿井建设知识的落地应用。当前矿井建设领域的研究方向主要包括:地质及水文条件勘探、通风管理、井筒建设、井巷挖掘、井底车场开拓等,这些学科间存在着深度交叉的联系,内部复杂多样的知识仍有待开发。怎样利用学科间的内在联系与知识的交互性实现各项工作的协同调度、优化矿井建设排程、减少不必要的建设损耗、提高矿井的生产效率,成为大数据背景下矿井建设过程中有待解决的问题。在以不同学科目的为研究背景的条件下,矿井建设知识图谱可以划分为:面向特定研究的领域型知识图谱和多模态语义融合型知识图谱,如图1所示。虽然地质学家的工作使矿井建设领域积累了大量勘探数据,但是其中不乏以文档或图像等形式存储的非结构化数据,难以被整合并有效利用;这些矿井建设数据储存于相对独立的业务体系中,数据共享存在障碍,无法开展深层次的信息挖掘工作;知识图谱在矿井建设领域的应用需求较为模糊、工作优势仍不显著。这些因素限制了矿井建设知识图谱的落地应用。针对上述问题,本文旨在分析矿井建设知识图谱所需重点技术的研究进展和应用实例,为今后知识图谱在矿井建设领域的研究提供理论依据和技术参照。1矿井建设知识图谱概述知识图谱最早是增强谷歌搜索引擎知识检索能力的产品名称8,旨在通过知识图谱阐述客观世界的语义信息,提升用户使用感,后在学术界广泛应用。与传统知识库相比,知识图谱可以体现矿井建设知识间的隐藏属性关联、具体总结为以下三点:(1)丰富语义信息。以“点”表示语料中的特定实体,如开采机构、矿井名称、井底车场巷道种类、硐室爆破类型、安全事故类别、井筒掘进设备种类等;以“边”映射实体间关系和属性,如矿井的可采储量、通风方式、瓦斯涌出量、粉尘浓度、服务年限等,可以更好地帮助计算机理解物理世界9。(2)提高知识库质量。知识图谱中的数据结构统一、来源多元化,含有充足的语料信息,是更高质量的数据库。(3)辅助人机交互。知识图谱中的数据主要以图的形式体现,与图相结合进行可视化分析10建立矿井建设综合性可视化页面辅助决策,可以防控安全事故、有效降低矿井建设风险系数、优化协调布控模式、提升矿井建设效率。矿井建设知识图谱与通用知识图谱的结构基本一致,两者的区别11在于:(1)应用场景不同。通用领域知识图谱依赖常识数据,很少面向特定领域,主要强调知识的全面概括性。旨在智能问答、推荐系统、搜索引擎等场景提升用户体验感。常见的通用领域知识图谱主要包括国内的CN-DBpedia12、知心、知立方、Zhishi.me13,以及国外的DBpedia14、Wikidata15、WordNet16、Freebase17和YAGO18。不同于通用领域知识图谱的全面性,矿井建设知识图谱侧重于知识图谱在矿井建设领域的适用性与知识的专业性19,主要帮助矿井专业的研究者分析不同类型的学科应用,实施各项矿井勘查建设工作。目前在矿产领域,已有研究将知识图谱技术应用于地质勘探、资源普查、成矿分析、矿藏预测、矿山安全等工作中。(2)数据来源不同。通用领域知识图谱对数据的吸收较为宽泛,数据的知识单元粒度较大。而应用于矿井建设知识图谱的数据须具备严苛的规范性和准确性,要求数据的知识粒度更为精细,这也决定了矿井建设知识图谱的构建依赖于专家制定本体库中的构造公理与规则。知识图谱主要包括三种构建方法:自底向上、自顶向下20、混合构建法21。(1)自底向上法提取海量网页信息组成知识三元组,将其经过知识融合筛选后引入知识图谱,并对图谱进行归类,适合构建数据范畴较为模糊的通用领域知识图谱。(2)自顶向下法采用既定的本体概念和数据框架,通过对模式规则进行概括获取知识三元组,更新本体框架。适合体系完整且逻辑层级清晰的领域型知识图谱。(3)混合构建法在结构化知识库中采用自顶向下法快速建立起知识框架,并以自底向上法获得网页数据中有价值的本体知识,扩充框架内容,建立起更完备的知识图谱。基于矿井建设知识图谱既强调本体框架的准确性,又对知识的专业性有一定的要求,因此本文主要分析混合构建法表述矿井建设领域的岩体、地质、地层、矿产资源、机电设备、安全事故、施工单位、规章制度等实体、关系及事件等组成知识图谱的本体知识,如图2所示。矿井建设数据包括:生产记录、研究文献、图册报表、能耗分析报告、地质要求规范、报警记录及瓦斯超限记录、环境监控数据等。数据主要具有以下特点:(1)数据价值密度高。矿井建设数据大多来自实验室、研究机构、煤炭企业和科学文献,数据的准确性和可靠性较高。(2)数据来源相对固定。中华人民共和国矿产资源法 规定,我国矿产资源属于国有资产,因此矿井建设数图1矿井建设知识图谱分类Fig.1Classification of mine construction knowledge graph矿井建设知识图谱面向特定研究的知识图谱多模态语义融合的知识图谱地质勘探通风管理井巷挖掘车场开拓井筒建设安全管理纸质报告文本资料图片资料音频数据视频数据电子数据环境保护设备监管排水系统邱云飞,等:矿井建设知识图谱构建研究综述65Computer Engineering and Applications计算机工程与应用2023,59(7)据大多来自国家部委、组织部门和数据平台,如:自然资源部、国家岩矿化石标本资源共享平台、IMA国际矿物协会等。(3)数据类型复杂。矿井建设数据容纳着储存在数据库中的标准数据,也包含只有部分标注的网页数据和无预先处理工序的视频等。这些数据间存在着复杂的知识关联,需要借助矿井建设领域的本体知识库模型将其处理为知识本体,目前领域型本体知识库的构建主要依靠人工制定的叙词表与关系型数据库。知识图谱的构建需要多方面技术的支持,鉴于目前知识图谱技术表征矿井建设数据的不足,本文将从以下三个方面就矿井建设知识图谱的研究提供合适的方法和参照:(1)知识抽取。抽取目标语料中有价值的实体、关系及事件等矿井建设关键要素。(2)知识融合。解决目标语料库中实体、关系与事件等模糊语义表述问题。(3)知识推理。基于完整的知识图谱挖掘出隐藏的语义信息,补全目标知识图谱。矿井建设知识图谱的构建框架如图3所示。2矿井建设知识图谱构建关键技术2.1矿井建设知识抽取知识抽取是捕获具有研究价值的异构性数据,使其经过处理后成为结构化数据,并