分享
GIS领域知识图谱进展研究_罗强.pdf
下载文档

ID:209791

大小:1.51MB

页数:8页

格式:PDF

时间:2023-03-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
GIS 领域 知识 图谱 进展 研究
第 48 卷第 1 期2023 年 2 月Vol.48 No.1Feb.2023测绘地理信息Journal of GeomaticsGIS领域知识图谱进展研究罗强1,2 胡中南1,2 王秋妹1,2 石伟伟1,2 贾玥31 北京超图软件股份有限公司,北京,1000152 自然资源部地理信息系统技术创新中心,北京,1000153 卡内基梅隆大学,美国匹兹堡,15213Research on the Progress of Knowledge Graph in GIS FieldLUOQiang1,2 HUZhongnan1,2 WANGQiumei1,2 SHIWeiwei1,2 JIAYue31 SuperMap Software Co.,Ltd.,Beijing 100015,China2 GIS Technology Innovation Center of Ministry of Natural Resources,Beijing 100015,China3 Carnegie Mellon University,Pittsburgh 15213,USA摘要:目 前,GIS 领 域 的 人 工 智 能(artificial intelligence,AI)技术更多被应用于空间信息提取,虽已替代部分人工交互的工作,但还未达到决策层面的“智慧”。如何进一步解译和推理提取的空间信息,提炼出地理知识,从而实现地理决策,将是未来 GIS发展的长远目标。知识图谱技术与 GIS的结合可为实体赋予丰富的语义化信息和结构化信息,在空间对象的精细化管理、计算推理及辅助决策等方面有着广阔的发展前景。综合知识图谱在 GIS领域的相关研究进展,从地理信息知识的抽取、融合、存储、检索和计算推理几个方面进行了系统阐述,总结了相关技术的难点与挑战,探索并展望了 GIS 知识图谱在三维时空信息及智慧城市建设等方面的应用。关 键 词:知 识 图 谱;语 义 网;时 空 关 系;GIS;人 工 智 能(artificial intelligence,AI)中图分类号:P208文献标志码:AAbstract:At present,artificial intelligence(AI)technology in the field of GIS is more widely used in the extraction of spatial information.Although it has replaced part of the work of artificial interaction,it is not smart at the decision level.How to further interpret and reason the extracted spatial information,and extract geographic knowledge to realize geographic decision will be the long-term goal of GIS development in the future.The combination of knowledge graph and GIS can give rich semantic information and structured information to entities,which has a broad development prospect in fine management,computational reasoning,decision-making assistance of spatial object.Based on the relevant research progress of knowledge graph in GIS,we systematically expound the extraction,fusion,storage,retrieval,computational reasoning of geographic information knowledge,summarize the difficulties and challenges of relevant technologies,and explore and prospect the applications of GIS knowledge graph in 3D spatiotemporal information and smart city construction.Key words:knowledge graph;semantic web;spatiotemporal relationship;GIS;artificial intelligence(AI)近年来,得益于地理信息大数据的爆发和深度学习的迅猛发展,地理空间人工智能(geospatial artificial intelligence,GeoAI)1技术已初步实现了空间信息识别和提取等功能的自动化,步入了感知智能层次。但现阶段深度学习本质是概率统计意义下的拟合,无法让机器理解语义,实现逻辑推理和学习判断,其不透明性、不可解释性制约着 GIS从感知智能向认知智能发展。Google提出的知识图谱概念2将知识工程“自上而下”的方式转变为“自下而上”的挖掘数据、抽取知识的方式,被认为是实现认知智能的关键技术之一3,推动了 AI在认识层面的创新。在 GIS 领域,空间实体语义关系的构建和地理概念表达是新型测绘领域亟待解决的问题。以语义网络为描述框架的知识图谱在 GIS领域的应用既具有技术普适性又具有地理信息领域的专业特殊性,在地理知识理解、地学问题求解和时空预测等方面具有巨大的应用潜力4。在理论研究方面,陈述彭等5将概念网络化的思想引入地理学领域,首次提DOI:10.14188/j.2095-6045.2022289文章编号:2095-6045(2023)01-0060-08引用格式:罗强,胡中南,王秋妹,等.GIS 领域知识图谱进展研究 J.测绘地理信息,2023,48(1):60-67(LUO Qiang,HUZhongnan,WANG Qiumei,et al.Research on the Progress of Knowledge Graph in GIS FieldJ.Journal of Geomatics,2023,48(1):60-67)基金项目:国家重点研发计划(2018YFB2100700)。第 48 卷第 1 期罗强等:GIS领域知识图谱进展研究出了地学信息图谱概念;后续发展出的地学信息图谱的思想6-9丰富和完善了地学信息图谱的理论体系,形成了形、数、理一体化的研究手段。学者们进一步探索地理知识的存储,基于计算机图谱的思想,构建了地理知识库10、常识地理知识库11、中文地理知识库12、众包地理知识图13等一系列地理知识库。在 GIS 知识图谱构建方面,张雪英等4提出了一种结合地理知识时空特征的知识图谱构建方法,并提出了地理知识图谱的表示方法;蒋秉川等14提出了基于多源异构数据的大规模地理知识图谱的构建技术流程。在 GIS 应用方面,知识图谱为发展更精准的 GIS 领域知识搜索引擎,以及位置服务信息的聚合和推送提供了重要的技术支撑,同时也是将地理信息服务拓展到地理知识服务的关键15。但目前知识图谱在 GIS 行业的应用尚处于起步阶段,应用场景不够广泛,技术适配度不高,因此,要继续探索和研究 GIS与知识图谱的深度结合。本文在前人研究成果的基础上,从地理信息角度较为系统地阐述了知识图谱的内涵及其在 GIS领域的发展和应用情况。依据知识图谱技术架构,从地理知识抽取、融合、存储、检索和计算推理 5 个层面对 GIS 知识图谱进行了较为系统的归纳和剖析,并分析了当前 GIS 知识图谱的主要应用方向,对GIS知识图谱未来的研究重点进行了展望。1 GISGIS知识图谱研究进展在 GIS 领域,知识图谱构建的核心问题是建立地理时空关系和自然语言的空间关系映射,用于描述地理概念产生、发展及演变的状态。知识抽取、知识融合、知识存储、知识检索、知识计算推理是通用知识图谱技术的核心模块16,17,参考通用知识图谱研究框架发展现状,本文对 GIS 领域知识图谱相应技术模块的研究进展进行讨论和分析。1.1GIS知识图谱抽取技术随着智慧城市、数字孪生等概念的普及,多源异构大数据正逐渐成为 GIS 主流数据来源18,知识抽取技术就是从这些不同结构和类型的数据中提取出来的计算机可理解和计算的结构化数据,抽取的内容包括实体、属性、关系。其中实体是对客观个体的抽象19,实体属性指与实体相联系的变量或意义20,关系则指实体间存在的各种语义关联4。近年来,以文本为主的地理信息理解问题得到了广泛关注,尤其面对半结构化、非结构化文本数据时,知识抽取成为不可或缺的一环。接下来,将从实体、属性、关系 3个角度阐述 GIS知识抽取的研究进展。1.1.1实体抽取实体抽取是指由计算机从文本中抽取实体名称,常用的方法有规则匹配、机器学习、深度学习。GIS领域借助地名辞典进行规则匹配,实现简单、准确度高,但需要专家制定规则和模板,覆盖范围有限,很难适应数据变化新需求21,22。机器学习模型,如条件随机场、支持向量机、隐马尔可夫等,可有效提高实体识别性能23-25,但要在实体抽取时建立训练语料库,这需要大量的人工标注,且监督学习算法不仅受限于训练集合,在准确率和召回率上表现也不够理想,而结合规则和统计的方法在识别命令实体时具有更好的召回率26,27。深度学习模型能够自动学习上下文特征,减少了对语料库的依赖,与其他机器学习模型相比,实体识别效果更佳28,但 GIS数据包含大量专业术语,加大了 GIS 实体识别难度。独凌子等29构建了地理信息服务语料库,在经典的序 列 标 注 模 型 BiLSTM-CRF(bidirectional long short-term memory-conditional random field)的基础上,引入自编码语言模型BERT(bidirectional encoder representation from transformers)预训练语言模型,并在 BiLSTM-CRF 前加入卷积神经网络(convolutional neural network,CNN),以更好地提取文本局部特征。储德平等30提出了 ELMOCNN-BiLSTM-CRF 模型,提高了对地质实体中复杂多义词的区分水平。但目前深度学习方法仍很难满足 GIS开放领域 的 实 体 抽 取,模 型 在 不 同 场 景 下 的 泛 化 能 力较低31。1.1.2属性抽取综合 GIS领域中实体的属性特征和自然语言中的描述特点,学者们分别从本体、规则匹配、监督学习和弱监督学习14,32方面讨论了实体属性的抽取。杨博等33使用规则和启发式算法自动抽取出相应的属性名称和属性值。在某些情况下,属性也可看作实体与属性值间的名词性关系,所以属性抽取可看作关系抽取的一种特殊情况。蒋焕剑34将属性抽取看作关系抽取,模糊了属性抽取和关系抽取方法的差异;郭剑毅等35把实体、属性、属性值看作 3类实体,将这 3类实体的抽取问题转化为命令实体识别问题。1.1.3关系抽取关系抽取为两个概念或实体之间的某种语义关系或关系类别。在 GIS领域则更加侧重对时间和空间关系的抽取,基于相关规则可有效对文本中的时间关系进行抽取和计算。相较而言,空间关系的抽取难度更大,其抽取过程是 GIS 计算模型到自然语言空间关系的语义转换。有学者通过构建空间关系61测绘地理信息2023 年 2 月词典和句法模式库,使用模式匹配方法完成以句子为单位的空间关系抽取36,37;也有研究使用机器学习方法完成对空间关系的抽取,这能有效避免规则的局限性,但对空间关系语料库的规模

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开