温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
基于
知识
图谱
人员
关系
构建
基于知识图谱的人员关系构建基于知识图谱的人员关系构建 王掀 李鑫 摘要:本文基于知识图谱通过节点定义、边关系处理以及规则集搭建来实现人员关系可视化,实现人员间显性和隐形关系的挖掘,为公共安全领域决策提供技术支撑。关键词知识图谱 实体 共词 近年来随着人工智能技术的蓬勃发展,知识表示技术作为人工智能的一个重要组成部分也得到了广泛发展和应用,其中知识图谱尤为突出,它用可视化技术描述实体间的潜在关联关系。知识图谱是描述客观世界中的实体、概念、事件、属性以及这些因素之间的联系。其中实体和概念用于指代客观世界中的具体事物,包括地点、人物、国家和产品等。实体与实体间以某种形式被联系在一起,其联系在知识图谱中以谓词形式体现出来。目前已有大量的科研机构和学者致力于知识图谱的相关研究,国内知识图谱项目有中文图谱资源库 OpenKG、百度知心和知立方等。这些知识图谱就是要为数据之间潜在关系的预测提供关键技术支撑,从而挖掘有用信息。1 知识图谱的人员关系构建 本文人员关系构建作为一种基于图的数据结构,它由节点(实体)和边(关系)组成,每个节点代表一個实体,每条边为实体与实体之间的关系,把与社会网络有关的所有数据都打通,构建包含多数据源的人员关系图谱。在构建过程中,需要通过节点定义、边关系处理以及规则集搭建来实现人员关系的可视化。1.1 定义实体节点 节点即为实体数据,如客户的 ID,手机号,微信,邮箱,QQ 等,一般用户 ID我们认为是业务的核心顶点。可利用任意节点拓展用户所有信息。同时可以建立双节点关联,实现节点间的关系查询。1.2 边关系处理 边关系用来描述两节点间边的属性内容。如在使用设备信息时,用户可能有登录、注册、转账等不同行为属性,手机也有呼入呼出等不同的行为属性,在处理边关系时,我们加入属性描述能更有效地识别用户行为轨迹和关联关系。1.3 规则集搭建 有了节点和关系,我们就构建了基础的关系网络,但这样的网络并不能直接将我们所关注的核心业务信息展示使用,这时规则集的搭建就显的格外重要。如使用手机号关联,IP 关联,邮箱关联,通讯录重合度关联等,将节点间的关联关系聚集,形成聚集关联,直接用于查询,快速搜索公共安全相关信息。其中,涉及到实体层次关系及关联关系的计算和共词的关系计算。对于实体中词之间的关系,主要是计算词之间的层次关系和关联关系,层次关系揭示词之间的上下位关系,关联关系揭示词之间的语义相关性,甚至关联的属性。词之间的共现关系中的共现词频本身就可以体现共词关联度,目前已有多种计算共词关系强度的算法,其一般原理为:将两个本来关系就密切的关键词显得更密切,使关系疏远的关键词显现得更疏远,由此可以在某一主题内,明显区分核心和非核心概念。常见的共词关系相似度的计算方法有内积、Dice 系数、Jaccard 系数和余弦函数,本文为充分挖掘热点实体间潜在的关系,我们选择 Jaccard 系数作为共词关系计算系数,关键词 D、D;的 Jaccard 系数定义为:2 实现结果 本文针对人员关系构建模型包括数据采集、知识抽取、模型服务和图谱构建(图 1),利用收集的网络公开数据和实验数据来进行实验,对原始数据进行知识抽取,包括数据预处理、数据分类等,从而形成有效信息,在模型构建中我们利用用户行为驱动的社交网络演化分析模型和隐空间视角下的动态网络宏观微观结构演化分析模型,进行节点的重要性演化,构建动态复杂网络演化生成模型,并开展模拟实验,通过分析其实体间的行为构建人员关系图谱。本实验以人员身份证号(模拟数据)为实体,通过输入身份证号指定特定人员进行搜索分析,得到与其在飞机、火车或网吧通行的人员关联数据,并进行可视化展示(图 2)。3 结论 通过基于知识图谱的人员关系构建,可对人员实体信息(包括人员基本信息、乘车记录等)和虚拟信息(包括微信、邮件、,上网记录等)进行关联,实现多个实体人员关系图谱构建,可支撑公共安全领域的搜索、预测等业务的开展。参考文献 1田星等,基于词向量的 Jaccard 相似度算法J.计算机科学.2018,7(07):186-189 2张君,用户行为驱动的社交网络演化分析D.清华大学,2015 3马江涛.基于社交网络的知识图谱构建技术研究D.战略支援部队信息工程大学,2018 4曹倩,知识图谱的技术实现流程及相关应用J,情报理论与实践.2015,38(12):127-131