温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
知识
图谱
方法
实践
应用
内 容 简 介 知识图谱是较为典型的多学科交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。本书系统地介绍知识图谱涉及的关键技术,如知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、知识问答、图挖掘分析等。此外,本书还尝试将学术前沿和实战结合,让读者在掌握实际应用能力的同时对前沿技术发展有所了解。本书既适合计算机和人工智能相关的研究人员阅读,又适合在企业一线从事技术和应用开发的人员学习,还可作为高等院校计算机或人工智能专业师生的参考教材。未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。版权所有,侵权必究。图书在版编目(CIP)数据 知识图谱:方法、实践与应用/王昊奋,漆桂林,陈华钧主编.北京:电子工业出版社,2019.8 ISBN 978-7-121-36671-0.知.王 漆 陈.知识管理.G302 中国版本图书馆 CIP 数据核字(2019)第 100477 号 责任编辑:宋亚东 印 刷:三河市良远印务有限公司 装 订:三河市良远印务有限公司 出版发行:电子工业出版社 北京市海淀区万寿路 173 信箱 邮编 100036 开 本:787980 1/16 印张:30 字数:546 千字 版 次:2019 年 8 月第 1 版 印 次:2019 年 8 月第 1 次印刷 定 价:118.00 元 凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888,88258888。质量投诉请发邮件至 ,盗版侵权举报请发邮件至 。本书咨询联系方式:010-51260888-819,。序序 知识图谱是人工智能的一个分支,对可解释人工智能具有重要作用。近几年,随着知识表示和机器学习等技术的发展,知识图谱相关技术取得了突破性的进展,特别是知识图谱的构建、推理和计算技术以及知识服务技术,都得到了快速的发展。这些技术的进步使知识图谱在工业界受到了广泛关注,并取得了显著成果。谷歌、微软、百度等互联网公司率先构建了大规模通用知识图谱,提供基于实体和关系的语义搜索,可以更好地理解用户查询。知识图谱还在智能决策系统、推荐系统和智能问答系统中起到了重要作用。知识图谱不仅有巨大的应用价值,而且具有重要的理论价值。知识图谱使传统知识表示和推理技术有了落脚点,也为知识表示和推理带来了新的挑战。本书系统介绍了知识图谱的理论、技术及应用。在理论方面,本书全面介绍了知识图谱的各种表示方法,以及知识图谱的推理方法,这些方法是知识图谱的根基。在技术方面,本书全面介绍了知识图谱的存储和查询技术、挖掘构建、知识融合技术,以及基于知识图谱的语义搜索和智能问答技术。在应用方面,本书全面地介绍了知识图谱在工业界的典型应用场景,为知识图谱的发展提供了养分。目前,关于知识图谱的专业书籍还比较缺乏,本书将给广大知识图谱研究人员和应用人员带来福音。本书作者们都是在知识图谱的研究和产业应用方面有丰富经验的专家和学者,很好地融合了知识图谱的学术研究和产业化实践,相信本书的出版对于知识图谱技术的普及和发展会产生非常积极的作用。清华大学教授 IV 知识图谱:方法、实践与应用 前前 言言 知识图谱的早期理念源于万维网之父 Tim Berners-Lee 关于语义网(The Semantic Web)的设想,旨在采用图结构(Graph Structure)来建模和记录世界万物之间的关联关系和知识,以便有效实现更加精准的对象级搜索。知识图谱的相关技术已经在搜索引擎、智能问答、语言理解、推荐计算、大数据决策分析等众多领域得到广泛的实际应用。近年来,随着自然语言处理、深度学习、图数据处理等众多领域的飞速发展,知识图谱在自动化知识获取、知识表示学习与推理、大规模图挖掘与分析等领域又取得了很多新进展。知识图谱已经成为实现认知层面的人工智能不可或缺的重要技术之一。为什么写作本书 知识图谱是较为典型的交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。而知识图谱的构建及应用涉及更多细分领域的一系列关键技术,包括:知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、智能问答、图计算分析等。做好知识图谱需要系统掌握和应用这些分属多个领域的技术。本书写作的第一个目的是尽可能地梳理和组织好这些知识点,帮助读者系统掌握相关技术,能够从整体、全局和系统的视角看待和应用知识图谱技术。早期的知识图谱应用主要是谷歌、百度等公司的通用域搜索引擎,以及基于搜索延续发展出来的基于知识图谱的智能问答应用,如天猫精灵、小米小爱等。这类应用主要依靠通用领域的知识图谱,如百科类知识图谱。近年来,知识图谱在医疗、金融、安全等垂直领域深入发展,知识图谱的应用也进一步从通用领域向越来越多的垂直领域扩展。对于刚刚进入该领域的从业人员,更需要能从应用入手,开展知识图谱的研究与开发。本书写作的第二个目的是希望能够为这些知识图谱应用开发人员提供一本参考型的工具书。因此,本书在章节最后安排了一个小节介绍相关技术点的常用开源工具,并在与本书配套的网站上提供了完整的实际操作教程。前 言 V 近几年,随着人工智能的进一步发展,知识图谱在深度知识抽取、表示学习与机器推理、基于知识的可解释性人工智能、图谱挖掘与图神经网络等领域取得了一系列新的进展。本书写作的第三个目的是希望梳理和整理这些与知识图谱相关领域的最新进展,帮助读者了解它们的技术发展前沿。关于本书作者 本书邀请了国内从事相关领域研究和开发的一线专家。三位主编都在语义网和知识图谱领域有着十余年的研究和开发经验,同时也是中文领域开放知识图谱 OpenKG 的发起人。每个章节由各细分技术领域的专家主持撰写,参与编写的编者既有来自国内高校从事相关学术研究的教师,也有来自企业拥有丰富实际开发经验的技术专家。本书主要内容 本书共包括 9 章,主要内容如下:第 1 章主要介绍知识图谱的基本概念、历史渊源、典型的知识图谱项目、技术要素以及核心应用价值。第 2 章围绕知识表示与建模,首先介绍传统人工智能领域的典型知识表示方法,如谓词逻辑、描述逻辑、框架系统等,接下来重点介绍 RDF、OWL 等互联网时代的知识表示框架,此外还介绍知识图谱的向量表示方法等。最后以 Protg 为例介绍知识建模的具体实践过程。第 3 章围绕知识存储,首先介绍知识图谱存储的主要特点和难点,然后介绍几种常用的知识图谱存储索引及存储技术,并对原生图数据库的技术原理进行简要介绍。此外,还概要介绍常用的图数据库,并以 Apache Jena 和 gStore 为例介绍知识图谱存储的具体实践过程。第 4 章围绕知识抽取与知识挖掘,首先介绍从不同来源获取知识图谱数据的常用方法,然后重点围绕实体抽取、关系抽取和事件抽取等,对从文本中获取知识图谱数据的方法展开了较为具体的介绍。最后以 DeepDive 开源工具为例介绍关系抽取的具体实践过程。第 5 章围绕知识图谱的融合,分别对概念层的融合和实体层的融合展开介绍,包括本VI 知识图谱:方法、实践与应用 体映射、语义映射技术、实体对齐、实体链接等。最后以 LIMES 开源工具为例介绍实体融合的具体实践过程。第 6 章围绕知识图谱推理,首先介绍推理的基本概念,然后分别从基于演绎逻辑的知识图谱推理和基于归纳的知识图谱推理,对常用的知识图谱推理技术进行介绍。最后以Apache Jena 和 Drools 等开源工具为例介绍知识图谱推理的具体实践过程。第 7 章和第 8 章分别围绕语义搜索和知识问答展开,介绍语义索引、基于知识图谱的问答等系列技术,并以 gAnswer 等开源工具为例,介绍基于知识图谱实现精准搜索和问答的具体实践过程。第 9 章为应用案例章节,作者挑选了电商、图情、生活娱乐、企业商业、创投、中医临床领域和金融证券行业 7 个应用案例,对知识图谱技术在不同领域的实现过程和应用方法展开介绍。如何阅读本书 这是一本大厚书,读者应该怎样利用这本书呢?在阅读此书前,读者应当学过数据库、机器学习及自然语言处理的基本知识。这本书的章节是依据知识图谱的相关技术点进行安排的。由于知识图谱涉及的技术面较多,我们建议刚进入知识图谱领域的读者分几遍阅读本书。第一遍先通读全书,主要厘清基本概念,对涉及学术前沿的内容以及开源工具实践部分的内容可以只简单浏览。第二遍重点针对每个章节后面的开源工具进行实践学习,通过上手操作加深对各技术点的理解。第三遍针对各章中介绍的算法进行学习,并结合相关论文的阅读加深对算法的理解。在这个阶段可以挑选自己感兴趣的技术点进行深入研究。在撰写本书时,编者考虑了各章节技术点的独立性,对知识图谱的某些技术已经有些了解的读者,可以不用严格按照书的章节顺序阅读,而是挑选自己感兴趣的章节进行学习。前 言 VII 致谢 本书是很多人共同努力的成果,在此感谢各位编者的共同努力。同时,在本书写作过程中,北京大学的邹磊,湖南大学的彭鹏,海知智能的袁熙昊、韩庐山、王燚鹏、孙胜男、郭玉婷,东南大学的吴桐桐、谭亦鸣、花云程、胡森,浙江大学的张文、王冠颖、王若旭、陈名杨、王梁、叶志权等人也提供了非常有价值的调研结果和修改意见,在此表示衷心的感谢。在电子工业出版社博文视点宋亚东编辑的热情推动下,最终促成了我们与电子工业出版社的合作。在审稿过程中,他多次邀请专家对此书提出有益意见,对书稿的修改完善起到了重要作用。在此感谢电子工业出版社博文视点和宋亚东编辑对本书的重视,以及为本书出版所做的一切。为推动中文领域开放知识图谱的发展,本书的作者们一致同意将部分稿酬捐赠给OpenKG。在此,也对参与本书的所有作者的无私奉献表示感谢。由于作者水平有限,书中不足及错误之处在所难免。此外,由于知识图谱技术涉及面广,本书难免有所遗漏,敬请专家和读者给予批评指正。作者 2019 年 7 月 读者服务 轻松注册成为博文视点社区用户(),扫码直达本书页面。提交勘误:您对书中内容的修改意见可在“提交勘误”处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。交流互动:在页面下方“读者评论”处留下您的疑问或观点,与我们和其他读者一同学习交流。VIII 知识图谱:方法、实践与应用 目目 录录 第 1 章 知识图谱概述.1 1.1 什么是知识图谱.1 1.2 知识图谱的发展历史.2 1.3 知识图谱的价值.5 1.4 国内外典型的知识图谱项目.9 1.4.1 早期的知识库项目.9 1.4.2 互联网时代的知识图谱.9 1.4.3 中文开放知识图谱.12 1.4.4 垂直领域知识图谱.13 1.5 知识图谱的技术流程.15 1.6 知识图谱的相关技术.19 1.6.1 知识图谱与数据库系统.19 1.6.2 知识图谱与智能问答.23 1.6.3 知识图谱与机器推理.25 1.6.4 知识图谱与推荐系统.28 1.6.5 区块链与去中心化的知识图谱.29 1.7 本章小结.30 参考文献.31 第 2 章 知识图谱表示与建模.40 2.1 什么是知识表示.40 2.2 人工智能早期的知识表示方法.43 2.2.1 一阶谓词逻辑.43 2.2.2 霍恩子句和霍恩逻辑.43 2.2.3 语义网络.44 2.2.4 框架.45 目 录 IX 2.2.5 描述逻辑.47 2.3 互联网时代的语义网知识表示框架.48 2.3.1 RDF 和 RDFS.48 2.3.2 OWL 和 OWL2 Fragments.53 2.3.3 知识图谱查询语言的表示.59 2.3.4 语义 Markup 表示语言.62 2.4 常见开放域知识图谱的知识表示方法.64 2.4.1 Freebase.64 2.4.2 Wikidata.65 2.4.3 ConceptNet5.66 2.5 知识图谱的向量表示方法.68 2.5.1 知识图谱表示的挑战.68 2.5.2 词的向量表示方法.68 2.5.3 知识图谱嵌入的概念.71 2.5.4 知识图谱嵌入的优点.72 2.5.5 知识图谱嵌入的主要方法.72 2.5.6 知识图