分享
基于中成药知识图谱的知识推理及智能推荐.pdf
下载文档

ID:3625863

大小:3.29MB

页数:8页

格式:PDF

时间:2024-06-26

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 中成药 知识 图谱 推理 智能 推荐
基 于 中 成 药 知 识 图 谱 的 知 识 推 理 及 智 能推荐马宸睿孟子琪边新宇李癑函赵汉青(河北大学中医学院保定 )摘要目的 意义 构建中成药说明书知识图谱,实现基于知识推理的智能推荐。方法 过程 基于 结合 图数据库搭建知识图谱的技术,整理 种中成药信息并构建数据库,基于三元闭包算法实现知识推理,运用概率模型计算中成药推荐评分。结果 结论 共形成实体概念 个,语义关系 种。构建了中成药智能推荐知识图谱,搭建中成药智能推荐平台实现中成药的准确推荐。实现中成药与知识图谱领域结合,为中医辅助诊疗提供方法借鉴,为进一步开展中成药知识可视化研究提供参考。关键词中成药;知识图谱;数据库;知识推理;智能推荐 中图分类号 文献标识码 ,(),;修回日期 作者简介马宸睿,本科生,发表论文 篇;通信作者:赵汉青,博士,高级工程师,硕士生导师。基金项目国家自然科学基金项目(项目编号:);河北省教育厅科学研究项目(项目编号:);河北省中医药类科研计划项目(项目编号:)。医学信息学杂志 年第 卷第 期 ,引言中成药作为中医治疗的一种重要手段,具有简便易用、服用方便等特点。随着药品不良反应监测的不断深入,发现中成药说明书在一定程度上存在用药安全隐患,如部分说明书描述模糊或描述缺少 ,不便于查询与使用。知识图谱可以优化搜索引擎的检索效率 ,实现知识的快速响应和推理。部分中医药领域知识图谱应用,见图 ,基于知识图谱对中成药数据进行存储可增强非结构化中成药数据之间的关联强度与紧密性。既有中成药智能推荐仍基于传统非结构化数据 ,为进一步提升中成药智能推荐的规范化及准确率,本研究将规范化整理后的中成药说明书内容借助知识图谱可视化的形式呈现并搭建中成药数据库进行知识推理,最终通过构建概率模型估计每种中成药对于特定症状的适应概率,结合三元闭包算法推荐相应的中成药。图 中医药领域知识图谱应用示例 资料与方法 数据来源中成药知识数据在 国家基本药物目录(年版)和 国家基本医疗保险、工伤保险和生育保险药品目录(年)(以下简称 国家医保药品目录(年)种中成药原说明书的基础上整理,由两名具有执业医师资格的中医医师根据中医辨证论治原则扩写,由具有高级职称且 年以上临床经验的中医医师审核,重点整理中成药的治则、适应症和使用禁忌等。中成药知识图谱构建思路 基本构建流程采用自顶向下的方法构建本体 ,本体可分为两个主要部分:“顶层本体”和“基础词库”。本体基本覆盖两本目录中的 种中成药,为构建中成药知识图谱提供了相对完整的框架。利用 软件对本体编码、形式化,完成中成药知识本体创建。中成药知识图谱三元组关系模型以中成药的治疗领域作为一级属性节点,如内科、外科、妇科等;中成药剂型作为二级属性节点;中成药名称为三级属性节点;中成药的 适应症、治则、禁忌及治疗疾病等为四、五级节医学信息学杂志 年第 卷第 期 ,点。知识图谱构建具体流程主要分为数据获取、数据处理和数据呈现等,见图 。图 中成药知识图谱基本构建流程 知识抽取与知识融合知识抽取是从收集的数据源中提取实体、属性以及实体间的相互关系,采用内容分析法,按照“实体 属性 关系”的步骤抽取知识,抽取的实体包括中成药名称、基本属性等。()实体抽取。从非结构中医文本中定位实体的边界并将其分配到预定义类别(如中成药的名称、治则、适应症、禁忌等)集合的过程 。()属性抽取。即实体的属性信息,体现实体的内部特征。()关系抽取。在已识别的实体基础上,从文本中抽取实体间关系,分为同类型实体间关系抽取和不同类型实体间关系抽取 ,体现实体的外部特征。抽取出的实体可能存在歧义和重复等问题,需先进行实体消歧和共指消解,再将处理后的实体转换为三元组,对三元组的数据进行规范化整理。三元组是知识图谱的最基本组成单元,由两个具有语义关联的实体(或概念)以及二者间关系组成,即 头实体、关系、尾实体或 实体、属性、属性值的形式。前者表达实体间的关联,后者表示实体的内在特征 。对大规模数据进行知识融合可以消除概念歧义,互补知识,目前知识融合的方法包括基于实体 的映射、基于本体的规范化映射和聚类、基于相似度的映射等 。通过知识融合,将多个知识库中同一实体不同信息融合为更精准的实体描述。知识加工与知识存储采用 图数据库构建和呈现中成药知识图谱,使用 语句实现图谱知识加工与存储 ,相关代码语句及其含义如下。用 语句创建节点并分配属性,语句检索节点属性,如批量建立节点并返回节点属性:(:中成药 :九味羌活丸(颗粒),(:症状 :恶寒)用 语句查找节点及其属性并创建关系,语句检索节点间的关联关系,如:(:治疗疾病 :感冒),(:症状 :头痛)():证候为 ()除上述命令,以下命令也可用于加工知识图谱,如 语句提供条件过滤数据、语句删除节点及关系。如删除节点关系:(:中成药 :内科用药):分类(:内科用药 :解表剂)基于知识图谱的中成药知识推理方法知识推理是从知识图谱中已有的知识出发,得医学信息学杂志 年第 卷第 期 ,出新的、未知的或隐含的知识,并挖掘或推理出未知或隐含的语义关系 。知识推理的实现一般分为步:自然语言处理、图谱知识表示和概率计算。将用户输入的信息进行分词、词性标注、实体识别、同义词转换等预处理,识别出其中的症状信息以供图谱查询,使用 模型将症状和药物的文本描述转换为向量形式。在此基础上,进行语义相似度计算,使用余弦相似度计算用户输入的症状与知识图谱中症状的语义相似度。本研究知识推理过程为语义推理,即通过计算实体间的关系及属性实现知识推理 。首先确保知识图谱中包含充分的中成药信息,包括中成药的治则、适应症及禁忌,以及适应症、禁忌、治则到中成药的映射关系。通过对比实体关系获得语义推理结果,结合属性等相关信息,将语义推理获取的最终数据存储到检索结果中,推理过程示例如下。():()():()(,)三元闭包算法 三元闭包的概念知识推理概率模型的构建采用三元闭包理论框架,三元闭包是网络中最小的局部结构和链接生成机制,在知识网络的演化过程中具有重要作用 ,可以被解释为:社交网络中,两个互不认识的人若拥有共同的朋友,那么这两个人将来因为某些因素成为朋友的可能性会大大提高 。在中成药知识网络中同样适用,、个节点,假设中成药 与中成药 拥有共同的邻居节点药物知识 ,则 与 更容易形成 链接、三元闭包稳定结构 。以本研究中的节点中成药、症状为例,边代表这些实体之间的关系(如“治疗疾病为”“证候为”关系),见图 。通过探索三元闭包,可以发现可能的中成药 症状或中成药 治则关联 。图 三元闭包示例 三元闭包的应用目前三元闭包在医学领域的应用已经涉及药物 疾病、药物 不良反应、药物 药物等关系的挖掘 ,本研究将三元闭包应用于中成药 中成药、中成药 治则等方面,探索中成药之间潜在的相似性和关联性。三元闭包理论在中成药知识图谱中的应用可以基于图论和中医药学的原则构建。关于三元闭包的进一步研究,从参数算法的角度探讨,证明强三元闭包存在 大小的点核 ,即强关联三元组。三元闭包的构建思路()数据准备。获得 中推理得到的实体关系,确保知识图谱中包含中成药、症状、禁忌等实体及其之间的关系。()三元闭包探索。在图中查找所有可能的三元闭包结构。()推荐评分计算。基于三元闭包的结构,计算每个药物的推荐评分。()生成推荐列表。根据评分为用户推荐药物。推荐评分方法如下:一是定义权重,赋予每种中成药 证候关系一个权重,用其代表该中成药治疗该证候的效力或相关性;二是计算共享证候的权重和,即对每一对中成药 和 ,找出其共同治疗的所有症状集合,并对这些共享证候的权重求和;三是归一化评分,为使评分在一个合理范围内,对评分进行归一化处理。这个过程用于评估两种中成药之间的相似性,比较两种中成药之间的治疗效果,为用户推荐最适合的中成药。中成药推荐算法推理逻辑:如果两种中成药 和 都与同一个症状 相关联,则 和 可能具有相似的治疗医学信息学杂志 年第 卷第 期 ,效果或成分。通过分析中成药与症状之间的三元闭包结构,可以推测哪些中成药在治疗特定症状方面可能有效,或者哪些中成药可能具有相似的治疗作用。假设中成药 和中成药 都与头痛(症状 )关联,但两种中成药之间没有直接关系,根据三元闭包理论,可以推断 和 可能都对治疗头痛有效。通过这种方式,三元闭包理论可以作为中成药知识图谱推荐系统中的一个关键组成部分,帮助揭示药物之间潜在的相似性和关联性。推荐算法的权重设定与临床效果、文献支持、专家意见有关,可以利用历史病例数据,通过数据挖掘技术分析药物与症状之间的关联强度。基于三元闭包的推荐分数计算方式如下。(,):,(,)(,)(,)这段伪代码定义了一个名为 的函数,用于计算基于三元闭包的推荐分数。函数接收两个参数:(一个包含三元组的列表,每个三元组表示一个药物与症状之间的关系)和 (一个图数据结构,包含了药物、症状及其关系权重)。函数的主要逻辑:创建一个空字典 ,用于存储每个药物组合及其对应的推荐分数;遍历 中的每个三元组(症状、药物 和药物 );对每个三元组,使用 ()方法获取药物 与症状之间的权重,以及药物 与症状之间的权重,将这两个权重相加得到推荐分数;将药物组合(药物 ,药物 )作为键,推荐分数作为值,存储 到 字 典 中;遍 历 完 成 后,返 回 字典。这个函数的作用是根据给定的药物与症状之间的关系三元闭包,计算每个药物组合的推荐分数。推荐分数可用于评估不同药物组合在治疗特定症状方面的优劣。中成药智能推荐平台总体设计采用前后端分离的业务逻辑架构,前端程序主要作为结果展示,即将推荐的中成药信息以知识图谱的形式呈现,后端程序主要用于数据计算。前端程序采用 开发语言,应用 前端开发框架,主要包括注册、信息反馈、智能推荐等功能模块,见图 ,并将用户选择 填写的信息通过 请求的方式传输到后端。后端程序采用 编程语言,根据知识推理规则运用概率模型计算中成药推荐评分,选择出推荐分数最高的中成药,将推荐的中成药数据借助 图数据库以知识图谱形式呈现,最终将生成的知识图谱以 页面发送至前端。图 智能推荐平台功能模块 结果 中成药知识图谱构建结果本研究共完成构建 个实体和 条关系,基于 图数据库可视化呈现中成药数据。中成药推荐成果用户注册并登录该平台,将自己的现有证候输入证候统计表,证候统计表分为两种类型,直接选择 标准证候信息和自主填空。这种设定是为了更加详细收集用户的证候,方便更加精准推荐中成药。该平台处理用户输入的内容后,为用户推荐最合适的中成药。具体实例的评分比较及中成药推荐,见表 ;推荐结果图谱显示,见图 。医学信息学杂志 年第 卷第 期 ,表 中成药推荐评分结果实例项目适应症禁忌治则评分实例用户输入关节疼痛肿胀、手指关节不敢伸直、肌肉酸痛、关节或肌肉僵硬、关节麻木、天气变冷时关节疼痛明显昆仙胶囊关节肿胀疼痛、关节屈伸不利、晨僵、关节压痛、关节喜暖畏寒、腰膝酸软、舌质淡苔白、脉沉细孕妇、哺乳期妇女、生育年龄有生育要求者、严重心律失常、患骨髓造血障碍疾病者、胃溃疡活动期、十二指肠溃疡活动期、处于生长发育期的婴幼儿、青少年、严重贫血者、严重白细胞低下者、严重血小板低下者、患有肝肾功能不全者、严重全身性疾病者均禁用补肾通络、升津舒经 正清风痛宁胶囊肌肉酸痛、关节肿胀、关节疼痛、关节屈伸不利、麻木僵硬支气管哮喘患者禁用升津舒经、活血通络、消肿止痛 实例用户输入发热、怕冷、咳嗽、咳白痰、鼻塞、头痛、流涕、微有汗出、喉咙痒;转头受到限制玉屏风颗粒恶风、发热、流清涕、鼻塞、咳嗽、咳痰白、干呕、头痛、面色白、汗出、项强、苔薄白、脉缓尚不明确益 气、固 表、止汗 葛根汤片(颗 粒、合剂)恶寒、发热、鼻塞、清涕、咳嗽、咳痰稀白、咽痒、汗出、头痛、身疼、项背僵急不舒、苔薄白、脉浮紧尚不明确发汗解表、升津舒经 实例用户输入半身不遂、口舌歪斜、舌强言蹇、偏身麻木、气短乏力、口角流涎、手脚发肿、曾患有缺血性卒中脑脉泰胶囊半身不遂、口舌歪斜、舌强言蹇、舌强不语、偏身麻木、气短乏力、头晕目眩、面色白、口角流涎尚不明确益气活血、熄风豁痰 脑 安 片(胶囊、颗粒、滴丸)半身不遂、口舌歪斜、舌强言蹇、偏身麻木、气短乏力、口角流涎、手足肿胀、舌暗或瘀斑、苔薄白出血性卒中慎用活血化瘀、益气通络 图 中成药图谱推荐结果医学信息学杂志 年第 卷第 期 ,讨论本研究针对市面上现有中成药说明书不完善可能导致中成药使用不当的问题,构建基于中成药知识图谱的智能推荐技术,探究中成药智能推荐的可实施性。结果表明该方法借助知识图谱呈现推荐结果,具有高效性和便捷性,有助于用户选择。通过用户应用效果评测,发现该研究提高了中成药对用户的有效率,缩短了用户的购买时间。建立智能反馈平台,为医患之间交流与治疗搭建桥梁,助力中医医疗信息化的持续高质量发展 。知识图谱作为知识工程领域的新技术,为中成药领域知识挖掘与利用扩展了新方向 。本研究存在如下不足:一是中成药说明书本身描述存在歧义或描述不清 ,如说明书中某些病因病机与证型不易区分,资料整理结果的准确度下降,智能推荐的中成药有效率下降;二是知识推理过程无法确保完全正确,对自主填空的证候信息可能存在无法正确识别的情况,可能会出现误导性的结论;三是基于三元闭包进行知识推理虽可以更准确预测实体间的关系、揭示隐含关系,但随数据量的增加会提升计算的复杂性;四是采用基于深度学习的智能推荐方法,机器学习模型可能受到数据不平衡、冷启动等问题的影响。为进一步提升中成药智能推荐的可实施性,将从以下几个方面进一步研究:不断完善中成药说明书,提高数据质量;建立反馈机制,及时修正知识推理的结果;持续优化算法及数据结构。结语中成药种类繁多、组成千变万化,增加了中成药临床准确应用的难度,本研究采取中成药知识图谱可视化的形式,构建中成药数据库,实现中成药的知识推理与智能推荐,旨在提高中成药的疗效及使用率。希望本研究结果可以为挖掘中成药数据的应用价值提供新思路,实现中医药资源的有效整合,为中成药可视化领域的相关研究奠定基础 ,推动中成药领域知识服务新形式的发展。后续研究将继续挖掘中医药古籍文献数据,进一步丰富中成药数据信息,为公众提供更优质的中成药智能推荐服务。该平台的中成药智能推荐功能方便患者购买和用药,既可以帮助用户减少在购买时的困惑,又可以帮助用户选择更适合个人病情的中成药,避免因盲目购药而影响身体健康的问题,同时更好地维护中成药声誉,推动中成药行业良性发展。利益声明:所有作者均声明不存在利益冲突。参考文献 吕小琴,马敏康,朱勇,等 中成药说明书安全性信息及不良反应监测数据分析 中国现代应用药学,():秦川,祝恒书,庄福振,等 基于知识图谱的推荐系统研究综述 中国科学:信息科学,():王志寅基于知识图谱的推荐算法研究及应用 太原:太原师范学院,张万义,张千,石赵雁,等 基于中医辨证的智能中成药推荐系统 智慧健康,():孙飞鹏,于淼,汤京淑 基于知识图谱的汉语词汇学习资源推荐研究 以 三级词汇为例 现代教育技术,():于彤,李敬华,于琦,等 中医养生知识图谱的构建与应用 中国数字医学,():黄恒琪,于娟,廖晓,等 知识图谱研究综述 计算机系统应用,():刘峤,李杨,段宏,等 知识图谱构建技术综述 计算机研究与发展,():李芊芊,付兴,杨凤,等 基于“病脉证并治”诊疗思维的 伤寒论知识图谱构建与应用 世界科学技术 中医药现代化,():张晗,安欣宇,刘春鹤 基于多源语义知识图谱的药物知识发现:以药物重定位为实证 数据分析与知识发现,():徐安迎,胡孔法,杨涛 基于 的肺癌中医诊疗知识图谱构建研究 世界科学技术 中医药现代化,():管芸笛通信波形自动推荐关键技术研究 成都:电子科技大学,(下转第 页)医学信息学杂志 年第 卷第 期 ,利益声明:所有作者均声明不存在利益冲突。参考文献 ,:,():,():,():,():张楠基于论文发表后同行评议分数的被引频次影响因素研究 合肥:中国科学技术大学,付中静 国际期刊评价指标的实证分析 基于 和 数据库对比视角 现代情报,():顾欢“标准特征因子”“标准论文影响分值”与 在跨学科评价中的相关性分析 情报杂志,():盛丽娜,顾欢,刘雪立“影响因子百分位”“标准特征因子”对期刊评价效力的实证研究 基于 眼科学期刊 情报杂志,():谭贝加 被引频次结合 评分、评分用于生 物 医 学 论 文 影 响 力 评 价 的 可 行 性 研 究 以 年 论文为例 中国科技期刊研究,():迟培娟,宋秀芳 个人学术影响力评价方法比较分析 学术迹与 评分、影响因子、被引次数等指标的比较分析 情报科学,():陈小清,刘丽,邢美园 单篇论著影响力评价指标比较分析 学术迹与 评分、评分、的比较 情报理论与实践,():苟莉,陈一龙,王雁,等 视角下临床医学科技期刊学术影响力提升策略初探:基于 热点论文被引频次与 相关性分析 中国科技期刊研究,():许丹,韩爽,徐爽 不同评价条件下论文多元评价指标差异性及相关性分析 中国科技期刊研究,():,():姜育彦,刘雪立 绝对颠覆性指数与同行评议指标及 的关系:基于病毒学论文的研究 图书情报工作,():(上接第 页)虞松涛基于学术知识图谱的语义检索研究 武汉:华中师范大学,高杨,张燕平,钱付兰,等 基于三元闭包的节点相似性链路预测算法 计算机科学与探索,():许云峰,赵宁,郝雪君,等 基于三元闭包和会员闭包的社区发现算法研究 河北科技大学学报,():孟永伟,王晓英,沈茜,等 基于三角形演化机制的社会网络模型研究 计算机工程与应用,():孙昊天,杨良斌 基于带权三元闭包的知识图谱的构建方法研究 情报杂志,():吴胜男,孙乙丹,蒲虹君,等 药物领域三元闭包形成的影响机制研究 基于机会 信任 动机视角 数据分析与知识发现,():孙乙丹机会 信任 动机视角下的药物领域三元闭包形成的影响机制研究 太原:山西医科大学,赵晋基于网络模型的药物重定位研究 西安:西安电子科技大学,():白逸晨,李海燕 基于中医专家思维的问诊信息模型构建及应用研究 中国卫生信息管理杂志,():,:,雷超,乔萌,陈子佳,等 中成药说明书安全性信息项修订的探讨与思考 中国药物警戒,():顾泽元,刘星,陈慧琴 基于中医药领域图谱自动构建与可视化研究 齐齐哈尔大学学报(自然科学版),():,医学信息学杂志 年第 卷第 期 ,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开