2023,59(16)电子病历(electronicmedicalrecord,EMR)是医疗数字化建设的重要成果之一,是医疗机构对门诊、住院患者进行临床治疗和指导干预的数字化医疗服务工作记录,其中包含了大量患者的医学信息,是重要的医疗数据资源。但电子病历由大量的非结构化和半结构化数据构成,难以直接应用于计算机。前期通过人工提取文本信息的方式,费时费力且准确率低,导致电子病历文本没有得到很好的使用。随着深度学习的发展,尤其是在自然语言处理(naturelanguageprocessing,NLP)领域的突破,为电子病历文本信息的提取提供了可靠的技术支持。信息抽取(informationextraction,IE)技术作为NLP领域的一个重要分支,其目的就是从非结构化文本中提取能被机器或者程序直接使用的结构化信息,内容主要包括命名实体识别(namedentityrecognition,NER)、关系抽取(relationextraction,RE)和事件抽取(eventextraction,EE)。关系抽取作为信息抽取的关键任务,其目的是检测、提取出实体间的特定类型关系。进而实现医疗文本从非结构化向结构化的转换。这种结构化数据是统计分析、信息挖掘、临床决策支持、医疗领域知识图谱构建以及医疗问答系统开发的重要基础性支撑。本文首先从关系抽取的概念和电子病历的特点出发,详细介绍了电子病历关系抽取任务的内容,对当下关系抽取的研究做了详细分类。然后系统地总结了电子病历关系抽取任务的发展,分析了不同阶段关系抽取方法的优点以及局限性。最后对未来的研究方向进行电子病历关系抽取综述王辰,李明,马金刚山东中医药大学智能与信息工程学院,济南250355摘要:信息抽取在电子病历上的应用取得丰富的研究成果,使得非结构化的生物医学数据得以利用。关系抽取是信息抽取的重要子任务,是从数据转化为知识的桥梁。根据关系抽取存在的不同问题以及不同解决方案,对关系抽取进行详细分类。整理了电子病历关系抽取领域的相关评测任务和具有代表性的数据集。分阶段对关系抽取在电子病历文本上的应用进展进行综述,重点介绍了深度学习方法在关系抽取上的广泛应用,以及现阶段预训练模型在电子病历关系抽取任务上的进展。对该领域进行展望,提出了未解决的问题以及未来的研究方向。关键词:电子病历;关系抽取;深度学习;预训练模型文献标志码:A中图分类号:TP391.1;TP18doi:10.3778/j.issn.1002-8331.2209-0366ReviewofRelationExtractioninElectronicMedicalRecordsWANGChen,LIMing,MAJingangCollegeofIntelli...