ComputerEngineeringandApplications计算机工程与应用2023,59(13)实体和关系抽取的目的是从非结构化文本中寻找实体的关系结构。许多下游任务,如基于知识的自动完成[1]、基于知识的问答[2-3]和视觉问答的符号技术[4]依赖于此任务。快速联合实体和关系抽取模型杨冬1,2,田生伟1,2,禹龙1,2,周铁军3,王博11.新疆大学软件学院,乌鲁木齐8300002.新疆大学软件技术重点实验室,乌鲁木齐8300003.新疆互联网信息中心,乌鲁木齐830000摘要:从纯文本中抽取实体和关系是知识和问答任务的关键技术。传统的多头模型预测所有片段对的关系类型,而由于关系的稀疏性,片段对的负标签数量远大于正标签。同时,该计算方式导致计算量与句长度的二次方成正比,降低了模型的实用性。为解决该问题,快速实体关系抽取模型被提出。对于命名实体识别任务,实体的开始和结束标签分别对两个指针网络预测。在关系抽取任务中删除了不包含实体结束标签的语义片段对。该方法减少了片段对的数量并加快了关系抽取任务的推理速度。为了证明模型的有效性,在英语新闻数据集ACE05和荷兰语房地产数据集DREC上进行了实验。实验结果表明,与基线模型相比,该模型取得了有竞争力的性能,其推理速度在ACE05上提高了约1.4倍,在DREC上提高了约2.1倍。关键词:实体识别;关系抽取;神经网络;自然语言处理;信息抽取文献标志码:A中图分类号:TP391doi:10.3778/j.issn.1002-8331.2204-0327FastModelforJointExtractionofEntityandRelationYANGDong1,2,TIANShengwei1,2,YULong1,2,ZHOUTiejun3,WANGBo11.CollegeofSoftware,XinjiangUniversity,Urumqi830000,China2.KeyLaboratoryofSoftwareEngineeringTechnology,XinjiangUniversity,Urumqi830000,China3.XinjiangInternetInformationCenter,Urumqi830000,ChinaAbstract:Extractingentitiesandrelationsfromplaintextisakeytechniqueforknowledgeandquestionansweringtasks.Thetraditionalmulti-headmodelpredictstherelationtypeofallsegmentpairs,whilethenumberofnegativelabelsforsegmentpairsismuchlargerthanpositivelabelsduetothesparsityofrelations.Atthesametime,thiscalculationmethodcausesthecalculationamounttobeproportionaltothesquareofsentencelength,whichreducesthepracticabilityofthemodel.Tosolvethisproblem,afastextractionmodelofentityandrelationisproposed.Forthenamedentityrecognitiontask,thes...