第20卷第4期2023年4月铁道科学与工程学报JournalofRailwayScienceandEngineeringVolume20Number4April2023基于BMBC模型的高速铁路道岔故障信息实体识别林海香1,白万胜1,陆人杰2,卢冉1,赵正祥1,李新琴3(1.兰州交通大学自动化与电气工程学院,甘肃兰州730070;2.卡斯柯信号有限公司,上海200071;3.中国铁道科学研究院集团有限公司电子计算技术研究所,北京100081)摘要:随着铁路信号设备故障文本的不断积累,亟待构建集故障信息、专业知识、技术规则及其内在关联于一体的铁路信号设备故障知识图谱,为铁路运营及设备维修提供全面高效的辅助策略。故障信息实体识别是构建铁路信号设备故障知识图谱的核心。以高速道岔故障文本为基础,并针对此文本挖掘过程中使用传统方法导致知识获取不够全面以及文本语义稀疏等问题,提出一种用于高速道岔故障信息实体识别任务的BMBC多层级模型。首先,通过分析高速道岔故障文本的结构特征,从中提取出故障现象、故障定位和故障致因等7类实体;其次,利用BERT预训练模型的迁移特性构建双向词表征并嵌入位置信息,引入多头注意力机制(MHA)使关键特征信息得到重点关注,随后依靠双向长短期记忆网络(BiLSTM)进行特征信息融合,从而充分获取全局语义信息以及更好表达序列间的长距离依赖关系;最后,依托条件随机场(CRF)赋予标签约束条件,从而获得最佳识别结果。以各铁路局近5年的高速铁路道岔故障文本为基础进行实验,实验结果表明,BMBC模型能够精确识别各类故障信息实体,有效缓解实体边界不清晰问题,模型识别精确率、召回率和F1值分别可达91.43%,93.15%和92.31%。实验完成后进行案例识别测试,证明所构建的BMBC多层级道岔故障信息实体识别模型具有良好的识别性能。关键词:道岔;故障文本;迁移学习;命名实体识别;BMBC多层级模型中图分类号:U284文献标志码:A开放科学(资源服务)标识码(OSID)文章编号:1672-7029(2023)04-1149-11Namedentityrecognitionoffaultinformationofhigh-speedrailwayturnoutfromBMBCmodelLINHaixiang1,BAIWansheng1,LURenjie2,LURan1,ZHAOZhengxiang1,LIXinqin3(1.SchoolofAutomationandElectricalEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China;2.CASCOSignalLtd.,Shanghai200071,China;3.InstituteofComputingTechnology,ChinaAcademyofRailwaySciencesCorporationLimited,Beijing100081,China)Abstract:Withthecontinuousaccumulationoffaulttextsofrailwaysign...