ISSN1004⁃9037,CODENSCYCE4JournalofDataAcquisitionandProcessingVol.38,No.4,Jul.2023,pp.777-791DOI:10.16337/j.1004⁃9037.2023.04.003Ⓒ2023byJournalofDataAcquisitionandProcessinghttp://sjcj.nuaa.edu.cnE⁃mail:sjcj@nuaa.edu.cnTel/Fax:+86⁃025⁃84892742基于知识表示向量的可解释深度学习模型及其疾病预测应用徐鹤1,2,郑群力1,2,谢作玲3,程海涛1,2,李鹏1,2,季一木1,2(1.南京邮电大学计算机学院/软件学院/网络空间安全学院,南京210023;2.江苏省高性能计算与智能处理工程研究中心,南京210023;3.东南大学附属中大医院内分泌科,南京210009)摘要:近年来,深度学习方法广泛应用于各种疾病预测任务,甚至在其中一些方面超过了人类专家。然而,算法的黑盒性质限制了其临床应用。对此,本文结合知识表示学习和深度学习方法构建了一种融入知识表示向量的可解释深度学习模型。该模型首先依据体检指标正常范围构建体检指标与检测值之间的关系图,并通过基于知识表示学习的深度学习模型对人体体检指标与检测值关系图进行编码,然后将患者体检数据表示为向量,输入到构建的自注意力机制和卷积神经网络构建的分类器中来实现疾病预测。将模型应用于糖尿病预测实验中,其准确率和召回率均优于对比的机器学习方法。与表现较优的随机森林算法相比,模型的准确率和召回率分别提升了0.81%和5.21%。实验结果表明,通过可解释性方法将知识表示学习和深度学习技术融合应用于糖尿病预测,可以达到对糖尿病的早期发现与辅助诊断的目的。关键词:疾病预测;知识表示学习;深度学习;自注意力机制;卷积神经网络;可解释性中图分类号:TP391文献标志码:AInterpretableDeepLearningModelBasedonKnowledgeRepresentationVectorsandItsApplicationinDiseasePredictionXUHe1,2,ZHENGQunli1,2,XIEZuoling3,CHENGHaitao1,2,LIPeng1,2,JIYimu1,2(1.SchoolofComputerScience/SchoolofSoftware/SchoolofCyberspaceSecurity,NanjingUniversityofPostsandTelecommunications,Nanjing210023,China;2.JiangsuHPCandIntelligentProcessingEngineerResearchCenter,Nanjing210023,China;3.DepartmentofEndocrinology,ZhongdaHospitalSoutheastUniversity,Nanjing210009,China)Abstract:Inrecentyears,deeplearningmethodshavebeenwidelyappliedtovariousdiseasepredictiontasks,evensurpassinghumanexpertsinsomeaspects.However,thebla...