计算机测量与控制.2023.31(3)ComputerMeasurement&Control测试与故障诊断·56·收稿日期:2022-07-31;修回日期:2022-09-07。作者简介:刁旭炀(1995-),男,上海奉贤人,工程师,硕士研究生,主要从事软件工程和机器学习方向的研究。引用格式:刁旭炀,吴凯,陈都,等.基于混合注意力机制的软件缺陷预测方法[J].计算机测量与控制,2023,31(3):56-62,70.文章编号:1671-4598(2023)03-0056-07DOI:10.16526/j.cnki.11-4762/tp.2023.03.009中图分类号:TP3文献标识码:A基于混合注意力机制的软件缺陷预测方法刁旭炀,吴凯,陈都,周俊峰,高璞(上海机电工程研究所,上海201109)摘要:软件缺陷预测技术用于定位软件中可能存在缺陷的代码模块,从而辅助开发人员进行测试与修复;传统的软件缺陷特征为基于软件规模、复杂度和语言特点等人工提取的静态度量元信息;然而,静态度量元特征无法直接捕捉程序上下文中的缺陷信息,从而影响了软件缺陷预测的性能;为了充分利用程序上下文中的语法语义信息,论文提出了一种基于混合注意力机制的软件缺陷预测方法DP-MHA(defectpredictionviamixedattentionmechanism);DP-MHA首先从程序模块中提取基于AST树的语法语义序列并进行词嵌入编码和位置编码,然后基于多头注意力机制自学习上下文语法语义信息,最后利用全局注意力机制提取关键的语法语义特征,用于构建软件缺陷预测模型并识别存在潜在缺陷的代码模块;为了验证DP-MHA的有效性,论文选取了6个Apache的开源Java数据集,与经典的基于RF的静态度量元方法、基于RBM+RF、DBN+RF无监督学习方法和基于CNN和RNN深度学习方法进行对比,实验结果表明,DP-MHA在F1值分别提升了16.6%、34.3%、26.4%、7.1%、4.9%。关键词:软件缺陷预测;语法语义信息;静态度量元;多头注意力机制;全局注意力机制MethodofSoftwareDefectPredictionBasedonMixedAttentionMechanismDI...