基金项目:国家自然科学基金(61972016);国家重点研发计划项目(2020YFF0304100);中国博士后科学基金(2021M692400);江苏省自然科学基金(BK20201479);中国铁道科学研究院集团有限公司重点项目(2021YJ183)收稿日期:2021-02-25修回日期:2021-03-07第40卷第2期计算机仿真2023年2月文章编号:1006-9348(2023)02-0177-04基于卷积神经网络的火车站语音情感识别方法彭凯贝1,孙小明2,陈皓炜2,王建荣2,3(1.中国铁道科学研究院集团有限公司电子计算技术研究所,北京100081;2.山西大学数学科学学院,山西太原030006;3.天津大学智能与计算学部,天津300072)摘要:近年来,卷积神经网络在图像、文本、语音分类等领域广泛使用,但现有的研究大多忽视了特定场所下语音情感识别的性能。针对上述问题,提出一种基于卷积神经网络(CNN)的火车站语音情感识别模型。模型首先提取每条语音的梅尔倒谱系数(MFCC)特征,然后把提取的特征矩阵送到卷积神经网络训练,最后由网络输出每个语音的所属类别。此外在模型的输出层加入了置信度的设置,认为每一条语音属于某类别的概率大于90%则是可信的,否则不可信。实验结果表明,与循环神经网络(RNN)和多层感知器(MLP)相比,上述模型准确率更高。所提出的方法为深度学习技术在语音情感识别中的应用及火车站等场所危险情况的预警提供了一定的借鉴。关键词:深度学习;语音情感识别;卷积神经网络;梅尔频率倒谱系数中图分类号:TP391.9文献标识码:BRailwayStationSpeechEmotionRecognitionBasedonConvolutionalNeuralNetworkPENGKai-bei1,SUNXiao-ming2,CHENHao-wei2,WANGJian-rong2,3(1.InstituteofComputingTechnology,ChinaAcademyofRailwaySciencesCorporationLimited,Beijing100190,China;2.SchoolofMathematicalSciences,ShanxiUniversity,TaiyuanShanxi030006,China;3.CollegeofIntelligenceandComputing,TianjinUniversity,Tianjin300072,China)ABSTRACT:Inrecentyears,convolutionalneuralnetworkshavebeenwidelyusedinimage,text,speechclassifi-cationandotherfields,butmostoftheexistingresearchesignorestheperformanceofspeechemotionrecognitioninspecificplaces.Tosolvethisproblem,thispaperproposesaspeechemotionrecognitionmodelbasedonConvolutionalNeuralNetwork(CNN).ThemodelfirstextractstheMelCepstralCoefficient(MFCC)featureofeachspeech,andthensendstheextract...