电子设计工程ElectronicDesignEngineering第31卷Vol.31第6期No.62023年3月Mar.2023收稿日期:2021-12-21稿件编号:202112131作者简介:张可欣(1999—),女,江苏徐州人,硕士研究生。研究方向:人工智能、语音情感识别。语音情感识别广泛应用于教育行业、服务行业、辅助驾驶行业以及刑事侦查行业。不仅国内人们对语音情感识别展开深入的研究,语音情感识别在国外也受到了重视[1-3]。1997年,麻省理工大学的教授提出了“情感计算”的概念[4]。前人在语音特征值的选择与提取、去除冗余特征、语音情感数据库的选择以及构建分类器方面实现了很大的进展。然而,跨语言的语音情感识别准确率低,还有待于提高。语言的差异,会导致识别率较低。为了解决这一个问题,ZhengWL提出的使用一种用于跨语料库多时话域自适应的多尺度差异对抗网络方法[4],文献[5]提融合多种语言的语音情感识别张可欣,刘云翔(上海应用技术大学计算机科学与信息工程学院,上海201418)摘要:由于语言的差异,提高跨语言情感数据库识别语音情感的准确度,仍然是一项难题。该文针对语言差异这一难题,融合了语音情感识别技术和自然语言处理技术。该文选取Berlin语音情感数据库和CASIA语音情感数据库,从两个数据库中分别挑选200条语音,选用开源API下的GoogleSpeech,实现语音文本的转化。使用机器翻译方法,将语言转化为文本,统一翻译成中文。利用自然语言处理的词法分析、句法分析、LSA的关键词提取算法,提取出表达情感的关键词。对于被提取出来的关键词,使用SpeechLib工具包将提取过特征值的文本转化成语音,提取MFCC特征,构建DNN+BLSTM模型,实现语音情感的分类。实验结果表明,文中使用的方法未加权平均召回率(UAR)和加权平均召回率(WAR)分别为48.22%和56.5%,相比其他方法,UAR和WAR分别提高了4%和8%。关键词:语音情感识别;自然语言处理;跨语言的语音情感识别;语音文本转化;LSA关键词提取算法中图分类号:TN0文献标识码:A文章编号:1674-6236(2023)06-0025-05DOI:10.14022/j.issn1674-6236.2023.06.006SpeechemotionrecognitionintegratingmultiplelanguagesZHANGKexin,LIUYunxiang(SchoolofComputerScienceandInformationEngineering,ShanghaiInstituteofTechnology,Shanghai201418,China)Abstract:Aimingattheproblemoflanguagedifferences,thispaperselectedBerlinvoiceemotiondatabaseandCASIAvoiceemotiondatabase,selected200voicesrespectiv...