收稿日期:2022-08-11∗基金项目:《新时代高职院校教师教学能力提升途径研究》(203767);《“提质培优”背景下高职公共英语课程思政教学改革的研究》(22SKGH607)作者简介:涂琼引(1987-),女,重庆长寿人,本科,讲师。基于语音识别的英语翻译终端设计∗涂琼引,成南(重庆轻工职业学院,重庆401329)摘要:针对传统的英语翻译系统存在无法准确识别说话者语音和语气的问题。设计一个基于语音识别和语气语音合成的英语翻译系统,该系统终端主要包括语音识别、语言翻译、语气识别、语气转换和语气语音合成模块。基于CVAE语气语音合成模型对语音识别和语言翻译的英语语句进行语气语音合成,以进行便携式英语翻译终端设计与实现。实验表明,基于CVAE的语气语音合成模型合成语气语音的基频曲线与原始语音间的误差仅为0.02,两者基频曲线十分接近。且在主观评价方面,本模型的语音合成自然度MOS评分为3.84分,方差仅为0.004;情感语气一致性平均打分为3.72,方差为0.002。综合分析可知,本模型可取得较好的语音生成效果,生成语音具备多样性和准确性。系统应用发现,本模型在系统中可提升英语翻译系统终端的语音识别和语气语音合成效果,系统性能优越。关键词:语音识别;英语翻译;CVAE;系统终端;语气语音合成中图分类号:TP392文献标识码:ADOI编码:10.14016/j.cnki.1001-9227.2023.01.251TheDesignoftheEnglishTranslationTerminalBasedonSpeechRecognitionTUQiongyin,CHENGNan(ChongqingVocationalCollegeofLightIndustry,Chongqing401329,China)Abstract:InviewofthetraditionalEnglishtranslationsystem,thereistheproblemoflowspeechrecognitionaccuracy,flatoutputspeechandintonation,whichcannotaccuratelyexpressthetoneofthespeaker.AnEnglishtranslationsystembasedonspeechrecognitionandtonespeechsynthesisisproposed.Thesystemterminalmainlyincludesspeechrecognition,languagetranslation,tonerecognition,toneconversionandtonespeechsynthesismodule.Basedontheconditionalvariationalautoencoder(CVAE)tonespeechsynthesismodelforspeechrecognitionandlanguagetranslation,inordertodesignandre-alizetheportableEnglishtranslationterminal.TheexperimentshowsthattheerrorbetweenthebasefrequencycurveandtheoriginalspeechbasedonCVAEisonly0.02,andthetwobasefrequencycurvesareveryclose.Forsubjectiveevaluation,theMOSscoreofspeechsynthesisis3.84,andt...