温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
信号
增强
机器人
远距离
语音
识别
仿真
卢丽萌
收稿日期:作者简介:卢丽萌(),女,福建漳州人,本科,讲师,研究方向:人工智能 辽宁大学学报 自然科学版第 卷 第 期 年 基于微信号增强的机器人远距离语音识别仿真卢丽萌(福州理工学院 计算与信息科学学院,福建 福州)摘 要:由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果 为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究 首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复 在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的 频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别 仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了以上,与对照组相比具有更好的识别效果关键词:微信号增强;远距离;语音识别;谱减法;功率谱;梅尔三角滤波器组;频谱参数;梯度下降算法中图分类号:文献标志码:文章编号:()(,):,DOI:10.16197/ki.lnunse.2023.01.009 ,:;引言随着现代信息技术的不断发展,智能设备的研发以及使用都达到了前所未有的高度 为了便捷化地使用与控制机器人,语音识别功能开始在设备中得到广泛应用 针对语音识别的研究也受到了越来越多的关注 影响语音识别效果主要的因素就是音频中的噪声,此外外界环境的噪声也是影响因素之一,特别当音源与机器人之间的距离相对较远时,语音信号的强度受到影响,此时噪声的干扰作用也将更加明显 为此,展开相应的语音识别研究是十分必要的 信号增强技术作为一种信号信息放大的手段,将其应用到复杂环境的机器人语音识别中,具有巨大的开发空间 本文提出基于微信号增强的机器人远距离语音识别仿真研究,拟在试验测试中分析验证在不同环境条件下设计方法的识别效果 通过本文的研究,以期为相关设备的语音识别效果提升带去有价值的参考 基于谱减法的微信号增强处理机器人在进行语音识别的过程中,受距离因素的影响,目标信号的强度相对较弱,导致其识别率下降,为此,本文首先采用谱减法对语音数据中的微信号进行增强处理假设无噪声的纯净语音信号用符号()表示,()表示服从均值为 高斯分布的噪声信号,那么则有()()()()其中,()表示带有噪声的语音信号 此时,三者的功率谱密度分布情况之间的关系为()()()()在稳定距离上,机器人接收到的语音信号中噪声功率谱具有一定的稳态属性,因此本文忽略平稳噪声功率谱的变化,在此基础上就可以估计出噪声的功率谱,那么则有()()()()考虑到在具体的计算过程中,可能会出现功率谱值为负数的情况,因此,当()()时,本文令纯净语音信号的功率谱(),此时的谱减计算方式为 第 期 卢丽萌:基于微信号增强的机器人远距离语音识别仿真()()(),()(),()()()结合式(),语音数据中微信号增强处理方式如图 所示图 基于谱减法的语音微信号增强方式示意图按照图 所示的方式,利用快速傅里叶变换(,)处理信号,并对各个相位信号进行差异化赋权,之后与去噪功率谱进行拟合,完成对信号相位的恢复,最后再经过快速傅里叶逆变换(,)处理,得到语音信号强度更高的语音数据 其中,相位信号进行差异化赋权以对应的高斯分布情况为基础进行,具体的计算公式为()()()其中:表示 相位信号的赋权结果;表示信号带宽;()表示 相位信号所在区间与横坐标之间形成的空间面积;表示语音信号自身的掩蔽系数 机器人远距离语音识别 语音识别特征参数提取每个人的声音在直观听觉时会存在一定的差异,这是因为语音信号的频率和幅度不同,所以每个人的声音听起来会不同 结合这一属性,本文分别以 频率和语音频率 之间的关系作为语音识别特征参数,其具体的计算公式为()()()其中:表示增强处理后语音信号的频率参数,即增强处理后语音信号的 频率基于式(),本文在实施语音识别特征参数提取过程中,首先对增强后的语音信号进行加窗分帧操作,由此将原始的语音信号分解为若干个独立的语音帧,上述处理过程可以表示为()()()其中:()表示分解得到的各语音帧的时域信号;表示分帧窗的数量;表示分帧窗的尺度大小;表示分解后的语音帧数量在此基础上,本文采用 变换计算语音信号的频谱参数,计算公式为()()()其中:()表示 变换后得到的语音信号频谱根据式()中的参数信息,需要分别计算出 频谱和线性频谱,为此,本文将()线性频谱转换为 频谱 首先根据其结果计算得出频率幅度,再将其输入到带有 个带通滤波器的梅尔三角滤波器组中,输出语音信号每帧的对数 频谱参数,其计算公式为 辽宁大学学报 自然科学版 年 ()()()()其中:()表示语音信号每帧的对数 频谱参数;()表示带通滤波器的中心频率;表示信号数据梅尔三角滤波器组的频率(滤波器的采样频率);表示滤波器组频率最小值;表示滤波器组频率最大值在此基础上,将式()中的参数代入到式()中,即可实现对语音识别特征参数的提取 语音识别特征匹配 节中提取到的语音特征参数,本文将对语音内容进行匹配及准确识别 上述过程将采用梯度下降算法进行计算首先,计算出当前信号特征的损失函数梯度,其计算公式为()()()其中:表示语音信号特征的损失函数梯度;()表示以基准参量 为目标的损失函数在此基础上,计算出当前信号识别特征梯度下降的距离,其计算公式为 ()其中:表示当前信号识别特征的梯度下降距离;表示单位步长 按照式()计算各语音帧的时域信号梯度下降距离的阈值 其计算公式为 ()其中:表示各语音帧时域信号特征整体梯度下降距离;表示梯度下降过程的阈值 根据该数值,将 (表示最小梯度下降距离)对应的语音内容作出识别结果,由此实现机器人对语音的识别 仿真测试与分析本文将进一步采用仿真分析验证所提出的基于微信号增强的机器人远距离语音识别的效果 在此基础上,分别采用文献中设计的以列文伯格 马奈尔特法 反向传播()神经网络为基础的机器人语音识别方法,文献中设计的以 为基础的机器人语音识别方法作为测试的对照组 根据 种不同方法对比分析本文设计方法的识别效果 测试环境设置本文以某智能机器人的控制系统为测试对象,其模块构成主要分为语音识别模块、图形用户界面(,)人机交互模块以及控制模块 本文主要针对语音识别模块进行仿真分析 在机器人控制系统运行期间,语音识别模块会将识别到的语音命令发送至 模块,在接收到对应的信号后,会将语音命令转化为控制模块可执行的动作控制命令,通过这样的方式,实现对机器人的有效控制 本文在 平台上对不同识别技术实施仿真测试 其中,测试模块部署在 的 上,语音识别模块部署在 的 上 实验数据准备首先,在静音室采集 个说话者的语音信息,对应的男女比例为,采集过程中,说话者与数 第 期 卢丽萌:基于微信号增强的机器人远距离语音识别仿真 据采集装置之间的距离为 ,同时分别采集了电动机和风扇所产生的噪声,采用语音融合方式分别按照、的信噪比在纯净的语音数据中添加噪声,完成对数据的准备并将其作为训练数据 在此基础上,对男性测试音频的准备包括男低音()、男基准音()、男中音()以及男高音()同样,对女性测试音频的准备包括女低音()、女基准音()、女低音()以及女高音()同时差异化了噪音频率设置,分别为、由此构成的测试组数据共计 条 测试结果在上述测试环境的基础上,本文首先测试在 条件距离下,按照 的信噪比分别在语音信息中混入频率为、的噪声,测试机器人识别语音内容的识别效果,次测试的平均结果如表 所示表 不同噪声频率下机器人的语音识别率对比噪声频率 神经网络识别率 识别率 本文识别率 从表 中可以看出,对比 种方法的识别结果,神经网络识别方法在语音数据中的噪声频率低于 时,对内容的识别率可以达到 以上,但是当噪声频率在 以上时,其识别率的下降幅度较为明显 识别方法表现出与 神经网络识别方法相似的属性特征,并且当噪声频率在 以上时,其识别效果受到的影响更加明显,例如噪声频率为 时的识别率仅为 相比之下,本文设计方法的识别率虽然也在一定程度上表现出了随着噪声频率的增加逐渐下降的趋势,但是整体下降幅度较小,当噪声频率在 时,识别率为,当噪声频率在 时,其识别率为 测试结果表明,本文设计方法可以在远距离条件下实现对高频噪声语音的有效识别结合表 中的测试结果可看出,为相对临界的噪声,因此,本文以此为基础,分别测试了在距离为 条件下,分别按照,、的信噪比在语音数据中混入 噪音,测试不同方法的识别效果,次测试的平均结果如表 所示表 不同信噪比下机器人的语音识别率对比信噪比 神经网络识别率 识别率 本文识别率 辽宁大学学报 自然科学版 年 结合表 中的测试结果可以看出,神经网络识别方法的识别率受音频中信噪比的影响较为明显,当信噪比为 时,其识别率仅为 ,随着信噪比的上升,识别率最大值达到了 识别方法也表现出了系统的属性特征,且受信噪比的影响更加突出,对信噪比为 和 的语音内容的识别率差值达到了,并且当信噪比达到 时,其识别率下降到了 以下 相比之下,本文设计识别方法并未明显受到语音数据信噪比的影响,信噪比为 和 的语音内容识别率分别为 和,均达到了 以上,具有良好的识别效果最后,结合表 和表 的测试结果,本文按照 的信噪比在语音中混入了频率为 的噪音,分别在 、的距离上测试不同方法下机器人的识别效果,次测试的平均结果如表 所示表 不同距离下机器人的语音识别率对比测试距离 神经网络识别率 识别率 本文识别率 结合表 中的数据可以看出,神经网络识别方法和 识别方法的识别率均表现出随着测试距离的增加而下降的趋势,当测试距离为 时,二者的识别率分别为 和 ,与测试距离为 时的结果相比,下降幅度分别达到了 和 相比之下,本文设计方法的识别率始终稳定在 以上,识别率与测试距离之间并未表现出显著的差异 在测试距离由 增加至 的过程中,识别率的下降幅度仅为 仿真测试结果表明本文提出的基于微信号增强的机器人远距离语音识别方法具有良好的识别效果为了提高测试的全面性,在 背景噪声测试的基础上,选择方向大于 和依赖度低的点,弱化语音信号谐波成分能量,以此形成带状噪音环境 在非平稳噪声环境下,本文按照 的信噪图 不同距离下机器人语音识别率结果比分别在、的距离上测试不同方法下机器人语音识别率,次测试的平均结果如图 所示结合图 测试结果可知,随着距离的增加,机器人语音识别率均有所下降 但是,本文识别方法可以保持在 的识别率,而 神经网络识别方法和 识别方法的识别率为 和 这是因为本文识别方法利用 有效去除噪声,恢复信号相位,增强语音数据中微信号,提升语音识别特征参数提取效果,可以有效抵抗带状噪音环境干扰 由此表明,本文提出的基于微信号增强的机器人远距离语音识别方法适用性较强 第 期 卢丽萌:基于微信号增强的机器人远距离语音识别仿真 结束语智能机器人在人们日常生产和生活中的应用越来越广泛,逐渐发展成了辅助生活、办公甚至是生产的重要设施之一 语音识别功能大大提高了对智能机器人控制的便捷性,对于促进其应用范围的进一步拓展具有极为重要的作用 本文提出基于微信号增强的机器人远距离语音识别仿真研究,充分考虑了由于空间距离带来的语音识别干扰因素,通过对微信号进行增强处理,大大提高了机器人在不同环境下对语音内容的识别率 通过本文的研究,希望可以为智能设备语音识别功能的进一步优化提供有价值的参考参 考 文 献:赵力瑾,高攀 基于连续隐马尔科夫模型的英语翻译机器人语音识别系统 自动化与仪器仪表,():,胡登峰,黄紫微,冯楠,等 关键核心技术突破与国产替代路径及机制:科大讯飞智能语音技术纵向案例研究 管理世界,():聂承启,李增,左少华,等 基于 和 的楼宇智能巡检机器人 自动化技术与应用,():,唐明磊,张文鹏,姜卫东,等 基于多分辨率显著性滤