温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
倒谱域提取基音信号分析研究
通信系统专业
倒谱域
提取
基音
信号
分析研究
通信
系统
专业
摘 要
人类在讲话时发出的一种别具一格的声音,被称之为语音。一系列的音汇聚成为语音,一系列的规则又控制着各个音的排列顺序。被称之为搭载特定模拟信号信息的的语音,是人们日常社会生产和生活中得到以及传播资讯的重要方式。为什么要处理语音信号的原因其实就是为了既能提取有效的信息还能在复杂的环境中做到这一点。
基音周期是语言信号的重要参数,因此也是语音激励源的特色所在,对描述其特征有重要作用。现阶段,该参数主要应用于指导听觉障碍人群、诊断发音系统方面的疾病、编码低码率语音以及语音识别等多个方面。其中语音识别与语音分析更是在许多行业得到应用。倒谱法被认为是一种比较成功的基音检测方法, 倒谱法作为信号处理的重要的方法之一,能够得到比较好的识别性能。
本毕业设计拟采用在倒谱域进行语音信号的基音提取和估算,从而了解语音信号的生成机理、掌握基音生成的概念和产生原理、掌握倒谱域提取基音信号的方法和过程。通过MATLAB仿真进行倒谱法基音检测以及简单的后处理,对仿真结果加以分析。最后能顺利检测提取到基音。
关键词:语音信号;基音周期;倒谱域
ABSTRACT
A distinctive sound that humans make when they speak is called phonology. A series of sounds converge into speech, and a series of rules control the order in which each sound is arranged. Speech, which is called as carrying specific analog signal information, is an important way for people to obtain and disseminate information in daily social production and life. And the reason why you want to deal with voice signals is because you want to be able to extract valid information and do that in complex environments.
To describe the important characteristics of speech excitation source, pitch period as one of the important parameters of speech signal must be necessary. Pitch cycle information is widely used in speech recognition, speaker recognition, speech analysis and synthesis, low bitrate speech coding, speech system disease diagnosis, language guidance for hearing impaired people and other fields. Cepstrum method is considered as a successful pitch detection method. As one of the important methods of signal processing, cepstrum method can get better recognition performance.
This graduation project intends to adopt pitch extraction and estimation of speech signal in cepstrum domain, so as to understand the generation mechanism of speech signal, master the concept and generation principle of pitch generation, and master the method and process of pitch extraction in cepstrum domain. MATLAB simulation is carried out to detect the fundamental sound of cepstrum method and simple post-processing, and the simulation results are analyzed. Finally, the pitch can be detected and extracted successfully.
Keywords:speech signal;pitch period;cepstrum domain
目 录
1 引言 1
1.1 课题研究背景及意义 1
1.2 本课题设计章节安排 2
2 语音信号的生成机理 3
2.1 语音的概念 3
2.2 发声器官 4
2.3 语音信号的数字模型 5
3 基音的概念和产生原理 10
3.1 基音的概念 10
3.2 基音的产生原理 10
3.3 基音周期的估算方法 11
4 倒谱域提取基音信号 14
4.1 语音信号的倒谱分析 14
4.2 倒谱法的基音检测及MATLAB仿真 16
4.3 MATLAB仿真结果分析 19
5 线性预测倒谱法 21
5.1 线性预测的基本原理 21
5.2 MATLAB仿真结果 22
6 结论 24
致谢 25
参考文献 26
附录 27
1 引言
1.1 课题研究背景及意义
语音是人与人之间交流的重要途径,也是识别不同个体的重要特征之一。随着信息技术的发展,语音技术也在不断创新和发展,语音与信息技术的结合实现了语音合成以及语音识别等多种功能。其中,语音合成技术是实现人与机器语音交流的重要内容,通过语音合成技术可以使机器人把信号转换成语音,实现了人与机器的对话,对机器人技术的发展有着十分重要的意义。
让机器像人一样说话,通过语音合成技术建立模型,将信息代码和不同的语言对应起来,在模型中编码发音规则,对这些信息进行编码和排序,将其转换成相应的发音单元,并根据语言的构成规则、语法以及停顿或者音节对这些发音单元的顺序进行适当的调整,从而得到相应的代码序列。从一定角度而言,这种按照一定顺序排列而成的代码系列也可以称之为言语码,这是实现机器人发音的基础条件。在此基础上,系统可以根据言语码以及编码的发音规则合成人的语言,主要通过语音合成器来实现。语音合成器犹如人脑中的神经命令, 能够根据言语码发出指令,通过电信号传输至发声器官,通过各个部位的协调发出对应的语音。
语音合成并不是近几年新提出的概念,事实上早就有学者对语音合成技术展开了研究,并且取得了一定的成果。现阶段,关于语音合成的研究有很多,应用的方法也十分多样,从这些研究方法的技术性入手可以将其分为规则合成法、参数合成法以及波形合成法。
基音周期作为语音的重要参数之一,对语音编码以及识别等技术有着十分重要的影响。与其他国家的语音相比,汉语难度比较大,发音也比较复杂,并且对语音语调的要求比较高。基音的变化就是声调,因此基音周期对汉语发音有重要的作用和影响,对辨别信息和发音有十分重要的意义,所以基音的提取和估算是一个非常重要的课题。
L.R .R等人在上世纪七十年代就意识到了基音周期的重要意义,并针对基音周期展开了讨论和研究,利用自相关函数法进行检测,这种方法的优点就是计算量比较小,并且具有较高的准确性,因此在多个领域得到广泛应用。
上世纪六十年代中后期,A.M .Noll通过一系列的分析提出检测的新算法,即倒谱法。与自相关函数法相比,倒谱法在检测语音信号方面具有更高的准确性,并且还有一定的抗干扰功能。不过由于倒谱法需要使用对数运算和傅立叶变换,所以对计算量的要求比较高,因此实用性不强。
后来,J.D等根据已有的检测算法进行改进,在上世纪七十年代初基于频域和时域的结合提出了SIFT,在保证检测准确性的同时有效减少了计算量。SIFT即简单逆滤波追踪法,通过逆滤波来削弱声道共振峰的作用,有效提高了基音信息的准确性。
两年后,M.J. Ross等人从时域入手展开研究和讨论,通过分析提出了新的语音检测法,即平均幅度差函数法。与其他检测方法相比,平均幅度差函数法的优点在于其运算量比较小,并且便于操作。具体而言,平均幅度差函数法只需要在时域上计算,并且以加减法为主,除法运算非常少,因此可以认为是最简单的语音信号检测方法。当然,平均幅度差函数法也存在一些不足,主要表现为容易产生倍基音以及半基音,仍然需要进一步的优化与调整。事实上,现阶段已经有很多学者对此展开研究,通过一系列分析提出改进的AMDF算法。
L. R.R等人在上世纪七十年代中后期对已有的语音信号检测法进行整理和比较分析,发现已有的检测方法都无法及时、准确反映语音信号的时变性,原因主要在于这些检测法都是基于一帧有超过两个基音周期,并且一帧内的语音信号平稳的假设。
S.K等人在上世纪九十年代初首次提出以小波变换为基础的语音信号检测方法,该方法的特点在于利用小波变换检测基音周期。具体而言,根据相邻两个尺度的小波变换局部最大值点和变换幅度判断清浊音,将浊音对应的局部最大值即为GO,基音周期即为相邻GO的距离。在小波变换基音周期检测法提出后,许多学者将小波变换作为入手点对基音周期检测展开讨论,提出了许多改进意见。此外,还有学者将其他检测方法与小波变换进行有机的结合,希望提高基音周期检测的准确性。
论文重点分析了语音信号的检测方法,通过对各种方法进行分析和讨论,找出该算法存在的不足,尤其是对倒谱法进行了深入的分析以及使用线性预测倒谱法的优化,并且模拟实现这些算法,旨在找到一种算法简单、准确性高并且具有较强的实用性和抗干扰能力。希望改进现有的语音信号检测方法,并将分通过改进实验算法,达到理想的基音检测效果。
1.2 本课题设计章节安排
本文以基音为研究对象,分析不同基音信号检测方法的特点并提出改进意见。论文主要有六个部分,各部分具体内容如下所示:
第一章为引言,介绍了论文的背景和研究目的,以及阐述本课题的设计方案思路。
第二章为语言信号的生成机理,主要是对语音的概念作基本的了解与解释,介绍语音信号的发声器官以及语音信号的几种数字模型。
第三章为基音的概念和产生原理,主要是对基音的概念、基音的产生原理作出阐述以及对几种不同的基音周期的估算方法进行介绍。
第四章为倒谱域提取基音信号,主要是讲解如何对语音信号进行倒谱分析,如何利用倒谱法进行基音检测并在MATLAB中完成仿真并对仿真结果加以分析。
第五章为线性预测倒谱法,主要是对上述倒谱法进行优化,讲述基本原理并作MATLAB仿真。
第六章为结论,对全文进行总结,并指出其中存在的问题和今后的改进方向。
2 语音信号的生成机理
2.1 语音的概念
语音是语言的重要部分,是语言的外部形式和物质外衣,它是一种符号体系,是最高效地记录大家思维活动的方式。如果有人说哪种声音具有社会意义,语音首当其冲的,因为在语言三个基本属性中它是第一的,这种人类发音器官发出的声音必须得以语音的形式出现。在这个世界上可以没有文字,但不能没有语音,它是决定语言的关键,撑起了整个语音。
因