分享
基于频域自适应动态压缩器的齿音抑制算法_陈锦辉.pdf
下载文档

ID:2643169

大小:1.61MB

页数:4页

格式:PDF

时间:2023-08-20

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 自适应 动态 压缩器 齿音 抑制 算法 陈锦辉
2023年第47卷第4期72语 音 技 术语 音 技 术oice TechnologyV文献引用格式:陈锦辉.基于频域自适应动态压缩器的齿音抑制算法 J.电声技术,2023,47(4):72-74,85.CHEN J H.Tooth sound suppression algorithm based on frequency domain adaptive dynamic compressorJ.Audio Engineering,2023,47(4):72-74,85.中图分类号:TP393 文献标识码:A DOI:10.16311/j.audioe.2023.04.020基于频域自适应动态压缩器的齿音抑制算法陈锦辉(福建星网智慧科技有限公司,福建 福州 530002)摘要:在免提通话系统中,当语音中含有“z,c,s,zh,ch,sh”等嘶嘶作响的声母时,气流在唇齿间摩擦产生齿音,这种刺耳的齿音会分散听者的注意力并导致听觉疲劳,最终影响通话体验。为了解决这一问题,基于动态压缩器提出了一种基于频域自适应压缩器的齿音抑制算法。该算法将语音信号从时域转换到频域,并将其划分为 10 个子频带。每个子频带分别经过自适应白化和动态压缩处理,以减弱齿音所在频段的能量。实验结果表明,相比于均衡器,基于频域自适应动态压缩器的齿音抑制算法在齿音的识别和抑制强度方面表现更优,同时对无齿音的时段和频段没有抑制作用,降低了语音的响度衰减。关键词:齿音抑制;动态压缩器;自适应白化Tooth Sound Suppression Algorithm Based on Frequency Domain Adaptive Dynamic CompressorCHENJinhui(FuJianI-StarTechnologyCo.,Ltd.,Fuzhou350002,China)Abstract:Inthehands-freecommunicationsystem,whenthevoicecontainshissinginitialssuchas“z,c,s,zh,ch,sh”,theairflowrubsbetweenthelipsandteeth,whichwilldistractthelistenerandleadtohearingfatigue,andultimatelyaffectthecommunicationexperience.Inordertosolvethisproblem,basedonthedynamiccompressor,atoothsoundsuppressionalgorithmbasedonthefrequencydomainadaptivecompressorisproposed.Thealgorithmtransformsthespeechsignalfromtimedomaintofrequencydomainanddividesitinto10sub-bands.Eachsub-bandissubjectedtoadaptivewhiteninganddynamiccompressiontoweakentheenergyofthefrequencybandwherethetoothsoundislocated.Theexperimentalresultsshowthat,comparedwiththeequalizer,thetoothsoundsuppressionalgorithmbasedonfrequencydomainadaptivedynamiccompressorperformsbetterintheidentificationandsuppressionintensityoftoothsound,andhasnosuppressioneffectontheperiodandfrequencybandwithouttoothsound,whichreducestheloudnessattenuationofspeech.Keywords:toothsoundsuppression;dynamiccompressor;adaptivewhitening0 引 言齿音抑制是一种减少语音信号中嘶嘶声的技术1。在免提通话系统中,通常采用时域均衡器来近似补偿信号频谱,以降低 2 6 kHz 频段的能量,从而实现去除齿音的效果。然而,时域均衡器所执行的重加权并非根据信号的频谱特征,而是在频率上以固定方式重新加权频谱,因此在没有齿音存在的语音中,2 6 kHz 频段的能量同样会被降低,从而降低了语音的高频清晰度,并减弱了响度。为了改善这个问题,提出使用动态压缩器的方法,将超过固定阈值的输入信号电平映射到较小的输出电平2。由于齿音也存在于较低电平上,通过增大压缩率同样会导致清晰度下降和响度减弱的现象。VALIN J M3提出使用深度学习来增强语音的方法,但是其计算量巨大,对桌面话机的硬件不友好。本文基于动态压缩器的原理,提出一种基于频域自适应压缩器的齿音抑制算法。该算法由子频带自适应白化4和频域动态压缩器组成,通过相对阈值进行控制,实现了自适应的齿音抑制,能够自动检测嘶嘶声的频率,并对各种扬声器进行实时 处理。2023年第47卷第4期73Voice TechnologY语 音 技 术语 音 技 术1 算法设计基于动态压缩器并借鉴相关规范5,在频域上将信号划分为 10 个子频带,各子频带的中心频率为 0 Hz、250 Hz、500 Hz、1 000 Hz、1 500 Hz、2 000 Hz、3 000 Hz、4 000 Hz、6 000 Hz以及8 000 Hz。基于频域自适应动态压缩器的齿音抑制算法框架如图 1 所示。在每个子频带中,计算能量并进行自适应白化处理,将能量幅值映射到 0 1 的范围内,然后进行动态压缩处理,减弱齿音所在子频带的能量,最后还原回时域语音信号,完成对齿音的抑制。频带划分FFTIFFTXa(,k)Xp(,k)N=512N=512x(n)y(n)|2|2|aa白化Ess-DRC图 1 基于频域自适应动态压缩器的齿音抑制算法框图1.1 子频带自适应白化参考 DSL-V5 的频带划分6,使用三角形频带将频谱划分为 10 个子频带,并计算每个子频带的能量和,这样既降低了计算复杂度,又符合人耳对于“低频密集、高频稀疏”的听觉特点。对每个子频带的能量和进行自适应白化处理,需遵循 3 个原则:第一,考虑到实时性需求,能量和的重加权只依赖于过去帧的能量和峰值;第二,为了更好地应对音频实时动态变化,峰值随时间呈指数衰减,即过去的峰值会逐渐减小;第三,为了防止峰值过低导致噪声(如量化噪声)被过度放大,在算法中添加了一个下限参数,确保峰值不会下降到低于该下限值。迭代算法的表达式为()()()()1max|,0max|,0nnnnBkr mPknP kBkrn|=|(1)式中:m 表示记忆系数,r 表示下限阈值,Bn(k)表示帧索引为 n、频带索引为 k 处的频谱能量和,Pn(k)表示帧索引为 n、频带索引为 k 处的峰值。为了方便起见,可以根据短时傅里叶变换(Short Time Fourier Transform,STFT)的帧速率和期望的 60 dB混响时间(即峰值衰减 60 dB 所需的时间)来计算记忆系数。1.2 动态压缩器各子频带经过自适应白化后,将系数从线性域转换为对数域,并作为动态压缩的输入,即xdB,n(k)=10lgBn(k)(2)将 xdB,n(k)与阈值 T(k)进行比较,高于阈值的系数将被缩小,低于阈值的系数保持不变。压缩率为R(k)=T(k)和 R(k)=1 时的滤波器曲线如图 2 所示。输入R(k)=T(k)R(k)=1输出图 2 向下压缩器滤波器曲线向下压缩器的函数表达式为()()()()()()()()()()()()()()()()()()()()1,2,max|,0max|,0,2112,222,2nnnndB ndB ndB ndB nsc ndB ndB ndB nBkr mPknP kBkrnxkxkT kWRxkT kWxkWgkT kWxkT kWxkT kT kxkT kWR|=|+|=+|+|()()()()()()()()()()()()()()()()()()()(),2,2112,222,2dB ndB ndB ndB ndB ndB ndB nxkxkT kWRxkT kWxkWT kWxkT kWxkT kT kxkT kWR+|+|+|(3)式中:T(k)表示频带索引k处的阈值,W表示软拐点,R 表示压缩率,gsc,n(k)表示子频带加权系数。通过线性插值,将子频带加权系数整合为整体的加权系数,并对频谱进行重新加权,最后将加权后的频谱2023年第47卷第4期74语 音 技 术语 音 技 术oice TechnologyV转换回时域,完成对齿音的抑制。2 实验及分析桌面话机在免提场景下,录制中文句子“四是四,十是十,十四是十四”作为测试算法的数据集,包含 4 个“s”声母和 7 个“sh”声母,具有明显的嘶嘶声。麦克风具有线性频率响应,但在免提系统中,高通滤波器对低频部分进行了抑制,突出了嘶嘶声的存在。子频带自适应白化滤波器中,设置记忆系数 m=0.998 6,下限阈值 r=0.1,各子频带的动态压缩器采用相同的软拐点 W=5 和相同的压缩率 R=8,各子频带阈值设置为 0,0,0,0,0,0,0,-10,-20,10。本文算法对嘶嘶声的抑制效果如图 3 所示。从图 3 可以观察到,在嘶嘶声的范围内,所有手动标记的区域都被准确检测,并进行了抑制处理。而在无嘶嘶声的时段和 0 3 kHz 的频段,未受到任何影响。动态压缩导致整体均方根(Root Mean Square,RMS)响度下降约 0.51 dB。均衡器(Equalization,EQ)对嘶嘶声的抑制效果如图 4 所示。从图 4 可以观察到,在所有时段中,EQ 在 3 0.51.52.51.02.010-110-15 00005 00005 0000输入信号输出信号输入 频率/Hz输出 频率/Hz输入输出 频率差/Hz时间/s图 3 本文算法对嘶嘶声的抑制效果0.51.52.51.02.010-110-15 00005 00005 0000输入信号输出信号时间/s输入 频率/Hz输出 频率/Hz输入输出 频率差/Hz图 4 EQ 对嘶嘶声的抑制效果(下转第 85 页)2023年第47卷第4期85Sound BroadcastinG声 学 制 播声 学 制 播序,包括对潜在事故、火灾、意外泄漏等紧急情况进行评估,并为维护人员提供相应的培训、应急装置和标识,帮助工作人员迅速、有效地应对紧急情况的目标。台站需要定期组织设备维护安全培训,要求维护人员了解最新的安全要求,开展安全演练和检查,评估设备维护过程的合规性和有效性。当发生事故时,及时记录并进行调查,以确定事故原因,采取措施避免类似事件再次发生,不断提高设备维护的安全性和有效性。5 结 语高山电视转播台的设备日常维护与管理工作至关重要,具有积极的实践意义。相关责任人必须认清设备维护与管理的价值。在未来的建设和发展中,高山电视转播台的设备维护与管理仍旧是关键,要求工作人员从多个方面提出问题应对措施,取得良好的维护管理效果。参考文献:1刘永.加强广播电视台机房设备维护管理 J.中国设备工程,2021(5):83-84.2王磊.电视台设备维护存在的问题及解决对策 J.黑龙江科学,2019,10(19):130-131.3禹景龙.加强电视台机房设备维护管理的策略探讨 J.数码世界,2019(9):234.4赵伟.电视台设备维护管理的策略 J.电视技术,2019,43(17):63-64.5孙中超.广播电视台机房设备的管理与维护J.传媒论坛,2019,2(1):66-67.8 kHz 频段区域都进行了抑制处理。然而,在工程实现中,EQ 的滤波器阶数不会

此文档下载收益归作者所有

下载文档
猜你喜欢
你可能关注的文档
收起
展开