温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
分数
基音
延迟
动态
搜索
语音
算法
田晖
第 1 期2023 年1 月电子学报ACTA ELECTRONICA SINICAVol.51 No.1Jan.2023基于分数基音延迟动态搜索的语音隐写算法田晖1,2,3,严艳1,2,3,汤莉莉2,3,4,吴俊彦1,2,3,王慧东1,2,3,全韩彧1,2,3(1.华侨大学计算机科学与技术学院,福建厦门 361021;2.厦门市数据安全与区块链技术重点实验室,福建厦门 361021;3.福建省大数据智能与安全重点实验室,福建厦门 361021;4.华侨大学机电及自动化学院,福建厦门 361021)摘要:论文提出了一种基于分数基音延迟动态搜索的语音隐写算法.该算法可根据隐藏容量(x比特/子帧)的需要将分数基音延迟候选值集合划分为2x个子集,每个子集代表不同的x比特信息.在闭环基音搜索过程中,可为每个子帧选择既能表示待嵌入隐秘信息且内插后的归一化相关系数最大的分数基音延迟候选值,从而有效降低隐写操作对于原始载体的影响.以目前IP语音系统中广泛使用的自适应多速率语音编码为例,对该算法从隐藏容量、不可感知性及抗检测性三方面进行了性能评估并与相关工作进行了对比分析.实验结果表明,本文提出的隐写算法较之现有基于基音延迟的隐写算法可在确保较高隐写容量的同时达到更好隐写安全性(即更好抗检测能力和不可感知性).关键词:语音隐写;动态搜索;分数基音延迟;自适应多速率语音编码;隐写安全性基金项目:国家自然科学基金(No.61972168)中图分类号:TP309文献标识码:A文章编号:0372-2112(2023)01-0067-09电子学报URL:http:/DOI:10.12263/DZXB.20211473Speech Steganography Based on Dynamic Search ofFractional Pitch DelayTIAN Hui1,2,3,YAN Yan1,2,3,TANG Li-li2,3,4,WU Jun-yan1,2,3,WANG Hui-dong1,2,3,QUAN Han-yu1,2,3(1.College of Computer Science and Technology,Huaqiao University,Xiamen,Fujian 361021,China;2.Xiamen Key Laboratory of Data Security and Blockchain Technology,Xiamen,Fujian 361021,China;3.Fujian Key Laboratory of Big Data Intelligence and Security,Xiamen,Fujian 361021,China;4.College of Mechatronics and Automation,Huaqiao University,Xiamen,Fujian 361021,China)Abstract:In this paper,we present a speech steganography algorithm based on dynamic search of fractional pitch delay.The algorithm can divide the candidate value set of fractional pitch delay into 2x subsets according to the needs of the covert capacity(x bits/subframe),where each subset represents different x bits of information.In the closed-loop pitch search process,the algorithm can select for each subframe the best candidate value of pitch delay that can not only denote the secret information but also make the interpolated normalized correlation coefficient largest.In this way,the impact of steganographic operations on the original carriers can be effectively reduced.Taking adaptive multi-rate speech codec widely used in the current Voice-over-IP systems as an example,the performance of presented algorithm has been evaluated from the aspects of covert capacity,imperceptibility and anti-detection,and compared with related works.Experimental results show that the proposed steganographic algorithm can achieve better steganography security(better resistance to detection and imperceptibility)than the existing steganographic methods based on pitch delay,while maintaining relatively high steganographic capacity.Key words:speech steganography;dynamic search;fractional pitch delay;adaptive multi-rate speech codec;steganographic securityFoundation Item(s):National Natural Science Foundation of China(No.61972168)1引言隐写术是利用人类的视听等器官的不敏感性,在数字媒介的冗余信息部分嵌入隐秘信息以实现信息隐藏的一种安全技术13.相较于传统加密技术,隐写术不仅保护了隐秘消息的内容,而且掩盖了其存在性,从而大大提高了信息传输和存储的安全性35.近年来,收稿日期:2021-11-01;修回日期:2022-09-02;责任编辑:李勇锋电子学报2023 年隐写术已从最初以图像为载体发展至几乎所有的多媒体69.随着 IP 语音(Voice over Internet Protocol,VoIP)技术的快速发展和日益普及,以VoIP为载体的隐写成为了信息隐藏领域的一个新兴分支2,3,6,10.为了实现语音信号的快速传输,VoIP通常采用语音压缩编码对语音信号进行压缩.代数码本激励线性预测(Algebraic Code-Excited Linear Prediction,ACELP)是 目 前 大 多 数 低 速 率 语 音 压 缩 编 码 标 准(如G.723.111,G.72912和Adaptive Multi-Rate13等)所采用的典型编码算法.它主要通过线性预测分析、自适应码本搜索和固定码本搜索三部分提取模型参数13,其中,线性预测分析的主要功能是获得线谱对频率的索引;自适应码本搜索通过基音分析获得基音延迟索引和基音增益索引;固定码本搜索则是为了获得固定码本索引和固定码本增益.相应地,以ACELP编码算法为基础,现有的语音隐写算法主要围绕三类典型的特征参数进行展开,即线性预测系数(Linear Prediction Coefficient,LPC)10,14,15、固 定 码 本(Fixed CodeBook,FCB)1618和 基 音 延 迟(Pitch Delay,PD)1924.在ACELP编码中,准确可靠地预测并提取基音周期对语音的分析合成至关重要,直接影响到合成语音是否能够真实再现原始语音信号.然而,由于基音周期的变化幅度较大,并且受到说话人的声带特性和背景噪声等因素的影响,因而基音周期预测(也称为基音检测)很难取得非常精准的结果20,22,23.从这个意义上来说,基于自适应码本搜索得到基音延迟参数其实是对于基音周期的近似预测,其误差难以避免.正是基音周期的这种“测不准”的特性为信息隐藏提供了可能性对基音延迟进行适当的改动不会对语音质量构成较大影响.因此,基音延迟被视作语音帧上的主要隐写域之一,并涌现了许多有效的隐写算法.代表性的工作如,余迟等19提出了一种基于Adap-tive Multi-Rate Wideband(AMR-WB)语音编码的整数基音延迟隐写算法,它预先筛选出与前后相邻子帧不同的整数基音延迟对应的子帧,然后在筛选出的子帧中采用模除隐藏法选择能够表示秘密信息的候选整数基音延迟构成搜索集合,并从中搜索最大的候选整数基音 延 迟 来 实 现 隐 写;Huang 等20提 出 了 一 种 基 于G.723.1语音编码的整数基音延迟参数隐写算法,该算法首先根据奇偶性划分整数基音延迟搜索范围,并通过在闭环基音搜索过程中根据隐秘信息的奇偶性从对应集合中搜索最优整数基音延迟来实现隐写;严书凡等21提出了一种基于G.723.1语音编码的整数基音延迟双层隐写算法,该算法先采用和Huang等人类似的算法在第二和第四子帧的整数基音延迟实现第一层隐写,并进一步利用搜索集合内整数基音延迟取值的任意性限制第四子帧的基音搜索范围实现第二层隐写,有效降低了隐写失真,从而取得了比Huang等人算法更好的不可感知性.刘程浩等22提出了一种基于G.729a语音编码的基音延迟隐写算法,该算法在整数基音延迟上采用和Huang等类似的嵌入算法,而在分数基音延迟上将搜索范围划分为零和非零的搜索区间以分别代表隐秘信息中的“0”和“1”,并通过在对应区间搜索最优分数基音延迟来实现隐写.吴志军等23提出了一种基于G.723.1语音编码的整数基音延迟参数隐写算法,该算法利用整数基音延迟的奇偶性表示隐秘信息,并结合矩阵编码在第一、第三和第四子帧的整数基音延迟参数上嵌入隐秘信息,可实现两比特隐秘信息嵌入而仅改动最多一个参数.作为对抗技术,基于基音延迟的语音隐写分析(隐写检测)近年来也受到了广泛关注.如Ren等人25提出了基于整数基音延迟二阶差分特征的隐写分析算法;Tian等26结合整数基音延迟的奇偶特性和二阶差分特性设计了基于混合统计特征的隐写分析算法;Liu等27分析了隐写前后整数基音延迟的奇偶性变化,提出了基于奇偶贝叶斯概率的隐写分析算法等.这些隐写分析算法均能有效检测现有的基于整数基音延迟的隐写算法.因此,如何提高基于基音延迟隐写算法的抗检测性能是一个亟待解决的关键问题.事实上,基音延迟不仅包括整数基音延迟还包括分数基音延迟,且分数基音延迟在整个基音延迟中所占的比例要小得多.例如,某个基音延迟值为9416,其中整数基音延迟是94,分数基音延迟是16,而后者在整个基音延迟中所占比例不到0.18%,因此,对分数基音延迟的适当修改不会给基音周期预测造成显著的影响.鉴于此,Liu等24提出了一种基于分数基音延迟的隐写算法,它通过分数基音延迟最低有效位的替换来实现信息隐藏.同时该算法还引入了部分相似度来衡量隐秘信息和分数基音延迟的相似性,只在相似度达到特定阈值的分数基音延迟上嵌入信息以减少替换操作带来的失真.此外,考虑到编码过程中分数基音延迟的改变会引起少部分整数基音延迟的变化,该算法采用了整数基音延迟覆盖策略,通过对语音进行两次编码操作,第一次编码用于保存整数基音延迟,第二次编码实现分数基音延迟的替换隐写,并且用第一次编码保存的整数基音延迟