分享
AVS浅压缩标准中的熵编码研究综述.pdf
下载文档

ID:2745071

大小:3.43MB

页数:5页

格式:PDF

时间:2023-11-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
AVS 压缩 标准 中的 编码 研究 综述
ression standardJ.Video205-208,225.IGITALVIDEO电视技重ideoEngineering数字视频文献引用格式:殷子悦,蔡江震,黄贺煜.AVS浅压缩标准中的滴编码研究综述 .电视技术,2 0 2 3,47(6):YIN Z Y,CAI JZ,HUANG H K.An overview of entropy coding in AVS lightweight compEngineering,2 0 2 3,47(6):2 0 5-2 0 8,2 2 5.中图分类号:TP311.5文献标识码:ADOI:10.16280/j.videoe.2023.06.052AVS浅压缩标准中的炳编码研究综述殷子悦,蔡江震,黄贺煜(福州大学物理与信息工程学院,福建福州350108)摘要:介绍AVS浅压缩标准整体框架,聚焦标准中的滴编码部分,对炳编码算法进行详细分析,指出其未来技术发展方向。关键词:浅压缩;炳编码;二值化An Overview of Entropy Coding in AVS Lightweight Compression StandardYIN Ziyue,CAI Jiangzhen,HUANG Hekun(College of Physics and Information Engineering,Fuzhou University,Fuzhou 350108,China)Abstract:This article introduces the overall framework of the AVS lightweight compression standard,focusing on the entropy encodingpart of the standard,conducting a detailed analysis of the entropy encoding algorithm,and pointing out its future technologicaldevelopmentdirection.Keywords:lightweight compression;entropy coding;binaryzation0引言2006年,中国经过自主研发,颁布了音频和视频编码标准(AudioVideo coding Standard,A VS)。由于对以指数增长的可视数据的压缩需求不断增长,AVS工作组在过去的二十年中一直致力于开发高效的视频编码标准。AVS标准制定的出发点是希望实现知识产权的自主可控,让标准回归为产业发展服务的本位 2 。为了在视频传输质量和传输通道速率之间找到一个平衡点,AVS浅压缩标准呼之欲出。它不仅可以使得视频质量优秀,而且对网络传输要求不高。浅压缩在保证数据质量的前提下,快速地将大量数据压缩成较小的文件大小,从而节省存储空间和网络带宽。与常见的H.265或H.266等深压缩视频编码算法相比,浅压缩算法的压缩和解压速度更快,因为它们通常只需要进行少量的计算。因此,浅压缩通常适用于对实时性要求较高的应用场景。视频之所以能够压缩,是因为它有很多几余信息。常见的视频数据存在空间允余、时间余、编码余和视觉允余4种允余类型 3。熵编码是一种对概率不同所带来的编码穴余进行设计的视频编码模块,利用信源随机过程的统计特性,将视频编码过程中的语法元素映射成二进制形式写入比特流中。熵编码模块作为编码过程的最后一步,无论是在国际编码框架或者国内自主编码框架中都是非常重要的一个环节 51AVS浅压缩AVS浅压缩支持YUV4:0:0,YU V 4:2:0,YUV4:2:2,YUV4:4:4和RGB4:4:4格式的图像及视频,以及8 bit、10 b it、12 b it 和16 bit的输人比特深度。其中,亮度通道单元为16 2 的像素块,色度通道单元则根据YUV/RGB的格式分为三种:8 1像素块(YUV420格式),8 2 像素块(YUV422格式)和16 2 像素块(YUV444/RGB444格式)。AVS浅压缩标准主要包括4个模块,分别为帧内预测模块、变换量化模块、码率控制模块以及编码模块,整体编码框架如图1所示。电视技术第47 卷第6 期(总第57 1期)205电视技术第47 卷第6 期(总第57 1期206JIGITALVIDEO技市ideoEngineering数字视频码率控制模式信息一图像输人块划分顿内预测变换量化编码比特流一变换跳过行缓存重建反变换反量化变换跳过-图1AVS浅压缩标准的整体编码框架2AVS浅压缩的炳编码AVS浅压缩标准中的熵编码分为二值化和语法元素交织两个模块。其中,二值化模块包含3种编码方式,分别是截断编码方式、分类定长编码方式以及定长编码方式;语法元素交织模块按每种语法元素的顺序进行交织编码。2.1语法元素介绍熵编码模块在获取码率控制模块产生的语法元素复杂度后,根据顿内预测得到的最佳预测模式来判断是否编码剩余的语法元素。AVS熵编码的整体编码顺序如图2 所示。如果最佳预测模式为原始值模式,则对当前宏块的像素值按比特深度为编码位数直接进行熵编码。否则,依次对分组方式、残差码长、残差和边界符号修正符进行熵编码。2.1.1复杂度复杂度是码率控制模块产生的语法元素。首先计算4个42 子块的复杂度等级,根据经验阈值判断其属于简单、一般或者复杂,以确定当前色彩通道16 2 宏块的复杂度等级(0,1,2,3,4)。其次,根据色彩通道复杂度等级确定当前宏块的复杂度等级,如果当前是YUV444/RGB444序列,当前宏块复杂度为Y,U 和V三个色彩通道复杂度的平均值。否则,取Y通道复杂度作为当前宏块复杂度。最后,对于选中的复杂度等级,使用这个值作为无损编码比特数的估计,并在当前块编码完成后使用编码开销信息计算真实的无损编码比特数,用于更新保存的值,以供后续码率控制模块使用。2.1.2预测模式预测模式是顿内预测模块产生的语法元素。在内预测模块的模式决策过程中,通过计算和对比不同预测模式编码时所花费的总比特数,选择代价最小的预测模式作为当前最佳预测模式,并且传递到熵编码模块进行编码。2.1.3残差码长和边界符号修正符残差码长和边界符号修正符是熵编码模块产生的语法元素。根据当前的最佳预测模式,首先得到当前通道宏块所对应最佳预测模式的残差,其次以N=4为一组内的残差最大值所占比特数作为当前41块内的残差码长,最后判断每组的残差是否出现取值位于当前残差码长所能表示的区间的边界值,并根据取值情况对边界符号修正符进行赋值。2.1.4分组方式对于亮度通道的每个系数集合,均可采用5种方式来划分系数组,如图3所示。相同颜色表示使用相同的残差码长,具体如下。(1)分组模式0:划分为1个系数组。(2)分组模式1:划分为2 个系数组,扫描顺序边界符号复杂度预测模式非原始模式分组方式残差码长残差修正符原始模式原始值图2编码语法元素编码流程图电视技术第47 卷第6 期(总第57 1期207JIGITALVIDEO电视技量ideo Engineering数字视频中的前8 个系数为第一组,后8 个系数为第二组。(3)分组模式2:划分为3个系数组,扫描顺序中的前8 个系数为第一组,中间4个系数为第二组,后4个系数为第三组。(4)分组模式3:划分为3个系数组,扫描顺序中的前4个系数为第一组,中间4个系数为第二组,后8 个系数为第三组。(5)分组模式4:划分为4个系数组,扫描顺序中的每4个系数为一组。分组模式0分组模式1分组模式2分组模式3分组模式4图3162像素块的系数组划分方式色度通道单元则根据YUV/RGB的格式分为三种:8 1像素块(YUV420格式),8 2 像素块(YUV422格式)以及16 2 像素块(YUV444/RGB444格式),如图4所示。相同颜色表示使用相同的残差码长,具体如下。分组模式0分组模式1(a)8x2像素块分组模式0分组模式1(b)81像素块图4像素块扫描方式和系数组划分方式对于8 2 像素块,扫描方式和系数组划分方式如图4(a)所示,相同颜色表示使用相同的残差码长,具体为:(1)分组模式0,划分为2 个系数组,扫描顺序中的前8 个系数为第一组,后8 个系数为第二组。(2)分组模式1,划分为4个系数组,扫描顺序中的每4个系数为一组。对于8 1像素块,扫描方式和系数组划分方式如图4(b)所示,具体为:(1)分组模式0,划分为1个系数组。(2)分组模式1,划分为2 个系数组,扫描顺序中的每4个系数为一组。2.2二值化二值化方案定义了语法元素到二进制符号串的唯一映射。按照规定的二值化方案进行编码,能够在解码端根据规则唯一地恢复出原始视频或原始图像。目前广泛使用算数编码和变长编码两种编码方法去除信源符号中的统计穴余 6 。算数编码递归地对编码区间进行划分,是一种把输人信源符号转为一个或多个码字的熵编码方法,最早由香农的信息论提出7。在视频和图像压缩系统中,常用的变长编码方法包括哈夫曼编码(HuffmanCode),指数哥伦布编码(Golomb-RiceCode),哥伦布莱斯编码(Ex p-G o l o mb Co d e)和一元码(Unary Code)。哈夫曼编码是一种根据信源符号的概率分布为其分配码字的编码方法,指数哥伦布编码和哥伦布莱斯编码则是为满足几何分布特性的信源模型提供了最佳编码效率的方法,而一元码则在处理概率分布符合指数信源模型的情况下能够取得最佳的编码效率。这些编码方法都是基于不同概率分布特性的信源模型,通过分配更短的码字给更高概率的符号,从而提高整体的编码效率。AVS浅压缩中的熵编码中使用了定长编码和变长编码两种方式。其中,变长编码方式包括分类定长编码方式和截断编码方式两种。定长码是一种使用长度为log2CMax+1进行固定长度编码的二值化方案。按照重要的比特在前、不重要的比特在后的顺序发出信号 8 。AVS浅压缩标准中,残差以码长进行固定长度编码的二值化方案如表1所示。假设此时以N=4为一组时的残差码长为2,那么当前组内所有残差都用码长2 进行定长编码。表1残差的编码方式残差二元符号串码长0002101221023112分类定长码是一种只使用两种固定长度进行编码的二值化方案,达到快速判断语法元素状态的电视技术第47 卷第6 期(总第57 1期)208(下转第2 2 5页)IGITALVIDEOideoEngineering数字视频优势以便解码。复杂度、预测模式和系数分组方式这3种语法元素都是采用分类定长码。其中,系数分组方式的二值化方案如表2 所示。表2系数分组方式的二值化方案系数分组方式二元符号串码长001110032101331103411113截断编码是一种利用数据的统计特性和穴余性进行编码的二值化方案。在截断编码中,常见的方法是对出现频率较高的数据利用较短比特编码,而对出现频率较低的数据进行较长比特编码。通过这种方式,可以实现对数据的有效压缩。设残差码长的最大值为lmax,残差码长为l,如表3所示,AVS浅压缩标准中的截断编码方式如下:(1)当0 l。2,输出固定长度为2 比特的值;(2)当3l。l e ma x-1,输出当前“l-1比特位的1以及1位的0;(3)l。l ma x,输出“l-1”比特位的1以及1位的1。2.3语法元素交织经过二值化后的语法元素,按照色彩空间的顺序进行交织送人码流,即编码完复杂度后,首先按顺序交织Y分量的所有语法元素:预测模式,分组方式,残差码长,残差和边界控制符。其次按顺序交织U分量的所有语法元素:预测模式,分组方式,残差码长,残差和边界控制符。最后按顺序交织V分量的所有语法元素:预测模式,分组方式,残差码长,残差和边界控制符。如表4所示,当语法元素按照规定的二值化方案映射成唯一的比特流后,按图5所示顺序进行码流交织表3残差码长的编码方式残差码长二元符号串码长00021012210231103411104511105:111-1101.m-1111-111表4每种语法元素进行编码时所需的比

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开