文章编号:0427-7104(2023)01-0053-10收稿日期:2022-03-08作者简介:覃龙靖(1998—),男,硕士研究生;王鑫,女,副教授,通信作者,E-mail:metero_wx@cuc.edu.cn;谢凌云,男,副研究员,硕士生导师,并列通信作者,E-mail:xiely@cuc.edu.cn三维声双耳渲染算法的客观评测与分析覃龙靖1,王鑫1,谢凌云2(1.中国传媒大学音乐与录音艺术学院,北京100024;2.中国传媒大学媒介音视频教育部重点实验室,北京100024)摘要:本文对5种双耳渲染算法进行了客观评测。首先对双耳信号提取双耳特征和单耳特征,并进行特征选择和降维,最终选择岭回归建立了总体评价和其二级维度,即音质、定位和空间感的客观评测模型,并探究了主观感知和客观参数之间的关系。实验结果表明,将实验信号时频域特征的双耳差值用于客观评测模型可以获得理想的拟合效果;对于音质的感知,与频域能量相关的特征是最为重要的影响因素;变化丰富的双耳线索和双耳间频谱信息的变化差异性对于定位和空间的感知有较为显著的影响。关键词:三维声;双耳渲染算法;客观评测;双耳交互作用中图分类号:TN912.2文献标志码:A1研究背景虽然以影院为代表的全景声技术(如DolbyAtmos、Auro-3D等)已经应用多年,但此类基于扬声器阵列的三维声重放系统在日常生活中难以获取,因此将三维声技术实施双耳可听化处理会更加符合人们日常使用的需求,同时这也对三维声双耳渲染效果的评价提出了新的挑战。音频评价方法通常分为主观评价和客观评价。主观评价方法往往费时费力且对测试条件和人员要求较高,而客观评价方法效率更高且更易实施。本文旨在对5种不同的三维声双耳渲染算法进行客观评测,并探究主观感知和客观参数之间的关系,为未来三维声双耳技术的评测和改进提供参考。通常来说,评测音频的客观方法分为有参考音频和无参考音频两种。目前国际上唯一的数字音频质量客观评测标准ITU-RBS.1387中采用的PEAQ(PerceptualEvaluationofAudioQuality)算法就属于有参考音频的一类[1]。该建议的主要目的是考察数字音频系统压缩、传输等过程带来的质量损失。随后有大量基于PEAQ或与其相类似的改进模型出现,如OE[2]、PEMO-Q[3]等。但这类评测方法主要针对独立声道进行评测,无...