温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
采用
声场
成像
声源
自适应
方法
第 卷第期 年月 物理实验 ,櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶櫶 收稿日期:;修改日期:基金项目:“中国高等教育”研究课题();兰州大学学生创新创业行动计划项目()作者简介:江煊明(),男,福建龙岩人,兰州大学物理科学与技术学院 级本科生 :通信作者:王心华(),男,青海海东人,兰州大学物理科学与技术学院高级实验师,博士,研究方向为磁性纳米材料 :文章编号:()采用声场成像的声源自适应降噪方法江煊明,郑煜,王心华(兰州大学 物理科学与技术学院;信息科学与工程学院;物理学国家级实验教学示范中心,甘肃 兰州 )摘要:针对现有声音定位技术动态适应能力弱的问题,基于由 个 组成的麦克风阵列群和声波接收时间差算法实现的声源定位技术,提出声源自适应降噪方法该方法在声场成像的基础上,通过能根据声源实际情况调整参量的异常值剔除和迭代修正复合式降噪过程,兼顾定位的准确性和实时性,实现内的声源自适应定位关键词:声音定位;声场成像;声源自适应;复合降噪中图分类号:文献标识码:当前,将声源自身情况纳入定位算法的研究较少 ,在忽略“声源”这一辨识度最高的数据源后,难以避免引发传统的声源定位和降噪算法的不足因此,近年国内外一些高校已开始研究具备声源自适应定位的方法,例如,浙江大学提出的声场形 态 分 量 分 析(,)模型和强化交替方向乘子(,)算法能够基于表征声学成分,实现优于将混响视为一般高斯噪声的声学成像效果;以色列理工学院提出了使用有监督的方法估计移动声源的位置和速度,实现了对声源速度变化的高敏感性算法本文采用综合声场成像、异常值剔除和迭代修正的声源自适应降噪方法,兼顾了定位的准确性与实时性传统声音定位技术 主流声音定位技术目前,声音定位技术主要可分成类:基于声波接收时间差的定位技术,基于声压幅度比的定位技术,基于最大输出功率的可控波束形成,高分辨率谱估计技术利用声波接收时间差(,),具有计算量小、原理简明、实时性强等显著特点,因此在实际应用中占有很大比例 经过天津大学李昌禄等 的实践总结,算法的基本理论已经相对完善,足以用于进行一般情况下的声音定位本文中麦克风阵列群的前端定位算法理论也基于 算法 传统声音降噪方法传统声音降噪方法可分为物理降噪与数据降噪物理降噪主要包括吸声、隔声、减振和阻尼,其核心是使用物理材料削弱噪声影响,但实际应用范围和效果非常有限数据降噪主要包括人工检查、归纳统计模型、分箱、聚类和回归,其核心是对收集到的数据进行平滑处理 经过数据降噪后的声音信息通常具备较高的实用价值 基于最大输出功率波束形成的声场成像声场成像是通过测量空间内声波到达各传感器的信号相位差异,依据相控阵原理确定声源的位置,并测量声源的幅值,获取空间声场分布云图 声像图 的技术基于最大输出功率的波束形成实现声场成像的基本原理是:先通过麦克风阵列采集远场声波信息,再选定声源处的某一扫描平面构建网格,通过波束成形分析将噪声热点还原至该平面,最后叠加原始几何图形具体方法如下:对狀个麦克风接收到的狀个信号进行傅里叶变换,获得频率谱密度犘的特性矩阵为犘(犳)(犘(犳槇)犘狀(犳槇),()式中犳为信号频率对式()进行互谱运算得到犆犘犘犘,()互谱矩阵犆犘将包含各麦克风所接收到的信号相位和频率的相对关系以扫描平面中的各网格点为假想声源(对应图中声场平面的像素点)并标号为狊,计算与阵列几何中心相距狓狀的第狀个麦克风接收到的声音信号犵(狊,狀)为犵(狊,狀)犳狋(狊,狀)狓狀狊()其中,狋(狊,狀)为声音信号在声源狊与麦克风狀间的传播时间差;狊为阵列几何中心与假想声源狊的距离由式()和式()计算自谱犃犘为犃犘(狊)犵犆狆犵犵,()最终取犃犘中匹配程度最高即元素最大值对应的网格点位置作为声源位置的测量值重复上述过程,遍历扫描平面中所有的网格点,即可得到声场图像图为实际平面与声场平面的投影关系图实际平面与声场平面的投影关系图声源自适应降噪原理 基于声场成像的降噪原理实际上,对绘制出的声场图像可引入图像处理方法进行图像降噪 对各像素点的 分量值,先对比像素点间的分量梯度和有效面积信息,再对每个色块进行平滑处理,降低噪声块对目标的影响,由此可得到更精确的声源位置信息与受噪声干扰更小的声场图像记相接像素点 分量梯度的最大和最小有效值分别为犌 和犌 ,有效面积阈值为犃 (最少像素点数量),可接受的 分量之差与可接 受 的 相 对 声 强 级 数 之 差的 比 值 的 绝 对 值为犇狊 犾只有相接像素点的 分量梯度在犌 和犌 之间,且声级相近,像素点面积不小于犃 的色块才被保留若相接的 分量为犪和犫,相对声强级数为正整数犛犪和犛犫,当同时满足:犪犛犪犇狊 犾,犪犛犪(犇狊 犾),犫犛犫犇狊 犾,犫犛犫(犇狊 犾),认为犪和犫声强级相近只要不出现与声源情况高度相仿的噪声,该降噪算法就能将声源位置信息(声强级数最高的色块的几何中心坐标)从噪声中剥离考虑到声强分布信息并不总适合坐标化,有必要在生成声强级色块前进行相应坐标值转化记四舍五入运算符号为,初始狓和狔值分别为狓和狔,则转化后对应值狓狋和狔狋应满足:犣狀狕 狓犣狓狓,犣狀狕 狔犣狔狔,狓狋狓狀狕 狓犣,狔狋狔狀狕 狔犣,其中,犣不为,狀狕 狓和狀狕 狔为取值与犣相关的整数基于声场成像的降噪效果如图所示,“非同步”表示在同一时刻采集的声场图像与经降噪输出的声场图像间存在不完全对应关系,但因采集足够快,可近似认为二者完全对应图表明:若出现与声源高度相仿的噪声,仅依靠上述降噪原理难以把目标声源从噪声中剥离,此时需对目标声源提前采样并进行学习()采集的声场图像()经降噪输出的声场图像图基于声场成像的降噪效果图(非同步)异常值剔除原理在探测平面中构建坐标系狓 犗 狔,记犇为声源与犗点间的距离,为声源与犗点连线沿顺时针偏离狔轴正半轴的角度,如图所示第期江煊明,等:采用声场成像的声源自适应降噪方法图声源位置标定示意图类比最近邻 算 法(,),先以狓轴为基准轴,分别以由 算法计算出的狓极大值和极小值对应的声源坐标点为圆心,绘制半径为犚(当待测声源距离变远或运动范围变大时,犚应增大,实际上,当长时间如 内没有新的合理坐标点输出时,可逐次增大犚以适应声源具体情况,单次增幅通常在 ,增幅可随时间流逝而继续增大)的判定圆,若在圆内的其他声源坐标点少于犓(通常犓,越近、运动越慢的声源对应犓越大),则删除该圆对应的坐标点,依此反复进行,直至左右两侧圆内均存在其他至少犓个声源坐标点;更换以狔轴为基准轴,重复上述筛选原理,直至上下两侧圆内均存在其他至少犓个声源坐标点,标志完成了轮异常值剔除图为进行轮上述剔除过程的示意图,其中狉表示图()中的红圈(判定圆)半径;红色箭号表示剔除平面(于虚线处垂直纸面的平面)沿坐标轴的前进方向与距离,被虚线掠过的声源坐标点被判定为异常值图表明,上述原理不仅让装置初步具备了根据声源信息自动调整参量的功能,还从整体上显著提高了定位的准确性,为后续的迭代修正提供高质量的输入数据,进而让装置具备更灵活的声源信息动态适应能力()生成初始数据图()第次沿狓轴()第次沿狔轴()第次沿狓轴()第次沿狔轴()输出剩余的声源坐标点图异常值剔除过程示意图 迭代修正降噪原理 基于主成分分析的数据降维原理迭代修正包括数据降维和动态修正为减小动态修正的计算量,保证定位实时性,先对数据降维由于各组数据点的狓和狔特殊性依赖于探测平面坐标系狓 犗 狔的选取,数据降维采用主成分分析(,)的基本原理:先以各组数据狓狔槡值为标记(),当输入狀狓 狔组数据时,以 值排序并重新标号,再取次标号最靠近中间值的犖组数据,最后绘制面积最小且能完全覆盖这犖个点的圆(最小修正单元)实际中狀狓 狔犖,后续实验中取狀狓 狔 取犖,狀狓 狔 时,效果如图所示图降维原理示意图物理实验第 卷 动态修正原理动态修正是迭代修正的核心在得到首个最小修正单元后,类比随 机梯 度下 降(,)搜 寻 局 部 最 小 值 的 思想,将该修正单元标号为犕犚(参考圆),进行另狀狓 狔组狓和狔值的收集与处理,得出第个最小修正单元,标号为犕犆(修正圆)若犕犆的圆心落在犕犚内(或半径为犽 犕犚的同心圆内),则删除犕犚,将犕犆重新标号为犕犚,重新测量犕犆,完成轮有效修正周期;反之则保留犕犚,删除犕犆,重新测量犕犆,完成轮无效修正周期若前端输出数据无明显错误,修正总趋势是使犕犚圆心靠近声源坐标实际值在不更换硬件的前提下,趋近程度需从累计参考圆数量(总修正次数犜次修正的参考圆数犆)与犽值大小来判断具体而言,在其他条件不变的情况下,随着犜或犆的增大,所得出的坐标测量值就越能稳定在真实值附近,该稳定值称为极限值;随着犽的减小,测量值趋近极限值所需的时间就越长,但极限值也越靠近真实值显然,新动态修正算法中犽 犕犚半径长度就对应了 传 统 梯 度 下 降 算 法 中 的“步 长()”,犕犆为迭代样本,声源运动轨迹(由犕犚和犕犆圆心坐标拟合出的函数图像)对应了传统梯度下降 算 法 中 的“假 设 函 数()”,犕犆圆心坐标与声源运动轨迹间存在的误差函数则对应了传统梯度下降算法中的“损失函数()”实际上,可根据犕犆的保留成功率推测声源的运动状态(其他条件不变时,定位快速运动声源时的犕犆保留成功率相比定位静止或缓慢运动声源时显著偏低),或结合声源与装置间的大致关系,调整参量狀狓 狔,犚,犓,犖,犜,犆和犽,保证装置对静止或近场(内)声源的高定位精度和对运动或远场声源的快速响应能力例如,在定位静止近场声源时,上述参量均应比定位运动近场声源时更大;定位运动远场声源时,上述参量均应比定位运动近场声源时更小,但参量大小的调节一般不涉及数量级的调节,调节过程与 中调节犚相似图为动态修正过程示意图,其中参考圆的圆心迁移轨迹的终点为经动态修正后得到的声源位置的测量值结合动态修正过程中的参量调节原理,图表明:动态修正将声源实际情况纳入到精度保障体系概括而言,动态修正对运动声源优先起到跟踪定位且保持定位实时性的效果,对静止或者近场声源则优先起到提高定位精度的效果,而对远场声源则兼顾了定位的精确性和实时性,能够增强装置的动态适应能力,从整体上兼顾定位的准确性和实时性,实现声源自适应定位图动态修正过程示意图数值模拟与实验探究参量设置如表所示,犓犻(犼)和犚犻(犼)中的犻和犼分别表示进行第犻次以犼轴为基准轴的异常值剔除时所设置的判定圆内所含其他数据点最少的数量犓和判定圆的半径犚;参量犌表示声场图像相接 分量的梯度可接受差值,即犌 犌 ;犖的奇偶设置用于同步输入数据的数量奇偶,防止程序崩溃表参量设置环节参量数值犃 声场成像降噪犌 犣犓(狓),犓(狔)异常值剔除犚(狓),犚(狔)犓(狓),犓(狔)犚(狓),犚(狔)犖(偶)(奇)迭代修正犆 犽 数值模拟先在 中标定若干个数据点生成范围,在程序生成足够多的数据点后进行多组声场成像降噪,再以各组的声源色块中心坐标作为输第期江煊明,等:采用声场成像的声源自适应降噪方法入数据,依次对其进行异常值剔除和迭代修正,结果如图所示()生成初始数据图()经过异常值剔除筛选数据点()经过异常值剔除后的数据点()生成首个参考圆心()参考圆迭代()测量值与拟定实际值对比图数值模拟过程图表明:模拟结果(,)与拟定实际值(,)相距约 ,接近后者到原点距离的,定位准确性较好,初步具备了进行实际应用的基础然而,由于模拟过程在 端进行,模拟平台的硬件性能较高,无法体现出算法的实时性优势 实验探究搭建由 和 构成的三麦克风阵列群(包括 个 麦克风)定位装置,以蓝牙音箱为声源,见图图实验装置及环境图数值模拟输出的数据为声源的坐标(狓,狔),出于实用性考虑,实验按图将(狓,狔)转换为极坐标(犇,),定义犔为测量点与实际点间的距离差,犔犇 ,输出时间狋定义为采用新方法后输出第个测量值或未采用新方法(原始方法:文献 定位方法)时输出第个 的测量值所消耗的时间 对静止声源的定位定位前设置参量如表所示表静止声源的定位参量设置环节参量数值犃 声场成像降噪犌 犣犓(狓),犓(狔)异常值剔除犚(狓),犚(