温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
改进
深度
学习
网络
音乐风格
分类
模型
优化
方法
郭联俊
,基金项目微型电脑应用 年第 卷第期基金项目:年陕西高校学生工作研究课题();现代职业教育与非遗人才培养研究 子课题()作者简介:郭联俊(),男,硕士,讲师,研究方向为音乐学;侯峰(),男,硕士,讲师,研究方向为音乐教育。文章编号:()基于改进深度学习网络的音乐风格分类模型优化方法郭联俊,侯峰(陕西铁路工程职业技术学院,工程管理与物流学院,陕西,渭南 )摘要:采用目前方法对音乐风格进行分类时,没有对提取的特征和进行融合处理,导致分类有效性差、时间复杂度高。对此基于改进深度学习网络提出一种音乐风格分类模型优化方法。在音高、节奏和音色三个方面对音乐进行特征提取,并在 证据理论的基础上对提取的特征进行融合处理,将融合后的音乐特征输入改进深度学习网络,构建音乐风格分类模型,实现音乐风格的分类。实验结果表明,所提方法的分类 值高、时间复杂度低、曲线趋近于。关键词:改进深度学习网络;音乐风格;特征提取;证据理论;分类模型中图分类号:文献标志码:,(,):,:;引言人们的生活情感可以通过音乐得以体现,在人们的日常生活和精神生活中音乐属于重要构成部分。数字音乐资源在数字时代中的数量直线上升,管理海量音乐资源的基础是对音乐风格进行分类。国内对音乐风格分类的研究与国外相比起步较晚,但越来越多的国内外学者开始研究音乐风格分类,在音乐风格特征提取和分类等领域取得了一定的成就,并提出了部分音乐风格分类模型。文献 提出基于 的音乐风格分类方法,该方法建立音乐情感与特征之间的联系模型,并提取音乐播放的特征参数,将其输入神经网络中,实现音乐风格的分类。该方法具有较好的准确率,但无法对获取的音乐特征参数进行融合处理,分类结果的 曲线不理想,存在 值低的问题。文献 提出基于度量学习和特征提取的 音乐分类模型。度量学习过程考虑使用结构化预测方法从包含多个音乐流派的一组 音频文件中学习一组参数化距离。利用 倒谱系数()提取声学信息,并利用主成分分析进行降维,实现 音乐分类。该方法能够有效实现音乐分类,但没有对音乐标签进行融合处理,导致处理候选标签所用的时间较长,存在时间复杂度高的问题。为了解决上述方法中存在的问题,本文提出基于改进深度学习网络的音乐风格分类模型优化方法。利用证据理论,融合处理提取的音乐特征,缩短了特征数据所用时间,进而降低了时间复杂度。融合处理后的音乐特征,采用改进深度学习网络,构建音乐风格分类模型,实现音乐风格分类,提高了方法的有效性。音乐特征提取与特征融合 特征提取本文主要从音色、节奏和音高三个方面进行音乐特征提取。具体的特征提取过程如下。)音色特征提取音色主要由频域统计特征决定,音色特征提取实际上就是频域统计特征的提取。由于频率通常情况下会影响音色的概率,因此采用短时傅里叶变换方法,提取频域统计 特征。在提取频域统计特征之前,首先用()描述音乐信号的原始时域,通过傅里叶变换音乐时域获得序列(),基金项目微型电脑应用 年第 卷第期 ()。在此基础上,对于音频信号,常见的频谱统计特征包括谱质心、谱扩散、谱偏度、谱峰度、滚降截止频率、谱通量及谱平坦度。计算频谱统计特征及其公式如下。()谱质心设代表谱质心,可通过式()计算得到:()()()()式中,()代表第个频带对应的中心频率,代表频率对应的一阶中心距。频率通常情况下属于随机变量,归一化的幅值即为频率的概率密度():()()()()()谱扩散谱扩散描述的是普矩心在频谱中的扩散程度,可通过式()计算得到:()()()()式中,代表频率对应的二阶中心距。()谱偏度谱偏度的表达式如下:()()()()式中,代表频率对应的三阶中心距。()谱峰度谱峰度代表在中心附近频率分布的平坦程度:()()()()式中,代表频率对应的四阶中心距。()滚降截止频率滚降截止频率描述的是当音乐信号总量衰减为 的状态下能量对应的频率,其表达式如下:()()()式中,代表衰减截止频率,代表采样率。频谱形状的特性在一般情况下可以通过滚降截止频率进行度量。()谱通量频 率 幅 度 的 变 化 情 况 可 以 通 过 谱 通 量 进 行反映:()()()式中,()代表经过傅里叶变换后第帧序列。()谱平坦度谱平坦度 可以通过式()计算:()()()通过上述公式,对音色特征进行提取。)节奏特征提取节奏特征的提取实际上就是提取节拍相关特征,即获取节拍分布直方图。通过在信号中寻找节拍显著性最强的周期性,实现音乐节奏特征的提取。本文基于离散小波变换方法,结合节拍的低频特征获取音乐节拍,具体过程如下。通过 算法获取小波系数,每一层中都存在采样过程以及低通、高通滤波表示为,()()(),()()()()式中,()代表高通滤波结果,()代表低通滤波结果,()、()分别代表低通和高通滤波器。小波分解流程如图所示。图小波分解流程利用小波分解对低通、高通滤波进行分解,得到序列信号和干扰信号,选取合适的低通和高通滤波器进行重构,获取序列信号在低通和高通滤波器上的重构信号表示为y()()()(),()y()()()(),()()峰值通过情况会出现在周期与延时相同的状态下,通过提取频域的能量峰值数y()()(),得到噪声信号的频段数,对自相关处理后的波形进行峰值监测,获取节拍分布直方图。)音高特征提取音高特征提取实际上就是获取基音周期。基于自相关函数算法,在频域上提取音高特征。音高特征的提取流程如图所示。根据图可知,首先输入初始信号,并对输入的初始信号进行预处理,当频率小于 时,通过低通滤波进行周期检测;当频率大于 时,经过周期检测后,再通过半波滤波进行周期检测。采用自相关函数算法,获取基音周期,实现音高特征提取。,基金项目微型电脑应用 年第 卷第期图音高特征提取流程 特征融合在完成音乐特征提取后,利用证据理论对上述提取的特征进行融合处理,用样本空间(,)描述上述过程提取的音乐特征信息作为证据,通过()对样本空间(,)进 行处理,获 得 证 据 置 信 函 数(),(),(),其中,描述的是 纹理特征。通过式()融合目标多元证据置信函数:()()(?)()()式中,()、(?)均代表目标融合证据诱导分布。设()代表融合似然函数,()代表融合置信度函数,其表达式分别如下:()():,()()()式中,由的全部子集构成。通过最大类概率函数()对音乐特征进行判断,实现音乐特征的融合:()()()()()式中,、分别代表、中元素的数量。音乐风格分类模型在实现音乐特征融合后,将融合的音乐特征输入改进深度学习网络,构建音乐风格分类模型。()将音乐特征输入网络,对深度学习网络的权值矩阵进行初始化处理,将隐含层和可见层的偏置、初始化为。()对可见层神经单元进行赋值,正向传输输入的音乐特征,获得 前 向 传 播 在 深 度 学 习 网 络 中 对 应 的 激 活 概 率()()。()神经元在隐含层对应的激活概率值()通常情况下为实数,对其进行二值化处理。()在深度学习网络中反向传播隐含层单元对应的概率值,获得重构值。用()描述激活概率:()()()()在改进深度学习网络中正向传播重构的,计算反向传播概率和激活概率。()利用上述计算结果获取可见层中偏置对应的增量,同时在隐含层中获取偏置对应的增量。权值矩阵的增量可通过反向传播概率和正向传播概率计算得到,通过式()构建音乐风格分类模型表示为 ()()()()()()()式中,代表学习率。通过上述步骤,输出音乐风格分类结果。实验与分析为了验证基于改进深度学习网络的音乐风格分类模型优化方法的整体有效性,需要对本文所提方法进行测试,仿真环境选择 ,从九酷音乐平台中 首歌曲作为实验所需的音乐文件,包括种音乐风格,每种风格有 首歌曲。其中,首作为训练级数据,首作为测试集数据,本次测试的实验环境如表所示。表实验环境项目内容操作系统 中央处理器 图形处理器 内存 硬盘 采用基于改进深度学习网络的音乐风格分类模型优化方法(方法)、基于 的音乐风格分类方法(方法)和基于用户评论的音乐风格分类方法(方法)分别进行测试。实验选取 值、时间复杂度和 曲线作为测试指标。其中,值是用来衡量模型精确度的一种指标,值越接近于,表明方法模型的有效性越好。值表达式为 ()式中,代表样本总体的精确率,代表样本总体的召回率。方法、方法和方法的 值测试结果如图所示。图 值测试结果 ,基金项目微型电脑应用 年第 卷第期分析图可知,在多次迭代中方法的 值远远高于方法和方法的 值。值越高对应的有效性越好,因而方法可有效地实现音乐风格的分类。其原因是方法在音高、节奏和音色三个方面提取音乐风格的特征,融合提取的特征实现音乐风格的分类,提高了方法的有效性。时间复杂度是一个算法的时间耗费,时间耗费越长,时间复杂度就越高。但时间耗费理论上是计算不出的,需要上机运行测试进行估计。通过运行时间对方法、方法和方法的时间性能进行测试,不同方法的运行时间测试结果如图所示。图运行时间测试结果由图可知,在多次迭代中方法的运行时间均在 以内,方法在第次迭代中获得的运行时间高达,方法的运行时间在第次迭代中高达。通过上述分析发现,方法的运行时间最短。因为方法利用证据理论对提取的音乐特征进行了融合处理,缩短了特征数据所用的时间,进而降低了方法的时间复杂度。曲线是用来描述模型的性能,曲线接近于,表明方法模型的特异性和灵敏性越高。图中的横纵坐标分别代表特 异 性和 灵 敏 度,不 同 方 法 的 曲 线 如 图所示。图 曲线测试结果由图可知,方法的 曲线接近于,表明方法对音乐风格分类的特异性和灵敏度较好,因为方法根据融合处理后的音乐特征采用改进深度学习网络构建了音乐风格分类模型,利用分类模型实现音乐风格的分类,提高了方法的特异性和灵敏度。根据方法和方法的 曲线可知,以上种方法在音乐风格分类的过程中无法同时满足灵敏性和特异性,获取的音乐风格分类结果效果不理想。总结音乐曲库的规模随着多媒体技术的发展不断扩大,并且还有大量的新曲目增加到音乐曲库中,在上述背景下亟需有效的方法对音乐风格进行分类,方便用户在海量音乐库中检索出自己喜欢的音乐曲目。目前音乐风格分类方法存在分类有效性差和时间复杂度高的问题,为此提出基于改进深度网络的音乐风格分类模型优化方法,提取音乐特征并进行融合处理,通过改进深度学习网络构建音乐风格分类模型,实现音乐风格的分类,解决了目前方法中存在的问题,为音乐曲库规模的扩大提供了保障。参考文献孙刚平多噪声背景电子音乐类型分类建模与分析研究现代电子技术,():梅林,肖兆雄,沙学军一种变邻域搜索与人耳掩蔽音乐生成方法哈尔滨工业大学学报,():李强,刘晓峰基于 的音乐情感分类计算机工程与设计,():,:贾宁,郑纯军基于注意力 的音乐主题推荐模型计算机科学,():易伶多特征融合和机器学习算法的电子音乐分类模型微型电脑应用,():杨志明,王来奇,王泳深度学习算法在问句意图分类中的应用研究计算机工程与应用,():胡长勤,刘坤鹏废弃煤矿瓦斯资源量预测模型的构建与应用能源与环保,():王永旭,栾 峰,杨 平 亚,等 数 控 加 工 与 分类库集成技术研究机械制造与自动化,():(收稿日期:)