面向多场景的环境异常声音识别_郑文宾.pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 1.61 MB
约6页
2023-07-24
收藏
评论
点赞(0)
海报
举报

投稿网址：ｗｗｗ．ｓｔａｅ．ｃｏｍ．ｃｎ２０２３年第２３卷第１７期２０２３，２３（１７）：０７４４４⁃０６科学技术与工程ＳｃｉｅｎｃｅＴｅｃｈｎｏｌｏｇｙａｎｄＥｎｇｉｎｅｅｒｉｎｇＩＳＳＮ１６７１—１８１５ＣＮ１１—４６８８／Ｔ引用格式：郑文宾，何蔚．面向多场景的环境异常声音识别［Ｊ］．科学技术与工程，２０２３，２３（１７）：７４４４⁃７４４９.ＺｈｅｎｇＷｅｎｂｉｎ，ＨｅＷｅｉ．Ｅｎｖｉｒｏｎｍｅｎｔａｌａｂｎｏｒｍａｌｓｏｕｎｄｒｅｃｏｇｎｉｔｉｏｎｆｏｒｍｕｌｔｉｐｌｅｓｃｅｎｅｓ［Ｊ］．ＳｃｉｅｎｃｅＴｅｃｈｎｏｌｏｇｙａｎｄＥｎｇｉｎｅｅｒｉｎｇ，２０２３，２３（１７）：７４４４⁃７４４９.面向多场景的环境异常声音识别郑文宾１，何蔚２∗（１.上海电力大学计算机科学与技术学院，上海２０１３０６；２.公安部第三研究所，上海２０００３１）摘要随着人工智能和大数据的发展，各种场景中对异常声音识别的需求日益增长，基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构，对异常声音的识别率较低，且识别的声音类型单一。为了有效识别异常声音，提出一种基于梅尔频率倒谱系数（Ｍｅｌ⁃ｆｒｅｑｕｅｎｃｙｃｅｐｓｔｒａｌｃｏｅｆｆｉｃｉｅｎｔ，ＭＦＣＣ）和卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ，ＣＮＮ）的环境声音识别算法，对各类异常声音进行采集和有效识别，并及时反馈声音状态，为各类声识别应用场景提供精细化管理技术手段。结果表明：提出的算法对５类场景下环境异常声音的识别率得到极大提高，适用于更广泛的声学场景，具有明显的优势。关键词异常声音；梅尔频率倒谱系数；卷积神经网络；音频事件检测中图法分类号ＴＰ３９１.４；文献标志码Ａ收稿日期：２０２２⁃０５⁃１０；修订日期：２０２３⁃０３⁃１７基金项目：国家自然科学基金（６１８７２２３０，Ｕ１９３６２１３）；上海市学术带头人计划（２１ＸＤ１４２１５００）；上海市科委项目（２００２０５００６００）第一作者：郑文宾（１９９７—），男，壮族，广西南宁人，硕士研究生。研究方向：智能信息处理。Ｅ⁃ｍａｉｌ：２７０２４１６１４＠ｑｑ．ｃｏｍ。∗通信作者：何蔚（１９７３—），女，汉族，上海人，博士，研究员。研究方向：人工智能识别与检测技术。Ｅ⁃ｍａｉｌ：１７５５４２３５４＠ｑｑ．ｃｏｍ。Ｅｎ...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容