投稿网址:www.stae.com.cn2023年第23卷第17期2023,23(17):07444⁃06科学技术与工程ScienceTechnologyandEngineeringISSN1671—1815CN11—4688/T引用格式:郑文宾,何蔚.面向多场景的环境异常声音识别[J].科学技术与工程,2023,23(17):7444⁃7449.ZhengWenbin,HeWei.Environmentalabnormalsoundrecognitionformultiplescenes[J].ScienceTechnologyandEngineering,2023,23(17):7444⁃7449.面向多场景的环境异常声音识别郑文宾1,何蔚2∗(1.上海电力大学计算机科学与技术学院,上海201306;2.公安部第三研究所,上海200031)摘要随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有效识别异常声音,提出一种基于梅尔频率倒谱系数(Mel⁃frequencycepstralcoefficient,MFCC)和卷积神经网络(convolutionneuralnetwork,CNN)的环境声音识别算法,对各类异常声音进行采集和有效识别,并及时反馈声音状态,为各类声识别应用场景提供精细化管理技术手段。结果表明:提出的算法对5类场景下环境异常声音的识别率得到极大提高,适用于更广泛的声学场景,具有明显的优势。关键词异常声音;梅尔频率倒谱系数;卷积神经网络;音频事件检测中图法分类号TP391.4;文献标志码A收稿日期:2022⁃05⁃10;修订日期:2023⁃03⁃17基金项目:国家自然科学基金(61872230,U1936213);上海市学术带头人计划(21XD1421500);上海市科委项目(20020500600)第一作者:郑文宾(1997—),男,壮族,广西南宁人,硕士研究生。研究方向:智能信息处理。E⁃mail:270241614@qq.com。∗通信作者:何蔚(1973—),女,汉族,上海人,博士,研究员。研究方向:人工智能识别与检测技术。E⁃mail:175542354@qq.com。En...