复杂环境下基于深度学习的声音识别研究

Research on Deep Learning Based Sound Recognition in Complex Environments

下载PDF

导出

摘要针对复杂环境下的声音识别问题,提出一种基于深度学习的声音识别方法。首先,通过自适应滤波降噪和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)提取等方法提取声音特征。其次,采用L2正则化的卷积神经网络(Convolutional Neural Network,CNN)识别声音,以提高模型的泛化能力和准确性。最后,使用ESC-50数据集对所提方法进行验证和测试。实验结果表明,该方法的精确率、准确率及召回率均优于对比方法。 A deep learning based sound recognition method is proposed for the problem of sound recognition in complex environments.Firstly,sound features are extracted through methods such as adaptive filtering noise reduction and Mel-Frequency Cepstral Coefficient(MFCC)extraction.Secondly,L2 regularized Convolutional Neural Network(CNN)are used to recognize sounds,in order to improve the model’s generalization ability and accuracy.Finally,validate and test the proposed method using the ESC-50 dataset.The experimental results show that the accuracy,precision,and recall of this method are superior to the comparison methods.

作者付兆婷 FU Zhaoting(Baiyin College,Baiyin Open University,Baiyin 730900,China)

机构地区白银开放大学白银学院

出处《电声技术》 2024年第5期40-42,共3页 Audio Engineering

关键词复杂环境卷积神经网络(CNN) 声音识别 complex environment Convolutional Neural Network(CNN) voice recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1李山.智能家具语音识别精准度优化仿真[J].计算机仿真,2018,35(11):281-284. 被引量：5
2刘波霞,陈建峰.基于特征分析的环境声音事件识别算法[J].计算机工程,2011,37(22):261-263. 被引量：15
3郑皓,赵庶旭,屈睿涛.一种用于城市交通的优化声音识别仿真[J].计算机技术与发展,2019,29(2):60-64. 被引量：6
4王胜,张拯,谌强,曾维,柏君,尹生阳,陈明浩.基于振动与声音信号深度学习的岩性识别方法[J].科学技术与工程,2023,23(7):2759-2767. 被引量：5
5王诗佳..基于深度学习的声音事件识别研究[D].东南大学,2018:
6周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1781
7李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：559
8吕炜,陈永刚,沈晨.带L2正则化项的神经网络逆向迭代算法收敛性分析[J].信息技术与信息化,2015(6):183-184. 被引量：10
9杨浩,马建红.正则化参数求解方法研究[J].计算机测量与控制,2017,25(8):226-229. 被引量：4
10翟永杰,彭雅妮,杨旭,胡东阳,王新颖.融合MFCC和IMFCC特征的电厂设备声音识别算法[J].现代电子技术,2022,45(8):6-12. 被引量：6

二级参考文献148

1徐静,李卫红,孙懋珩,魏捷,陈圆,李昕.基于麦克风阵列的车辆鸣笛嗅探器[J].数据采集与处理,2012,27(S2):262-266. 被引量：2
2傅初黎,李洪芳,熊向团.不适定问题的迭代Tikhonov正则化方法[J].计算数学,2006,28(3):237-246. 被引量：33
3姜洪臣,郑榕,张树武,徐波.基于SDC特征和GMM-UBM模型的自动语种识别[J].中文信息学报,2007,21(1):49-53. 被引量：14
4王书诏,邱天爽.说话人识别研究综述[J].电声技术,2007,31(1):51-55. 被引量：9
5赵力.语音信号处理[M].北京:机械工业出版社,2008. 被引量：10
6Temko A,Malkin R,Zieger C,et al.CLEAR Evaluation of Acoustic Event Detection and Classification Systems[C]//Proc.of the 1st International Evaluation Conference on Classification of Events,Activities and Relationships.Heidelberg,Germany: Springer-Verlag,2007: 311-322. 被引量：1
7Heittola T,Klapuri A.TUT Acoustic Event Detection System[C]// Proc.of the 2nd International Evaluation Conference on Classification of Events,Activities and Relationships.Heidelberg,Germany: Springer-Verlag,2008: 364-370. 被引量：1
8常西畅,周艳玲,陈进.机械设备噪声故障诊断的新进展[C].北京:全国振动(诊断、模态、噪声与结构动力学) 工程及应用学术会议论文集,2002:140-143. 被引量：5
9ZAMPARO M,STRAMAGLIA S,BANAVAR J,et al.Inverse Problem for Multivariate Time Series Using Dynamical Latent Variables[J].Physica A:Statistical Mechanics and its Applications,2012,391(11):3159-3169. 被引量：1
10WERBOS P.Beyond regression:New Tools for Prediction and Analysis in the Behavioral Sciences[D].Massachusetts:Harvard University,1974. 被引量：1

共引文献2290

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10孙守强,李青青,肖舒玥,曾子明.基于情景感知的叙事型壁画场景式移动视觉搜索模型研究[J].数据分析与知识发现,2024,8(8):52-62.

1应娜,吴顺朋,杨萌,邹雨鉴.基于小波散射变换和MFCC的双特征语音情感识别融合算法[J].电信科学,2024,40(5):62-72. 被引量：1

电声技术

2024年第5期

浏览历史

内容加载中请稍等...

复杂环境下基于深度学习的声音识别研究

参考文献10

二级参考文献148

共引文献2290

相关作者

相关机构

相关主题

浏览历史