基于流形学习和SVM的环境声音分类被引量：1

Environmental Sound Classification Based on Manifold Learning and SVM

下载PDF

导出

摘要为利用生态环境中各种声音包含的信息,提出一种将流形学习算法和支持向量机(SVM)相结合的生态环境声音分类技术。提取音频强度、音色、音调和音频节奏的特征集合并计算对应的特征向量,采用改进的拉普拉斯特征映射流形学习算法对特征向量进行维数约简,从而降低数据处理的复杂性。使用SVM对降维后的特征向量进行分类,发挥SVM在处理小样本、非线性及高维数据方面的优势,从而提高分类准确率。实验结果表明,该技术能对生态环境声音进行快速准确的分类。 In order to take full advantage of the information contained in the eco-environmental sounds,this paper presents a ecological environmental sounds classification technology based on manifold learning algorithm and Support Vector Machine（SVM）.Select four different kinds of audio characteristics those are dynamics,timbre,pitch and rhythm and then calculate the feature vectors corresponding to those four audio characteristics.So as to reduce the complexity of data processing,it makes use of an improved Laplacian feature mapping for dimensionality reduction.To improve the accuracy,the SVM classifier is used to classify the dimension-reduced feature vectors because SVM have advantages in dealing with the data that is of few samples,nonlinear and high dimension.Experimental results show that the technology can be used to classify ecological environmental sounds quickly and accurately.

作者李勇李应余清清

机构地区福州大学数学与计算机科学学院

出处《计算机工程》 CAS CSCD 北大核心 2011年第7期288-290,共3页 Computer Engineering

基金国家自然科学基金资助项目(61075022) 福建省教育厅A类科技基金资助项目(JA09021)

关键词生态环境声音分类流形学习支持向量机 ecological environmental sound classification manifold learning Support Vector Machine（SVM）

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Wichem G,Xue Jiachen,Thornburg H.Segmentation,Indexing,and Retrieval for Environmental and Natural Sounds[J].IEEE Transactions on Audio,Speech,and Language Processing,2010,18(3):688-707. 被引量：1
2Selina C,Narayanan S,Jay K C C.Environmental Sound Recognition with Time-frequency Audio Features[J].IEEE Transactions on Audio,Speech,and Language Processing,2009,17(6):1142-1158. 被引量：1
3赵晖,顾亚强,唐朝京.基于乘积HMM的双模态语音识别方法[J].计算机工程,2010,36(8):7-9. 被引量：8
4李燕诚,崔慧娟,唐昆.基于似然比测试的语音激活检测算法[J].计算机工程,2009,35(10):214-216. 被引量：5
5Briggs F,Raich R,Fern X Z.Audio Classification of Bird Species:A Statistical Manifold Approach[C]//Proc.of the 9th IEEE International Conference on Data Mining.Miami,Florida,USA:[s.n.],2009. 被引量：1
6曾宪华,罗四维,王娇,赵嘉莉.基于测地线距离的广义高斯型Laplacian特征映射[J].软件学报,2009,20(4):815-824. 被引量：9
7Shawkat A S,Abraham A.An Empirical Comparison of Kernel Selectionfor Support Vector Machines[C]//Proc.of the 2nd International Conference on Hybrid Intelligent Systems.Santiago,Chile:[s.n.],2002. 被引量：1

二级参考文献13

1詹德川,周志华.基于集成的流形学习可视化[J].计算机研究与发展,2005,42(9):1533-1537. 被引量：24
2Sohn J, Kim N S, Sung Wonyong. A Statistical Model-based Voice Activity Detection[J]. IEEE Signal Processing Letters, 1999, 6(1): 1-3. 被引量：1
3Cho Yongdtlk, Kondoz A. Analysis and Improvement of a Statistical Model-based Voice Activity Detector[J]. IEEE Signal Processing Letters, 2001, 8(10): 276-278. 被引量：1
4Gazor S, Zhang Wei. Speech Enhancement Employing Laplacian- Gaussian Mixture[J]. IEEE Transactions on Speech and Audio Processing, 2005, 13(5): 896-904. 被引量：1
5Chang Joon-Hyuk, Kim N S, Mitra S K. Voice Activity Detection Based on Multiple Statistical Models[J]. IEEE Transactions on Signal Processing, 2006, 54(6): 1965-1976. 被引量：1
6Gazor S, Zhang Wei. Speech Probability Distribution[J]. IEEE Signal Processing Letters, 2003, 10(7): 204-207. 被引量：1
7Kumatani K,Nakamura S,Shikano K.An Adaptive Integration Based on Product HMM for Audio-visual Speech Recognition[C]// Proceedings of IEEE ICME'01.Tokyo,Japan:[s.n.],2001:1020-1023. 被引量：1
8Lee J S,Park C H.Robust Audio-visual Speech Recognition Based on Late Integration[J].IEEE Transactions on Multimedia,2008,10(5):767-779. 被引量：1
9Dupont S,Luettin J.Audio-visual Speech Modeling for Continuous Speech Recognition[J].IEEE Transactions on Multimedia,2000,2(3):141-151. 被引量：1
10Zhao Hui,Tang Chaojing,Yu Tao.Fast Thresholding Segmentation for Image with High Noise[C]//Proceedings of ICIA'08.Zhangjiajie,China:[s.n.],2008:290-295. 被引量：1

共引文献19

1龚卫国,童玉娟,李正浩.各向异性非刚性形变局部不变特征研究[J].仪器仪表学报,2010,31(1):99-104. 被引量：1
2曾宪华,罗四维.全局保持的流形学习算法对比研究[J].计算机工程与应用,2010,46(15):1-6. 被引量：6
3胡强,余国先.基于集成图的保局投影算法[J].计算机工程与设计,2010,31(20):4463-4465.
4邱文武,蒋建中,吴琼.基于能量熵统计模型的语音增强算法[J].计算机工程,2010,36(23):229-230.
5张亮,杜子平,张俊,李杨.基于拉普拉斯特征映射的仿射传播聚类[J].计算机工程,2011,37(9):216-217. 被引量：1
6尹晨晓,郭英,张碧锋,刘霞.基于Bark小波的语音端点检测算法[J].计算机工程,2011,37(12):276-278. 被引量：5
7李宇,郭雷勇,谭洪舟.基于噪声倒谱阈值频谱估计的语音活动检测[J].计算机工程,2011,37(14):140-142. 被引量：3
8余国先,张国基,韦佳,任亚洲.一种基于多图的集成直推分类方法[J].电子与信息学报,2011,33(8):1883-1888. 被引量：3
9梁吉光,田俊华,姜杰.基于改进HMM的文本信息抽取模型[J].计算机工程,2011,37(20):178-179. 被引量：9
10曹洁,余丽珍.改进的说话人聚类初始化和GMM的多说话人识别[J].计算机应用研究,2012,29(2):590-593. 被引量：6

同被引文献3

1冯陈定,李少波,姚勇,杨静.基于改进卷积神经网络与动态衰减学习率的环境声音识别算法[J].科学技术与工程,2019,19(1):177-182. 被引量：15
2胡挺,祝永新,田犁,封松林,汪辉.面向移动平台的轻量级卷积神经网络架构[J].计算机工程,2019,45(1):17-22. 被引量：13
3陈波,俞轶颖.基于深度神经网络的城市声音分类模型研究[J].浙江工业大学学报,2019,47(2):199-203. 被引量：7

引证文献1

1杨磊,赵红东.基于轻量级深度神经网络的环境声音识别[J].计算机应用,2020,40(11):3172-3177. 被引量：5

二级引证文献5

1杜晓冬,滕光辉,刘慕霖,赵雨晓,周振宇,祝鹏飞.基于轻量级卷积神经网络的种鸡发声识别方法[J].农业机械学报,2022,53(10):271-276. 被引量：5
2吴佳赛,高振斌.基于双二流卷积和多特征融合的D-S声音分类[J].计算机应用研究,2022,39(3):693-698. 被引量：2
3董明宇,严迪群.基于ResNet的音频场景声替换造假的检测算法[J].计算机应用,2022,42(6):1724-1728.
4柳心敬,陈俊杰,张伟,修宇.基于深度学习的公共厕所漏水检测系统设计[J].电脑与信息技术,2023,31(4):11-14.
5苏瑞轩,葛动元,姚锡凡.基于通道和帧级特征注意力模型的环境声音识别[J].科学技术与工程,2024,24(16):6792-6798. 被引量：2

1王熙,李应.多频带谱减法用于生态环境声音分类[J].计算机工程与应用,2014,50(3):190-193. 被引量：4
2李玲俐.基于HMM和SVM的环境声音分类[J].计算机时代,2011(11):59-61. 被引量：1
3余清清,李应,李勇.噪音情境下生态环境声音的分类[J].小型微型计算机系统,2011,32(8):1689-1693. 被引量：1
4翁胜彬.妙用EXCEL合并计算[J].网络与信息,2003,17(10):63-63. 被引量：1
5伍亿.运用VLOOKUP函数合并计算的研究[J].重庆电子工程职业学院学报,2011,20(2):154-156. 被引量：1
6王志军.利用“合并计算”完成跨工作表的求和[J].电脑知识与技术（经验技巧）,2014(7):42-42.
7余清清.噪音环境下基于时-频特征的生态环境声音的分类（英文）[J].计算机与数字工程,2017,45(1):8-14. 被引量：2
8王浩安,李应.噪声环境下基于能量检测的生态声音识别[J].计算机工程,2013,39(2):168-171. 被引量：5
9吴月娥.通配符在Excel高级筛选和合并计算中的使用[J].信息与电脑,2016,28(1):60-62.
10马震安.多表汇总 “合并计算”更轻松[J].电脑爱好者,2016,0(15):56-56.

计算机工程

2011年第7期

浏览历史

内容加载中请稍等...

基于流形学习和SVM的环境声音分类被引量：1

参考文献7

二级参考文献13

共引文献19

同被引文献3

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于流形学习和SVM的环境声音分类 被引量：1

参考文献7

二级参考文献13

共引文献19

同被引文献3

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于流形学习和SVM的环境声音分类被引量：1