基于卷积神经网络分类的说话人识别算法被引量：6

Speaker Recognition Algorithm Based on Convolutional Neural Networks

下载PDF

导出

摘要由于经典的说话人识别算法都是将特征提取和模式分类分开进行的,这导致特征的选取对分类影响很大,更增加了算法的复杂度。利用卷积神经网络(CNN)的结构优势,文章提出一种基于卷积神经网络分类的说话人识别算法。算法首先对原始语音信号计算语谱图,对获得的语谱图采用卷积神经网络进行分类,分类的结果即为类别。通过真实语音库和TIMIT库测试表明,本算法取得了较高的识别率,说明这是一种有效的说话人识别方法。 Feature extraction and pattern classification are two separated part in classical algorithms for speaker recognition, wherein the choice of features has much infl uence on classifi cation, and thus algorithm complexity is generally increased. In this manuscript we propose to use the structure advantage of convolutional neural network（CNN） to form a new speaker recognition algorithm. The algorithm firstly computes the spectrograms of a speech signal, then using CNN for classification. Experimental results based on self-built database and the TIMIT database show that the presented algorithm is effective in speaker recognition.

作者胡青刘本永

机构地区贵州大学大数据与信息工程学院贵州大学智能信息处理研究所

出处《信息网络安全》 2016年第4期55-60,共6页 Netinfo Security

基金国家自然科学基金[60862003] 科技部国际合作项目[2009DFR10530] 贵州大学研究生创新基金[2015081]

关键词卷积神经网络说话人识别语谱图 convolutional neural network speaker recognition spectrogram

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献23

1王韵琪,俞一彪.自适应高斯混合模型及说话人识别应用[J].通信技术,2014,47(7):738-743. 被引量：8
2鲁晓倩..基于VP树和GMM的说话人识别研究[D].中国科学技术大学,2014:
3ATALB S. Automatic Recognition of Speaker from Their Voices[J].IEEE Transaction on Acoustics, Speech, and Signal Processing, 1976,64(4): 460-475. 被引量：1
4DAVISS B, MERMELSTEIN P. Comparison of ParametricRepresentations for Monosyllabic Word Recognition in ContinuouslySpoken Sentences [J]. IEEE Transactions on Acoustics, Speech and SignalProcessing, 1980: 28(4): 357-366. 被引量：1
5LAWRENCER. Fundamentals of Speech Recognition[M].India:Pearson Education India, 2008. 被引量：1
6DAVENPORTM R, GARUDADRI H. A Neural Net AcousticPhonetic Feature Extractor Based on Wavelets[C]// IEEE. Pacific RimConference on Communications, Computers and Signal Processing, May9-10, 1991, Victoria, B. C., CANADA. NJ: IEEE, 1991: 449-452. 被引量：1
7刘鸣,戴蓓倩,李辉,李霄寒,陆伟.基于离散小波变换和感知频域滤波的语音特征参数[J].电路与系统学报,2000,5(1):21-25. 被引量：16
8NADASA, NAHAMOO D, PICHENY M A. Speech RecognitionUsing Noise-adaptive Prototypes[J].IEEE Transactions on Acoustics,Speech and Signal Processing, 1989, 37(10): 1495-1503. 被引量：1
9COLOMBIJ M, RUCK D W, ANDERSON T R, et al. CohortSelection and Word Grammar Effects for Speaker Recognition[C]//IEEE.International Conference on Acoustics, Speech and Signal Processing, May7-10,1996, Atlanta, Georgia. NJ: IEEE, 1996: 85-88. 被引量：1
10REYNOLDSD A, CARLSON B A. Text-dependent SpeakerVerification Using Decoupled and Integrated Speaker and SpeechRecognizers[C]//IEEE. 4th European Conference on SpeechCommunication and Technology. September 18-21, 1995, Madrid, Spain.NJ: IEEE, 1995: 2201-2204. 被引量：1

二级参考文献27

1宋英兰.老年患者行口腔修复治疗37例的临床效果分析[J].世界最新医学信息文摘,2019,0(83):40-41. 被引量：4
2CUMANI S, LAFACE P. Analysis of Large-Scale SVM Training Algorithms for Language and Speaker Recognition [J ]. IEE.F. Trans. on AUDIO, SPEECH, AND LAN- GUAGE PRGESSING,2012,20(05) :1585-1596. 被引量：1
3SELVA N S, SELVA K R. : and Text-independent Speaker Identification System Using GMM [ J ]. WSEAS Trans. On Signal Processing,2013,9(04):185-194. 被引量：1
4REYNOLDS D A, ROSER C. Robust Text-independent Speaker Identification Using Gaussian Mixture Speaker Models [ J ]. IEEE Transactions on Speech and Audio Processing, 1995, 3(01) :72-83. 被引量：1
5张凯.基于立体视觉的自然手势识别[学位论文].北京:北京大学,2005. 被引量：1
6LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient-based learning applied to document recognition. USA: IEEE, 1998: 2278-2324. 被引量：1
7Lauer F, Suen CY, Bloch G. A trainable feature extractor for handwritten digit recognition. Pattern Recognition, 2007, 40(6):1816-1824. 被引量：1
8Lawrence S, Giles CL, Tsoi AC, Back AD. Face recognition: A convolutional neural network approach. IEEE Trans. on Neural Networks, 1997, 8(1): 98-113. 被引量：1
9Tivive FHC, Bouzerdoum A. An eye feature detector based on convolutional neural network. Proc. 8th Int. Symp. Signal Process. Applic. Sydney, New South Wales, Australia. IEEE, 2005: 90-93. 被引量：1
10Mate S, Akira Y, Munetaka Y, Jun O. Pedestrian detection with convolutional neural networks. IEEE Intelligent Vehicles Symposium Proceedings. USA: IEEE, 2005: 224-229. 被引量：1

共引文献73

1丁胜男,李威,蔡立明,李蒙,胡常青.基于目标特征分布增强卷积神经网络的红外目标检测算法[J].导航与控制,2024,23(1):97-106.
2李战明,王贞.基于小波包分析特征参数的说话人识别系统[J].电声技术,2005,29(6):46-49. 被引量：5
3刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
4颜龙,刘刚,郭军.基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究[J].中文信息学报,2006,20(2):60-65. 被引量：6
5郝征科,魏明果.基于小波包变换的说话人语音特征参数的提取[J].三峡大学学报（自然科学版）,2006,28(4):374-376. 被引量：2
6陈杰,张玲华.说话人识别中语音特征参数的研究[J].信息技术,2006,30(11):88-89. 被引量：6
7王岩,苏健民,于慧伶,赵伟.小波分析在语音识别系统中的研究与应用[J].林业劳动安全,2007,20(1):38-41. 被引量：4
8屈百达,蒋纯纲,王月,徐保国.基于小波包变换的说话人语言特征参数及其在说话识别中的应用[J].中国新通信,2008,10(1):40-44.
9吴翔,唐焕华,刘锦高.一种鲁棒的基于小波变换的语音参数提取算法[J].计算机应用研究,2008,25(10):2984-2986.
10陈静,张飞云.基于小波包变换和MFCC的说话人识别特征参数[J].电声技术,2009,33(2):49-51. 被引量：3

同被引文献53

1李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
2孙子文,李慧,纪志成.基于D-S证据理论的融合图像隐写分析[J].控制与决策,2011,26(8):1192-1196. 被引量：12
3胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：29
4袁文浩,林家骏,陈宁,王雨.一种基于Bark域能量分布的噪声分类方法[J].华东理工大学学报（自然科学版）,2013,39(4):472-476. 被引量：5
5朱琦,酆广增,肖海勇.基于模式识别的语音分类方法[J].南京邮电学院学报,2000,20(4):29-33. 被引量：2
6雷磊,佘堃.基于小波分析和超级向量的非对称文本相关的说话人识别模型[J].信息安全研究,2018,4(4):352-358. 被引量：1
7罗希平,田捷.自动指纹识别中的图像增强和细节匹配算法[J].软件学报,2002,13(5):946-956. 被引量：229
8王韵琪,俞一彪.自适应高斯混合模型及说话人识别应用[J].通信技术,2014,47(7):738-743. 被引量：8
9唐宇,刘嘉勇,汤殿华.一种可撤销的指纹模板保护方案[J].信息网络安全,2015(1):72-75. 被引量：3
10庞永春,孙子文,王尧.基于手机触摸屏传感器多点触摸身份认证算法[J].计算机应用,2015,35(6):1780-1784. 被引量：9

引证文献6

1龙敏,龙啸海,马莉.基于深度卷积神经网络的指纹活体检测算法研究[J].信息网络安全,2018,0(6):28-35. 被引量：5
2孙子文,李富.基于HMM与D-S证据理论的手势身份认证方法[J].信息网络安全,2018(10):17-23. 被引量：1
3李晓峰,李东.基于卷积神经网络的多样性关键数据并行推荐算法[J].沈阳大学学报（自然科学版）,2019,31(4):307-312. 被引量：4
4蔡倩,高勇.一种基于卷积神经网络的快速说话人识别方法[J].无线电工程,2020,50(6):447-451. 被引量：4
5王华朋,牛瑾琳,刘元周,张琨瑶.不同语音特征对声音分类的有效性研究[J].中国刑警学院学报,2020(6):122-128. 被引量：3
6高晓利,李捷,王维,赵火军,骆明伟.基于CRNN的汽车发动机声纹个体识别方法[J].火力与指挥控制,2021,46(3):150-153. 被引量：4

二级引证文献21

1黄玉萍,谢翔,姚文俊,郑梦飞.一种难分割图形验证码识别方法及相应安全策略[J].信息网络安全,2020(S02):94-97.
2郎巨林,郑晟.基于CNN-RNN集成的隧道事故异常声音识别[J].电子测量技术,2023,46(20):164-169.
3李晓峰,李东,王妍玮.面向医疗系统的多样性数据深层神经网络推荐算法[J].沈阳大学学报（自然科学版）,2020,32(3):233-239. 被引量：1
4霍延军.采样优化支持的指纹图像二值化算法研究[J].单片机与嵌入式系统应用,2020,20(9):43-46. 被引量：2
5吴争,李瑶虹,杨晓梅,崔恒志,费益军.基于HMM的无线充电系统PFC装置故障检测[J].电力工程技术,2020,39(6):166-171. 被引量：4
6武凌,王浩,张晓春,周健,段爱华.基于深度迁移学习的垃圾分类系统设计与实现[J].沈阳大学学报（自然科学版）,2020,32(6):496-502. 被引量：13
7李会,陈红羽,李侠,王丽叶.机器学习领域的研究热点及主题演化分析——以科学计量为基础[J].沈阳大学学报（社会科学版）,2021,23(1):19-25. 被引量：1
8南兆营.基于参数迁移和C-LSTM的说话人识别研究[J].电声技术,2020,44(11):37-41. 被引量：1
9徐丽珍,吴功才.基于青少年在线学习的特定动作识别[J].信息与电脑,2021,33(13):24-26.
10杨海红,王琳娟.强混响及噪声相关背景下说话人跟踪方法[J].无线电工程,2021,51(9):963-970. 被引量：1

1李香萍.MATLAB在说话人识别算法中的应用[J].实验室研究与探索,2008,27(1):70-72.
2侯焱,张高伟.说话人识别算法在嵌入式仿真环境的实现[J].计算机仿真,2007,24(5):62-65.
3江太辉.神经网络预测模型的说话人识别算法[J].五邑大学学报（自然科学版）,2003,17(1):23-26.
4申志生,于明.说话人识别算法的定点DSP实现[J].单片机与嵌入式系统应用,2011,11(3):78-79. 被引量：3
5陶洁,张会林.一种改进型HMM说话人识别算法[J].微型机与应用,2012,31(21):31-32. 被引量：2
6何伟,徐阳,张玲.基于SOPC的说话人识别算法的实现与优化[J].计算机应用,2012,32(5):1463-1466. 被引量：3
7胡青,刘本永.基于卷积神经网络的说话人识别算法[J].计算机应用,2016,36(A01):79-81. 被引量：12
8陈勇,李晶皎,石鑫,张莉佳.基于FPGA的说话人识别系统设计[J].电子技术应用,2012,38(11):16-18. 被引量：1
9成新民,张迎,蒋云良.基于FVQMM的说话人识别[J].辽宁工程技术大学学报（自然科学版）,2007,26(5):719-722.
10江太辉.基于VQ的说话人识别算法与实验[J].计算机工程与应用,2004,40(9):77-79. 被引量：4

信息网络安全

2016年第4期

浏览历史

内容加载中请稍等...

基于卷积神经网络分类的说话人识别算法被引量：6

参考文献23

二级参考文献27

共引文献73

同被引文献53

引证文献6

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络分类的说话人识别算法 被引量：6

参考文献23

二级参考文献27

共引文献73

同被引文献53

引证文献6

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络分类的说话人识别算法被引量：6