基于小波包全频分解的耐噪声纹识别算法被引量：2

Noise-resistant speaker recognition algorithm based on full-frequency speech features with wavelet packet

下载PDF

导出

摘要目前多数说话人识别算法均在干净环境下进行,在噪声环境下的效果较差.为提升噪声环境下说话人识别的正确率,提出一种新的特征提取方法与识别模型WPGT.利用小波包分解高频和低频信号,Gammatone滤波器组模拟人耳听觉系统处理非线性信号,从而提取更完备的说话人语音特征,采用卷积神经网络对特征进行训练并完成说话人识别.基于开源语音数据集、噪声融合数据集,将本研究方案与常用的声纹特征提取方法MFCC和Gammatone进行对比.实验结果表明,在噪声环境下,本研究所提WPGT方法的声纹识别精度相较于MFCC和Gammatone分别提升10.63%和16.91%,具有更好的抗噪声能力. At present,most speaker recognition algorithms are performed in a clean environment,and the effect is poor in a noisy environment.In order to improve the accuracy of speaker recognition in a noisy environment,a new feature extraction method,wavelet packet&Gammatone(WPGT)based model,is proposed.In this model,the wavelet packet is used to decompose high-frequency and low-frequency signals and the Gammatone filter bank simulates the human auditory system to process non-linear signals so that more complete speaker voice features are extracted,and finally,the convolutional neural network is used to train the features and complete speaker recognition.Based on the open source speech data sets and the noise fusion data sets,the proposed method is compared with the commonly used voiceprint feature extraction methods MFCC and Gammatone.The experimental results show that,in a noisy environment,WPGT has better anti-noise ability than MFCC and Gammatone.Compared with MFCC and Gammatone,the accuracy of WPGT is improved by 10.63%and 16.91%,respectively.

作者徐晓梦谭振华李欣书 XU Xiaomeng;TAN Zhenhua;LI Xinshu(Software College,Northeastern University,Shenyang 110819,Liaoning Province,P.R.China)

机构地区东北大学软件学院

出处《深圳大学学报（理工版）》 EI CAS CSCD 北大核心 2020年第S01期84-91,共8页 Journal of Shenzhen University(Science and Engineering)

基金国家重点研发计划资助项目(2019YFB1405803) 下一代互联网技术创新计划资助项目(NGII20190609)。

关键词生物信息识别说话人识别小波包卷积神经网络 biometric identification speaker recognition wavelet packet convolutional neural network

分类号 TN915.08 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献28

1苏本跃,王广军,章健.基于物联网环境下体感交互技术的智能家居系统[J].中南大学学报（自然科学版）,2013,44(S1):181-184. 被引量：16
2陈联武,郭武,戴礼荣.声纹识别中合成语音的鲁棒性[J].模式识别与人工智能,2011,24(6):743-747. 被引量：3
3靳玉红.声纹识别中的语言属性映射[J].重庆邮电大学学报（自然科学版）,2012,24(4):507-511. 被引量：1
4陈祝允,李艳雄,杜佳媛.基于矢量量化的时序说话人聚类方法[J].科学技术与工程,2014,22(2):41-44. 被引量：5
5李威,贺前华,李艳雄.一种多说话人角色聚类方法[J].华南理工大学学报（自然科学版）,2015,43(1):21-27. 被引量：2
6邓昀,李朝庆,程小辉.基于物联网的智能家居远程无线监控系统设计[J].计算机应用,2017,37(1):159-165. 被引量：100
7王丰华,王邵菁,陈颂,袁国刚,张君.基于改进MFCC和VQ的变压器声纹识别模型[J].中国电机工程学报,2017,37(5):1535-1542. 被引量：84
8吴震东,潘树诚,章坚武.基于CNN的连续语音说话人声纹识别[J].电信科学,2017,33(3):59-66. 被引量：10
9林海波,王可佳.一种新的听觉特征提取算法研究[J].南京邮电大学学报（自然科学版）,2017,37(2):27-32. 被引量：11
10郑凯鹏,周萍,张上鑫,柯晶晶.基于倒谱分量的融合参数应用于声纹识别[J].微电子学与计算机,2017,34(8):29-32. 被引量：5

引证文献2

1江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：2
2余亚东,李春江,杨丽.基于语音识别的智能家居物联网系统[J].计算机应用,2022,42(S01):391-394. 被引量：12

二级引证文献14

1牛帅,张弛,董振华,何义.WM8978音频处理器的百度AI语音识别[J].单片机与嵌入式系统应用,2023,23(2):42-44. 被引量：6
2韩薇薇.物联网传感器技术在智能家居中的应用[J].电子技术（上海）,2022,51(12):145-147. 被引量：5
3李游,吕微露.基于IDL通用接口的智能家居语音交互控制系统设计[J].现代电子技术,2023,46(17):57-60. 被引量：2
4王彦坤,樊红,樊勇,李晓明,王伟玺,郭仁忠.一种“附近”空间关系增强的多源融合室内定位方法[J].测绘学报,2024,53(1):118-125. 被引量：1
5曾庆宇.基于图像识别的精准分析运动方向语音播报系统设计[J].信息与电脑,2023,35(21):158-160.
6陈小顺,魏子韬.拼合式QR地图及识别车研究与设计[J].电脑知识与技术,2024,20(3):11-14.
7陶雨昂.MFCC特征训练技术在声纹识别中的应用[J].集成电路应用,2024,41(2):386-387. 被引量：1
8焦晓燕.基于改进型DTW的语音识别系统的设计与实现[J].电声技术,2024,48(4):60-62.
9范雅楠,刘浩.万物互联时代下智能家居行业营销创新研究——以小米公司为例[J].北方经贸,2024(6):120-124.
10宋隆霖,张培卿.面向智能家居设备控制的唇形识别系统设计[J].科技创新与生产力,2024,45(7):133-135.

1钱志强,尹青峰.提高纯钨微小孔电火花加工深径比的方法[J].机械设计与制造,2020,0(2):121-123. 被引量：3
2俞飞.海外个人生物信息攻防战[J].方圆,2019(24):24-27.
3和丽华,江涛,潘文林,杨皓然.基于CNN-BGRU的音素识别研究[J].云南民族大学学报（自然科学版）,2020,29(5):493-500. 被引量：1

深圳大学学报（理工版）

2020年第S01期

浏览历史

内容加载中请稍等...

基于小波包全频分解的耐噪声纹识别算法被引量：2

同被引文献28

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于小波包全频分解的耐噪声纹识别算法 被引量：2

同被引文献28

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于小波包全频分解的耐噪声纹识别算法被引量：2