说话人识别的特征组合方法被引量：2

Feature combination method in speaker recognition

下载PDF

导出

摘要针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。 Focusing on the issue that direct combination of Linear Prediction Coefficient（ LPC） and Mel Frequency Cepstrum Coefficient（ MFCC） will increase the dimension of the feature parameters and lead to heavy computation,the method by integrating LPC parameters into the computation of MFCC parameters was proposed. Firstly,LPC parameters from speech singal were calculated and the speech power spectrum of LPC were gotten; Secondly,the logarithm of output by making the speech power spectrum of LPC through triangular filter group was conducted. Finally,the output of logarithm was transformed by discrete cosine transform,and a new feature factor which is called Linear Prediction Mel Frequency Cepstrum Coefficient（ LPMFCC） was obtained. LPMFCC parameters had both vocal track of LPC parameters and auditory of MFCC parameters. Although increasing a step of computation,the dimension of parameters was not increased and computation cost was relatively low. The simulation results show that the speaker recognition rate of the proposed LPMFCC parameters promotes by 18. 57% and 10% than the speaker recognition rate of LPC parameters and MFCC parameters respectively in the pure voice database,while by 13. 22% and 4. 55% respectively in various noise environments.

作者毛燕湖曾以成陈雨莺谢小娟

机构地区湘潭大学物理与光电工程学院

出处《计算机应用》 CSCD 北大核心 2015年第A02期242-244,共3页 journal of Computer Applications

基金国家自然科学基金资助项目(60972147)

关键词说话人识别梅尔频率倒谱系数线性预测系数矢量量化高斯混合模型 speaker recognition Mel frequency cepstrum coefficient linear prediction coefficient Vector Quantization（VQ） Gaussian Mixture Model（GMM）

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献11

1赵力编著..语音信号处理[M].北京:机械工业出版社,2003:316.
2王书诏,邱天爽.说话人识别研究综述[J].电声技术,2007,31(1):51-55. 被引量：9
3吴朝晖,杨莹春著..说话人识别模型与方法[M].北京:清华大学出版社,2009:329.
4ZHU L, YANG Q. Speaker recognition system based on weighted feature parameter[ J]. Physics Procedia, 2012, 25:1515 -1522. 被引量：1
5余建潮,张瑞林.基于MFCC和LPCC的说话人识别[J].计算机工程与设计,2009,30(5):1189-1191. 被引量：47
6YUAN Y, ZHAO P, ZHOU Q. Research of speaker recognition based on combination of LPCC and MFCC[ C ]// Proceedings of 2010 International Conference on Intelligent Computing and Intelli- gent Systems. Piscataway: IEEE Press, 2010, 3:765-767. 被引量：1
7谢迎春,于湘珍,刘建平,张卫华.基于多特征有效组合的说话人识别[J].现代电子技术,2005,28(9):68-70. 被引量：5
8鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：16
9PATEL K, PRASAD R K. Speech recognition and verification using MFCC & VQ[ J]. International Journal of Emerging Science and En- gineering, 2013, 1(7) : 33 -37. 被引量：1
10SRINIVASAN A. Speaker identification and verification using vec- tor quantization and Mel frequency cepstral coefficients[ J]. Re- search Journal of Applied Sciences, Engineering and Technology, 2012, 4(1): 33-40. 被引量：1

二级参考文献44

1徐涛,杨国庆,陈松灿.数据融合的概念、方法及应用[J].南京航空航天大学学报,1995,27(2):258-265. 被引量：14
2丁爱明.作为说话人识别特征参量的M FCC的提取过程[J].电子工程师,2006,32(1):51-53. 被引量：10
3于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
4任江涛,孙婧昊,施潇潇,黄焕宇,印鉴.一种用于文本聚类的改进的K均值算法[J].计算机应用,2006,26(B06):73-75. 被引量：24
5周长锋,韩力群.概率神经网络在文本无关说话人识别中的应用[J].北京工商大学学报（自然科学版）,2007,25(1):49-51. 被引量：1
6张芸,李昕,郑宇,杨庆涛.一种基于Fisher准则的说话人识别方法研究[J].兰州大学学报（自然科学版）,2007,43(2):92-97. 被引量：5
7Rudasi L, Zahorian SA. Text-independent talker identification with neural networks [C].ICAS SP91,1991:389-392. 被引量：1
8宫晓梅,王怀阳.噪声环境下MFCC特征提取[J].微计算机信息,2007,23(22):247-249. 被引量：9
9Atal B S.Automatic Recognition of Speakers from Their Voices[J].Proceedings of IEEE,1976,64(4):460-475. 被引量：1
10Naik J M.Speaker verification:Atutorial[J].IEEE Commucation Magazine,1990,28(1):42-48. 被引量：1

共引文献71

1张晓俊,陶智,顾济华,赵鹤鸣,施晓敏.基于PCNN和DTW的语音识别系统设计[J].通信技术,2007,40(4):60-62. 被引量：3
2李鹏,马道钧,余菲.基于聚类分析的说话人识别研究[J].仪器仪表用户,2008,15(1):15-16.
3张飞云,王红艳.噪声环境中基于VQ说话人识别[J].现代电子技术,2009,32(22):119-122.
4李雨凇,周治平.采用决策层融合的人脸语音识别技术[J].微电子学与计算机,2010,27(4):111-114.
5叶蕾,方鹏.文本无关的说话人识别系统抗噪方法研究[J].计算机与现代化,2010(10):16-19.
6王红丽,崔荣一.基于SVM的说话声实时检测[J].延边大学学报（自然科学版）,2010,36(3):257-262.
7王润舵.一种基于DBN信息融合的说话人识别方法[J].桂林电子科技大学学报,2010,30(6):581-585.
8方凡泉,李心广,王桂珍,林江豪.语音质量客观评价方法研究及实现[J].广州大学学报（自然科学版）,2011,10(1):65-69. 被引量：4
9王易川,李智忠.基于Mel倒谱和BP神经网络的船舶目标分类研究[J].传感器与微系统,2011,30(6):55-57. 被引量：2
10周燕.基于Fast ICA的多说话人识别系统[J].苏州市职业大学学报,2011,22(2):10-13.

同被引文献9

1高慧,苏广川,陈善广.基于Teager能量算子(TEO)非线性特征的语音情绪识别[J].航天医学与医学工程,2005,18(6):427-431. 被引量：8
2刘庆华.基于声门闭合瞬间检测的时延算法研究[J].电声技术,2006,30(9):45-49. 被引量：1
3李燕萍,唐振民,丁辉,张燕.一种适于说话人辨认的自适应频率尺度变换[J].南京理工大学学报,2010,34(2):182-186. 被引量：2
4陈丽萍,王尔玉,戴礼荣,宋彦.基于深层置信网络的说话人信息提取方法[J].模式识别与人工智能,2013,26(12):1089-1095. 被引量：5
5李壮辉.基音特征融合高斯混合模型的说话人识别研究[J].测控技术,2014,33(6):28-31. 被引量：2
6张涛涛,陈丽萍,蒋兵,戴礼荣.采用深度神经网络的说话人特征提取方法[J].小型微型计算机系统,2017,38(1):142-146. 被引量：8
7秦楚雄,张连海.基于DNN的低资源语音识别特征提取技术[J].自动化学报,2017,43(7):1208-1219. 被引量：25
8白静,史燕燕,薛珮芸,郭倩岩.融合非线性幂函数和谱减法的CFCC特征提取[J].西安电子科技大学学报,2019,46(1):86-92. 被引量：11
9周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：44

引证文献2

1茅正冲,王俊俊.基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统[J].南京理工大学学报,2018,42(1):82-88. 被引量：4
2曾金芳,徐文涛,黄费贞.基于耳蜗倒谱系数的说话人识别[J].电子技术与软件工程,2020(5):85-86. 被引量：1

二级引证文献5

1贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：5
2朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：15
3王家盛,郭其威,吴松,马建敏.基于特征相对贡献度对加权Mel倒谱的改进[J].声学技术,2021,40(3):408-414. 被引量：4
4冯晓静,白静,薛珮芸,戎如意.基于双模态融合特征的模糊语音识别研究[J].电子设计工程,2022,30(2):43-48. 被引量：3
5龙华,黄张衡,邵玉斌,杜庆治,苏树盟.基于改进CFCC特征提取的语种识别算法研究[J].通信学报,2022,43(12):211-221. 被引量：1

1陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11
2李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25
3李哲军,周萍,景新幸.基于改进噪声估计的谱减法应用于说话人识别[J].计算机测量与控制,2016,24(4):155-158.
4舒若,李世宝,潘辛.SVAC音频编码的特征参数量化器改进[J].信息技术,2014,38(6):50-54.
5胡斌,何其超.语音LPC参数的自适应LMS实时估计算法[J].声学学报,1992,17(1):65-70. 被引量：1
6胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：19
7魏君颖,魏维.说话人识别特征提取算法改进[J].成都信息工程学院学报,2014,29(S1):67-70. 被引量：1
8潘海琦,杨震,徐珑婷,朱俊华.一种基于压缩感知的说话人识别参数分析[J].数据采集与处理,2015,30(2):399-407. 被引量：2
9Abe,Y,朱晓红.应用与声学／语音环境有关的音素样板的动态...[J].南邮科技译丛,1991(2):60-66.
10杨俊成,李淑霞.基于MFCC特征和隐马尔可夫模型的咳嗽信号自动识别[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(6):799-801. 被引量：1

计算机应用

2015年第A02期

浏览历史

内容加载中请稍等...

说话人识别的特征组合方法被引量：2

参考文献11

二级参考文献44

共引文献71

同被引文献9

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

说话人识别的特征组合方法 被引量：2

参考文献11

二级参考文献44

共引文献71

同被引文献9

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

说话人识别的特征组合方法被引量：2