联合因子分析和稀疏表示在稳健性说话人确认中的应用被引量：7

Robust speaker verification using sparse representation on joint factor analysis

下载PDF

导出

摘要在说话人确认的任务中,为了解决信道失配问题,提高系统性能,引入了联合因子分析和稀疏表示算法。首先利用联合因子分析算法去除信道干扰,得到与信道无关的说话人因子,然后在稀疏表示算法中利用说话人因子构建过完备字典,求解稀疏最优化问题计算说话人得分。由于此方法有机结合了联合因子分析算法的信道鲁棒性和稀疏表示的鉴别性,使用此算法构建的系统在NIST SRE 2008电话训练、电话测试数据集上性能表现良好,相对于联合因子分析-支持向量机系统在性能上有竞争性,在原理上有互异性,系统融合更带来了最小检测代价指标上4.91%的性能提升。实验表明使用联合因子分析与稀疏表示进行说话人确认是可行的。 This paper introduced sparse representation on joint factor analysis to solve the channel mismatch problem and to improve system performance. This algorithm uses joint factor analysis to generate the speaker factors space and construct the over-complete dictionary to calculate speaker score by solving the optimization problem. The minimum detection cost function （minDCF） of the system with sparse representation on joint factor analysis gave good performance on NIST speaker recognition evaluation （SRE） 2008 telephone to telephone test corpus. Because the sparse representation algorithm and the support vector machine classification algorithm also have a good complementary, the fusion of JFA-SR and JFA-SVM can achieve 4.91% reduction in minDCF. The results of the experiments show that speaker verification using sparse representation on joint factor analysis is feasible and has a great future.

作者杨海张翔梁春燕索宏彬颜永红

机构地区中国科学院声学研究所中国科学院语言声学与内容理解重点实验室

出处《声学学报》 EI CSCD 北大核心 2012年第5期548-552,共5页 Acta Acustica

基金国家科技支撑计划(2008BAI50B03) 国家自然科学基金(10925419,90920302,10874203,60875014)经费资助

关键词因子分析稀疏表示稳健性说话人确认信道干扰应用最优化问题支持向量机 Algorithms Multivariant analysis Speech recognition Support vector machines Telephone Telephone sets Telephone systems

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献15

1Reynolds D A, Quatieri T F, Dunn R B. Speaker veri- fication using adapted Gaussian mixture models. Digital signal processing, 2000: 10(1-3): 19 41. 被引量：1
2国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
3张建平,李明,索宏彬,杨琳,付强,颜永红.长时语音特征在说话人识别技术上的应用[J].声学学报,2010,35(2):267-269. 被引量：8
4Kenny P, Boulianne G, Ouellet P, Dumouchel P. Joint fac- tor analysis versus eigenchannels in speaker recognition. IEEE Transactions on Audio Speech and Language Pro- cessing, 2007: 15(4): 1435 1447. 被引量：1
5Kenny P, Boulianne G, Ouellet P, Dumouchel P. Speaker and session variability in GMM-based speaker verification. IEEE Transactions on Audio Speech and Language Pro- cessing, 2007: 15(4): 1448 1460. 被引量：1
6Kenny P, Ouellet P, Dehak N, Gupta V, Dumouchel P. A study of interspeaker variability in speaker verification. IEEE Transactions on Audio Speech and Language Pro- cessing, 2008: 16(5): 980-988. 被引量：1
7Naseem I, Togneri R, Bennamoun M. Sparse representation for speaker identification. In: Pattern Recognition (ICPR), 2010 20th International Conference on, 2010. 被引量：1
8Kenny P, Boulianne G, Dumouchel P. Eigenvoice modeling with sparse training data. IEEE Transactions on Audio Speech and Language Processing, 2005: 13(3): 345-354. 被引量：1
9Vogt, Sridharan R S. Explicit modelling of session vari- ability for speaker verification. Computer Speech and Lan- guage, 2008: 22(1): 17 38. 被引量：1
10郭武,李轶杰,戴礼荣,王仁华.说话人识别中的因子分析以及空间拼接[J].自动化学报,2009,35(9):1193-1198. 被引量：14

二级参考文献46

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
3Reynolds D A. Channel Robust Speaker Verification via Feature Mapping// Proc of the IEEE International Conference on Acoustics, Speech and Signal Processing. Hongkong, China, 2003,Ⅱ: 53 -56. 被引量：1
4Deng Jing, Zheng T F, Wu Wenhu. Session Variabihty Subspace Projection Based Model Compensation for Speaker Verification //Proc of the IEEE International Conference on Acoustics, Speech and Signal Processing. Honolulu, USA, 2007, Ⅳ: 47 - 50. 被引量：1
5Kenny P, Ouellet P, Dehak N, et al. A Study of Inter-Speaker Variability in Speaker Verification. IEEE Trans on Audio, Speech and Language Processing, 2008, 16(5) : 980 -988. 被引量：1
6Vogt R, Sridharan S. Experiments in Session Variability Modeling for Speaker Verification// Proc of the IEEE International Conference on Acoustics, Speech and Signal Processing. Toulouse, France, 2006, Ⅰ : 897 -900. 被引量：1
7Campbell W M, Sturim D E, Reynolds D A. Support Vector Machines Using GMM Supervectors for Speaker Verification. IEEE Signal Processing Letters, 2006, 13(5) : 308 -311. 被引量：1
8Reynolds D A, Quatieri T F, Dunn R B. Speaker Verification Using Adapted Gaussian Mixture Models. Digital Signal Processing, 2000, 10(1/2/3): 19-41. 被引量：1
9Castaldo F, Colibro D, Dalmasso E, et al. Compensation of Nuisance Factors for Speaker and Language Recognition. IEEE Trans on Audio, Speech and Language Processing, 2007, 15 ( 7 ) : 1969 - 1975. 被引量：1
10Kenny P, Boulianne G, Dumouchel P. Eigenvoice Modeling with Sparse Training Data. IEEE Trans on Speech and Audio Processing, 2005, 13(3) : 345 -354. 被引量：1

共引文献37

1雷鸣,李学仁,李果.飞机舱音背景声下的鲁棒语音端点检测[J].振动与冲击,2008,27(10):83-86. 被引量：2
2张守宝,谢生荣,何富连.液压支架泄漏检测方法的分析与实践[J].煤炭学报,2010,35(1):145-148. 被引量：21
3姜占才,孙燕,王得芳.基于复合能量和自适应阈值的语音端点检测[J].计算机工程与科学,2010,32(4):136-138. 被引量：1
4程洪炳,雷鸣,李学仁,冀捐灶,李果.飞机舱音信息鲁棒语音端点检测[J].数据采集与处理,2010,25(2):223-227. 被引量：1
5孙彦群,俞一彪.基于有效特征集选择的说话人识别[J].电脑知识与技术,2011,7(4):2360-2362.
6何亮,史永哲,刘加.联合因子分析中的本征信道空间拼接方法[J].自动化学报,2011,37(7):849-856. 被引量：8
7李亚丽,徐为群,颜永红.语义类的提取及其在语音搜索系统中的应用[J].声学学报,2011,36(5):550-556. 被引量：1
8姜涛,韩纪庆,郑铁然.基于高斯混合模型移动因子补偿的说话人识别方法[J].声学学报,2011,36(6):658-664. 被引量：2
9赵晓东,张延杰.基于单片机的便携式智能液压支架测试仪研究[J].煤炭科学技术,2011,39(12):96-98. 被引量：1
10顾晓江,赵鹤鸣,吕岗.模型与特征混合补偿法及其在耳语说话人识别中的应用[J].声学学报,2012,37(2):198-203. 被引量：4

同被引文献97

1郭武,戴礼荣,王仁华.采用UBM更新量作为支持向量机特征的说话人确认[J].清华大学学报（自然科学版）,2008,48(S1):704-707. 被引量：4
2张春梅,尹忠科,肖明霞.基于冗余字典的信号超完备表示与稀疏分解[J].科学通报,2006,51(6):628-633. 被引量：70
3肖汉光,蔡从中,廖克俊.利用声波和地震波识别军事车辆类型[J].系统工程理论与实践,2006,26(4):108-113. 被引量：7
4Donoho.Compressed sensing.IEEE Transactions on Information Theory,2006;52(4):1289-1306. 被引量：1
5Emmanuel J Candes,Michael B Wakin.An introduction to compressive sampling.IEEE Signal Processing Magzaine, 2008;25(2):21-30. 被引量：1
6Mallat S,Zhang Z.Matching pursuits with time-frequency dictionaries.IEEE Transactions on Signal Processing, 1993;41(12):3397-3415. 被引量：1
7Donoho D,Huo X.Uncertainty principles and ideal atomic decompositions.IEEE Transactions on Information Theory, 2001;47(7):2845-2862. 被引量：1
8Davis G,Mallat S,Avellaneda M.Adaptive greedy approximation. Constructive Approximation,1997;13(1):57-98. 被引量：1
9Elad M,Bruckstein A M.A generalized uncertainty principle and sparse representation in pairs of bases.IEEE Trans Information Theory,2003;48(9):1579-1581. 被引量：1
10Peyre G C.Best basis compressed sensing.IEEE Transactions on Signal Processing,2010;58(5):2613-2622. 被引量：1

引证文献7

1曾理,张雄伟,陈亮,杨吉斌,黄建军.分段匹配追踪式Karhunen-Loeve非相干字典语音压缩感知[J].声学学报,2013,38(4):493-500. 被引量：2
2梁春燕,杨琳,周若华,颜永红.韵律特征在概率线性判别分析说话人确认中的应用[J].声学学报,2015,40(1):28-33. 被引量：6
3王瑞,王康晏,冯玉田,张海燕,金彦亮,张有正.复杂场景下声频传感器网络核稀疏表示车辆识别[J].西安电子科技大学学报,2015,42(4):114-120. 被引量：7
4何建超,章坚武,吴震东.一种基于筛选高斯分量的说话人确认方法[J].杭州电子科技大学学报（自然科学版）,2015,35(6):50-54.
5陈斌,陈琦,张连海,屈丹,李弼程.一种区分性互补系统构造与融合的语音识别方法[J].声学学报,2016,41(1):125-134.
6舒毅,邢玉娟.基于i-向量和PCA字典学习稀疏表示的说话人确认[J].计算机工程与应用,2016,52(18):144-147. 被引量：1
7刘晓晨,潘孝勤,曹金璇,芦天亮.声纹识别和语音识别技术在公安领域的应用[J].网络安全技术与应用,2021(4):153-155. 被引量：14

二级引证文献30

1孙林慧,杨震.语音压缩感知研究进展与展望[J].数据采集与处理,2015,30(2):275-288. 被引量：10
2宋宫琨琨,郭业才.基于自给式呼吸器的语音减噪改进方法[J].科学技术与工程,2015,35(16):63-67.
3刁志蕙,冯玉田,王瑞,毕超,李园辉.基于稀疏表示的声频目标识别方法研究[J].电声技术,2016,40(5):31-34.
4酆勇,熊庆宇,石为人,曹俊华.深度非线性度量学习在说话人确认中的应用[J].声学学报,2018,43(1):112-120. 被引量：3
5仲伟峰,方祥,范存航,温正棋,陶建华.深浅层特征及模型融合的说话人识别[J].声学学报,2018,43(2):263-272. 被引量：11
6程淑红,高许,周斌.基于多特征提取和SVM参数优化的车型识别[J].计量学报,2018,39(3):348-352. 被引量：19
7罗涛,冯玉田,唐子成,毕超.基于加权稀疏表示分类的车辆识别[J].电子测量技术,2018,41(6):27-31. 被引量：1
8徐利敏,魏翔.Android平台说话人认证系统的并行计算与设计[J].计算机工程与应用,2017,53(3):231-236.
9赵宏旭,杨文帅.基于短时能量和梅尔倒谱系数的车型音频识别[J].科学技术与工程,2018,18(18):197-201. 被引量：11
10王艳芬,朱绪冉,云霄,孙彦景,石韫开,王赛楠.面向公共安全监控的多摄像机车辆重识别[J].西安电子科技大学学报,2019,46(4):190-196. 被引量：9

1邬坚耀.专题一——函数[J].数学教学通讯（数学金刊）（高考）,2010(7):14-21.
2王胜林.有限集相等的性质及其应用[J].数学通讯（教师阅读）,2004,18(1):22-22.
3陈存宝,赵力,邹采荣.基于极大似然线性回归的模型合成和特征映射进行说话人确认[J].声学学报,2011,36(1):81-87. 被引量：2
4吴加贵,吴正茂,林晓东,张毅,钟东洲,夏光琼.双信道光混沌通信系统的理论模型及性能研究[J].物理学报,2005,54(9):4169-4175. 被引量：23
5陈奎孚,焦群英.链式结构振动系统固有频率的互异性[J].北京农业工程大学学报,1995,15(2):24-28. 被引量：2
6赵建勋.学习集合注意的几个问题[J].数学大世界（教学导向）,2000(1):15-16.
7蒋世信.重视集合中元素的三性[J].数学教学,2009(8):36-37.
8张钟谊.集合问题错解五处谈[J].数学通讯（学生阅读）,2000(18):7-8.
9马静,侯丽敏,王朔中.基于全局背景模型和竞争者模型的说话人确认系统[J].声学技术,2007,26(1):105-110. 被引量：1
10谢恩武.数学后进生的问题与对策[J].未来英才,2016,0(16):27-27.

声学学报

2012年第5期

浏览历史

内容加载中请稍等...

联合因子分析和稀疏表示在稳健性说话人确认中的应用被引量：7

参考文献15

二级参考文献46

共引文献37

同被引文献97

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

联合因子分析和稀疏表示在稳健性说话人确认中的应用 被引量：7

参考文献15

二级参考文献46

共引文献37

同被引文献97

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

联合因子分析和稀疏表示在稳健性说话人确认中的应用被引量：7