基于深层信息散度最大化的说话人确认方法被引量：2

Speaker verification method based on deep information divergence maximization

下载PDF

导出

摘要针对说话人确认中无法准确捕获特征间非线性关系的问题,提出了一种基于深层信息散度最大化的目标函数表示方法。该方法能通过计算特征所在分布之间相似度,来对特征间的非线性关系进行隐性表示,并在最大化这种统计相关性的优化目标指导下,使深度神经网络向着同类数据更紧凑、异类数据更分散的方向优化,最终达到提升深层特征空间区分性的目标。实验结果表明,相对于其他深度学习方法,所提方法的相对等错误率(EER)最多降低了15.80%,显著提升了系统性能。 To solve the problem that the nonlinear relationship between speaker representations cannot be accurately captured in speaker verification,an objective function based on depth information divergence maximization was proposed.It could implicitly represent the nonlinear relationship between speaker representations by calculating the similarity be-tween their distributions.Under the supervision of the optimization goal of maximizing the statistical correlation,the deep neural network was optimized towards the direction that the within-class data was more compact and the be-tween-class data were far away from each other,and finally the discrimination of deep speaker representation space could be effectively improved.Experimental results show that compared with other deep learning methods,the relative EER of the proposed method is reduced by 15.80%at most,which significantly improves the system performance.

作者陈晨肜娅峰季超群陈德运何勇军 CHEN Chen;RONG Yafeng;JI Chaoqun;CHEN Deyun;HE Yongjun(School of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China;Postdoctoral Research Station of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China)

机构地区哈尔滨理工大学计算机科学与技术学院哈尔滨理工大学计算机科学与技术博士后流动站

出处《通信学报》 EI CSCD 北大核心 2021年第7期231-237,共7页 Journal on Communications

基金国家自然科学基金资助项目(No.61673142) 黑龙江省自然科学基金资助项目(No.JJ2019JQ0013) 黑龙江省博士后专项基金资助项目(No.LBH-Z20020) 黑龙江省普通高校基本科研业务费专项资金资助项目(No.2020-KYYWF-0341)。

关键词说话人确认目标函数深层信息散度特征表示学习 speaker verification objective function deep information divergence representation learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1郑方,李蓝天,张慧,艾斯卡尔.肉孜.声纹识别技术及其应用现状[J].信息安全研究,2016,2(1):44-57. 被引量：48
2张钹,朱军,苏航.迈向第三代人工智能[J].中国科学：信息科学,2020,50(9):1281-1302. 被引量：158
3高荣春,韩纪庆,张磊.说话人识别中基于最大后验概率的通道补偿方法[J].通信学报,2009,30(3):99-103. 被引量：2
4汪海彬,郭剑毅,毛存礼,余正涛.基于通用背景-联合估计(UB-JE)的说话人识别方法[J].自动化学报,2018,44(10):1888-1895. 被引量：5
5陈莹,陈湟康.基于多模态生成对抗网络和三元组损失的说话人识别[J].电子与信息学报,2020,42(2):379-385. 被引量：4
6龙华,杨明亮,邵玉斌.基于特征流融合的带噪语音检测算法[J].通信学报,2020,41(4):134-142. 被引量：6

二级参考文献24

1FURUI S. Cepstral analysis technique for automatic speaker verification[J]. IEEE Trans on Acoustic, Speech and Signal Processing, 1981, 29(2): 254-272. 被引量：1
2GONG Y E. Speech recognition in noisy environments: a survey[J]. Speech Communication, 1995, 16: 261-291. 被引量：1
3HERMANSKY H, MORGAN N, HIRSCH H. Recognition of speech in additive and convolutional noise based on RASTA spectral processing[A]. Proceedings of the International Conference on Acoustics, Speech, and Signal Processing[C]. 1993.83-86. 被引量：1
4QUATIERI T E REYNOLDS D A, O'LEARY G C. Estimation of handset nonlinearity with application to speaker recognition[J]. IEEE Transcation on Speech and Audio Processing, 2000, 8(5): 567-583. 被引量：1
5SUN S C, JI L X. Design keyword recognition system over telephone channel based on muti-band processing[A]. The Second IEEE Conference on Industrial Electronics and Applications[C]. 2007.2235- 2238. 被引量：1
6JUNANG B H, RABINER L R, WILPON J G. On the use of bandpass filtering in speech recognition[J]. IEEE Transctions on Acoustic, Speech and Signal Processing, 1987, 35: 871-879. 被引量：1
7ZHOU X, FU Y, LIU M. Robust analysis and weighting on MFCC components for speech recognition and speaker identification[A]. ICME 2007[C]. 2007. 188-191. 被引量：1
8GALES M, YOUNG S. HMM recognition in noise using parallel model combination[A]. Proc of Eurospeech-93 [C]. 1993.342-346. 被引量：1
9GALES M, YOUNG S. Robust continuous speech recognition using parallel model combination[A]. Transactions on Speech and Audio Processing[C]. 1996. 352-359. 被引量：1
10MORENO P J, RAJ B, STERN R M. A vector taylor approach for environment independent speech recognition[A]. Proc ICASSP[C]. New York, 1996.733-736. 被引量：1

共引文献217

1龚善要.人工智能司法应用的实践审思与完善[J].国家检察官学院学报,2023,31(5):95-108. 被引量：4
2尚凡成,孔繁钰,詹可,朱仁传.基于神经网络的船舶剖面参数化建模与辐射水动力系数预测[J].水动力学研究与进展（A辑）,2022,37(6):751-756.
3刘三女牙.人工智能与教育双向赋能的人才培养模式创新和体系重构[J].科教发展研究,2022(2):42-56. 被引量：5
4王丽莉.一种具有自学习能力的用户感知人工智能测量方法[J].电子测量技术,2023,46(6):147-152. 被引量：1
5王沛然.从控制走向训导:通用人工智能的“直觉”与治理路径[J].东方法学,2023(6):188-198. 被引量：17
6杨勇.VC++中位图的几种显示特技[J].电脑编程技巧与维护,2000(5):77-84.
7胡学海,王厚军,黄建国.分布式目标检测融合决策优化算法[J].电子科技大学学报,2013,42(3):375-379. 被引量：3
8石国飞.声纹识别技术在智能建筑中的应用[J].低碳世界,2017,7(2):162-163. 被引量：1
9王煜.说话人识别研究现状[J].数字技术与应用,2017,35(6):59-61. 被引量：2
10朱虹,金小峰.改进的跨语种说话人确认方法的研究[J].延边大学学报（自然科学版）,2017,43(2):184-188.

同被引文献3

1李明,张勇,李军权,张亚芬.改进PSO-SVM在说话人识别中的应用[J].电子科技大学学报,2007,36(6):1345-1349. 被引量：9
2杨成福,章毅.相关向量机及在说话人识别应用中的研究[J].电子科技大学学报,2010,39(2):311-315. 被引量：13
3姜珊,张二华,张晗.基于Bi-GRU+BFE模型的短语音说话人识别[J].计算机与数字工程,2022,50(10):2233-2239. 被引量：2

引证文献2

1陈晨,季超群,李文文,陈德运,王莉莉,杨海陆.基于互信息自适应估计的说话人确认方法[J].电子科技大学学报,2023,52(1):125-131. 被引量：1
2张玉莲,姚姗姗,王超,畅江.基于不确定性学习的文本无关的说话人确认方法[J].计算机应用,2023,43(12):3727-3732.

二级引证文献1

1鲁程逸,代子正,王艳红.基于情感分析的电商平台评论应用研究[J].科技创业月刊,2023,36(10):150-154. 被引量：1

1孟雷.高校财务管理中的精细化管理应用[J].现代营销（上）,2020(12):244-245. 被引量：2
2史静娴,胡杰.2016-2020年浙江省技术交易市场分析及发展对策[J].科技视界,2021(19):184-185. 被引量：2
3薛纱纱.建筑业收入的财税处理——基于新收入准则视角[J].财经界,2021(19):195-196. 被引量：2
4邵小青,贾钰峰,章蓬伟,丁娟.基于K-Means聚类算法的数据分析[J].科学技术创新,2021(23):85-86. 被引量：9
5陈浩,徐菁,曾锦树,闫业磊,王乾伟,沈歆,黄玉芬,徐飞.肥胖儿童递增负荷运动中HRVT与AT的一致性研究[J].湖北体育科技,2021,40(6):544-548. 被引量：3
6张志林,李玉鑑,刘兆英,张婷.深度学习在细粒度图像识别中的应用综述[J].北京工业大学学报,2021,47(8):942-953. 被引量：12
7王军.基于新收入准则的信息流广告代理收入确认方法选择分析[J].企业改革与管理,2021(6):196-197. 被引量：3
8白皓.新媒体背景下的视频广告智能识别研究[J].电子设计工程,2021,29(15):184-188. 被引量：1
9李海军,张中来,苏之勇,袁铁锁,楚雪靖,翟俊杰,张朋飞,丁柘涵,寇景康,王芳,牛华文,谢余越.风机对冷藏车制冷系统性能的影响[J].流体机械,2021,49(7):91-97. 被引量：5
10孙靖超,刘为军.基于多采样双向编码表示的网络舆情主题识别研究[J].情报科学,2021,39(7):147-152. 被引量：1

通信学报

2021年第7期

浏览历史

内容加载中请稍等...

基于深层信息散度最大化的说话人确认方法被引量：2

参考文献6

二级参考文献24

共引文献217

同被引文献3

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深层信息散度最大化的说话人确认方法 被引量：2

参考文献6

二级参考文献24

共引文献217

同被引文献3

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深层信息散度最大化的说话人确认方法被引量：2