基于分层识别的快速说话人识别研究被引量：3

Fast speaker recognition based on hierarchical recognition

下载PDF

导出

摘要随着说话人模型数量的增加,说话人识别系统的识别速度下降,不能满足实时性要求。针对这个问题,提出了基于分层识别模型的快速说话人识别方法。将变分法求解的KL散度的近似值作为模型间的相似性度量准则,并设计了说话人模型聚类的方法。结果表明,本文方法能够保证说话人模型聚类结果的有效性,在系统识别率损失很小的情况下,使系统的识别速度得到大幅度提升。 As the number of speaker models increases,the recognition speed of the speaker recognition system decreases,thus it cannot meet real-time requirement.To solve this problem,we propose a fast speaker recognition method based on hierarchical recognition model.The approximate value of the KL divergence solved by the variational method is used as the similarity measure between speaker models and a speaker model clustering method is designed.Experimental results show that the proposed method can ensure the validity of speaker model clustering results and improve the recognition speed of the system greatly while maintaining a small system recognition rate loss.

作者茅正冲涂文辉 MAO Zheng-chong;TU Wen hui(Key Laboratory of Advanced Process Control for Light Industry Ministry of Education,Jiangnan University,Wuxi 214122,China)

机构地区江南大学轻工过程先进控制教育部重点实验室

出处《计算机工程与科学》 CSCD 北大核心 2018年第7期1244-1249,共6页 Computer Engineering & Science

基金国家自然科学基金(60973095) 江苏省自然科学基金(BK20131107)

关键词高斯混合模型说话人识别 KL散度模型聚类 Gauss mixture model speaker recognition KL divergence model clustering

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1熊华乔,郑建彬,詹恩奇,汪阳,华剑.基于说话人模型聚类的说话人识别[J].计算机工程与应用,2014,50(2):133-136. 被引量：2
2安茂波,刘建.一个快速说话人识别系统的设计和实现[J].网络新媒体技术,2012,1(3):37-41. 被引量：1
3余艳.融合KL散度和移地距离的高斯混合模型相似性度量方法[J].计算机应用,2014,34(3):828-832. 被引量：4
4王欢良,韩纪庆,郑贵滨.基于K-L散度模型聚类的快速说话人辨识方法[J].模式识别与人工智能,2010,23(6):856-861. 被引量：5

二级参考文献37

1刘文举,孙兵,钟秋海.基于说话人分类技术的分级说话人识别研究[J].电子学报,2005,33(7):1230-1233. 被引量：5
2Campbell J P.Speaker Recognition:A Tutorial.Proc of the IEEE,1997,85(9):1437-1462. 被引量：1
3Pellom B L,Hansen J H L.An Efficient Scoring Algorithm for Gaussian Mixture Model Based Speaker Identification.IEEE Signal Processing Letter,1998,5(11):281-284. 被引量：1
4McLaughlin J,Reynolds D A,Gleeson T.A Study of Computation Speed-Ups of the GMM-UBM Speaker Recognition System // Proc of the 6th European Conference on Speech Communication and Technology.Budapest,Hungary,1999:1215-1218. 被引量：1
5Kinnunen T,Karpov E,Franti P.Real-Time Speaker Identification and Verification.IEEE Trans on Audio,Speech,and Language Processing,2006,14(1):277-288. 被引量：1
6Jhanwar N,Raina A K.Pitch Correlogram Clustering for Fast Speaker Identification.EURASIP Journal on Applied Signal Processing,2004,17:2640-2649. 被引量：1
7Xiong Zhenyu,Zheng T F,Song Zhanjiang,et al.Combining Selection Tree with Observation Reordering Pruning for Efficient Speaker Identification Using GMM-UBM // Proc of the IEEE International Conference on Acoustics,Speech and Signal Processing.Philadelphia,USA,2005:625-628. 被引量：1
8Aronowitz H,Burshtein D.Efficient Speaker Recognition Using Approximated Cross Entropy (ACE).IEEE Trans on Audio,Speech and Language Processing,2007,15(7):2033-2043. 被引量：1
9Apsingekar V R,Leon P L D.Efficient Speaker Identification Using Speaker Model Clustering // Proc of the 16th European Signal Processing Conference.Lausanne,Switzerland,2008:64-68. 被引量：1
10Kullback S,Leibler R A.On Information and Sufficiency.Annals of Mathematical Statistics,1951,22(1):79-86. 被引量：1

共引文献8

1郭艳平,颜文俊,包哲静,杨强.基于经验模态分解和散度指标的风力发电机滚动轴承故障诊断方法[J].电力系统保护与控制,2012,40(17):83-87. 被引量：39
2边根庆,龚培娇,邵必林.基于K-L散度的恶意代码模型聚类检测方法[J].计算机工程,2014,40(12):104-107. 被引量：1
3于永军,贾子文,顾煜炯,王方楠.基于阶比与散度分析的风机齿轮箱故障诊断[J].电力科学与工程,2017,33(1):7-14. 被引量：1
4朱昀,王俊,陈刚,郭帅.一种新的避免航迹合并的联合综合概率数据关联滤波器[J].电子与信息学报,2017,39(10):2346-2353.
5张建恒,黄蔚,胡国超.基于LDA模型和AP聚类的主题事件抽取技术[J].计算机与现代化,2017(12):77-81. 被引量：1
6赖松轩,李艳雄.说话人聚类的初始类生成方法[J].计算机工程与应用,2017,53(3):149-153.
7杨小艳.基于对称Kullback-Leibler散度的点集配准方法[J].激光与光电子学进展,2020,57(8):193-199.
8钱立恩,马国峰,庞博.基于深度学习的敏感音频分类[J].通信对抗,2021,40(1):6-9.

同被引文献17

1柏航州,王隆太.基于声发射技术的磨削监控系统开发与试验研究[J].现代制造工程,2008(5):121-125. 被引量：14
2刘科,田书林,肖寅东.多通道任意波形发生器精密相位控制方法[J].信息与控制,2011,40(2):209-213. 被引量：6
3周静雷,江浩,乔站仙.基于ARM与DSP的声频数据采集系统设计[J].电子测量技术,2012,35(10):102-106. 被引量：10
4冯晓荣,潘海.基于ARM的A型脉冲超声波探伤系统设计[J].计算机光盘软件与应用,2013,16(7):241-241. 被引量：3
5耿荣生,沈功田,刘时风.声发射信号处理和分析技术[J].无损检测,2002,24(1):23-28. 被引量：162
6谭振贇.嵌入式系统应用现状及发展趋势概述[J].数字技术与应用,2015,33(6):16-16. 被引量：7
7龙铭,文章,黄文艺,周建民,周继慧.滚动轴承故障程度评估的AR-GMM方法[J].机械科学与技术,2016,35(8):1183-1188. 被引量：6
8郑方,李蓝天,张慧,艾斯卡尔.肉孜.声纹识别技术及其应用现状[J].信息安全研究,2016,2(1):44-57. 被引量：48
9朱文杰,王广龙,田杰,乔中涛,高凤岐.空时自适应混合高斯模型复杂背景运动目标检测[J].北京理工大学学报,2018,38(2):165-172. 被引量：16
10邱雷,房芳,袁慎芳,梅寒飞.导波强化裂变聚合概率模型损伤监测方法[J].振动．测试与诊断,2018,38(3):438-445. 被引量：9

引证文献3

1杨勇.VC++中位图的几种显示特技[J].电脑编程技巧与维护,2000(5):77-84.
2王刚,肖黎,屈文忠.Lamb波高斯混合模型螺栓松动损伤检测[J].机械科学与技术,2020,39(4):493-500. 被引量：6
3王丽萍,王光明.基于ARM的多通道大功率脉冲声发射器的设计[J].自动化与仪器仪表,2021(3):115-118. 被引量：2

二级引证文献8

1刘阳,丁奉龙,刘英,沈鹭翔,董瑞文.基于高斯混合模型的青梅表面缺陷检测识别技术[J].林业工程学报,2020,5(4):139-144. 被引量：9
2陈世超,崔春雨,张华,马戈,朱凤华,商秀芹,熊刚.制造业生产过程中多源异构数据处理方法综述[J].大数据,2020,6(5):55-81. 被引量：14
3郭履宝,刘子国,徐贤炜,夏鲲.非接触物体尺寸形态测量系统[J].单片机与嵌入式系统应用,2021,21(9):73-77. 被引量：1
4李红发,程绍兵,王荣鹏,董志聪,夏敏,黄哲,王灵坤.松紧状态可视化的螺栓结构优化[J].技术与市场,2022,29(4):47-49.
5刘俊燚,李宁,姜玉虎,李美求.基于经验模态分解的螺栓连接状态敲击检测方法[J].机床与液压,2022,50(16):18-23. 被引量：1
6张敏照,王乐,田鑫海.基于内积矩阵及卷积自编码器的螺栓松动状态监测[J].工程力学,2022,39(12):222-231. 被引量：6
7王保宪,欧丙泽,赵维刚,谭兆,秦守鹏.钢桥密集螺栓异常状态视觉识别方法[J].中国铁道科学,2023,44(5):81-93. 被引量：1
8陶曾杰,熊宇,任锦锦,王馨逸.非接触式物体形状和尺寸自动测量系统的设计[J].自动化与仪表,2024,39(1):112-115.

1刘镇,范远超,卜禹,陆璐璐.基于并行化的说话人识别方法的研究[J].信息技术,2017,41(10):121-123.
2曾台英,杜菲.基于层次聚类的图像超分辨率重建[J].光学学报,2018,38(4):122-129. 被引量：13
3刘世杰,王虹.声纹检验技术现状与发展评析[J].山东化工,2018,47(15):79-80. 被引量：5
4薛丽萍,姚应龙,王志强,周虹.说话人识别中基于粒子群优化的GMM训练方法[J].软件工程与应用,2013,2(1):1-5.
5李杨,梁炜,谈金东.关于腰椎CT图像病灶区域优化检测仿真[J].计算机仿真,2018,35(7):327-330. 被引量：2
6艾斯卡尔·肉孜,王东,李蓝天,郑方,张晓东,金磐石.说话人识别中的分数域语速归一化[J].清华大学学报（自然科学版）,2018,58(4):337-341. 被引量：4
7刘俊坤,李燕萍,凌云志.基于AutoEncoder DBN-VQ的说话人识别系统[J].计算机技术与发展,2018,28(2):45-49. 被引量：2
8谢松云,李亚兵,王伟,孟雅,谢辛舟.基于行为学的无人机操作员认知状态评估[J].西北工业大学学报,2018,36(4):715-721.
9方赛鸿.一种改进的双麦克智能语音前端算法[J].信息技术与网络安全,2018,37(2):127-130.
10裴煜.Y—STR家系排查法在侦查中应用的思考[J].湖南警察学院学报,2018,30(1):22-30. 被引量：9

计算机工程与科学

2018年第7期

浏览历史

内容加载中请稍等...

基于分层识别的快速说话人识别研究被引量：3

参考文献4

二级参考文献37

共引文献8

同被引文献17

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于分层识别的快速说话人识别研究 被引量：3

参考文献4

二级参考文献37

共引文献8

同被引文献17

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于分层识别的快速说话人识别研究被引量：3