期刊文献+

融合注意力机制的Res2Net-LSTM声纹识别方法

原文传递
导出
摘要 针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重进行调整,通过关注重点区域,提高分类性能。在公开的Voxceleb1数据集上进行验证,实验结果表明,相较于ResNetLSTM、Res2Net-LSTM准确率分别提升了10.4%,10.5%,验证了该方法具有更好的性能。
作者 李坤明
机构地区 郑州警察学院
出处 《网络安全技术与应用》 2024年第5期58-61,共4页 Network Security Technology & Application
基金 中央高校基本科研业务经费项目(2022TJJBKY026,2022TJJBKY009)。
  • 相关文献

参考文献7

二级参考文献22

  • 1Kenny P,Dumouchel P.Experiments in speaker verificationusing factor analysis likelihood ratios[].Proc Odyssey.2004 被引量:1
  • 2Campbell W M,Sturimv D E,Reynolds D A.SVM basedspeaker verification suing a GMM supervector kernel andNAP variability compensation[].Signal ProcessingLetters.2006 被引量:1
  • 3Cristianini N,Shawe-Taylor J.Support Vector Machines[]..2000 被引量:1
  • 4Solomonoff A,Campbell W M,Boardman I.Advances inchannel compensation for SVM speaker recognition[].Proc ICASSP.2005 被引量:1
  • 5XIONG Zhengyu,ZHENG Fang,SONG Zhanjiang,et al.Combining selection tree with observation reordering pruningfor efficient speaker identification using GMM-UBM[].Proc ICASSP.2005 被引量:1
  • 6Wan V,Renals S.Support Vector machine speakerverification methodology[].AcousticsSpeech and SignalProcessing.2003 被引量:1
  • 7DENG Jing,ZHENG Fang,WU Wenhu.Session variabilitysubspace projection based model compensation for speakerverification[].AcousticsSpeech and Signal Processing.2007 被引量:1
  • 8Furui S.Cepstral analysis technique for automatic speakerverification[].IEEE Trans Acoust Speech SignalProcessing.1981 被引量:1
  • 9Viikki O,Laurila K.Noise robust HMM-based speechrecognition using segmental cepstral feature vectornormalization[].ESCA NATO Workshop on RobustSpeech Recognition for Unknown Communication Channels.1997 被引量:1
  • 10D. A. Reynolds,T. Quatieri,and R. Dunn.Speaker verification using adapted Gaussian mixture models[].Digital Signal Processing.2000 被引量:1

共引文献87

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部