采用HDPHMM符号化器的语音查询样例检测方法被引量：1

Query-by-example Spoken Term Detection by Applying the HDPHMM Tokenizer

下载PDF

导出

摘要提出一种基于层级狄利克雷过程隐马尔科夫模型(HDPHMM)符号化器的无监督语音查询样例检测(Qb E-STD)方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过对顶层状态假设一个层级狄利克雷过程先验,获得非参贝叶斯模型HDPHMM。使用无标注语音数据对该模型进行训练,然后对测试语音和查询样例输出后验概率特征矢量,使用非负矩阵分解算法对后验概率进行优化得到新的特征,然后在此基础上,应用修正分段动态时间规整算法进行检索,构成Qb E-STD系统。实验结果表明,相比于基于高斯混合模型符号化器的基线系统,本文所提出的方法性能更优,检索精度得到显著提升。 This paper presents a study of hierarchical Dirichlet processing hidden Markov model （HDPHMM） approach for unsupervised query-by-example spoken term detection （QbE-STD）. First a hierarchical hidden Markov model is applied, in which the top layer states are used for representing the finding acoustic units, bottom layer states are used for modeling the emission probability of top layer states. We can get a nonparametric Bayesian model HDPHMM when imposing a hierarchical Dirichlet processing prior on the top layer states. After the model is trained by unlabeled speech data, it outputs posteriorgram feature vector for test utterance and query term. The posteriorgram feature is optimized by non-negative matrix factorization al- gorithm. Then the detection is performed by modified SDTW algorithm. Experimental results show that the proposed method outperforms the baseline system based on Gaussian mixture model tokenizer, and improve the detection precision obviously.

作者曹建凯张连海

机构地区解放军信息工程大学信息系统工程学院

出处《信号处理》 CSCD 北大核心 2017年第5期703-710,共8页 Journal of Signal Processing

基金国家自然科学基金资助项目(61673395 61403415 61302107)

关键词无监督语音查询样例检测层级狄利克雷过程非负矩阵分解 unsupervised query-by-example spoken term detection hierarchical Dirichlet processing non-negative ma- trix factorization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1胡永刚,张雄伟,邹霞,闵刚,郑云飞,李莉,石佳佳.改进的非负矩阵分解语音增强算法[J].信号处理,2015,31(9):1117-1123. 被引量：7

二级参考文献20

1张雄伟,等.现代语音处理技术及应用[M].北京:机械丁业出版社,2009. 被引量：3
2Loizou P C. Speech Enhancement: Theory and Practice [ M ]. Signal Processing and Communications, 2007. 被引量：1
3Boll S. Suppression of acoustic noise in speech using spec- tral subtraction [ J ]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1979, 27(2) :113-120. 被引量：1
4Hung Wei Tseng, Srikanth Vishnubhotla, et al. A novel single channel speech enhancement approach by combi- ning wiener filter and dictionary learning [ C ]//Vancou- ver: Acoustics, Speech and Signal Process ( ICASSP), IEEE, 2013:8653-8657. 被引量：1
5Yu Wang, Mike Brookes. Speech enhancement using a robust kalman filter post-processor in the modulation do- main [ C ]//Vancouver: Acoustics, Speech and Signal Process (ICASSP), IEEE, 2013:7457-7461. 被引量：1
6Borgstrom B J, Alwan A. Log-spectral amplitude estima- tion with generalized Gamma distributions for speech en- hancement [ C ] ///Prague: IEEE Int. Conf. Acoustic, Speech and Signal Process (ICASSP), 2011: 4756-4759. 被引量：1
7Srinivasan S, Samuelsson J, Kleijn W B. Codebook driv- en short term predictor parameter estimation for speech enhancement [ J ]. IEEE Trans. Audio, Speech, and Language Process, 2006, 14 ( 1 ) : 163-176. 被引量：1
8Xu Y, Du J, Dai L R, et al. A regression approach to speech enhancement based on deep neural networks [ J ]. IEEE Transactions on Audio, Speech, and Language Pro- cessing, 2015, 23(1), 7-19. 被引量：1
9Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization [J]. Nature, 1999, 401 (10) :788-791. 被引量：1
10Smaragdis P. Convolutive speech bases and their applica- tion to supervised speech separation [ J ]. IEEE Trans. on Audio, Speech and Language Processing, 2007, 15 (1) :1-12. 被引量：1

共引文献6

1肖楠,李健,肖启阳.采用SVD-NMF的管道泄漏信号去噪算法[J].传感技术学报,2017,30(1):101-108. 被引量：4
2李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
3何礼,周翊,刘宏清.利用相位时频掩蔽的麦克风阵列噪声消除方法[J].信号处理,2018,34(12):1490-1498. 被引量：4
4时文华,张雄伟,邹霞,孙蒙.利用深度全卷积编解码网络的单通道语音增强[J].信号处理,2019,35(4):631-640. 被引量：5
5倪峰,周翊,刘宏清.利用信号功率谱密度的麦克风阵列噪声消除方法[J].信号处理,2020,36(3):373-381. 被引量：4
6万路瑶,叶安胜.基于NMF与SVM的粘连种子分类研究[J].软件导刊,2020,19(2):153-156.

同被引文献2

1孙晓莉.多传感器信息融合在机器人技术中的应用[J].无线互联科技,2018,15(2):130-131. 被引量：3
2张含阳.人机协作:下一代机器人的必然属性[J].机器人产业,2016,0(3):37-45. 被引量：19

引证文献1

1吴鸿敏,张国英,管贻生,JUAN Rojas.基于多模态时间序列建模的机器人安全监控[J].哈尔滨工业大学学报,2020,52(1):126-132. 被引量：3

二级引证文献3

1张洪波.基于云计算的机器人状态实时监控系统[J].机械设计与制造工程,2022,51(7):72-77. 被引量：1
2李利峰.应用不间断巡检机器人的仓库异常自主报警方法[J].微型电脑应用,2023,39(4):146-149.
3王小宇,贺鸿鹏,马成龙,陈欢颐.基于多模态神经网络流量特征的网络应用层DDoS攻击检测方法[J].沈阳农业大学学报,2024,55(3):354-362.

1马成龙,姜亚松,李艳玲,张艳,颜永红.基于词矢量相似度的短文本分类[J].山东大学学报（理学版）,2014,49(12):18-22. 被引量：6
2杨建华.QB显示汉字的方法[J].中文信息,1994,11(2):18-19.
3杨嵩.基于HTK的连续汉语数码语音输入系统研究[J].计算机与数字工程,2012,40(4):35-38. 被引量：2
4侯刚.VB对SQL Server数据库的访问解析[J].潍坊学院学报,2010,10(6):61-66. 被引量：1
5常晓娟,伊波.VB访问SQL Server数据库技术的探索[J].黑龙江科技信息,2009(13):60-60.
6Blackfin处理器的网络应用[J].世界电子元器件,2006(7):84-88.
7曲昊,闵洁.利用谱聚类发现符号化时间序列中的模式[J].九江职业技术学院学报,2017(2):14-16.
8胡晓辉,范仲元.最新的BASIC编译,调试软件QB（四）[J].计算机世界月刊,1989(6):37-42.
9胡晓辉,范仲元.最新的BASIC编译,调试软件QB（三）[J].计算机世界月刊,1989(5):44-50.
10徐晨,曹辉,赵晓.基于SVM的说话人识别参数选择方法[J].计算机工程,2012,38(21):175-177. 被引量：5

信号处理

2017年第5期

浏览历史

内容加载中请稍等...

采用HDPHMM符号化器的语音查询样例检测方法被引量：1

参考文献1

二级参考文献20

共引文献6

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

采用HDPHMM符号化器的语音查询样例检测方法 被引量：1

参考文献1

二级参考文献20

共引文献6

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

采用HDPHMM符号化器的语音查询样例检测方法被引量：1