利用投票选择机制进行语音分割的新方法被引量：2

New method for speech segmentation using candidate selection

下载PDF

导出

摘要针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的端点检测方法,而是将基于分形维数的端点检测方法,基于倒谱特征的端点检测方法,基于HMM的端点检测方法等多种不同方法下得到的端点检测结果,通过投票选择的方式,得到最终的端点检测结果,从而达到对连续语音信号进行分割的目的。实验结果表明,该方法较明显地提高了语音分割的准确性。 Aiming at the question that the performance of speech segmentation declines distinctly in noise environment,this paper proposes a new speech segmentation method for continuous speech signal.The method doesn＇t employ a single method for endpoint detection,but combines several different results derived from different endpoint detection methods based on fractal dimension,cepstral feature and HMM model,using a candidate selection approach to get the final boundary in order to segment the continuous speech signaLThe experimental results show that the proposed approach rather improves the speech segmentation accuracy.

作者黄湘松赵春晖陈立伟

机构地区哈尔滨工程大学信息与通信工程学院

出处《计算机工程与应用》 CSCD 北大核心 2009年第24期21-24,共4页 Computer Engineering and Applications

基金国家自然科学基No60702053 黑龙江省自然科学基NoF2004-08~~

关键词语音分割倒谱特征分形维数隐马尔科夫模型(HMM) 投票选择背景噪声 speech segmentation cepstral feature fractal dimension Hidden Markov Mode（lHMM） candidate selection noise environment

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1杨行峻,迟惠生等编著..语音信号数字处理[M].北京:电子工业出版社,1995:451.
2胡金艳,张太镒,刘枫,曹俊兴.ACCURATE SPEECH SEGMENTATION VIA the IMPROVED SHORT-TIME FRACTAL DIMENSION[J].Journal of Pharmaceutical Analysis,2003,15(2):139-142. 被引量：1
3王朋,塔维娜,陈树中.带噪汉语语音识别的端点检测方法[J].计算机工程,2003,29(17):120-121. 被引量：3
4王炳锡等著..实用语音识别基础[M].北京:国防工业出版社,2005:363.
5陈亮,张雄伟.基于分形维数实现语音分割和增强[J].北京邮电大学学报,2003,26(z1):112-114. 被引量：8
6胡光锐,韦晓东.基于倒谱特征的带噪语音端点检测[J].电子学报,2000,28(10):95-97. 被引量：70

二级参考文献4

1[1]Thompson C, Mulpur A,Mehta V. Transition to chaos in acoustically driven flow (acoustic streaming)[J]. J.Acoust. Soc.Am., 1991,90:2 097-2 103. 被引量：1
2[2]Maragos P. Fractal aspects of speech signals: dimension and interpolation[A]. Proc. IEEE ICASSP[C]. 1991:417-420. 被引量：1
3[3]Lai X Y., Huang A S,Wu M J., Intelligent interface of voice and speech system using fuzzy controller and fractal dimension[A]. Proc. ICCPCOL[C], Florida:1992. 被引量：1
4Lee C H，Automatic Speech and speaker recognition-advanced topics，1996年被引量：1

共引文献76

1马道钧,陈天策,高婕.语音端点检测方法的分析与实现[J].北京电子科技学院学报,2007,15(4):66-69. 被引量：3
2王晓亚,鲁玉海.语音的端点检测处理技术[J].无线电工程,2010,40(2):16-18. 被引量：7
3刘宇红,刘桥,任强.基于改进的模糊ART的语音信号端点检测与切分[J].系统工程与电子技术,2004,26(8):1151-1154. 被引量：6
4于迎霞,史家茂.一种改进的基于倒谱特征的带噪端点检测方法[J].计算机工程,2004,30(19):85-87. 被引量：13
5沈乐君,程小平.基于模式的实时音频流分割与控制系统[J].计算机工程与设计,2004,25(7):1211-1213. 被引量：2
6蒋华,赵耿,段慧达,魏占祯.数字流混沌产生器的模型参考同步降噪[J].北京邮电大学学报,2005,28(1):23-25. 被引量：2
7陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
8胡大雷,刘珩.高噪声环境下的语音活动检测技术[J].中国农业大学学报,2005,10(3):65-68. 被引量：2
9杨胜跃,周宴宇,黄深喜.语音信号端点检测方法与展望[J].信息技术,2005,29(7):5-8. 被引量：4
10李鹏怀,徐佩霞.基于DSP的嵌入式语音识别系统的实现[J].计算机工程,2005,31(16):160-162. 被引量：10

同被引文献17

1Bregman A S.Auditory scene analysis[M].Cambridge, MA: MIT Press, 1990. 被引量：1
2Cooke M P, Brown G J.Computational auditory scene analysis: exploiting principles of perceived continuity[J].Speech Communication, 1993,13(3/4) :391-399. 被引量：1
3Cooke M P.Modelling auditory processing and organisation[M]. Cambridge,UK:Cambridge Univ Press,1993. 被引量：1
4Hu G, Wang D L.Monaural speech segregation based on pitch tracking and amplitude modulation[J].IEEE Trans on Neural Network,2004,15(5) : 1135-1150. 被引量：1
5Wang D L, Brown G J.Separation of speech from interfering sounds based on oscillatory correlation[J].IEEE Trans on Neural Network, 1999,10 (3) : 684-697. 被引量：1
6Meddis R.Simulation of auditory-neural transduction:further studies[J].J Acoust Soc Am, 1988,83(3) : 1056-1063. 被引量：1
7Romeny B,Florack L, Koenderink J, et al.Scale-space theory in computer vision[M].New York:Springer, 1997. 被引量：1
8Meddis R.Simulation of mechanical to neural transduction in the auditory receptor[J].Journal of Acoustical Society of America, 1986,79(3) :702-711. 被引量：1
9Darwin C J.Perceiving vowels in the presence of another sound: constraints on formant perception[J].J Acoust Soc Amer, 1984,76 (6) : 1636-1647. 被引量：1
10Li Q,Zheng J S, Tsai A, et al. Robust endpoint detection and energy normalization for real-time speech and speaker recog- nition [ J ]. IEEE Transactions on Acoustic, Speeeh and Audio Processing,2002,10 ( 3 ) : 146 - 157. 被引量：1

引证文献2

1郑荔平.一种基于上升缘与下降缘的语音分割方法[J].计算机工程与应用,2012,48(5):127-130.
2韦国刚,周萍,杨青.一种简单的噪声鲁棒性语音端点检测方法[J].测控技术,2015,34(2):31-34. 被引量：9

二级引证文献9

1吴进,张青.一种改进的孤立词语音识别系统设计[J].西安邮电大学学报,2016,21(1):76-80. 被引量：4
2董胡,钱盛友.改进的能量谱熵端点检测算法[J].测控技术,2016,35(6):26-29. 被引量：14
3韩云飞,张太红,白涛.融合Mel系数和kNN的语音端点检测[J].信息技术,2017,41(3):37-41. 被引量：2
4于阿强,汪方军,孙存,朱锡祥,吕钊.基于Android平台的吉他智能校准系统设计与实现[J].计算机技术与发展,2017,27(7):140-144.
5范崇山,陈新伟,罗智荣,刘乐,林秋文.典型简单模板匹配语音识别方式技术研究[J].科技视界,2017(7):238-239.
6黄媛.数字视频图像加密域水印嵌入鲁棒性评估仿真[J].计算机与数字工程,2018,46(5):1012-1016.
7杨海燕,吴雷,周萍.基于压缩感知和MFCC的语音端点检测算法[J].测控技术,2019,38(5):88-93. 被引量：2
8杨长洲,杨阳,徐敏.中压开关设备故障类型的声音识别方法[J].厦门理工学院学报,2019,27(3):15-21. 被引量：3
9李艳,成凌飞,张培玲.一种基于改进谱熵的语音端点检测方法[J].计算机科学,2016,43(S2):233-236. 被引量：6

1缴春芳,尹业安,梁玉营.基于MFCC和BP神经网络的说话人识别研究[J].网友世界,2013(4):37-37.
2柯世杰,岳振军.分形理论在语音信号处理中的应用[J].电脑知识与技术,2009,5(3):1719-1721. 被引量：1
3谢志成,张栋.基于粒子群优化的哼唱语音端点检测算法[J].福州大学学报（自然科学版）,2014,42(2):195-199. 被引量：1
4董远,胡光锐.多重分形维数在语音分割和语音识别中的应用[J].上海交通大学学报,1999,33(11):1406-1408. 被引量：4
5常辽豫,余小清,万旺根,李昌莲,许雪琼.MP3压缩域中语音分割的研究与实现[J].计算机应用,2009,29(4):1188-1192. 被引量：3
6杨茂巍,郑伯川,高春梅.基于SAPI的语音驱动口型动画方法[J].现代计算机,2012,18(7):3-7.
7王彪,杨志明,杨小东,黄海宁,田杰.基于倒谱特征的舰船辐射噪声识别算法研究[J].西北师范大学学报（自然科学版）,2006,42(6):34-35.
8唐永锋,霍春宝.噪声环境下语音信号端点检测算法的研究与改进[J].电脑知识与技术,2007(6):1386-1387. 被引量：1
9张俊星,石立新,王都生.阈值自适应语音自动分割系统模型[J].计算机工程与设计,2010,31(8):1886-1888. 被引量：9
10郑荔平.一种基于上升缘与下降缘的语音分割方法[J].计算机工程与应用,2012,48(5):127-130.

计算机工程与应用

2009年第24期

浏览历史

内容加载中请稍等...

利用投票选择机制进行语音分割的新方法被引量：2

参考文献6

二级参考文献4

共引文献76

同被引文献17

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

利用投票选择机制进行语音分割的新方法 被引量：2

参考文献6

二级参考文献4

共引文献76

同被引文献17

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

利用投票选择机制进行语音分割的新方法被引量：2