基于Hilbert-Huang变换的语音信号共振峰频率估计被引量：12

Speech formant frequency estimation based on Hilbert-Huang transform

下载PDF

导出

摘要由快速傅里叶变换(FFT)初步估计出的语音信号的各阶共振峰频率确定相应带通滤波器的参数,并用该参数对语音信号作滤波处理,对滤波后的信号进行经验模态分解(EMD)得到一族固有模态函数(IMF),按能量最大原则确定出含有共振峰频率的IMF,计算出该IMF的瞬时频率和Hilbert谱即得到语音信号的共振峰频率参数.实验结果表明,与传统方法相比,该方法无须对语音信号进行分帧截断,提高了语音信号共振峰频率估计的时频分辨率和准确性,能够更精确地反映共振峰频率随时间的快速变化. After being filtered with the band-pass filters with the centre-frequencies obtained by using the fast Fourier transform （FFT） analysis, speech data were decomposea into a set of intrinsic mode function （IMF） using empirical mode decomposition （EMD）. The IMFs containing formant frequencies were then identified according to the energy maximum criteria, and their instantaneous frequencies and Hilbert spectra were calculated, and finally, the formant frequencies of speech data were efficiently determined. The results show that, compared with the conventional formant estimation methods, the method based on HHT not only can provide more clear descriptions of the non-linear and non-stationary characteristics of speech signals, but also gives the speech formant frequencies and their variations with high time-frequency resolution and veracity.

作者黄海陈祥献

机构地区浙江大学仪器科学与工程学系

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2006年第11期1926-1930,共5页 Journal of Zhejiang University：Engineering Science

基金国家自然科学基金资助项目(60275004)

关键词语音信号 Hilbert—Huang变换共振峰非线性 speech signals Hilbert-Huang transform formant nonlinearity

分类号 TN911.72 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1MARKEL J D.Spectral analysis of speech by linear prediction[J].IEEE Transactions on Audio and Electroacoustic,1973,21(3):140-148. 被引量：1
2CHRISTENSEN R L,SREONG W J,PALMER E P.A comparison of three methods of extracting resonance information from predictor-coefficient coded speech[J].IEEE Transactions on ASSP,1976,24(1):8-14. 被引量：1
3张家騄.元音的内在基频与讲话方式对共振峰的影响[J].声学学报,1989,14(6):401-406. 被引量：6
4张家騄.论语音技术的发展[J].声学学报,2004,29(3):193-199. 被引量：15
5WATANABE A.Formant estimation method using inverse-filter control[J].IEEE Transactions on Speech and Audio Processing,2001,9(4):317-326. 被引量：1
6RAO P,BARMAN A D.Speech formant frequency estimation:evaluating a nonstationary analysis method[J].Signal Processing,2000,80(8):1655-1667. 被引量：1
7HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society,1998,454A:903-995. 被引量：1
8FLANDRIN P,RILLING G,GONCALVES P.Empirical mode decomposition as a filter bank[J].IEEE Signal Processing Letters,2004,11(2):112-114. 被引量：1

二级参考文献2

1张家騄.元音的内在基频与讲话方式对共振峰的影响[J].声学学报,1989,14(6):401-406. 被引量：6
2ZHANG Jialu DONG Shiwei(Institute of Acoustzcs, Academia Sinica Beijing 100080).Guidelines to assessment of speech synthesis systems for Chinese[J].Chinese Journal of Acoustics,1998,17(4):289-295. 被引量：1

共引文献18

1吕成国,韩纪庆,王承发.动态时间规正与差别子空间相结合的变异语音识别方法[J].声学学报,2005,30(3):229-234. 被引量：2
2田岚,姜晓庆,侯正信.多语种下情感语音基频参数变化的统计分析[J].控制与决策,2005,20(11):1311-1313. 被引量：2
3孟子厚.普通话单元音女声共振峰统计特性测量[J].声学学报,2006,31(3):199-202. 被引量：8
4姜晓庆,田岚,崔国辉.多语种情感语音的韵律特征分析和情感识别研究[J].声学学报,2006,31(3):217-221. 被引量：8
5张鹏,王琳,刘胜.基于韵律匹配代价和韵律拼接代价的汉语语音合成[J].哈尔滨工业大学学报,2006,38(11):2006-2008. 被引量：1
6刘浩杰,杜利民.语音合成技术的发展与展望[J].微计算机应用,2007,28(7):726-730. 被引量：14
7姜晓庆,崔世耀,殷艳华.人机语音交互中的情感语音处理[J].济南大学学报（自然科学版）,2008,22(4):354-357. 被引量：1
8王宏,潘金贵.基于共振峰增强的语音信号共振峰频率估计[J].计算机应用与软件,2008,25(11):140-142. 被引量：1
9王行荣.智能语音教学系统的研究和实现[J].重庆工商大学学报（自然科学版）,2009,26(3):247-251.
10第16届全国儿科肾脏病学术会议征文通知[J].中华儿科杂志,2014,52(3):193-193.

同被引文献107

1范影乐,俞祁焰,李轶,庞全.基于Hilbert-Huang变换的含噪语音特征分析[J].传感技术学报,2007,20(10):2288-2293. 被引量：3
2王枫,胡旭君,王永华.听力障碍儿童与正常儿童视觉记忆能力比较研究[J].中国特殊教育,2002(4):32-34. 被引量：14
3庞程,李晓飞,刘宏.基于MFCC与基频特征贡献度识别说话人性别[J].华中科技大学学报（自然科学版）,2013,41(S1):108-111. 被引量：8
4汲胜昌,周冬生,陈锦,李彦明,孙强.空载变压器油箱表面振动信号的初步研究[J].高电压技术,2004,30(8):30-32. 被引量：26
5Dr Andrew Smith,王树峰.全球听力障碍的现状及对策——WHO关于听障问题的白皮书简介[J].中国听力语言康复科学杂志,2004(6):8-9. 被引量：24
6周静芳,陈一宁,李科,刘加.基于高斯语音滤波的稳健文本无关说话人识别[J].计算机工程,2005,31(2):179-181. 被引量：5
7程锦,李延沐,汲胜昌,李彦明,郝韩兵.振动法在线监测变压器绕组及铁心状况[J].高电压技术,2005,31(4):43-45. 被引量：76
8申丽然,李雪耀,王慧强,尹清波,张汝波.基于Hilbert-Huang变换理论的语音增强初探[J].哈尔滨工程大学学报,2005,26(2):220-224. 被引量：9
9汲胜昌,程锦,李彦明.油浸式电力变压器绕组与铁心振动特性研究[J].西安交通大学学报,2005,39(6):616-619. 被引量：96
10于萍,韩冰,黄冬雁,杨伟炎,韩东一.嗓音声学分析和电声门图的比较研究[J].听力学及言语疾病杂志,2005,13(3):160-163. 被引量：19

引证文献12

1王坤赤,蒋华.一种基于语音频谱的基频和共振峰提取算法[J].信息技术,2007,31(10):20-22. 被引量：2
2高阳,王宏.基于MATLAB的振峰估计[J].喀什师范学院学报,2007,28(3):65-66.
3于凤芹,肖志.利用Hilbert-Huang变换的自适应带通滤波特性提取共振峰[J].声学技术,2008,27(2):266-270. 被引量：4
4陈宁,万茂文.语音信号共振峰频率估计的分段线性预测算法[J].计算机工程与应用,2009,45(28):156-159. 被引量：1
5全学海,丁宣浩,蒋英春.基于EMD和概率神经网络的说话人识别[J].桂林电子科技大学学报,2010,30(2):108-112. 被引量：4
6杨丹,姜占才,余蓥良,李振起.语音信号共振峰提取方法的研究分析[J].科技信息,2012(4):161-162. 被引量：3
7赵毅,尹雪飞,陈克安.一种基于共振峰提取的多通道响度补偿算法[J].信号处理,2012,28(3):352-360. 被引量：7
8宋卫东.基于经验模态分解和减影法高强度聚焦超声离体牛肝组织损伤的监控成像[J].中国组织工程研究,2012,16(40):7520-7527.
9韩志艳,王健.基于神经网络的汉语声韵母可视化方法[J].电子设计工程,2017,25(5):5-8. 被引量：2
10韩志艳,王健.基于共振峰曲线的语音信号动态特征提取方法[J].计算机技术与发展,2017,27(6):72-75. 被引量：3

二级引证文献37

1杨录,樊建平,张艳花.一种基于EMD和神经网络的超声缺陷信号分类方法[J].中北大学学报（自然科学版）,2012,33(5):598-602. 被引量：4
2马振,张雄伟,杨吉斌.一种基于K-SVD的说话人识别方法[J].计算机工程与应用,2012,48(34):112-115. 被引量：2
3张宝琳,张玲华.数字助听器中多通道响度补偿方法的研究[J].信号处理,2013,29(5):656-661. 被引量：6
4杨鸿武,赵涛涛.一种基于加权Mel倒谱的语音信号共振峰提取算法[J].西北师范大学学报（自然科学版）,2014,50(1):53-57. 被引量：6
5曹旭来,张玲华,林志敏,郑宝玉.数字助听器中单通道语音增强算法的研究[J].信号处理,2014,30(4):405-412. 被引量：4
6焦蓓,曾以成,毛燕湖.基音周期检测的希尔伯特-黄变换方法[J].计算机工程与应用,2015,51(1):204-207. 被引量：1
7吴媛,丁亚军,钱盛友,胡强,邹孝.基于神经网络的艺术嗓音客观评价方法[J].电声技术,2015,39(12):57-60. 被引量：2
8贾伟,张玲华.数字助听器中新的非线性响度补偿方法的研究[J].计算机工程与应用,2016,52(8):256-260. 被引量：1
9李如玮,曹龙涛,鲍长春,吴水才.基于Gammatone滤波器组分解的数字助听器频响补偿算法[J].北京生物医学工程,2016,35(2):143-150. 被引量：5
10郑洋,唐加能,柳培忠,刘晓芳.数字助听器研究现状及其算法综述[J].海峡科学,2016,0(7):14-17. 被引量：5

1焦红霞.同态滤波处理在语音处理中的应用[J].科学与财富,2014,0(7):183-183.
2柳兴,袁超伟,杨震,胡仲伟.移动云计算中基于移动代理的用户切换与接入控制[J].北京邮电大学学报,2014,37(2):88-92. 被引量：6
3陈宁,万茂文.语音信号共振峰频率估计的分段线性预测算法[J].计算机工程与应用,2009,45(28):156-159. 被引量：1
4王晓亚.倒谱在语音的基音和共振峰提取中的应用[J].无线电工程,2004,34(1):57-58. 被引量：15
5王利萍,邵高平.一种基于Hilbert-Huang变换的直扩信号盲检测方法[J].信息工程大学学报,2009,10(4):471-475. 被引量：1
6石林锁,沈金伟,张亚洲,牛武泽.基于AR模型和谱峭度法的滚动轴承故障诊断[J].振动与冲击,2011,30(12):257-260. 被引量：17
7王坤赤,蒋华.一种基于语音频谱的基频和共振峰提取算法[J].信息技术,2007,31(10):20-22. 被引量：2
8赵越,林玮.汉语耳元音共振峰与音长特性研究[J].电声技术,2016,40(11):48-52.
9王平,袁伟娜,范平志.隐含训练序列信道估计中的功率分配[J].电子与信息学报,2008,30(7):1584-1587. 被引量：2
10王宏,潘金贵.基于共振峰增强的语音信号共振峰频率估计[J].计算机应用与软件,2008,25(11):140-142. 被引量：1

浙江大学学报（工学版）

2006年第11期

浏览历史

内容加载中请稍等...

基于Hilbert-Huang变换的语音信号共振峰频率估计被引量：12

参考文献8

二级参考文献2

共引文献18

同被引文献107

引证文献12

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于Hilbert-Huang变换的语音信号共振峰频率估计 被引量：12

参考文献8

二级参考文献2

共引文献18

同被引文献107

引证文献12

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于Hilbert-Huang变换的语音信号共振峰频率估计被引量：12