全局谱参数下的耳语说话人状态因子分析被引量：1

Speaker factor analysis of whispered speech from global spectral features

下载PDF

导出

摘要提出了全局谱参数下的耳语说话人状态因子分析方法。首先,根据耳语听辨实验结果,提出导入唤醒度-愉悦度因子对说话人状态进行三级度量;其次,提取耳语音正弦模型、人耳听觉模型下的谱参数,结合其他短时频谱参量,进行轨迹跟踪并计算各参数的全局统计变量,作为特征参数来实现耳语说话人状态的分类。实验结果显示,正弦模型及人耳听觉模型的全局谱参数可将耳语说话人状态因子分类系统的准确率提高至90%。该分类方法及状态因子描述方案提供了耳语音说话人状态分析的有效途径。 Speaker factor analysis of whispered speech from global spectral features is proposed. According to the perceptual experiments, the Arousal-Valance factor is imported to determine the speaker＇s state. The spectral parameters from the Sinusoidal Model and Auditory Model, in addition to the Short-term Spectral Features, are abstracted and tracked. The global statistics from all of the variables mentioned above are calculated to identify the speaker＇s sentiment of whispered speech. The experimental results indicate that the accuracy of this system reaches to 90%. This classification method and speaker factor description scheme offer an effective path to state analysis of whispered speaker.

作者龚呈卉赵鹤鸣陶智张庆芳

机构地区苏州大学电子信息学院苏州大学物理科学与技术学院

出处《声学学报》 EI CSCD 北大核心 2014年第2期281-288,共8页 Acta Acustica

基金国家自然科学基金(61071215 61271359 61372146) 江苏省普通高校研究生科研创新计划项目(05KJB510113)资助

关键词因子分析方法状态分析谱参数正弦模型听觉模型分类系统说话人轨迹跟踪 Multivariant analysis

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1陈雪勤,赵鹤鸣.基于听觉模型的汉语耳语音声调检测[J].电子学报,2009,37(4):864-867. 被引量：5
2茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
3赵鹤鸣,朱祺,陈雪勤,俞一彪.临界频带子波变换用于混叠语音分离的研究[J].声学学报,2004,29(2):177-181. 被引量：7
4张翠玲,谭铁军,刘昇.伪装语音的自动话者识别研究[J].刑事技术,2007,32(2):18-21. 被引量：4
5王敏,赵鹤鸣.基于多带解调分析和瞬时频率估计的耳语音话者识别[J].声学学报,2010,35(4):471-476. 被引量：12
6赵迎春,张劲松,韩晶晶,任芳,蔡汝刚.中国儿童情感评价图片库(7～14岁,上海版)的建立[J].中国儿童保健杂志,2009,17(3):290-292. 被引量：6
7陶智,赵鹤鸣,吴迪,陈大庆,张晓俊.基于修正Mel域掩蔽模型和无语音概率的耳语音增强[J].声学学报,2009,34(4):370-377. 被引量：2
8潘欣裕,赵鹤鸣.中文耳语元音的声调特征研究[J].信号处理,2011,27(10):1525-1530. 被引量：3
9金赟,赵艳,黄程韦,赵力.耳语音情感数据库的设计与建立[J].声学技术,2010,29(1):63-68. 被引量：8

二级参考文献88

1黄宇霞,罗跃嘉.国际情绪图片系统在中国的试用研究[J].中国心理卫生杂志,2004,18(9):631-634. 被引量：99
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
4杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
5陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
6白露,马慧,黄宇霞,罗跃嘉.中国情绪图片系统的编制——在46名中国大学生中的试用[J].中国心理卫生杂志,2005,19(11):719-722. 被引量：310
7周洁,赵力,邹采荣.情感语音合成的研究[J].电声技术,2005,29(10):57-59. 被引量：10
8林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：22
9樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
10黄海,潘家强.基于Hilbert-Huang变换的基音周期提取方法[J].声学学报,2006,31(1):35-41. 被引量：11

共引文献39

1陶智,赵鹤鸣,顾济华,吴迪.基于心理声学模型和临界频带子波变换的数字声频水印[J].声学学报,2006,31(2):114-119. 被引量：15
2赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
3TAO Zhi,ZHAO Heming,GU Jihua,WU Di.Audio watermarking based on psychoacoustic model and critical band wavelet transform[J].Chinese Journal of Acoustics,2007,26(1):63-72. 被引量：1
4施晓敏,顾济华,陶智,赵鹤鸣,张晓俊.基于听觉感知的电子耳蜗共振峰提取方案[J].计算机工程与应用,2007,43(29):232-234. 被引量：1
5王忠文,谢莉萍,梁杰豪.基于计算听觉场景分析的混叠语音分离算法[J].电声技术,2008,32(10):56-59. 被引量：1
6赵迎春,张劲松.7～14岁儿童情绪识别特点初步分析[J].上海交通大学学报（医学版）,2009,29(7):778-781. 被引量：1
7韩晶晶,张劲松.破坏性行为障碍儿童青少年情绪反应特征研究[J].中国儿童保健杂志,2010,18(3):184-188. 被引量：1
8丁军,苏林雁,高雪屏,马静,冯哲,文慧.国际情绪图片系统(IAPS)在中国10-12岁儿童的初步应用研究[J].中国临床心理学杂志,2010,18(2):168-170. 被引量：3
9王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
10王敏,赵鹤鸣.基于多带解调分析和瞬时频率估计的耳语音话者识别[J].声学学报,2010,35(4):471-476. 被引量：12

同被引文献4

1高伟,王宁.一种基于支持向量机的海底声学参数快速统计反演方法[J].声学学报,2010,35(3):343-352. 被引量：6
2李真真,吴效明.喘鸣音的时频谱图特征提取与信号检测[J].信号处理,2013,29(4):429-435. 被引量：7
3李秀坤,夏峙.水下目标回波盲分离性能的瞬时频率特征评价方法[J].声学学报,2015,40(5):655-664. 被引量：4
4徐峰,许怿文,刘成成,他得安.松质骨超声背散射信号的谱信息熵判断方法[J].声学学报,2016,41(3):281-286. 被引量：5

引证文献1

1李佳芮,洪缨.喘鸣音的声谱图熵特征分析及检测[J].声学学报,2020,45(1):131-136. 被引量：3

二级引证文献3

1赵登煌,周长伟,朱欣程,张晓俊,陶智.gammatone短时谱自相似度的病理嗓音检测[J].生物医学工程学杂志,2022,39(4):694-701. 被引量：1
2孙继平,余星辰,王云泉.基于声谱图和SVM的煤矿瓦斯和煤尘爆炸识别方法[J].煤炭科学技术,2023,51(2):366-376. 被引量：3
3余星辰,李小伟.基于小波散射变换的煤矿瓦斯和煤尘爆炸声音识别方法[J].煤炭科学技术,2024,52(S01):70-79.

1王飞,胡秀华.物理常数的分类[J].齐齐哈尔师范学院学报（自然科学版）,1992,12(1):51-54. 被引量：4
2ZHAO Heming WANG Yongqi CHEN Xueqin.Auditory model inversion and its application[J].Chinese Journal of Acoustics,2005,24(4):323-330.
3杨秀会.双原子层铁纳米带初始态的磁化强度分布研究[J].四川大学学报（自然科学版）,2008,45(4):895-898.
4库少平.A generalized sinusoidal model and its applications[J].Journal of Chongqing University,2009,8(1):70-74.
5黄丽,唐万梅.复杂样本分类系统的FAGABPNN法[J].重庆工学院学报,2007,21(15):122-125.
6余建坤,张文彬,陆玉昌.遗传算法及其应用[J].云南民族学院学报（自然科学版）,2002,11(4):193-197. 被引量：25
7邓秀慧.耳语音元音共振峰研究[J].电声技术,2015,39(12):53-56.
8YIN Hui XIE Xiang KUANG Jingming.Acoustic features based on auditory model and adaptive fractional Fourier transform for speech recognition[J].Chinese Journal of Acoustics,2011,30(4):453-463.
9王季陶.反应耦合现象和现代热力学分类系统[J].大学化学,2002,17(2):29-34.
10eCl@ss信息分类系统[J].程序员,2012(3):13-13.

声学学报

2014年第2期

浏览历史

内容加载中请稍等...

全局谱参数下的耳语说话人状态因子分析被引量：1

参考文献9

二级参考文献88

共引文献39

同被引文献4

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

全局谱参数下的耳语说话人状态因子分析 被引量：1

参考文献9

二级参考文献88

共引文献39

同被引文献4

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

全局谱参数下的耳语说话人状态因子分析被引量：1