基于F-DFCC融合特征的语音情感识别方法被引量：1

Speech emotion recognition based on F-DFCC fusion feature

下载PDF

导出

摘要结合神经网络、并行多特征向量和注意力机制,有助于提高语音情感识别的性能。基于此,从前期已经提取的DFCC参数入手,提取I-DFCC和Mid-DFCC特征参数,利用Fisher比选取特征参数构成F-DFCC;再将F-DFCC特征参数与LPCC、MFCC特征参数进行对比并融合,输入到含双向LSTM网络及注意力机制的ECAPA-TDNN模型中;最后,在CASIA和RAVDESS数据集上验证F-DFCC融合特征参数的有效性。实验结果表明:与单一的F-DFCC特征参数相比,F-DFCC融合特征的准确率WA、召回率UA、F1-score在CASIA数据集上分别提高0.035 1、0.031 1、0.031 3;在RAVDESS数据集上分别提高0.024 5、0.035 8、0.033 2。在两个数据集中,surprised情感的识别准确率最高,为0.94;F-DFCC融合特征参数的6种和8种情感识别率与其他特征参数相比均有所提升。 The performance of speech emotion recognition can be improved by combining neural networks,parallel multiple feature vectors,and attention mechanisms.On this basis,starting from the previously extracted DFCC parameters,I-DFCC and Mid DFCC feature parameters are extracted,and Fisher′s ratio is used to select feature parameters to form F-DFCC.F-DFCC feature parameters are compared and fused with LPCC and MFCC feature parameters,and then they are inputted into the ECAPATDNN model with bidirectional LSTM network and attention mechanism.The effectiveness of F-DFCC fusion feature parameters is verified on the CASIA and RAVDESS datasets.The experimental results show that in comparison with single F-DFCC feature parameter,the accuracy WA,recall UA,and F1-score of F-DFCC fusion features are improved by 0.035 1,0.031 1,and 0.031 3on the CASIA dataset,respectively,improved by 0.024 5,0.035 8,and 0.033 2 on the RAVDESS dataset,respectively.In the two datasets,the highest recognition accuracy was realized for supervised emotions,at 0.94.In comparison with other feature parameters,the recognition rates of the 6 and 8 emotions fused by F-DFCC are improved.

作者何朝霞朱嵘涛罗辉 HE Zhaoxia;ZHU Rongtao;LUO Hui(College of Arts and Science,Yangtze University,Jingzhou 434023,China;College of Computer and Control Engineering,Northeast Forestry Univesity,Harbin 150040,China)

机构地区长江大学文理学院东北林业大学计算机与控制工程学院

出处《现代电子技术》北大核心 2024年第6期131-136,共6页 Modern Electronics Technique

基金国家自然科学基金青年科学基金项目(62101114) 湖北省教育厅科学研究计划指导性项目(B2022474) 荆州市科技局、长江大学文理学院联合基金项目(2023LHX04)。

关键词语音情感识别 DFCC F-DFCC 融合特征特征提取 Fisher比 ECAPA-TDNN speech emotion recognition DFCC F-DFCC fusion feature feature extraction Fisher ratio ECAPA-TDNN

分类号 TN912.3-34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1崔琳,崔晨露,刘政伟,薛凯.改进MFCC和并行混合模型的语音情感识别[J].计算机科学,2023,50(S01):156-162. 被引量：6
2王思羽..语音情感识别算法研究[D].南京邮电大学,2019:
3吴虹蕾..基于深度学习的语音情感识别算法的设计与实现[D].黑龙江大学,2021:
4何朝霞,潘平,罗辉.音色变换音频信号的篡改检测技术研究[J].中国测试,2017,43(2):98-103. 被引量：3
5孙肖然..阻塞性睡眠呼吸暂停低通气的鼾声识别与分类[D].华南理工大学,2022:
6王佳慧.基于CNN与Bi-LSTM混合模型的中文文本分类方法[J].软件导刊,2023,22(1):158-164. 被引量：7
7张悦..基于深度学习的语音情感识别[D].电子科技大学,2022:

二级参考文献20

1陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11
2陆成刚.语音性别变换的实时实现[J].电声技术,2009,33(12):50-53. 被引量：1
3志扬.一位科学家对音乐的贡献[J].乐器,1990(2):36-36. 被引量：1
4丁琦,平西建.针对语音变换的语音篡改检测[J].数据采集与处理,2012,27(1):57-62. 被引量：6
5何朝霞,潘平,罗辉.基于非线性共振的说话人特征提取研究与仿真[J].科学技术与工程,2012,20(25):6507-6510. 被引量：4
6晁浩,宋成,彭维平.基于发音特征的声效相关鲁棒语音识别算法[J].计算机应用,2015,35(1):257-261. 被引量：8
7陈炜亮,孙晓.基于MFCCG-PCA的语音情感识别[J].北京大学学报（自然科学版）,2015,51(2):269-274. 被引量：16
8孙颖,姚慧,张雪英,张奇萍.基于混沌特性的情感语音特征提取[J].天津大学学报（自然科学与工程技术版）,2015,48(8):681-685. 被引量：12
9贺鸣,孙建军,成颖.基于朴素贝叶斯的文本分类研究综述[J].情报科学,2016,34(7):147-154. 被引量：70
10贾隆嘉,张邦佐.高校网络舆情安全中主题分类方法研究——以新浪微博数据为例[J].数据分析与知识发现,2018,2(7):55-62. 被引量：5

共引文献13

1张琳,吴建明.基于计算机技术的钢琴音色识别与电子合成系统设计[J].自动化与仪器仪表,2018,0(10):79-82. 被引量：6
2张红兵.Mel频率下语音信号深度频谱特征提取方法仿真[J].计算机仿真,2020,37(5):197-200. 被引量：6
3周岳亮,李宗阳,李绍铭.基于文本的网络安全事件检测技术研究与探索[J].自动化与仪器仪表,2023(8):79-82. 被引量：1
4许萌,韩鹏.面向学前教育对话机器人的多模态情感识别实现关键技术[J].自动化与仪器仪表,2023(9):137-141.
5王兴林.基于MFCC的空中交通管制语音指令的特征提取研究[J].电声技术,2023,47(6):68-72.
6桂婷,马子璇,梁泽.基于BERT-CNN模型的微博文本情感分类研究[J].网络安全技术与应用,2023(11):34-35. 被引量：1
7张晓莉.改进MFCC特征和MLA模型的语音情感识别[J].福建电脑,2024,40(1):52-56. 被引量：3
8袁钰喜,陈义安,刘晓慧.基于集成算法的在线购物平台消费者评价情感分析与研究[J].现代信息科技,2024,8(4):101-105.
9于爱莲,李亚峰.融合迁移学习的Bi-LSTM自动翻译系统设计[J].自动化与仪器仪表,2024(2):187-190.
10陈云峰,石谢达,袁瑶,朱全.汽车异响自动识别研究[J].汽车实用技术,2024,49(15):89-92.

同被引文献12

1高庆吉,赵志华,徐达,邢志伟.语音情感识别研究综述[J].智能系统学报,2020,15(1):1-13. 被引量：16
2罗德虎,冉启武,杨超,豆旺.语音情感识别研究综述[J].计算机工程与应用,2022,58(21):40-52. 被引量：5
3梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68. 被引量：1
4崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：3
5陶建华,陈俊杰,李永伟.语音情感识别综述[J].信号处理,2023,39(4):571-587. 被引量：4
6崔琳,崔晨露,刘政伟,薛凯.改进MFCC和并行混合模型的语音情感识别[J].计算机科学,2023,50(S01):156-162. 被引量：6
7谷泽月,边巴旺堆,祁晋东.基于多特征融合的藏语语音情感识别[J].现代电子技术,2023,46(21):129-133. 被引量：3
8史少寒,周晓彦,李大鹏.基于ARIMA算法特征补齐的语音情感识别[J].电子器件,2023,46(5):1333-1338. 被引量：4
9蔡优新,边巴旺堆.基于双向GRU模型的藏语语音情感识别[J].信息技术与信息化,2023(10):209-213. 被引量：1
10孙颖,李泽,张雪英.基于约束式双通道模型的语音情感识别[J].东北大学学报（自然科学版）,2023,44(11):1537-1542. 被引量：1

引证文献1

1董胡,彭高丰,李垣陵.中文儿童语音情感识别研究综述[J].特立研究,2024(2):16-21.

1王益君,龙苗苗.情感框架、意见领袖与政府信任[J].情报探索,2024(2):41-47.

现代电子技术

2024年第6期

浏览历史

内容加载中请稍等...

基于F-DFCC融合特征的语音情感识别方法被引量：1

参考文献7

二级参考文献20

共引文献13

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于F-DFCC融合特征的语音情感识别方法 被引量：1

参考文献7

二级参考文献20

共引文献13

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于F-DFCC融合特征的语音情感识别方法被引量：1