期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
基于MFCC和短时能量混合的异常声音识别算法 被引量:29
1
作者 吕霄云 王宏霞 《计算机应用》 CSCD 北大核心 2010年第3期796-798,共3页
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统... 针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。 展开更多
关键词 异常声音识别 梅尔倒谱系数 短时能量 高斯混合模型
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
2
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:19
3
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 翻转梅尔频率倒谱系数 FISHER准则 高斯混合模型
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:19
4
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率倒谱系数 FISHER线性判别分析
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
5
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率倒谱参数 相关系数
下载PDF
基于MFCC和GMM的昆虫声音自动识别 被引量:16
6
作者 竺乐庆 张真 《昆虫学报》 CAS CSCD 北大核心 2012年第4期466-471,共6页
昆虫的运动、取食、鸣叫都会发出声音,这些声音存在种内相似性和种间差异性,因此可用来识别昆虫的种类。基于昆虫声音的昆虫种类自动检测技术对协助农业和林业从业人员方便地识别昆虫种类非常有意义。本研究采用了语音识别领域里的声音... 昆虫的运动、取食、鸣叫都会发出声音,这些声音存在种内相似性和种间差异性,因此可用来识别昆虫的种类。基于昆虫声音的昆虫种类自动检测技术对协助农业和林业从业人员方便地识别昆虫种类非常有意义。本研究采用了语音识别领域里的声音参数化技术来实现昆虫的声音自动鉴别。声音样本经预处理后,提取梅尔倒谱系数(Mel-frequency cepstrum coefficient,MFCC)作为特征,并用这些样本提取的MFCC特征集训练混合高斯模型(Gaussian mixturemodel,GMM)。最后用训练所得到的GMM对未知类别的昆虫声音样本进行分类。该方法在包含58种昆虫声音的样本库中进行了评估,取得了较高的识别正确率(平均精度为98.95%)和较理想的时间性能。该测试结果证明了基于MFCC和GMM的语音参数化技术可以用来有效地识别昆虫种类。 展开更多
关键词 昆虫 种类鉴定 声音处理 自动识别 梅尔倒谱系数 混合高斯模型
下载PDF
基于神经网络的说话人识别实验设计 被引量:15
7
作者 杨瑶 陈晓 《实验室研究与探索》 CAS 北大核心 2020年第9期38-41,50,共5页
针对目前国内人工智能教学和科研活动中缺乏真实现场验证,设计了利用BP神经网络进行说话人识别实验。先对已有说话人语音数据库的样本进行采集,将所采集的语音进行梅尔倒谱系数(MFCC)特征参数的提取,构建了利用BP神经网络实现说话人识... 针对目前国内人工智能教学和科研活动中缺乏真实现场验证,设计了利用BP神经网络进行说话人识别实验。先对已有说话人语音数据库的样本进行采集,将所采集的语音进行梅尔倒谱系数(MFCC)特征参数的提取,构建了利用BP神经网络实现说话人识别功能的系统。然后利用Matlab软件进行编程测试。实验时既可用训练好的网络直接进行说话人识别的验证性实验,也可作为创新性实验,由学生自行设计并编程实现神经网络进行说话人识别。 展开更多
关键词 说话人识别 梅尔倒谱系数 BP神经网络 特征提取
下载PDF
基于MFCC和双重GMM的鸟类识别方法 被引量:12
8
作者 王恩泽 何东健 《计算机工程与设计》 CSCD 北大核心 2014年第5期1868-1871,F0003,共5页
针对鸟类鸣声信号变化丰富和复杂的特点,提出一种基于MFCC和鸣叫、鸣唱声GMM模型的鸟类识别方法。该方法拟采用将鸟鸣声分为鸟叫声和鸟唱声的策略,分别提取其特征参数MFCC,提出双重GMM模型进行训练和识别。用8种鸟的鸣叫声和鸣唱声1077... 针对鸟类鸣声信号变化丰富和复杂的特点,提出一种基于MFCC和鸣叫、鸣唱声GMM模型的鸟类识别方法。该方法拟采用将鸟鸣声分为鸟叫声和鸟唱声的策略,分别提取其特征参数MFCC,提出双重GMM模型进行训练和识别。用8种鸟的鸣叫声和鸣唱声1077个样本进行实验,实验结果表明,双重GMM模型的识别率达到90%以上,与单一鸣声模型相比具有更高的识别率。 展开更多
关键词 鸟类识别 梅尔倒谱系数 鸣叫 鸣唱 双重高斯混合模型
下载PDF
基于卷积神经网络的说话人识别算法 被引量:12
9
作者 胡青 刘本永 《计算机应用》 CSCD 北大核心 2016年第A01期79-81,200,共4页
语音信号是一个时变信号,受个体、环境等影响较大。为提高说话人识别率,对原始语音信号进行一定预处理是必要的,提出一种利用卷积神经网络的说话人识别算法。该算法利用卷积神经网络的卷积和降采样两种操作对说话人识别中的语音信号进... 语音信号是一个时变信号,受个体、环境等影响较大。为提高说话人识别率,对原始语音信号进行一定预处理是必要的,提出一种利用卷积神经网络的说话人识别算法。该算法利用卷积神经网络的卷积和降采样两种操作对说话人识别中的语音信号进行预处理,通过构建一维和二维卷积操作,对预处理后的信号提取梅尔频率倒谱系数特征参数,并采用经典的通用背景模型对说话人进行识别模型建模。通过自建库和TIMIT标准库测试表明,该算法与经典的直接基于梅尔频率倒谱系数特征和通用背景模型的方法相比,识别率提升了8%~15%,并且有效地降低了算法的时间复杂度和空间复杂度。 展开更多
关键词 卷积神经网络 说话人识别 通用背景模型 梅尔频率倒谱系数 预处理
下载PDF
基于MATLAB GUI的语音信号特征提取系统设计 被引量:11
10
作者 王光艳 赵晓群 王霞 《河北工业大学学报》 CAS 北大核心 2010年第4期14-18,共5页
语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信... 语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义. 展开更多
关键词 语音信号 线性预测分析(LPC) 美尔倒谱系数(mfcc) MATLABGUI
下载PDF
基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统 被引量:11
11
作者 陈锦飞 徐欣 《计算机工程》 CAS CSCD 北大核心 2017年第2期201-205,共5页
安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关... 安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关的声纹模式匹配,并结合安卓NDK技术实现快速声纹识别。实验结果表明,该系统具有较高的解锁成功率和较快的解锁速度,相比数字或图形解锁,声纹解锁安全性更高,用户体验更好。 展开更多
关键词 梅尔频率倒谱系数 动态时间规整 声纹识别 安卓系统 声纹解锁
下载PDF
一种分布式光纤传感系统的信号识别方法 被引量:10
12
作者 帅师 王翦 +2 位作者 吴红艳 贾波 艾鑫 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期611-618,共8页
分布式光纤传感系统利用光纤作为传感元件和和传输介质,对环境中的物理量进行测量.以往的算法都是计算机直接将采集到信号进行定位计算并发出警报,由于该系统具有极高的灵敏度,在实际应用中接收到大部分信号都是无用的自然界声音,导致... 分布式光纤传感系统利用光纤作为传感元件和和传输介质,对环境中的物理量进行测量.以往的算法都是计算机直接将采集到信号进行定位计算并发出警报,由于该系统具有极高的灵敏度,在实际应用中接收到大部分信号都是无用的自然界声音,导致程序运行时间长,内存占用率高,限制了系统的效率.本文在阐述分布式光纤传感器原理的基础上,提出了一种基于支撑向量机(SVM)对分布式光纤传感系统的信号进行模式识别的方法,SVM算法在解决小样本、非线性及高维模式识别中有许多特有的优势.首先提取出光纤传感信号的Mel频率倒谱系数(MFCC),然后以MFCC特征训练SVM模型,达到模式识别的目的.实验结果表明,该方法能够准确识别剪切、敲击等入侵信号和吹风、下雨等非入侵信号,可以有效排除自然界中风雨等的干扰,具有很强的实用性. 展开更多
关键词 光纤传感 模式识别 mel频率倒谱系数 支撑向量机
下载PDF
基于深度自编码网络语音识别噪声鲁棒性研究 被引量:9
13
作者 黄丽霞 王亚楠 +1 位作者 张雪英 王洪翠 《计算机工程与应用》 CSCD 北大核心 2017年第13期49-54,共6页
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,... 为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。 展开更多
关键词 语音识别 鲁棒性 深度自编码网络 GFCC特征 mfcc特征
下载PDF
基于HMM与SVM的语音活动检测 被引量:10
14
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率倒谱系数 隐马尔科夫模型 支持向量机 语音活动检测 核函数
下载PDF
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:9
15
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel倒谱系数 LBG算法 矢量量化
下载PDF
基于HMM/SVM的抗噪语音特征提取及优化 被引量:9
16
作者 李婉玲 张秋菊 《传感器与微系统》 CSCD 2019年第4期55-58,共4页
为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支... 为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支持向量机(SVM)分类器作为后处理器。实验表明,改进的MFCC、短时平均能量和Teager能量算子组合参数识别效果最优,识别率达到90. 48%。PCA降维后识别率降低了0. 4%,提升了计算速度。增加后处理器,系统识别率达到95. 25%,提高了系统的识别效率和分类决策力,相对于常规识别方法,准确率有所提高。 展开更多
关键词 语音识别 梅尔频率倒谱系数 特征参数提取 主成分分析 隐马尔可夫模型 支持向量机
下载PDF
基于HHT变换的病态嗓音特征提取及识别研究 被引量:7
17
作者 龚英姬 胡维平 《计算机工程与应用》 CSCD 北大核心 2007年第34期217-219,245,共4页
主要介绍基于HHT变换提取的瞬时能量(A)和瞬时频率(f)的标准差参数作为病态嗓音特征参数的有效性,详细描述了A-f新特征参数的提取过程,并利用DHMM模型对A-f标准差新特征参数,与语音识别中常用的MFCC系数进行识别。识别结果表明,由HHT变... 主要介绍基于HHT变换提取的瞬时能量(A)和瞬时频率(f)的标准差参数作为病态嗓音特征参数的有效性,详细描述了A-f新特征参数的提取过程,并利用DHMM模型对A-f标准差新特征参数,与语音识别中常用的MFCC系数进行识别。识别结果表明,由HHT变换提取的A-f标准差参数更适合于描述病态嗓音,更能有效区分病态嗓音和正常嗓音。 展开更多
关键词 希尔伯特黄变换 病态嗓音 A—f标准差参数 离散隐含马尔可夫模型 mel频率倒谱系数
下载PDF
基于特征融合和B-SVM的鸟鸣声识别算法 被引量:1
18
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
19
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 mel频率倒谱参数 相关系数 谱熵
下载PDF
基于注意力机制与LSTM的语音情绪识别 被引量:6
20
作者 陈巧红 于泽源 +1 位作者 孙麒 贾宇波 《浙江理工大学学报(自然科学版)》 2020年第6期815-822,共8页
针对现有语音情绪识别方法特征提取完整性和准确率较差的问题,将注意力机制和长短时记忆网络(Long short-term memory, LSTM)相结合,提出了一种语音情绪识别模型。该模型首先采用语音信号的梅尔频率倒谱系数(Mel frequency cepstrum coe... 针对现有语音情绪识别方法特征提取完整性和准确率较差的问题,将注意力机制和长短时记忆网络(Long short-term memory, LSTM)相结合,提出了一种语音情绪识别模型。该模型首先采用语音信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为LSTM的输入,借助LSTM对频谱序列进行建模,并在LSTM的遗忘门和输入门中做窥孔连接,将单元状态也作为输入数据加入门限层中;然后将LSTM得到的情感特征输入注意力层,计算每一帧语音信号的权重;最后使用权重较高的语音特征来区分不同情绪,完成对语音信号的情绪识别。结果表明:该模型与基础LSTM模型相比,在EMO-DB、CASIA和RAVDESS三种数据集上准确率分别提高2.96%、2.66%和7.06%,召回率和F1值也均有提高。这表明提出的模型语音分类识别性能较强,有效提升了语音情绪识别的准确率。 展开更多
关键词 语音情感识别 梅尔频率倒谱系数 长短时记忆网络 注意力机制
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部