期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
基于隐马尔可夫模型的音频自动分类 被引量:47
1
作者 卢坚 陈毅松 +1 位作者 孙正兴 张福炎 《软件学报》 EI CSCD 北大核心 2002年第8期1593-1597,共5页
音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此... 音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此,提出一种基于隐马尔可夫模型的音频分类算法,用于语音、音乐以及它们的混合声音的分类.实验结果表明,隐马尔可夫模型的音频分类性能较好,最优分类精度达到90.28%. 展开更多
关键词 隐马尔可夫模型 音频自动分类 向量量化 mfcc 语音信号处理
下载PDF
基于MFCC的语音情感识别 被引量:23
2
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 mfcc 语音情感识别 情感计算
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
3
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 mel频率倒谱系数(mfcc) 语音识别 特征提取
下载PDF
基于多核学习特征融合的语音情感识别方法 被引量:17
4
作者 王忠民 刘戈 宋辉 《计算机工程》 CAS CSCD 北大核心 2019年第8期248-254,共7页
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基... 在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96 %。 展开更多
关键词 语音情感识别 多核学习 卷积神经网络 梅尔频率倒谱系数 语谱图
下载PDF
改进卷积神经网络的语音情感识别方法 被引量:12
5
作者 曾润华 张树群 《应用科学学报》 CAS CSCD 北大核心 2018年第5期837-844,共8页
研究了基于卷积神经网络的语音情感识别算法,改进了传统卷积神经网络训练过程中的卷积核权值的更新算法,使卷积核权值的更新算法与迭代次数有关联;同时为了增加情感语音之间的特征差异性,将语音信号经过预处理后得到的梅尔频率倒谱系数... 研究了基于卷积神经网络的语音情感识别算法,改进了传统卷积神经网络训练过程中的卷积核权值的更新算法,使卷积核权值的更新算法与迭代次数有关联;同时为了增加情感语音之间的特征差异性,将语音信号经过预处理后得到的梅尔频率倒谱系数特征数据矩阵进行变换,提高卷积神经网络的表达能力.实验表明,改进后的语音情感识别算法的错误识别率比传统算法的错误识别率约减少7%. 展开更多
关键词 语音情感识别 卷积神经网络 梅尔频率倒谱系数 识别率
下载PDF
基于改进MFCC的鸟鸣声识别方法研究 被引量:11
6
作者 程龙 张华清 《中国传媒大学学报(自然科学版)》 2017年第3期41-46,共6页
鸟鸣声识别的关键就在于对鸣声信号进行合理的特征值提取。鸟鸣声信号具有非平稳性,传统的梅尔倒谱系数(MFCC)仅能反映鸣声信号的静态特性,并且算法中直接运用FFT处理非平稳信号存在局限性。本文提出了一种基于经验模态分解(EMD)改进的M... 鸟鸣声识别的关键就在于对鸣声信号进行合理的特征值提取。鸟鸣声信号具有非平稳性,传统的梅尔倒谱系数(MFCC)仅能反映鸣声信号的静态特性,并且算法中直接运用FFT处理非平稳信号存在局限性。本文提出了一种基于经验模态分解(EMD)改进的MFCC算法,通过对鸟鸣声信号进行经验模态分解,得到一系列固有模态函数分量后再进行FFT计算,频域合成后通过Mel滤波器,取其对数能量进行DCT变换,然后对结果作差分得到改进的MFCC参数,再采用高斯混合模型(GMM)进行鸟鸣声的识别。实验结果表明,改进的MFCC识别率达到70.09%,与未改进的MFCC识别率相比提高了3.42%。 展开更多
关键词 鸣声识别 梅尔倒谱系数 经验模态分解 高斯混合模型
下载PDF
基于矢量量化的猪咳嗽声识别 被引量:11
7
作者 龚永杰 黎煊 +3 位作者 高云 雷明刚 刘望宏 杨专 《华中农业大学学报》 CAS CSCD 北大核心 2017年第3期119-124,共6页
针对猪的规模化养殖中频发的呼吸道疾病问题,提出通过监测咳嗽状况对猪的健康状况进行预警,以谱减法去噪和端点检测为猪咳嗽信号主要预处理方法,以矢量量化(vector quantization,VQ)匹配算法为核心算法,分别构建基于标准梅尔频率倒谱系... 针对猪的规模化养殖中频发的呼吸道疾病问题,提出通过监测咳嗽状况对猪的健康状况进行预警,以谱减法去噪和端点检测为猪咳嗽信号主要预处理方法,以矢量量化(vector quantization,VQ)匹配算法为核心算法,分别构建基于标准梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)和改进的MFCC 2种猪咳嗽声识别模型。测试结果显示,以标准MFCC为特征矢量构建的识别系统的识别率、误判率和综合识别率分别达到88%、14%和87.3%,基于改进的MFCC特征矢量构建的识别系统与之相比有很大提高,其识别率、误判率和综合识别率分别达到91%、12%和90.0%。试验表明,采用改进的MFCC与矢量量化相结合构建猪咳嗽识别系统是可行的,能够应用于猪的呼吸道疾病预警。 展开更多
关键词 矢量量化 咳嗽 识别 梅尔频率倒谱系数
下载PDF
基于神经网络的语音情感识别 被引量:9
8
作者 石瑛 胡学钢 《计算机工程与应用》 CSCD 北大核心 2008年第24期191-193,199,共4页
研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有较大贡献的特征,并寻找适合的模型将有效特征加以利用。分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功... 研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有较大贡献的特征,并寻找适合的模型将有效特征加以利用。分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功地提取了相关的语音信号的特征。研究了基音频率、振幅能量和共振峰等目前常用的情感特征在语音情感识别中的作用,重点研究了MFCC和△MFCC,实验发现特征筛选后系统的识别效果有着一定程度的提高。将处理后的频谱特征参数同原有的BP人工神经网络模型有效地结合起来,形成完整的语音情感识别系统,取得了较为满意的识别结果。 展开更多
关键词 语音情感识别 情感特征 人工神经网络 mfcc
下载PDF
无人机被动音频探测和识别技术研究 被引量:9
9
作者 王威 安腾飞 欧建平 《声学技术》 CSCD 北大核心 2018年第1期89-93,共5页
为解决近场空域低、慢、小旋翼无人机的安全威胁,提出基于音频信号分析的无人机探测识别方法。该方法采用改进流程和参数的梅尔频率倒谱系数(Mel-Frequency Cepstral Coeffi-cients,MFCC)和其一阶差分作为无人机音频的特征参数,结合提... 为解决近场空域低、慢、小旋翼无人机的安全威胁,提出基于音频信号分析的无人机探测识别方法。该方法采用改进流程和参数的梅尔频率倒谱系数(Mel-Frequency Cepstral Coeffi-cients,MFCC)和其一阶差分作为无人机音频的特征参数,结合提出的多距离分段采集法,通过训练高斯混合模型(Gaussian Mixture Model,GMM),建立多特征的无人机音频"指纹库",最后用特征匹配算法实现无人机的探测和识别。实验结果表明,所提出的方法在典型郊区环境中可实现150 m距离内无人机的探测和识别,识别率达到84.4%。 展开更多
关键词 无人机 探测和识别 梅尔频率倒谱系数 高斯混合模型
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
10
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 mel频率倒谱系数(mfcc) 小波分解 支持向量机
下载PDF
基于样本熵与MFCC融合的语音情感识别 被引量:7
11
作者 屠彬彬 于凤芹 《计算机工程》 CAS CSCD 2012年第7期142-144,共3页
提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿... 提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿真实验结果表明,该方法的识别率较高。 展开更多
关键词 语音情感识别 样本熵 mel频率倒谱系数 支持向量机
下载PDF
基于听觉感知特性的语音质量客观评价方法 被引量:6
12
作者 谭晓衡 许可 秦基伟 《西南交通大学学报》 EI CSCD 北大核心 2013年第4期756-760,共5页
讨论了基于MFCC(Mel-frequency cepstral coefficients)特征参数的语音质量客观评价方法 Mel-CD(Mel-cepstral distance measure).根据心理声学原理将Johannesma提出的人耳听觉模型和非线性压缩变换引入MFCC特征参数的提取过程,用Gammat... 讨论了基于MFCC(Mel-frequency cepstral coefficients)特征参数的语音质量客观评价方法 Mel-CD(Mel-cepstral distance measure).根据心理声学原理将Johannesma提出的人耳听觉模型和非线性压缩变换引入MFCC特征参数的提取过程,用Gammatone滤波器组对人耳基底膜进行仿真.利用改进后的MFCC作为语音信号特征参数,提出了一种更加符合人耳听觉感知特性的客观评价方法——Mel-GD(Mel-cepstral gammatone filter bankdistance measure).性能测试结果表明:所提算法与Mel-CD算法在时间复杂度上保持一致,评价结果的主观与客观的相关度提高了4.9%,平均估计偏差改善了45.5%. 展开更多
关键词 语音质量 mfcc Gammatone滤波器组 非线性变换
下载PDF
基于EMD的改进MFCC的语音情感识别 被引量:6
13
作者 屠彬彬 于凤芹 《计算机工程与应用》 CSCD 2012年第18期119-122,共4页
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过... 人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。 展开更多
关键词 语音情感识别 mel频率倒谱系数 经验模态分解 支持向量机
下载PDF
基于基音周期的语音MFCC参数提取 被引量:4
14
作者 陈迪 龚卫国 杨利平 《计算机应用》 CSCD 北大核心 2007年第5期1217-1219,共3页
提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无... 提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。 展开更多
关键词 说话人识别 基音周期 mfcc参数 频谱距离
下载PDF
基于MFCC和HMM的语音识别优化方法研究
15
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率倒谱系数(mfcc) 隐马尔可夫模型(HMM) 期望最大化(EM)
下载PDF
基于LSTM模型的音乐推荐系统研究
16
作者 范凯燕 胡彦红 《电声技术》 2024年第9期136-138,共3页
随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音... 随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音乐推荐系统,并通过MATLAB平台进行测试。结果表明,该推荐系统表现良好。 展开更多
关键词 音乐推荐 梅尔频率倒谱系数(mfcc) 长短期记忆(LSTM) 内容推荐
下载PDF
MFCC中DCT结构的设计与实现 被引量:3
17
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率倒谱系数 离散余弦变换 分布式算法
下载PDF
基于修正Mel频率映射的应力影响下变异语音识别方法 被引量:1
18
作者 马永林 韩纪庆 +1 位作者 张磊 王承发 《计算机工程与应用》 CSCD 北大核心 2002年第20期75-76,91,共3页
文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正... 文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正Mel频率映射的MFCC特征改进了变异语音的识别性能。 展开更多
关键词 修正 mel频率映射 应力 变异语音识别 语音分类器 mel倒谱系数
下载PDF
Application of formant instantaneous characteristics to speech recognition and speaker identification
19
作者 侯丽敏 胡晓宁 谢娟敏 《Journal of Shanghai University(English Edition)》 CAS 2011年第2期123-127,共5页
This paper proposes a new phase feature derived from the formant instantaneous characteristics for speech recognition (SR) and speaker identification (SI) systems. Using Hilbert transform (HT), the formant chara... This paper proposes a new phase feature derived from the formant instantaneous characteristics for speech recognition (SR) and speaker identification (SI) systems. Using Hilbert transform (HT), the formant characteristics can be represented by instantaneous frequency (IF) and instantaneous bandwidth, namely formant instantaneous characteristics (FIC). In order to explore the importance of FIC both in SR and SI, this paper proposes different features from FIC used for SR and SI systems. When combing these new features with conventional parameters, higher identification rate can be achieved than that of using Mel-frequency cepstral coefficients (MFCC) parameters only. The experiment results show that the new features are effective characteristic parameters and can be treated as the compensation of conventional parameters for SR and SI. 展开更多
关键词 instantaneous frequency (IF) Hilbert transform (HT) speech recognition speaker identification mel-frequency cepstral coefficients mfcc
下载PDF
基于鼾声的声学特征估计睡眠呼吸暂停指数 被引量:2
20
作者 侯丽敏 张伟涛 +1 位作者 施丹 刘焕成 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期435-444,共10页
睡眠呼吸暂停低通气综合征(sleep apnea hypopnea syndrome,SAHS)是一种睡眠呼吸疾病.提出用鼾声的声学特征对SAHS严重程度进行筛查的方法.提取鼾声的美频率倒谱系数(Mel-frequency cepstral coefficients,MFCC),利用高斯混合模型对鼾... 睡眠呼吸暂停低通气综合征(sleep apnea hypopnea syndrome,SAHS)是一种睡眠呼吸疾病.提出用鼾声的声学特征对SAHS严重程度进行筛查的方法.提取鼾声的美频率倒谱系数(Mel-frequency cepstral coefficients,MFCC),利用高斯混合模型对鼾声进行建模和分类,并估计了打鼾者的呼吸暂停低通气指数(apnea hypopnea index,AHI).对120人的实验结果表明,与多导睡眠仪(polysomnography,PSG)诊断的AHI值相比,本方法对严重程度诊断的正确率达80.00%,与PSG诊断的一致性达到83.30%,相关系数为0.9563(P<0.001).说明MFCC是筛查SAHS较为有效的声学特征.研究结果对医疗辅助诊断和居家医疗的发展有着积极的促进作用. 展开更多
关键词 睡眠呼吸暂停低通气综合征 鼾声 美频率倒谱系数 高斯混合模型 呼吸暂停低通气指数
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部