期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于基音周期与清浊音信息的梅尔倒谱参数 被引量:1
1
作者 郭武 王仁华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2007年第2期229-233,共5页
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模... 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。 展开更多
关键词 说话人确认 梅尔参数 基音频率 清浊音信息
下载PDF
一种新的四元阵列融合声源识别方法 被引量:3
2
作者 刘亚雷 顾晓辉 甘宁 《科学技术与工程》 北大核心 2020年第28期11620-11625,共6页
针对声源识别中观测模型线性化误差,信号特征参数提取依赖于经验分析阈值判断而造成信息丢失的问题,从信号观测模型、预处理、特征提取与分类识别、半实物仿真试验等方面,提出了一种新的四元阵列融合声源识别方法。首先在系统坐标系下... 针对声源识别中观测模型线性化误差,信号特征参数提取依赖于经验分析阈值判断而造成信息丢失的问题,从信号观测模型、预处理、特征提取与分类识别、半实物仿真试验等方面,提出了一种新的四元阵列融合声源识别方法。首先在系统坐标系下建立了四元阵列有色噪声环境下的观测模型;其次基于经验模态分解(empirical mode decomposition,EMD)理论,给出了四元阵列EMD融合算法,有效抑制了高频信号的干扰;再次基于梅尔频率倒谱系数-动态时间规整(Mel-frequency cepstrum coefficient-dynamic time warping,MFCC-DTW)方法,设计了阵列信号特征提取与分类识别算法;最后通过半实物仿真试验,并与相关研究基础对比,分别验证了提出的EMD融合算法及阵列信号特征提取与分类识别算法的有效性。 展开更多
关键词 被动声识别 经验模式分解 梅尔参数 动态时间规整
下载PDF
基于改进语音特征与极限学习机的语音端点检测
3
作者 罗庆 包亚萍 俞强 《微电子学与计算机》 北大核心 2020年第3期37-41,共5页
语音端点检测(Voice Activity Detection,VAD),是指在给定语音信号帧中判别语音是否存在,鲁棒的VAD有助于提高语音应用的自动化效率,例如语音增强、说话人识别、助听器等.为了提高低信噪比下语音端点检测的精度以及效率,提出了一种新的... 语音端点检测(Voice Activity Detection,VAD),是指在给定语音信号帧中判别语音是否存在,鲁棒的VAD有助于提高语音应用的自动化效率,例如语音增强、说话人识别、助听器等.为了提高低信噪比下语音端点检测的精度以及效率,提出了一种新的语音特征-低频消噪能量(Low Frequency De-noising Energy,LFDE),将其应用于VAD中,并利用LFDE与现有的声学特征(梅尔频率倒谱参数、共振峰频率)结合训练极限学习机(Extreme Learning Machine,ELM)分类器.仿真实验发现,端点检测的精度与效率都有提高. 展开更多
关键词 低频消噪能量 梅尔参数 共振峰频率 极限学习机
下载PDF
说话人识别中改进特征提取算法的研究 被引量:3
4
作者 宋乐 白静 《计算机工程与设计》 CSCD 北大核心 2014年第5期1772-1775,1781,共5页
为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,... 为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,提出了一种基于相关距离Fisher准则的特征选取方法,利用该方法对提取出的参数进行加权降维。通过实验对比结果表明,该算法提高了识别率,具备可行性与优越性,是一种有效的特征提取算法。 展开更多
关键词 说话人识别 特征提取 归一化短时能量 梅尔复合参数 相关距离Fisher准则
下载PDF
基于矢量量化的婴儿哭声识别算法 被引量:2
5
作者 赵文博 王艇艇 +1 位作者 张生 孙国强 《微计算机信息》 2011年第4期224-225,187,共3页
基于嵌入式微处理器的智能婴儿摇篮的功能需求,本文提出了一种针对婴儿哭声的语音识别算法。语音特征参数使用目前最广泛采用的MFCC参数,使用最大欧氏距离划分初始样本,使用LBG算法不断迭代优化得到最终码本。在婴儿哭声的识别阶段,提... 基于嵌入式微处理器的智能婴儿摇篮的功能需求,本文提出了一种针对婴儿哭声的语音识别算法。语音特征参数使用目前最广泛采用的MFCC参数,使用最大欧氏距离划分初始样本,使用LBG算法不断迭代优化得到最终码本。在婴儿哭声的识别阶段,提取待识别语音的MFCC特征参数与已有码本计算矢量量化误差,若矢量量化误差两次低于判断值,输出判别为婴儿哭声的结果。 展开更多
关键词 矢量量化 婴儿哭声识别 梅尔频率参数 LBG算法
下载PDF
嵌入式系统中语音识别加速技术的研究 被引量:1
6
作者 张军 李学斌 《微计算机信息》 2009年第20期29-30,共2页
针对嵌入式系统语音识别执行速度太慢的问题,对梅尔频率倒谱参数和隐马尔可夫模型各步骤作详细研究,提出了在嵌入式系统中进行整数运算和查表算法,实现语音识别加速的方法。加速前后执行速度对比实验显示,在特征提取部分,加速约有20倍。
关键词 语音识别 梅尔频率参数 隐马尔可夫模型
下载PDF
基于DSP的语音识别系统研究
7
作者 翟片富 景新幸 《大众科技》 2013年第12期16-18,共3页
文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数(MFCC)作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法(DTW)实现语音参数的匹... 文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数(MFCC)作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法(DTW)实现语音参数的匹配。用MATLAB实现DTW算法的仿真,进而将语音识别技术应用到DSP上,实验结果表明对特定人、小词汇量和孤立词的语音识别效果比较好。 展开更多
关键词 语音识别 DSP 梅尔特征参数 DTW
下载PDF
采用主成分分析的特征映射 被引量:8
8
作者 郭武 戴礼荣 王仁华 《自动化学报》 EI CSCD 北大核心 2008年第8期876-879,共4页
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数... 在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%. 展开更多
关键词 说话人确认 混合高斯模型 超矢量 梅尔刻度式参数
下载PDF
采用高斯概率分布和支持向量机的说话人确认 被引量:2
9
作者 郭武 戴礼荣 王仁华 《模式识别与人工智能》 EI CSCD 北大核心 2008年第6期794-798,共5页
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高... 在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降. 展开更多
关键词 广义线性判别式序列(GLDS) 梅尔刻度式参数(MFCC) 线性预测参数(LPCC)
原文传递
基于模型距离和支持向量机的说话人确认 被引量:2
10
作者 姚红 梁栋 郭武 《计算机仿真》 CSCD 北大核心 2009年第3期343-346,共4页
针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识... 针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识别率。在2004年NIST评测数据库上,采用推荐算法的系统等错误率比基线的混合高斯-背景模型系统低16%。对说话人识别取得一定进展。 展开更多
关键词 马氏距离 广义线性判别式序列核函数 梅尔刻度式参数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部