-
题名基于基音周期与清浊音信息的梅尔倒谱参数
被引量:1
- 1
-
-
作者
郭武
王仁华
戴礼荣
-
机构
中国科技大学电子工程与信息科学系
-
出处
《数据采集与处理》
CSCD
北大核心
2007年第2期229-233,共5页
-
基金
中国科技大学青年教师基金
国家863(2006AA010104)资助项目
-
文摘
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。
-
关键词
说话人确认
梅尔倒谱参数
基音频率
清浊音信息
-
Keywords
speaker verification
Mel-cepstrum
pitch frequency
information of voiced/unvoiced
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名一种新的四元阵列融合声源识别方法
被引量:3
- 2
-
-
作者
刘亚雷
顾晓辉
甘宁
-
机构
中国人民武装警察部队海警学院舰艇指挥系
南京理工大学智能弹药技术国防重点学科重点实验室
-
出处
《科学技术与工程》
北大核心
2020年第28期11620-11625,共6页
-
基金
国家自然科学基金青年基金(51605227)
公安部科技创新项目(2017JSYJC11)。
-
文摘
针对声源识别中观测模型线性化误差,信号特征参数提取依赖于经验分析阈值判断而造成信息丢失的问题,从信号观测模型、预处理、特征提取与分类识别、半实物仿真试验等方面,提出了一种新的四元阵列融合声源识别方法。首先在系统坐标系下建立了四元阵列有色噪声环境下的观测模型;其次基于经验模态分解(empirical mode decomposition,EMD)理论,给出了四元阵列EMD融合算法,有效抑制了高频信号的干扰;再次基于梅尔频率倒谱系数-动态时间规整(Mel-frequency cepstrum coefficient-dynamic time warping,MFCC-DTW)方法,设计了阵列信号特征提取与分类识别算法;最后通过半实物仿真试验,并与相关研究基础对比,分别验证了提出的EMD融合算法及阵列信号特征提取与分类识别算法的有效性。
-
关键词
被动声识别
经验模式分解
梅尔倒谱参数
动态时间规整
-
Keywords
passive acoustic identification
empirical mode decomposition
Mel-frequency cepstrum coefficient
dynamic time warping
-
分类号
TN911.72
[电子电信—通信与信息系统]
-
-
题名基于改进语音特征与极限学习机的语音端点检测
- 3
-
-
作者
罗庆
包亚萍
俞强
-
机构
南京工业大学计算机科学与技术系
-
出处
《微电子学与计算机》
北大核心
2020年第3期37-41,共5页
-
文摘
语音端点检测(Voice Activity Detection,VAD),是指在给定语音信号帧中判别语音是否存在,鲁棒的VAD有助于提高语音应用的自动化效率,例如语音增强、说话人识别、助听器等.为了提高低信噪比下语音端点检测的精度以及效率,提出了一种新的语音特征-低频消噪能量(Low Frequency De-noising Energy,LFDE),将其应用于VAD中,并利用LFDE与现有的声学特征(梅尔频率倒谱参数、共振峰频率)结合训练极限学习机(Extreme Learning Machine,ELM)分类器.仿真实验发现,端点检测的精度与效率都有提高.
-
关键词
低频消噪能量
梅尔倒谱参数
共振峰频率
极限学习机
-
Keywords
low frequency de-noising energy
mel-frequency cepstrumcoefficient
formant frequency
extreme learning machine
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名说话人识别中改进特征提取算法的研究
被引量:3
- 4
-
-
作者
宋乐
白静
-
机构
太原理工大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第5期1772-1775,1781,共5页
-
基金
国家自然科学基金项目(61072087)
山西省科技攻关基金项目(20120313013-6)
-
文摘
为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,提出了一种基于相关距离Fisher准则的特征选取方法,利用该方法对提取出的参数进行加权降维。通过实验对比结果表明,该算法提高了识别率,具备可行性与优越性,是一种有效的特征提取算法。
-
关键词
说话人识别
特征提取
归一化短时能量
梅尔倒谱复合参数
相关距离Fisher准则
-
Keywords
speaker recognition
feature extraction
the normalized short-term energy
Mel cepstrum composite coefficients
Fisher criterion with correlation distance
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于矢量量化的婴儿哭声识别算法
被引量:2
- 5
-
-
作者
赵文博
王艇艇
张生
孙国强
-
机构
上海理工大学
-
出处
《微计算机信息》
2011年第4期224-225,187,共3页
-
基金
上海市研究生创新基金项目
基金申请人:赵文博
+2 种基金
王艇艇
项目名称:基于嵌入式微处理器的智能婴儿摇篮
基金颁发部门:上海市教育委员会(JWCXSL1002)
-
文摘
基于嵌入式微处理器的智能婴儿摇篮的功能需求,本文提出了一种针对婴儿哭声的语音识别算法。语音特征参数使用目前最广泛采用的MFCC参数,使用最大欧氏距离划分初始样本,使用LBG算法不断迭代优化得到最终码本。在婴儿哭声的识别阶段,提取待识别语音的MFCC特征参数与已有码本计算矢量量化误差,若矢量量化误差两次低于判断值,输出判别为婴儿哭声的结果。
-
关键词
矢量量化
婴儿哭声识别
梅尔频率倒谱参数
LBG算法
-
Keywords
Vector Quantization
Identification baby crying
MFCC
LBG
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名嵌入式系统中语音识别加速技术的研究
被引量:1
- 6
-
-
作者
张军
李学斌
-
机构
北京化工大学信息科学与技术学院
-
出处
《微计算机信息》
2009年第20期29-30,共2页
-
文摘
针对嵌入式系统语音识别执行速度太慢的问题,对梅尔频率倒谱参数和隐马尔可夫模型各步骤作详细研究,提出了在嵌入式系统中进行整数运算和查表算法,实现语音识别加速的方法。加速前后执行速度对比实验显示,在特征提取部分,加速约有20倍。
-
关键词
语音识别
梅尔频率倒谱参数
隐马尔可夫模型
-
Keywords
speech recognition
MFCC
HMM
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于DSP的语音识别系统研究
- 7
-
-
作者
翟片富
景新幸
-
机构
桂林电子科技大学信息与通信学院
-
出处
《大众科技》
2013年第12期16-18,共3页
-
文摘
文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数(MFCC)作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法(DTW)实现语音参数的匹配。用MATLAB实现DTW算法的仿真,进而将语音识别技术应用到DSP上,实验结果表明对特定人、小词汇量和孤立词的语音识别效果比较好。
-
关键词
语音识别
DSP
梅尔倒谱特征参数
DTW
-
Keywords
Speech recognition
DSP
Mel Frequency Cepstrum Coefficient
DTW
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名采用主成分分析的特征映射
被引量:8
- 8
-
-
作者
郭武
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《自动化学报》
EI
CSCD
北大核心
2008年第8期876-879,共4页
-
基金
国家高技术研究发展计划(863计划)(2006AA010104)
中国科学技术大学青年教师基金资助~~
-
文摘
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
-
关键词
说话人确认
混合高斯模型
超矢量
梅尔刻度式倒谱参数
-
Keywords
Speaker verification, Gaussian mixture model (GMM), supervector, Mel frequency cepstral coefficients (MFCC)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名采用高斯概率分布和支持向量机的说话人确认
被引量:2
- 9
-
-
作者
郭武
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第6期794-798,共5页
-
基金
国家863计划资助项目(No.2006AA010104)
-
文摘
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
-
关键词
广义线性判别式序列(GLDS)
梅尔刻度式倒谱参数(MFCC)
线性预测倒谱参数(LPCC)
-
Keywords
Generalized Linear Discriminant Sequence (GLDS), Mel Frequency Cepstrum Coefficient ( MFCC), Linear Prediction Cepstrum Coefficient (LPCC)
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于模型距离和支持向量机的说话人确认
被引量:2
- 10
-
-
作者
姚红
梁栋
郭武
-
机构
安徽大学计算智能与信号处理教育部重点实验室
中国科学技术大学电子工程与信息科学系
-
出处
《计算机仿真》
CSCD
北大核心
2009年第3期343-346,共4页
-
文摘
针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识别率。在2004年NIST评测数据库上,采用推荐算法的系统等错误率比基线的混合高斯-背景模型系统低16%。对说话人识别取得一定进展。
-
关键词
马氏距离
广义线性判别式序列核函数
梅尔刻度式倒谱参数
-
Keywords
Mahalanobis distance
GLDS
MFCC
-
分类号
TN912.34
[电子电信—通信与信息系统]
-