期刊文献+
共找到692篇文章
< 1 2 35 >
每页显示 20 50 100
语音识别和说话人识别中各倒谱分量的相对重要性 被引量:74
1
作者 甄斌 吴玺宏 +1 位作者 刘志敏 迟惠生 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期371-378,共8页
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分... 采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。 展开更多
关键词 MFCC 说话人识别 语音识别
下载PDF
基于改进的网格搜索法的SVM参数优化 被引量:122
2
作者 王健峰 张磊 +1 位作者 陈国兴 何学文 《应用科技》 CAS 2012年第3期28-31,共4页
比较了现今应用比较广泛的3种支持向量机(SVM)参数优化方法.具体分析了网格法、遗传算法和粒子群算法在SVM参数优化方面的性能以及优缺点,提出了一种改进的网格法.先在较大范围内进行搜索,在得到的优化结果附近区域再进行精确搜索.实验... 比较了现今应用比较广泛的3种支持向量机(SVM)参数优化方法.具体分析了网格法、遗传算法和粒子群算法在SVM参数优化方面的性能以及优缺点,提出了一种改进的网格法.先在较大范围内进行搜索,在得到的优化结果附近区域再进行精确搜索.实验表明改进的网格搜索法耗时短,更适用于有时间要求的说话人识别应用中. 展开更多
关键词 支持向量机 参数优化 网格搜索 遗传算法 粒子群算法 说话人识别
下载PDF
基于MFCC和加权矢量量化的说话人识别系统 被引量:34
3
作者 邵央 刘丙哲 李宗葛 《计算机工程与应用》 CSCD 北大核心 2002年第5期127-128,共2页
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结... 文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。 展开更多
关键词 倒谱系数 说话人识别系统 加权矢量量化 MFCC 语音识别 INTERNET
下载PDF
说话人识别中支持向量机核函数参数优化研究 被引量:49
4
作者 刘祥楼 贾东旭 +1 位作者 李辉 姜继玉 《科学技术与工程》 2010年第7期1669-1673,共5页
在基于SVM的说话人识别系统研究中,如何获得理想的识别率是亟待解决的问题。SVM核函数是众多影响识别率因素中最明显的。该系统提高识别率的技术关键是SVM核函数的选取及其参数优化。为此,在对三种常用核函数的特点进行研究的基础上,利... 在基于SVM的说话人识别系统研究中,如何获得理想的识别率是亟待解决的问题。SVM核函数是众多影响识别率因素中最明显的。该系统提高识别率的技术关键是SVM核函数的选取及其参数优化。为此,在对三种常用核函数的特点进行研究的基础上,利用网格搜索法来分别进行参数优选,通过实际语音的训练和识别验证识别效果。目前优选参数可以实现识别率≥99.9%且识别时间<0.1 s。 展开更多
关键词 支持向量机 说话人识别 核函数 参数优化 网格搜索法
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
5
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 MEL频率倒谱系数 Gammatone滤波器
下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
6
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测倒谱系数 美尔倒谱系数 仿真
下载PDF
基于修正MFCC参数汉语耳语音的话者识别 被引量:22
7
作者 林玮 杨莉莉 徐柏龄 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第1期54-62,共9页
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提... 耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 展开更多
关键词 耳语音 话者识别 MFCC参数 隐马尔可夫模型
下载PDF
基于PCNN的语谱图特征提取在说话人识别中的应用 被引量:23
8
作者 马义德 袁敏 +2 位作者 齐春亮 刘悦 刘映杰 《计算机工程与应用》 CSCD 北大核心 2005年第20期81-84,共4页
该文首次提出了一种将有生物视觉依据的人工神经网络——脉冲耦合神经网络(PulseCoupledNeuralNetwork,以下简称为PCNN)用于说话人识别领域的语谱图特征提取的新方法。该方法将语谱图输入到PCNN后得到输出图像的时间序列及其熵序列作为... 该文首次提出了一种将有生物视觉依据的人工神经网络——脉冲耦合神经网络(PulseCoupledNeuralNetwork,以下简称为PCNN)用于说话人识别领域的语谱图特征提取的新方法。该方法将语谱图输入到PCNN后得到输出图像的时间序列及其熵序列作为说话人语音的特征,利用它的不变性实现说话人识别。实验结果表明,该方法可以快速有效地进行说话人识别。该文将PCNN引入到语音识别的应用研究中,开拓了信号处理中两个极为重要的部分———语音信号处理和图像信号处理结合的新领域,同时对于PCNN的理论研究和实际应用具有非常重要的现实意义。 展开更多
关键词 脉冲耦合神经网络 说话人识别 语谱图 特征提取 时间序列 熵序列
下载PDF
二次特征提取及其在说话人识别中的应用 被引量:10
9
作者 马志友 杨莹春 吴朝晖 《电路与系统学报》 CSCD 2003年第2期130-133,共4页
传统的特征提取方法在处理小范围的说话人识别时尚可为之,但是在较大用户群的情况下,由于特征覆盖范围不够导致性能下降。鉴于此,本文提出了一种新的二次特征提取方法,它通过综合运用加权、微分、组合、筛选等方法,进一步挖掘说话人语... 传统的特征提取方法在处理小范围的说话人识别时尚可为之,但是在较大用户群的情况下,由于特征覆盖范围不够导致性能下降。鉴于此,本文提出了一种新的二次特征提取方法,它通过综合运用加权、微分、组合、筛选等方法,进一步挖掘说话人语音背后的隐性个性差异。在采用138人的YOHO数据库上进行的说话人识别测试中,其性能优于传统的特征提取方法。 展开更多
关键词 发音机理 说话人识别 特征提取 二次特征提取 MFCC LPCC
下载PDF
说话人识别中MFCC参数提取的改进 被引量:29
10
作者 胡政权 曾毓敏 +1 位作者 宗原 李梦超 《计算机工程与应用》 CSCD 2014年第7期217-220,共4页
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表... 在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 展开更多
关键词 MFCC参数 频谱重建 说话人识别
下载PDF
基于Gammatone滤波器组的听觉特征提取 被引量:29
11
作者 胡峰松 曹孝玉 《计算机工程》 CAS CSCD 2012年第21期168-170,174,共4页
目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压... 目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压缩,模拟人耳听觉模型处理信号的非线性特性。在基于高斯混合模型分类器的识别算法下进行仿真实验,结果表明,该听觉特征具有比梅尔频率倒谱系数和线性预测倒谱系数更好的抗噪声能力。 展开更多
关键词 说话人识别 特征提取 Gammatone滤波器 听觉模型 倒谱系数 鲁棒性
下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
12
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率倒谱系数(MFCC) 分裂法与K均值聚类结合法
下载PDF
距离加权矢量量化文本无关的说话人识别 被引量:15
13
作者 张炜 胡起秀 吴文虎 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第3期20-23,共4页
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特... 本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。 展开更多
关键词 说话人识别 文本无关 矢量量化 声音识别
原文传递
基于矢量量化的组合参数法说话人识别 被引量:8
14
作者 尉洪 周浩 杨鉴 《云南大学学报(自然科学版)》 CAS CSCD 2002年第2期96-100,共5页
说话人识别的方法很多 ,提出的基于矢量量化 (VQ)的算法 ,在语音特征表征上利用几种特征参数的组合使用来提高识别率 ,在VQ过程中 ,经典的K均值算法收敛速度快 ,但极易收敛于局部最佳点 ,为了使聚类算法收敛于全局最优点 ,同时提高识别... 说话人识别的方法很多 ,提出的基于矢量量化 (VQ)的算法 ,在语音特征表征上利用几种特征参数的组合使用来提高识别率 ,在VQ过程中 ,经典的K均值算法收敛速度快 ,但极易收敛于局部最佳点 ,为了使聚类算法收敛于全局最优点 ,同时提高识别率 ,采用模拟退火算法来改善聚类码本质量 .讨论了具体的算法实现 ,并给出了一些实验数据 ,实验结果表明该处理方法是有效的 . 展开更多
关键词 说话人识别 矢量量化 组合参数 模拟退火算法 语音识别 聚类算法 聚类码本
原文传递
作为说话人识别特征参量的M FCC的提取过程 被引量:10
15
作者 丁爱明 《电子工程师》 2006年第1期51-53,共3页
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率... 说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。 展开更多
关键词 说话人识别 倒谱 MFCC 特征提取
下载PDF
基于支撑向量机的文本无关的说话人识别系统 被引量:8
16
作者 何昕 刘重庆 李介谷 《计算机工程》 EI CAS CSCD 北大核心 2000年第6期61-63,共3页
支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有... 支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有更好的性能。 展开更多
关键词 支撑向量机 说话人识别系统 语音识别 模式识别
下载PDF
基于小波变换说话人识别技术的研究 被引量:16
17
作者 赵铮 侯伯亨 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2000年第4期437-441,共5页
提出了基于小波变换理论的说话人识别算法———小波基包法 .利用小波变换多分辨的特性 ,提取出真正地反映基音周期变化的基频包络 ,从声学语音学的角度去认识方言和口音 ,首次提出了汉语口音的参量表征 ,并应用到说话人识别当中 ,以实... 提出了基于小波变换理论的说话人识别算法———小波基包法 .利用小波变换多分辨的特性 ,提取出真正地反映基音周期变化的基频包络 ,从声学语音学的角度去认识方言和口音 ,首次提出了汉语口音的参量表征 ,并应用到说话人识别当中 ,以实现从听觉的角度出发 ,进行说话人的先天特性与后天特性相结合的说话人识别 .结果表明 ,从基频包络中可以表现口音的一些表征 ,有助于认识说话人的特性 . 展开更多
关键词 小波变换 说话人识别 口音特性 语音识别
下载PDF
应用小波包变换提取说话人识别的特征参数 被引量:15
18
作者 刘雅琴 裘雪红 《计算机工程与应用》 CSCD 北大核心 2006年第9期67-69,共3页
论文研究了小波包变换,分析了MFCC参数的提取,比较了MEL滤波器组频带划分和小波包分解的频带划分,提取出了基于小波包变换的特征参数(DBWPTC),实验结果表明通过小波包变换提取的语音特征参数DBWPTC优于通过傅立叶变换提取的特征参数MFCC。
关键词 说话人识别 小波包变换 MFCC 矢量量化
下载PDF
基于改进梅尔倒谱系数的GIS机械故障诊断方法 被引量:19
19
作者 徐明月 李喆 +2 位作者 孙汉文 盛戈皞 江秀臣 《高压电器》 CAS CSCD 北大核心 2020年第9期122-128,共7页
机械故障是GIS常见的故障,若不及时发现会造成分合闸失误等重大安全隐患。文中提出了一种用于GIS机械故障在线监测的基于改进梅尔倒谱系数诊断方法。首先对预处理后的声音信号提取MFCC;为适应GIS运行声音能量变化平缓的特点,对MFCC进行... 机械故障是GIS常见的故障,若不及时发现会造成分合闸失误等重大安全隐患。文中提出了一种用于GIS机械故障在线监测的基于改进梅尔倒谱系数诊断方法。首先对预处理后的声音信号提取MFCC;为适应GIS运行声音能量变化平缓的特点,对MFCC进行优化得到改进特征;引入SVM构建基于声学的GIS机械故障诊断模型,并采用袋装算法对SVM模型进行集成。本研究通过在真型GIS上模拟机械故障,获取真实的故障声音信号进行训练和测试。实验结果表明,改进MFCC相较于传统MFCC在GIS故障声音识别系统中有着更高的识别精度。并且对比传统MFCC特征,改进的特征在噪声条件下也有更好的表现,尤其在信噪比低时,F1分数提升幅度可以达到30%左右。 展开更多
关键词 气体绝缘组合电器(GIS) 机械故障 故障诊断 梅尔倒谱系数 说话人识别
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
20
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部