期刊文献+
共找到213篇文章
< 1 2 11 >
每页显示 20 50 100
基于MFCC的说话人识别系统 被引量:19
1
作者 郭春霞 裘雪红 《电子科技》 2005年第11期53-56,共4页
说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分... 说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率。得出差分MFCC组合MFCC优于MFCC。 展开更多
关键词 说话人识别 MEL频率倒谱系数 特征提取
下载PDF
基于支持向量机的说话人辨认研究 被引量:17
2
作者 侯风雷 王炳锡 《通信学报》 EI CSCD 北大核心 2002年第6期61-67,共7页
支持向量机是统计学习理论的一个重要的学习方法,也是解抉模式识别问题的一个有力的工具。本文提出了用支持向量机来解决说话人辨认问题,结合语音信号的特点,解决了大数据量情况下支持向量机的训练问题。支持向量机对两类的分类问题有... 支持向量机是统计学习理论的一个重要的学习方法,也是解抉模式识别问题的一个有力的工具。本文提出了用支持向量机来解决说话人辨认问题,结合语音信号的特点,解决了大数据量情况下支持向量机的训练问题。支持向量机对两类的分类问题有着突出的优势,本文用两种判决规则将两类问题应用到多类的识别问题。用支持向量机实现了一个与文本无关的说话人辨认系统,实验表明,本方法有良好的效果。 展开更多
关键词 支持向量机 说话人辨认 模式识别 语言信号 训练算法
下载PDF
声纹识别技术及其应用 被引量:22
3
作者 杨阳 陈永明 《电声技术》 2007年第2期45-46,50,共3页
声纹是生物特征的一种,对于人体来说,声纹是长期稳定的特征信号,通过声纹鉴别技术可以区分不同个体。介绍了声纹、声纹识别的概念和原理;指出了声纹识别技术的应用范围和前景。
关键词 声纹 声纹识别 说话人辨认 说话人确认
下载PDF
说话人识别中特征参数提取的一种新方法 被引量:16
4
作者 汪峥 连翰 王建军 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2005年第1期197-200,共4页
提出了一种新的说话人识别中特征参数的提取方法.在分别使用傅立叶分析和小波分析得到两组特征参数之后,进一步利用Fisher准则进行参数选取,构造了一种新的混合特征参数.在不增加训练和识别时计算量的同时,结合了傅立叶分析和小波分析... 提出了一种新的说话人识别中特征参数的提取方法.在分别使用傅立叶分析和小波分析得到两组特征参数之后,进一步利用Fisher准则进行参数选取,构造了一种新的混合特征参数.在不增加训练和识别时计算量的同时,结合了傅立叶分析和小波分析两者的优点,具有更好的分类能力.实验结果显示,这种新的混合参数有效地提高了说话人的识别率,能更好地表征说话人的特征. 展开更多
关键词 FISHER准则 特征参数 说话人识别 识别率 显示 分类能力 小波分析 傅立叶分析 计算量 优点
原文传递
基于支撑向量机的文本无关的说话人识别系统 被引量:8
5
作者 何昕 刘重庆 李介谷 《计算机工程》 EI CAS CSCD 北大核心 2000年第6期61-63,共3页
支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有... 支撑向量机(SVM)是一种新的统计学习方法。提出一种基于支撑向量机的文本无关的说话人辨认系统,在作者的实验中得到了98%的平均识别率,同时实验表明同基于向量量化(VQ)和高斯混合模型(GMM)的经典方法相比,基于SVM的方法具有更好的性能。 展开更多
关键词 支撑向量机 说话人识别系统 语音识别 模式识别
下载PDF
实时说话人辨识系统中改进的DTW算法 被引量:20
6
作者 李邵梅 刘力雄 陈鸿昶 《计算机工程》 CAS CSCD 北大核心 2008年第4期218-219,共2页
识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明... 识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。 展开更多
关键词 说话人辨识 美尔倒谱系数 动态时间弯折
下载PDF
基于LPC分析的语音特征参数研究及其在说话人识别中的应用 被引量:13
7
作者 张玲华 郑宝玉 杨震 《南京邮电学院学报(自然科学版)》 2005年第6期1-6,共6页
对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,... 对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。 展开更多
关键词 说话人识别 特征参数 LPC分析 运算复杂度
下载PDF
噪声环境下说话人识别的组合特征提取方法 被引量:12
8
作者 芮贤义 俞一彪 《信号处理》 CSCD 北大核心 2006年第5期673-677,共5页
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话... 针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。 展开更多
关键词 说话人识别 小波变换 矢量量化 组合特征
下载PDF
文本无关的说话人识别:综述 被引量:8
9
作者 岳喜才 叶大田 《模式识别与人工智能》 EI CSCD 北大核心 2001年第2期194-200,共7页
本文介绍了说话人识别的基本概念和应用前景,分析了说话人识别的技术难点,详细讨论了说话人语音特征的提取方法和说话人识别方法并简要介绍了作者的工作。
关键词 说话人识别 文本 特征提取 适量量化 神经网络 语音信号处理
原文传递
基于动态贝叶斯网络的音视频双模态说话人识别 被引量:11
10
作者 吴志勇 蔡莲红 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期470-475,共6页
动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行... 动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行音视频说话人识别的实验.通过对不同层级的建模过程及说话人识别实验的结果进行分析,结果表明,动态贝叶斯网络为描述音视频间的时序相关性和特征相关性提供了有效的建模方法,在不同语音信噪比的情况下均能提高说话人识别的性能. 展开更多
关键词 生物识别 说话人识别 音视频联合建模 融合 动态贝叶斯网络
下载PDF
Hadamard纠错码结合支持向量机在多分类问题中的应用 被引量:15
11
作者 尹安容 谢湘 匡镜明 《电子学报》 EI CAS CSCD 北大核心 2008年第1期122-126,共5页
多分类问题一直是模式识别领域的一个热点,本文提出了将Hadamard纠错码同二元分类器相结合的方法来解决此问题,相对于其它类型的纠错码多分类器法,该方法的实现简单快捷,且更容易构造出性能优越的纠错码本.本文将Hadamard纠错码和支持... 多分类问题一直是模式识别领域的一个热点,本文提出了将Hadamard纠错码同二元分类器相结合的方法来解决此问题,相对于其它类型的纠错码多分类器法,该方法的实现简单快捷,且更容易构造出性能优越的纠错码本.本文将Hadamard纠错码和支持向量机相结合,应用于说话人辨认这样一个多分类问题中,并同传统的"1对余"的多类推广方式进行了比较.实验结果表明在多分类任务中,Hadamard纠错码对于不同的类别都表现出了很强的分类能力,且性能优于"1对余"法,对于类间码字的不同分配方式也具有良好的鲁棒性. 展开更多
关键词 模式识别 说话人辨认 Hadmnard矩阵 支持向量机 纠错码
下载PDF
两级决策的开集说话人辨认方法 被引量:12
12
作者 何致远 胡起秀 徐光祐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期516-520,共5页
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ... 为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。 展开更多
关键词 说话人识别 说话人辨认 语音切分 隐MARKOV模型 两级决策 语音识别
原文传递
基于GMM-UBM的声纹识别技术的特征参数研究 被引量:15
13
作者 周玥媛 孔钦 《计算机技术与发展》 2020年第5期76-83,共8页
声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话... 声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力。基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话人辨认两种应用角度进行性能比较。在取不同特征参数阶数、不同高斯混合度和使用不同时长的训练语音与测试语音的情况下,从理论识别效果、实际识别效果、识别所用时长、识别时长占比等多个方面进行了分析与研究。最终结果表明:在GMM-UBM模式识别方法下,三种静态特征参数中MFCC绝大多数时候具有最佳识别效果,同时其系统识别耗时最长;识别率与语音特征参数的阶数之间并非单调上升关系。静态参数在结合较佳阶数的动态参数时能够提升识别效果;增加动态参数阶数与提高系统识别效果之间无必然联系。 展开更多
关键词 GMM-UBM 声纹识别 特征参数性能 说话人确认 说话人辨认
下载PDF
基于高斯混合模型的说话人确认系统 被引量:5
14
作者 杨澄宇 赵文 杨鉴 《计算机应用》 CSCD 北大核心 2001年第4期7-8,11,共3页
由于在人的话音频谱中 ,低频和较高频段含有较多说话人的个性信息 ,本文提出一种LPC倒谱的改进算法用于与文本无关的说话人识别。该改进算法通过话音频谱的各频段进行加权 ,突出说话人的个性信息 ,从而使说话人更易于区分。
关键词 混合高斯模型 说话人确认系统 语音识别 语音信息处理 LPC倒谱
下载PDF
声纹识别系统 被引量:7
15
作者 蔡耿平 黄顺珍 +3 位作者 徐志鸿 蓝波 范国华 梁凡 《深圳大学学报(理工版)》 EI CAS 2002年第2期78-80,共3页
介绍一个与文本无关、与语种无关、与性别无关的声纹识别系统 ,采用的技术包括MFCC特征提取、VQ矢量量化、LBG聚类建模、数据有效性距离测度和计算机深层编程等 ,在字表大小为 5 0人以内时识别率接近 10 0 % .
关键词 声纹识别 说话人辨认 矢量量化 聚类算法 距离测度 计算机识别
下载PDF
不依赖于文本的说话人识别研究及其应用 被引量:8
16
作者 于世功 田岚 李传林 《计算机工程与应用》 CSCD 北大核心 2000年第4期75-77,共3页
说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上,提出采用长时线性预测倒谱(LPCCEP)系数和矢量量化(VQ)模型的不依赖于文本的说话人识别方法,并成功地应用于一个数据库查询... 说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上,提出采用长时线性预测倒谱(LPCCEP)系数和矢量量化(VQ)模型的不依赖于文本的说话人识别方法,并成功地应用于一个数据库查询系统中。该方法训练时间短,识别响应实时,数据存储量少。实验表明,在100名说话人集合内,识别率达98%。 展开更多
关键词 说话人识别 特征提取 文本 语音信号 语音识别
下载PDF
基于小波变换的鲁棒型特征提取及说话人识别 被引量:7
17
作者 芮贤义 俞一彪 《电路与系统学报》 CSCD 北大核心 2005年第5期129-132,共4页
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波... 说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。 展开更多
关键词 说话人识别 鲁棒型特征 小波变换 矢量量化
下载PDF
与文本无关的复合策略说话人辨识系统 被引量:6
18
作者 牟晓隆 胡起秀 吴文虎 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第3期16-19,共4页
为获得较高的说话人辨识正确率,同时减小辨识系统的时空开销,提出了一种复合策略的辨识系统。采用长时平均频谱作为粗识的特征,定义了相应的辨识判别准则。建立mel-倒谱特征的高斯混合模型(GMM)进行第二步辨识。给出了GM... 为获得较高的说话人辨识正确率,同时减小辨识系统的时空开销,提出了一种复合策略的辨识系统。采用长时平均频谱作为粗识的特征,定义了相应的辨识判别准则。建立mel-倒谱特征的高斯混合模型(GMM)进行第二步辨识。给出了GMM求解算法的一种简便推导,着重研究了判别阈值,预加重系数,GMM阶次,训练语音长度及辨识语音长度对系统辨识性能的影响。 展开更多
关键词 说话人辨识 文本无关 声音识别 复合策略
原文传递
模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别 被引量:7
19
作者 吴晓娟 韩先花 聂开宝 《电子与信息学报》 EI CSCD 北大核心 2002年第6期845-849,共5页
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算... 该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。 展开更多
关键词 模糊C-均值(FCM)聚类法 模糊聚类 矢量量化 说话人识别 语音特征 语音识别
下载PDF
说话人识别使用遗传RBF网络 被引量:6
20
作者 岳喜才 管桦 叶大田 《应用声学》 CSCD 北大核心 2000年第2期35-38,共4页
针对RBF网络普遍采用的一种训练算法所存在的局部最佳问题,本文将遗传算法用于RBF网络训练过程,增强了该网络的全局寻优能力,提高了RBF网络的模式识别性能.说话人识别实验显示,改进训练算法后,RBF网络的说话人识别率... 针对RBF网络普遍采用的一种训练算法所存在的局部最佳问题,本文将遗传算法用于RBF网络训练过程,增强了该网络的全局寻优能力,提高了RBF网络的模式识别性能.说话人识别实验显示,改进训练算法后,RBF网络的说话人识别率有稍许提高. 展开更多
关键词 语音识别 神经网络 遗传算法 RBF网络
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部