期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
GMM-UBM和SVM说话人辨认系统及融合的分析 被引量:9
1
作者 鲍焕军 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期693-698,共6页
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在... 在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,SVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够。该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能。在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%。 展开更多
关键词 说话人辨认 Gauss混合模型-通用背景模型(gmm-ubm) 支持向量机(SVM) 信道鲁棒
原文传递
基于声纹识别的智能照明语音识别算法研究 被引量:9
2
作者 王建平 马兰兰 孙伟 《传感器与微系统》 CSCD 2020年第6期37-40,44,共5页
提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多... 提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多种声控命令的自适应实时语音训练样本库,采用对数似然分法和矢量累积距离法实现声控人身份认定与声控信号语义识别。仿真实验结果表明:该算法能快速准确判定与识别智能照明声控信号的身份和语义。 展开更多
关键词 声纹识别 智能照明 高斯混合模型-通用背景模型 动态时间规整
下载PDF
自适应并行模型组合的鲁棒语音身份识别算法 被引量:6
3
作者 李聪 葛洪伟 《信号处理》 CSCD 北大核心 2018年第7期867-875,共9页
由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环... 由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。 展开更多
关键词 说话人识别 特征补偿 并行模型组合 高斯混合模型-通用背景模型 噪声
下载PDF
基于特征相对贡献度对加权Mel倒谱的改进 被引量:4
4
作者 王家盛 郭其威 +1 位作者 吴松 马建敏 《声学技术》 CSCD 北大核心 2021年第3期408-414,共7页
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universa... 在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。 展开更多
关键词 增减分量法 贡献度 梅尔(Mel)倒谱系数 高斯混合-通用背景模型(gmm-ubm)
下载PDF
一种改进动态特征参数的话者语音识别系统 被引量:4
5
作者 申小虎 万荣春 张新野 《计算机仿真》 CSCD 北大核心 2015年第4期154-158,共5页
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种... 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。 展开更多
关键词 话者语音识别系统 美尔频率倒谱系数 滑动差分倒谱特征 动态时频倒谱系数 混合高斯-通用背景模型
下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
6
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
下载PDF
非线性幂变换Gammachirp滤波器的鲁棒语音特征提取 被引量:2
7
作者 李聪 葛洪伟 《计算机科学与探索》 CSCD 北大核心 2019年第8期1351-1359,共9页
针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gam... 针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gammachirp滤波器组代替Gammatone滤波器组进行滤波,并在特征参数中融合了分段式非线性幂函数变换的方式。另外,算法中利用了均值方差归一化和时间序列滤波等技术的方法,进一步提高了其在噪声环境下的鲁棒性,并在改进的i-vector+PLDA模型下进行了测试。实验结果表明,相较于目前常用的一些说话人语音特征提取算法,在不同噪声和不同信噪比下,NPGFCC特征具有最佳抗噪性能,特别是在信噪比较低的情况下,与其他语音特征相比,NPGFCC特征具有更大的优势。 展开更多
关键词 特征提取 说话人识别 伽马啁啾滤波器 高斯混合模型-通用背景模型(gmm-ubm) 辨识向量(i-vector) 概率线性判别分析(PLDA)
下载PDF
基于得分域多维特征分类器的声纹密码系统
8
作者 潘逸倩 魏思 +1 位作者 戴礼荣 刘庆峰 《模式识别与人工智能》 EI CSCD 北大核心 2012年第5期755-761,共7页
针对不同类型数据对目标发音人区分能力不同的现象,在传统系统基础上提出利用UBM模型对测试数据进行分类,使用分类后的似然比得分形成多维特征,在此基础上利用SVM分类器进行声纹密码确认.该方法把传统的似然比检验策略转换成多维特征空... 针对不同类型数据对目标发音人区分能力不同的现象,在传统系统基础上提出利用UBM模型对测试数据进行分类,使用分类后的似然比得分形成多维特征,在此基础上利用SVM分类器进行声纹密码确认.该方法把传统的似然比检验策略转换成多维特征空间上的二类分类问题.测试与注册数据同信道情况时,在4种手机数据集上,文中系统相对文本相关GMM-UBM声纹密码系统等错误率分别下降41.25%、33.33%、37.49%和26.03%,在交叉信道上系统性能也获得改善. 展开更多
关键词 声纹密码 混合高斯模型-统一背景模型(gmmubm) 平均似然比 二类分类器
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部