期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
联合因子分析和稀疏表示在稳健性说话人确认中的应用 被引量:7
1
作者 杨海 张翔 +2 位作者 梁春燕 索宏彬 颜永红 《声学学报》 EI CSCD 北大核心 2012年第5期548-552,共5页
在说话人确认的任务中,为了解决信道失配问题,提高系统性能,引入了联合因子分析和稀疏表示算法。首先利用联合因子分析算法去除信道干扰,得到与信道无关的说话人因子,然后在稀疏表示算法中利用说话人因子构建过完备字典,求解稀疏最优化... 在说话人确认的任务中,为了解决信道失配问题,提高系统性能,引入了联合因子分析和稀疏表示算法。首先利用联合因子分析算法去除信道干扰,得到与信道无关的说话人因子,然后在稀疏表示算法中利用说话人因子构建过完备字典,求解稀疏最优化问题计算说话人得分。由于此方法有机结合了联合因子分析算法的信道鲁棒性和稀疏表示的鉴别性,使用此算法构建的系统在NIST SRE 2008电话训练、电话测试数据集上性能表现良好,相对于联合因子分析-支持向量机系统在性能上有竞争性,在原理上有互异性,系统融合更带来了最小检测代价指标上4.91%的性能提升。实验表明使用联合因子分析与稀疏表示进行说话人确认是可行的。 展开更多
关键词 因子分析 稀疏表示 稳健性 说话人确认 信道干扰 应用 最优化问题 支持向量机
下载PDF
韵律特征在概率线性判别分析说话人确认中的应用 被引量:6
2
作者 梁春燕 杨琳 +1 位作者 周若华 颜永红 《声学学报》 EI CSCD 北大核心 2015年第1期28-33,共6页
研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准... 研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。 展开更多
关键词 线性判别分析 说话人确认 韵律特征 MEL频率倒谱系数 应用 概率 标准技术研究院 说话人识别
下载PDF
汉语连续语音识别系统中三音子模型的优化 被引量:4
3
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《计算机应用研究》 CSCD 北大核心 2013年第10期2920-2922,共3页
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三... 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。 展开更多
关键词 决策树聚类 三音子模型 声韵母 最大后验概率
下载PDF
谐波显著度的基频提取方法 被引量:5
4
作者 宋黎明 李明 颜永红 《声学学报》 EI CSCD 北大核心 2015年第2期294-299,共6页
我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005... 我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。 展开更多
关键词 显著度 语音信号 轨迹跟踪 基音周期 抗噪性能 数据集 共振峰 加权求和 基音检测 宽度范围
下载PDF
具有选择注意能力的语音拾取技术 被引量:4
5
作者 王晓飞 国雁萌 +3 位作者 葛凤培 吴超 付强 颜永红 《中国科学:信息科学》 CSCD 北大核心 2015年第10期1310-1327,共18页
随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以... 随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取. 展开更多
关键词 传声器阵列 唤醒词 声学回波控制 语音增强 目标语音检测 混响抑制
原文传递
最小方差无失真响应感知倒谱系数在说话人识别中的应用 被引量:4
6
作者 梁春燕 张翔 +2 位作者 杨琳 张建平 颜永红 《声学学报》 EI CSCD 北大核心 2012年第6期673-678,共6页
研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识... 研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识别评测核心测试集上分别对最小方差无失真响应感知倒谱系数和传统的Mel频率倒谱系数进行测试。结果显示,两种不同特征的系统性能相当,采用线性融合方法后,在不同测试集上的等错误率相对下降了7.6%~30.5%,最小检测错误代价相对下降了3.2%~21.2%。实验表明,最小方差无失真响应感知倒谱系数能有效应用于说话人识别中,且与传统的Mel频率倒谱系数存在一定程度的互补性。 展开更多
关键词 MEL频率倒谱系数 最小方差无失真响应 说话人识别 感知 应用 高斯混合模型 标准技术研究院 测试集
下载PDF
鉴别性最大后验概率声学模型自适应 被引量:2
7
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《计算机应用》 CSCD 北大核心 2014年第1期265-269,共5页
为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相... 为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相结合的H-criterion最大后验概率(H-MAP)自适应估计先验分布中心,提出了基于最大互信息最大后验概率先验的最小音素错误最大后验概率(MPE-MMI-MAP)和基于H-criterion最大后验概率先验的最小音素错误最大后验概率(MPE-H-MAP)算法。任务自适应实验结果表明,MPE-MMI-MAP和MPE-H-MAP算法的自适应性能均优于MPE-MAP、MMI-MAP和最大后验概率(MAP)自适应方法,分别比MPE-MAP相对提高3.4%和2.7%。 展开更多
关键词 最大后验概率 鉴别性最大后验概率 最大互信息 最小音素错误 声学模型自适应
下载PDF
鉴别性最大后验概率线性回归说话人自适应研究 被引量:2
8
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第9期946-950,共5页
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法.将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应... 为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法.将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性.大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%. 展开更多
关键词 最大似然线性回归 最大后验概率线性回归 最大互信息 说话人自适应
下载PDF
面向维吾尔语电话交谈式语音识别的词典设计方法研究 被引量:1
9
作者 李鑫 侯炜 +2 位作者 计哲 潘接林 颜永红 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2013年第3期391-396,共6页
为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元。在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素... 为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元。在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素错误率差别选择词语最佳分解结果,从而构建语素-统计子词联合词典的方法。在维吾尔语电话交谈式语音识别任务上比较各个系统的性能。实验结果表明,语素或统计子词的运用能有效缓解词语系统集外词过多的问题。与词典大小为200K的词语系统相比,55K的语素-统计子词联合系统使测试集上的音素错误率从45.4%下降到43.8%。 展开更多
关键词 黏着语 语音识别 集外词 词语分解 分解方法联合
原文传递
音子配列学语种识别系统中特征选择方法的研究 被引量:1
10
作者 梁春燕 杨琳 +2 位作者 汪俊杰 张建平 颜永红 《声学学报》 EI CSCD 北大核心 2013年第2期208-214,共7页
将信息增益和加权log似然比特征选择方法应用于音子配列学语种识别系统中进行特征降维。在美国国家标准技术研究院2009年语种识别评测数据集上进行实验,分别使用信息增益和加权log似然比准则以及传统的互信息,X^2统计量方法对数量巨大... 将信息增益和加权log似然比特征选择方法应用于音子配列学语种识别系统中进行特征降维。在美国国家标准技术研究院2009年语种识别评测数据集上进行实验,分别使用信息增益和加权log似然比准则以及传统的互信息,X^2统计量方法对数量巨大的N-gram进行特征选择,从中选出最具有鉴别性的部分组成特征向量,并用分类器进行分类。结果显示,当根据信息增益和加权log似然比准则选取一定数量的特征时,系统性能与使用全部特征的基线系统相比略好;当选取的特征数量很少时,信息增益和加权log似然比方法的性能要优于传统的互信息和X^2统计量方法。实验表明,在音子配列学语种识别系统中,信息增益和加权log似然比方法均可以有效地去除冗余信息,降低特征向量的维数,并且能使系统性能得到一定的提高。 展开更多
关键词 特征选择 识别系统 语种识别 似然比准则 X^2统计量 标准技术研究院 信息增益 N-GRAM
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部