期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
汉语连续语音识别系统中三音子模型的优化 被引量:4
1
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《计算机应用研究》 CSCD 北大核心 2013年第10期2920-2922,共3页
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三... 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。 展开更多
关键词 决策树聚类 三音子模型 声韵母 最大后验概率
下载PDF
基于网格的语音关键词检索算法改进 被引量:2
2
作者 肖熙 王竞千 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期508-513,共6页
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递... 针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递算法做出了针对汉语特点的改进。实验表明这2方面的研究不仅提高了以音节作为输出的语音识别引擎的单候选识别效果,也大幅提高了多候选的识别性能。最后搭建了一个基于多候选网格的语音关键词检索系统,在该系统中验证了上述改进的效果。 展开更多
关键词 语音关键词检索 多候选网格 Gauss混合模型 CUDA 三音子模型
原文传递
汉语三音子模型观测概率比较 被引量:1
3
作者 刘玉宇 吴及 王作英 《中文信息学报》 CSCD 北大核心 2003年第3期47-52,共6页
HMM的观测概率能否很好描述模型的实际分布对识别性能有很大的影响。为了比较汉语三音子模型在不同观测概率情况下的差异 ,本文构造了三种不同模型 ,及其训练和识别算法。通过从多方面对这三个模型进行比较 ,得出结论 ,为今后汉语三音... HMM的观测概率能否很好描述模型的实际分布对识别性能有很大的影响。为了比较汉语三音子模型在不同观测概率情况下的差异 ,本文构造了三种不同模型 ,及其训练和识别算法。通过从多方面对这三个模型进行比较 ,得出结论 ,为今后汉语三音子模型观测概率的选择提供依据。 展开更多
关键词 人工智能 机器翻译 语音识别 三音子模型 观测概率
下载PDF
基于先验知识的三音子模型聚类结构自适应策略
4
作者 董明 刘润生 《电子与信息学报》 EI CSCD 北大核心 2007年第9期2050-2053,共4页
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中... 该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中心,依据基本声学模型对自适应语音库的分割,按照最大似然准则迭代地重估新的聚类中心和模型聚类结构。实验表明:基于先验知识的三音子模型聚类结构自适应策略可以在不足两小时的自适应语音库上实现三音子模型聚类结构重估,在针对汉语母语说话人的英语声学模型实验中,该文的模型聚类结构自适应策略可以将系统识别率从74.59%提高到83.63%。 展开更多
关键词 语音识别 三音子模型 模型聚类
下载PDF
基于决策树的藏语拉萨话三音子模型 被引量:3
5
作者 李冠宇 于洪志 +1 位作者 李永宏 马宁 《计算机工程与科学》 CSCD 北大核心 2013年第9期146-150,共5页
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个... 对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。 展开更多
关键词 藏语 拉萨话 大词表连续语音识别 隐马尔可夫模型 三音子模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部