期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉语连续语音识别系统中三音子模型的优化
被引量:
4
1
作者
齐耀辉
潘复平
+1 位作者
葛凤培
颜永红
《计算机应用研究》
CSCD
北大核心
2013年第10期2920-2922,共3页
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三...
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
展开更多
关键词
决策树聚类
三音子模型
声韵母
最大后验概率
下载PDF
职称材料
基于网格的语音关键词检索算法改进
被引量:
2
2
作者
肖熙
王竞千
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第5期508-513,共6页
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递...
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递算法做出了针对汉语特点的改进。实验表明这2方面的研究不仅提高了以音节作为输出的语音识别引擎的单候选识别效果,也大幅提高了多候选的识别性能。最后搭建了一个基于多候选网格的语音关键词检索系统,在该系统中验证了上述改进的效果。
展开更多
关键词
语音关键词检索
多候选网格
Gauss混合模型
CUDA
三音子模型
原文传递
汉语三音子模型观测概率比较
被引量:
1
3
作者
刘玉宇
吴及
王作英
《中文信息学报》
CSCD
北大核心
2003年第3期47-52,共6页
HMM的观测概率能否很好描述模型的实际分布对识别性能有很大的影响。为了比较汉语三音子模型在不同观测概率情况下的差异 ,本文构造了三种不同模型 ,及其训练和识别算法。通过从多方面对这三个模型进行比较 ,得出结论 ,为今后汉语三音...
HMM的观测概率能否很好描述模型的实际分布对识别性能有很大的影响。为了比较汉语三音子模型在不同观测概率情况下的差异 ,本文构造了三种不同模型 ,及其训练和识别算法。通过从多方面对这三个模型进行比较 ,得出结论 ,为今后汉语三音子模型观测概率的选择提供依据。
展开更多
关键词
人工智能
机器翻译
语音识别
三音子模型
观测概率
下载PDF
职称材料
基于先验知识的三音子模型聚类结构自适应策略
4
作者
董明
刘润生
《电子与信息学报》
EI
CSCD
北大核心
2007年第9期2050-2053,共4页
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中...
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中心,依据基本声学模型对自适应语音库的分割,按照最大似然准则迭代地重估新的聚类中心和模型聚类结构。实验表明:基于先验知识的三音子模型聚类结构自适应策略可以在不足两小时的自适应语音库上实现三音子模型聚类结构重估,在针对汉语母语说话人的英语声学模型实验中,该文的模型聚类结构自适应策略可以将系统识别率从74.59%提高到83.63%。
展开更多
关键词
语音识别
三音子模型
模型聚类
下载PDF
职称材料
基于决策树的藏语拉萨话三音子模型
被引量:
3
5
作者
李冠宇
于洪志
+1 位作者
李永宏
马宁
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个...
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
展开更多
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
下载PDF
职称材料
题名
汉语连续语音识别系统中三音子模型的优化
被引量:
4
1
作者
齐耀辉
潘复平
葛凤培
颜永红
机构
北京理工大学信息与电子学院
中国科学院声学研究所中国科学院语言声学与内容理解重点实验室
河北师范大学物理科学与信息工程学院
中国科学院声学研究所 中国科学院语言声学与内容理解重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2013年第10期2920-2922,共3页
基金
国家自然科学基金资助项目(10925419,90920302,61072124,1107427511161140319,91120001,61271426)
中国科学院战略性先导科技专项资助项目(XDA06030100,XDA06030500)
+1 种基金
国家“863”计划资助项目(2012AA012503)
中国科学院重点部署项目(KGZD-EW-103-2)
文摘
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
关键词
决策树聚类
三音子模型
声韵母
最大后验概率
Keywords
decision
tree-based
clustering
triphone
model
initials
and
finals
maximum
a
posteriori(MAP)
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于网格的语音关键词检索算法改进
被引量:
2
2
作者
肖熙
王竞千
机构
清华大学电子工程系
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第5期508-513,共6页
文摘
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递算法做出了针对汉语特点的改进。实验表明这2方面的研究不仅提高了以音节作为输出的语音识别引擎的单候选识别效果,也大幅提高了多候选的识别性能。最后搭建了一个基于多候选网格的语音关键词检索系统,在该系统中验证了上述改进的效果。
关键词
语音关键词检索
多候选网格
Gauss混合模型
CUDA
三音子模型
Keywords
speech
keyword
spotting
multi-candidate
lattice
Gaussian
mixture
model
compute
unified
device
architecture(CUDA)
triphone
model
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
原文传递
题名
汉语三音子模型观测概率比较
被引量:
1
3
作者
刘玉宇
吴及
王作英
机构
清华大学电子工程系
出处
《中文信息学报》
CSCD
北大核心
2003年第3期47-52,共6页
基金
国家 8 63高技术项目 ( 863- 30 6-ZD0 3- 0 2 - 1)
985重大项目 ( 985校 - 2 2 -攻关 - 0 6)
文摘
HMM的观测概率能否很好描述模型的实际分布对识别性能有很大的影响。为了比较汉语三音子模型在不同观测概率情况下的差异 ,本文构造了三种不同模型 ,及其训练和识别算法。通过从多方面对这三个模型进行比较 ,得出结论 ,为今后汉语三音子模型观测概率的选择提供依据。
关键词
人工智能
机器翻译
语音识别
三音子模型
观测概率
Keywords
artificial
intelligence
machine
translation
speech
recognition
triphone
model
observation
density
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于先验知识的三音子模型聚类结构自适应策略
4
作者
董明
刘润生
机构
清华大学电子工程系
出处
《电子与信息学报》
EI
CSCD
北大核心
2007年第9期2050-2053,共4页
文摘
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中心,依据基本声学模型对自适应语音库的分割,按照最大似然准则迭代地重估新的聚类中心和模型聚类结构。实验表明:基于先验知识的三音子模型聚类结构自适应策略可以在不足两小时的自适应语音库上实现三音子模型聚类结构重估,在针对汉语母语说话人的英语声学模型实验中,该文的模型聚类结构自适应策略可以将系统识别率从74.59%提高到83.63%。
关键词
语音识别
三音子模型
模型聚类
Keywords
Speech
recognition
triphone
model
model
tying
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于决策树的藏语拉萨话三音子模型
被引量:
3
5
作者
李冠宇
于洪志
李永宏
马宁
机构
西北民族大学中国民族语言文字教育部重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
基金
国家自然科学基金资助项目(61262054)
西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100)
文摘
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
Keywords
Tibetan
Lhasa
dialect
~
LVCSR
~
HMM
~
triphone
model
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉语连续语音识别系统中三音子模型的优化
齐耀辉
潘复平
葛凤培
颜永红
《计算机应用研究》
CSCD
北大核心
2013
4
下载PDF
职称材料
2
基于网格的语音关键词检索算法改进
肖熙
王竞千
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015
2
原文传递
3
汉语三音子模型观测概率比较
刘玉宇
吴及
王作英
《中文信息学报》
CSCD
北大核心
2003
1
下载PDF
职称材料
4
基于先验知识的三音子模型聚类结构自适应策略
董明
刘润生
《电子与信息学报》
EI
CSCD
北大核心
2007
0
下载PDF
职称材料
5
基于决策树的藏语拉萨话三音子模型
李冠宇
于洪志
李永宏
马宁
《计算机工程与科学》
CSCD
北大核心
2013
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部