-
题名连续语音识别中声学建模的组合聚类算法研究
被引量:5
- 1
-
-
作者
韩兆兵
贾磊
张树武
徐波
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2003年第4期33-38,共6页
-
基金
国家自然科学基金资助项目 (6 9835 0 0 3)
973资助项目 (G19980 30 0 5 0 4 )
-
文摘
基于三音子连续语音识别的一个关键问题是在有限训练数据的条件下对大量声学模型参数的鲁棒性估计。为了解决这个问题 ,有两个主要的上下文相关的聚类算法被提出 ,它们是合并 (AgglomerativeClustering)聚类 (AGG)和决策树 (Tree based)聚类 (TB)。本文分析了这两种算法的优缺点 ,并分别对其进行了改进 ,然后提出了最大似然框架下组合聚类算法。大词汇量连续语音识别 (LVCSR)的实验结果表明 ,和单一的决策树聚类算法比较 ,提出的组合聚类算法对识别率有显著的提高。
-
关键词
连续语音识别
声学建模
组合聚类算法
合并聚类
决策树聚类
鲁棒性估计
-
Keywords
computer application
Chinese information processing
speech recognition
agglomerative clustering
decision tree-based clustering
acoustic modeling
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名汉语连续语音识别系统中三音子模型的优化
被引量:4
- 2
-
-
作者
齐耀辉
潘复平
葛凤培
颜永红
-
机构
北京理工大学信息与电子学院
中国科学院声学研究所中国科学院语言声学与内容理解重点实验室
河北师范大学物理科学与信息工程学院
中国科学院声学研究所 中国科学院语言声学与内容理解重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第10期2920-2922,共3页
-
基金
国家自然科学基金资助项目(10925419,90920302,61072124,1107427511161140319,91120001,61271426)
中国科学院战略性先导科技专项资助项目(XDA06030100,XDA06030500)
+1 种基金
国家“863”计划资助项目(2012AA012503)
中国科学院重点部署项目(KGZD-EW-103-2)
-
文摘
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
-
关键词
决策树聚类
三音子模型
声韵母
最大后验概率
-
Keywords
decision tree-based clustering
triphone model
initials and finals
maximum a posteriori(MAP)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于聚类的决策树在玉米种质筛选中的应用
- 3
-
-
作者
王斌
-
机构
河北大学数学与计算机学院
河北农业大学理学院
-
出处
《安徽农业科学》
CAS
北大核心
2011年第33期20368-20370,共3页
-
文摘
[目的]建立一种改进的基于聚类的模糊决策树,并研究其在玉米种质筛选中的应用。[方法]采用一种新型的基于聚类的决策树算法,该算法针对传统的决策树算法不能处理无类别样本的这一不足,进行了改进。同时,将改进算法应用在玉米品种的筛选问题中,通过对叶面积、株高、干重、钾利用率等指标的衡量,筛选出耐低钾性较强的玉米种子。[结果]该算法在玉米种质的筛选上,适用性强且性能较优。[结论]在今后工作中还需进一步验证比较改进的基于聚类的模糊决策树与传统的模糊聚类决策树的性能,并将其应用在更多的实际问题中。
-
关键词
FCM
基于聚类的决策树
筛选指标
耐低钾性
-
Keywords
FCM
decision tree based upon clustering
screening indices
tolerance of hypokalemic
-
分类号
S513
[农业科学—作物学]
-