基于三音子模型的语料自动选择算法被引量：12

Automatic Corpus Selecting Algorithm Based on Triphone Models

下载PDF

导出

摘要在语音识别中 ,如何经济地挑选语音训练语料 ,使其覆盖尽可能多的语音现象是一个非常重要的问题 .传统的语音训练语料采用手工挑选后再进行检验和补充的方法 ,此方法难以保证所选语料语音现象的覆盖率 .该文提出了一种自动地从大规模语料库中挑选语料的搜索算法 ,此算法不但能使所选语料覆盖几乎所有语音现象 ,而且能保证训练语料中三音子和类三音子有足够的样本个数 ,使训练数据不过于稀疏 ,为训练正确而可靠的语音模型打下了坚实的基础 . In speech recognition, the selection of training corpus for robust acoustic modeling which can cover almost all phone phenomena is very important. Traditionally, corpus is selected manually first, and then tested and supplemented, which can't provide sufficient coverage of samples for various statistical modeling methods. An algorithm for automatically selecting the training samples from large scale text corpus is developed in this paper. This algorithm can not only cover almost all phone phenomena but also ensure to include ideal samples of triphones or class triphones and ensure enough data for training, which makes it possible to train acoustic model reliably.

作者吴华徐波黄泰翼

机构地区中国科学院自动化研究所模式识别国家重点实验室

出处《软件学报》 EI CSCD 北大核心 2000年第2期271-276,共6页 Journal of Software

基金国家自然科学基金! (No.6 9835 0 30 )资助

关键词语音识别语料选择算法三音子模型 Speech recognition, model training, triphone, class triphone.

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1Gao Sheng，Proceedings of the ’98 International Symposium on Chinese Spoken Language Proce，1998年，44页被引量：1
2曲菲，第 4届全国人机语音通讯学术会议论文集，1996年，337页被引量：1
3孙甲松，’95智能计算机接口与应用进展，1995年，116页被引量：1
4林焘，语音学教程，1991年被引量：1

同被引文献77

1宁振江,杜利民.面向语音识别声学模型的汉语语料抽选方法[J].声学技术,2003,22(z2):356-358. 被引量：1
2刘鹏,王作英.多模式汉语连续语音识别中视觉特征的提取和应用[J].中文信息学报,2004,18(4):79-84. 被引量：6
3祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
4曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
5曹剑芬.普通话语音的环境音变与双音子和三音子结构[J].语言文字应用,1996(2):58-63. 被引量：11
6刘连元.现代汉语语料库研制[J].语言文字应用,1996(3):3-9. 被引量：28
7洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
8蔡琴,吾守尔.斯拉木.基于HTK的维吾尔语连续数字语音识别[J].现代计算机,2007,13(4):14-16. 被引量：7
9Huang F J, Graf H P, Cosatto E. Triphone-basexi Unit Selection for Concatenative Visual Speech Synthesis[C]//Proc. of the Int'l Conf. on Acoustics Speech and Signal Processing. Orlando, FI, USA: [s. n.], 2002. 被引量：1
10Cosatto E, Potamianos G, Graf H E Audio-visual Unit Selection for the Synthesis of Photo-realistic Talking-heads[C]//Proc. of IEEE Int'l Conf. on Multimedia and Expo( II ). New York, USA: [s. n.], 2000: 619-622. 被引量：1

引证文献12

1李荪,曹峰,刘姿杉.面向算法模型的语音数据集质量评估方法研究[J].计算机科学,2022,49(S02):519-524. 被引量：4
2宁振江,杜利民.面向语音识别声学模型的汉语语料抽选方法[J].声学技术,2003,22(z2):356-358. 被引量：1
3宁振江,杜利民.一种改进后的递增式语音语料抽选算法[J].中国科学院研究生院学报,2005,22(2):140-146.
4刘刚,张洪刚,郭军.不同训练样本对识别系统的影响[J].计算机学报,2005,28(11):1923-1928. 被引量：15
5杨阳蕊,李永宏,于洪志.藏语安多方言的音联结构及统计分析[J].西北民族大学学报（自然科学版）,2008,29(2):11-16. 被引量：2
6赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
7赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：6
8赵晖,唐朝京.基于汉语视频三音素的可视语音合成[J].电子与信息学报,2009,31(12):3010-3014.
9邹灿,李柏岩.基于BIC的语音识别模型压缩算法[J].计算机与现代化,2014(6):71-73.
10徐宝龙,努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.关于维吾尔语口语语料的三音子选取方法研究[J].中文信息学报,2015,29(2):118-124. 被引量：2

二级引证文献32

1赵丹群,王心玥,郭磬馨.开放科学时代学术评价研究的新机遇与新挑战——从系列开放获取宣言/倡议或行动计划谈起[J].情报学进展,2024(1):247-277.
2邓红平,宋婉娟.基于反例样本的原始凭证的手写数字识别[J].武汉理工大学学报,2008,30(3):154-156. 被引量：2
3辛宪会,叶秋果,滕惠忠,郭思海,李军,张靓,韩晓宏.小样本机器学习算法的特性分析与应用[J].海洋测绘,2007,27(3):16-19. 被引量：2
4崔江,王友仁.一种云样本的控制产生及在电路故障诊断中的应用[J].控制理论与应用,2008,25(3):556-559. 被引量：3
5吴丽芳,徐圆,朱群雄.基于组件的石化过程智能建模与优化系统的设计与开发[J].计算机与应用化学,2009,26(8):979-984. 被引量：1
6贾俊川,李大勇,李卫国,易永利.基于多层前向神经网络的基波检测方法[J].电力系统保护与控制,2009,37(19):101-105. 被引量：1
7高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：15
8赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：6
9陈先来,杨路明.基于均矢量相似性的机器学习样本集划分[J].中南大学学报（自然科学版）,2009,40(6):1636-1641. 被引量：7
10严志宇,赵欣如,王璐,谢簪,李峤,谭军华.普通话测试语音信息库的设计与实现[J].计算机时代,2010(3):38-41. 被引量：1

1董明,刘润生.基于先验知识的三音子模型聚类结构自适应策略[J].电子与信息学报,2007,29(9):2050-2053.
2齐耀辉,潘复平,葛凤培,颜永红.汉语连续语音识别系统中三音子模型的优化[J].计算机应用研究,2013,30(10):2920-2922. 被引量：4
3魏瑞莹,梁维谦.基于三音子模型连续语音声调识别方法[J].电声技术,2011,35(8):34-37. 被引量：1
4徐向华,朱杰,郭强.一种基于模糊聚类分析的异音混合共享模型[J].声学学报,2005,30(5):457-461.
5高升,徐波,黄泰翼.基于决策树的汉语三音子模型[J].声学学报,2000,25(6):504-509. 被引量：20
6程雪林,吴开政,李宗葛.利用上下文和基频提高汉语连续数字串识别性能[J].计算机工程与应用,2003,39(23):84-86.
7徐向华,朱杰,郭强.汉语连续语音识别中的分级聚类算法的研究和应用[J].信号处理,2004,20(5):497-500. 被引量：2

软件学报

2000年第2期

浏览历史

内容加载中请稍等...

基于三音子模型的语料自动选择算法被引量：12

参考文献4

同被引文献77

引证文献12

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于三音子模型的语料自动选择算法 被引量：12

参考文献4

同被引文献77

引证文献12

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于三音子模型的语料自动选择算法被引量：12