汉英双语混合声学建模方法研究被引量：4

Research of Chinese-English Bilingual Acoustic Modeling

下载PDF

导出

摘要本文从直接合并汉英双语的 phoneset入手 ,对三种不同的汉英双语混合声学建模方法进行了研究。这三种方法分别是 :(1)直接合并二者的 phoneset进行声学建模 ;(2 )基于IPA映射的统一声学表示 ;(3)对汉英双语的Phone进行自动合并聚类。实验结果表明 ,方法 (1)的声学模型较为鲁棒 ,但是建模单元也最多 ,模型不够紧凑 ;方法 (2 )具有紧凑的模型 ,但是鲁棒性较差 ;方法 (3)以较少的Phone进行双语混合声学建模 ,不仅保持了 (2 )中模型紧凑的特点 ,而且基本达到 (1)的识别率 ;特别是当使用声学似然度准则时 ,英语的识别率甚至超过了方法 (1) In this paper, three different approaches of Chinese-English bilingual acoustic modeling are investigated and compared. The first approach is to simply combine Chinese and English phone inventories together without phone shared across the languages. The second one is to map language-dependent phones to the inventory of the International Phonetic Association (IPA) based on phonetic knowledge to construct the bilingual phone inventory. The third one is to merge the language-dependent phone models by hierarchical phone clustering algorithm to get a compact bilingual inventory. Experimental results show that phone clustering approach outperforms IPA-based phone mapping approach, and it can also achieve comparable performance to the simple combination of language-dependent phone inventories with less model parameters, especially when using acoustic likelihood measurement.

作者于胜民张树武徐波

机构地区中国科学院自动化研究所高技术创新中心

出处《中文信息学报》 CSCD 北大核心 2004年第5期78-84,共7页 Journal of Chinese Information Processing

基金国家 8 6 3计划 (0 0 2AA1170 10 ) 北京市数字奥运资助项目 (H0 30 130 0 5 0 4 30 )

关键词计算机应用中文信息处理语音识别声学建模汉语双语合并聚类似然度 computer application Chinese information processing speech recognition acoustic modeling bilingual hierarchical clustering likelihood

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Byrne. B., P. Beyerlein, J. M. Huerta et al., Towards Language Independent Acoustic Modeling[ A]. IEEE ICASSP [C], 2000, Istanbul, Turkey. 2:1029- 1032. 被引量：2
2Adda-Decker M., Towards Multilingual Interoperability in Automatic Speech Recognition [ J], Speech Communication, 2001,35(1-2):5-20. 被引量：2
3Wells, C.J., Computer-coded phonemic notation of individual languages of the European community [ J]. J. Int.Phonetic Assoc., 1989,19:32- 54. 被引量：1
4Hieronymus, J.L., ASCH phonetic symbols for the world's languages Worldbet [ J]. J. Int. Phonetic Assoc., 1993,23. 被引量：2
5IPA, The International Phonetic Association (revised to 1993) - IPA Chat [J]. J. Int. Phonetic Assoc., 1993,23. 被引量：2
6Schultz T. and A. Waibel, Language- independent and language-adaptive acoustic modeling for speech recognition[J]. Speech Communication, 2001,35(1 - 2) :31 - 51. 被引量：2
7Kohler J., Multilingual phone models for vocabulary-independent speech recognition tasks [J], Speech Communication, 2001,35( 1 - 2) :21 - 30. 被引量：1
8Uebler U., Multilingual speech recognition in seven languages [J], Speech Communication, 2001,35(1 - 2):53-69. 被引量：1
9Bin Ma and Qiang Huo. Benchmark results of triphone-based acoustic modeling on HKU96 and HKU99 putonghua corpora[ A], ISCSLP [ C ], 2000, 359 - 362. 被引量：1
10Brian Mak and Etienne Bamard. Phone clustering using the bhattacharyya distance[ A], ICSLP [C], 1996,2005 -2008. 被引量：1

共引文献1

1陈福山,徐建平,高恩丽,张立明,林森.含硅有机锡催化合成香料乙酸苄酯[J].精细石油化工,2011,28(6):37-39. 被引量：1

同被引文献42

1李健,王作英.HMM转移概率的新的重估算法[J].电子学报,2001,29(z1):1833-1835. 被引量：5
2林贤明,李堂秋,史晓东.基于模板的机器翻译系统中模板库的自动构建技术[J].计算机应用,2004,24(9):127-128. 被引量：4
3秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
4梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
5刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
6张春祥,赵铁军,杨沐昀,李生,时晓升.机器翻译系统跨领域移植方法的研究[J].计算机工程与应用,2005,41(3):10-11. 被引量：1
7李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
8王建波,杜春玲,王开铸.基于篇章理解的自动文摘研究[J].中文信息学报,1995,9(3):33-42. 被引量：12
9王智勇,王正欧.一种统计降维和Kohonen网络相结合的文本聚类方法[J].计算机应用,2005,25(10):2328-2330. 被引量：3
10傅间莲,陈群秀.自动文摘系统中的主题划分问题研究[J].中文信息学报,2005,19(6):28-35. 被引量：13

引证文献4

1王士进,孟猛,梁家恩,徐波.基于Multilingual的音素识别及其在语种识别中的应用[J].清华大学学报（自然科学版）,2008,48(S1):678-682. 被引量：2
2李生,赵铁军.Chinese Information Processing and Its Prospects[J].Journal of Computer Science & Technology,2006,21(5):838-846. 被引量：1
3徐明,黄中伟,杨磊.普通话发音训练多级音素模板综合评价方法[J].计算机工程与应用,2007,43(28):237-239.
4孟猛,梁家恩,徐波.基于音素聚类的多语言声学建模方法[J].模式识别与人工智能,2009,22(1):86-90. 被引量：1

二级引证文献4

1王士进,李宏言,柯登峰,李鹏,高鹏,徐波.面向第二语言学习的口语大规模智能评估技术研究[J].中文信息学报,2011,25(6):142-148. 被引量：7
2连秀珍.基于支持向量机的西北少数民族语语种识别[J].自动化与仪器仪表,2013(6):122-123. 被引量：1
3宗中.中文信息检索中词典机制分词算法的研究[J].计算机技术与发展,2014,24(4):118-121. 被引量：6
4陈峰.两微一端视听节目智慧监管系统设计与实现[J].中国有线电视,2021(1):52-55. 被引量：1

1余立新,陈光喜.基于PCA与合并聚类的RBFNN人脸识别[J].桂林电子科技大学学报,2009,29(2):88-91. 被引量：3
2张继昊,张爱新,陆松年,高奎,金波.基于自组织映射网络的图像分割算法[J].信息安全与通信保密,2010,7(4):50-52. 被引量：1
3韩伟,张雄伟,白崧廷,张瑞昕,马鸣.深度学习理论及其应用专题讲座(四) 第7讲深度学习在语音识别中的应用[J].军事通信技术,2016,37(3):91-97. 被引量：2
4Liu Gang Chen Wei Guo Jun.Novel Active Learning Method for Speech Recognition[J].China Communications,2010,7(5):29-39. 被引量：1
5张玉芳,罗俊玮,熊忠阳.基于模糊C均值算法的类合并聚类算法研究[J].计算机工程与应用,2009,45(24):122-124. 被引量：7
6冯少荣,肖文俊.一种提高DBSCAN聚类算法质量的新方法[J].西安电子科技大学学报,2008,35(3):523-529. 被引量：13
7赵伟丽,孙艳蕊,张志国,李金娜.基于信息熵的蚁群聚类算法的改进[J].沈阳化工学院学报,2005,19(4):296-300. 被引量：9
8施韶亭,曹方.文本挖掘技术在科技管理领域热点主题抽取方向的应用研究[J].计算机应用与软件,2012,29(7):109-111. 被引量：5
9黄苏雨.四川口音普通话的声学建模[J].科技广场,2008(1):9-12.
10S.C.S. Gianni AMADASI 李彦海(译).汽车声学建模：不一样的汽车噪声解决方法[J].汽车制造业,2009(05X):58-60.

中文信息学报

2004年第5期

浏览历史

内容加载中请稍等...

汉英双语混合声学建模方法研究被引量：4

参考文献14

共引文献1

同被引文献42

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

汉英双语混合声学建模方法研究 被引量：4

参考文献14

共引文献1

同被引文献42

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

汉英双语混合声学建模方法研究被引量：4