基于GMM符号化和置信判别的汉语方言自动辨识研究被引量：3

A Study about Chinese Dialect Identification Based on GMM Tokenization & Confidence Measure

下载PDF

导出

摘要近年来汉语方言自动辨识研究有了初步进展,但由于缺乏带有语音标注的方言音库,性能优越的并行音素识别-语言模型(PPRLM)方法尚未得到研究和运用。本文借助高斯混合模型(GMM)符号化器把PPRLM的思想方法引入到汉语方言辨识中,并通过融合置信判别使系统能够用于开集辨识。仿真实验表明,本文方法具有很高的稳定性和可靠性,综合性能较为优越。 Lately the study of Chinese dialect identification （CDI） shows some progress. Yet the excellent method-parallel phone recognizers followed by language modeling（PPRLM）-has not be study in CDI field due to the lack of dialect corpus with annotation. In this paper, we study CDI using a method like PPRLM by virtue of GMM tokenizer, further we study the combination of a confidence measure to use the method in open-set task. Simulation results show that this CDI method is an excellent method with high stability and reliability.

作者沈兆勇顾明亮杨亦鸣

机构地区徐州师范大学语言研究所语言科学与神经认识工程江苏省重点实验室

出处《计算机科学》 CSCD 北大核心 2006年第11期210-211,236,共3页 Computer Science

基金国家社会科学基金重点项目(01AYY004) 江苏省社会科学基金项目(06J5BYY006) 江苏省"十五"社科基金项目(K3-013) 徐州师范大学人文社会科学基金项目(06XWB28)

关键词汉语方言自动辨识 PPRLM方法 GMM符号化置信判别 Chinese dialect identification, PPRLM method,GMM tokenization, Confidence measure

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Tsai Wuei-He, Chang Wen-Whe. Discrimination Training of Guassian Mixture Bigram Models with Application to Chinese Dialect Identification[J] . Speech Communication 2002,36 : 317-326 被引量：1
2Lim Boon Pang,Li Haizhou,Ma Bin. Using Local & Global Phonotactic Features in Chinese Dialect Identification [C]. In: Proc.of ICASSP'05,2005,1 : 577 -580 被引量：1
3Muthusamy Y K,Barnard E,Cole R A. Reviewing automatic language identification [C]. IEEE Signal Processing Mag, 1994, 11(4):33-3 被引量：1
4Zissman M A. Comparison of Four Approaches to Automatic Language Identification of Telephone Speech [C]. IEEE Trans.Speech and Audio Pro, 1996,4(1):31-34 被引量：1
5Torres-Carrasquillo P A, Reynolds D A, Deller J R Jr. Language identification using Gaussian mixture model tokenization [C]. In:Proc. of ICASSP 2002,12002 : 757- 760 被引量：1
6Laird N M, Lange N, Stram D. Maximum Likelihood Computations with Repeated Measures: Applications of the EM algorithm[J]. Journal of the American Statistical Association, 1987,82:97-105 被引量：1
7Jelinek F. Statistical Methords for Speech Recognition [M]. Cambridge, Massachusetts,MIT Press,1999 被引量：1
8Biederman D C, Ososanya E. Capacity of several neural networks with respect to digital adder and multiplier System Theory [C]. In: Proc. of the Twenty-Seventh Southeastern Symposium on Neural Network, 1995. 305-308 被引量：1
9赵力．语音信号处理[M]．北京：机械工业出版社，2001 被引量：1
10Gleason T P, Zissman M A. Composite background models and score standardization for language identification system [C]. ICASSP, 2001 (1) : 529 -532 被引量：1

共引文献2

1侯精一.汉语规范化50年——谨以此文纪念《语文研究》出刊100期[J].语文研究,2006(3):1-5. 被引量：7
2顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J].中文信息学报,2006,20(5):77-82. 被引量：19

同被引文献37

1谢波,陈岭,陈根才,陈纯.普通话语音情感识别的特征选择技术[J].浙江大学学报（工学版）,2007,41(11):1816-1822. 被引量：13
2贾珈,蔡莲红,李明,张帅.汉语普通话与沈阳方言转换的研究[J].清华大学学报（自然科学版）,2009(S1):1309-1315. 被引量：7
3潘复平,赵庆卫,颜永红.一种用于方言口音语音识别的字典自适应技术[J].计算机工程与应用,2005,41(23):4-6. 被引量：5
4陈立万.基于语音识别系统中DTW算法改进技术研究[J].微计算机信息,2006,22(02Z):267-269. 被引量：28
5顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J].中文信息学报,2006,20(5):77-82. 被引量：19
6顾明亮,马勇.基于高斯混合模型的汉语方言辨识系统[J].计算机工程与应用,2007,43(3):204-206. 被引量：9
7许慧燕,钱盛友.湖南方言声频特性的计算机分析[J].电声技术,2007,31(4):56-58. 被引量：2
8王洪海,刘刚,郭军.自动语言辨识的研究方法及发展概述[J].电脑与信息技术,2007,15(2):37-39. 被引量：1
9Martin A F, Przybocki M A.NIST 2003 language recognition evaluation[C]//Proceedings of Eurospeech, 2003 : 1341-1344. 被引量：1
10Zissman M A.Comparison of four approaches to automatic language identification of telephone speech[J].IEEE Transactions on Speech and Audio Processing,1996,4:31-44. 被引量：1

引证文献3

1曾秀花,杨鉴,徐永华.语种辨识的多特征信息应用[J].计算机工程与应用,2010,46(25):146-148. 被引量：2
2胡扬,年晓红.一种汉语方言编码与转换机制的研究[J].计算机应用研究,2013,30(1):206-210.
3廖长斌,叶阿勇,陶涛.一种多模轻量级手机室内定位系统[J].福建电脑,2018,34(3):40-42.

二级引证文献2

1寇芳玲,杨鉴,程杨,奎丽萍.CV音节特征提取在自动语种识别中的应用[J].信息与控制,2013,42(4):464-469. 被引量：1
2田昕,唐皓,余江,蔡光卉,肖文珂.GMM-UBM语种识别技术在无线电监管中的应用[J].电子测量技术,2015,38(8):82-84. 被引量：1

1顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J].中文信息学报,2006,20(5):77-82. 被引量：19
2顾明亮.一种新的汉语方言辨识特征[J].广西科学,2007,14(4):423-425.
3顾明亮,马勇.基于高斯混合模型的汉语方言辨识系统[J].计算机工程与应用,2007,43(3):204-206. 被引量：9
4肉克艳木.买买提,热依曼.吐尔逊,吾守尔.斯拉木.维吾尔语语音标注复查软件的研究与实现[J].新疆大学学报（自然科学版）,2013,30(1):87-90. 被引量：2
5吴青娥,王拓,黄永宣,李济生.粗糙集的拓扑基础[J].模糊系统与数学,2008,22(5):145-150. 被引量：2
6富钰.“声音”的数字化存储与管理系统[J].网络与信息,2007,21(4):78-78.
7方锦清.大数据浪潮冲击下网络科学与工程面临的挑战与机遇[J].自然杂志,2013,35(5):345-354. 被引量：17
8贾晶晶,顾明亮,朱恂,张世形.基于流形学习与特征融合的汉语方言辨识[J].计算机工程与应用,2015,51(7):233-237. 被引量：5
9张凯,苏剑波.基于相似度分布的开集人脸识别方法[J].模式识别与人工智能,2011,24(1):147-152. 被引量：2
10张德全.伪离散空间的拓扑性质[J].桂林航天工业学院学报,2013,18(1):73-75.

计算机科学

2006年第11期

浏览历史

内容加载中请稍等...

基于GMM符号化和置信判别的汉语方言自动辨识研究被引量：3

参考文献13

共引文献2

同被引文献37

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于GMM符号化和置信判别的汉语方言自动辨识研究 被引量：3

参考文献13

共引文献2

同被引文献37

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于GMM符号化和置信判别的汉语方言自动辨识研究被引量：3