基于分类及最佳匹配读音的维吾尔多音词消歧被引量：1

Uyghur Homograph Disambiguation Based on Classification and Optimal Mapping Pronunciation

下载PDF

导出

摘要研究维吾尔语中的多音词现象,根据多音词的不同特点进行分类。利用词性和读音的映射关系消歧第1类多音词。根据词缀连接词干后是否发生元音弱化的特点消歧第2类多音词。提取上下文语境信息,使用最佳匹配读音的方法消歧第3类多音词。采用似然比方法进行关键词选择,并对不同窗口宽度的关键词选取方法进行对比实验。结果表明,该方法可以得到错误率为20.9%的多音词消歧效果。 This paper deeply investigates the homograph in Uyghur language and classifies them according to the different features of homograph,disambiguates the first type of homograph according to the mapping relation between the part of speech and pronunciation,disambiguates the second type of homograph according to vowel weakening when suffix attaches to a stem,and optimal pronunciation mapping method is used to disambiguate the third type of homograph by extracting the contextual features of homograph.Log-likelihood ratio is used to select and keyword selection experiment of different window size is also conducted.Experimental result shows that the homograph disambiguation performance of can be got to 20.9% error rate through the research idea of this paper.

作者姑丽加玛丽.麦麦提艾力艾斯卡尔.肉孜古丽娜尔.艾力艾斯卡尔.艾木都拉

机构地区新疆大学信息科学与工程学院新疆大学数学与系统科学学院

出处《计算机工程》 CAS CSCD 2012年第18期22-25,共4页 Computer Engineering

基金国家自然科学基金资助项目(61065005,61062008) 教育部新世纪优秀人才支持计划基金资助项目(NCET-10-0969)

关键词维吾尔语多音词消歧分类元音弱化最佳匹配读音关键词选取 Uyghur language； homograph disambiguation； classification； vowel weakening； optimal mapping pronunciation； keyword selection

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Zhang Hong, Yu Jiangsheng, Zhan Weidong. Disambiguation of Chinese Polyphonic Characters[C]//Proc. of the 1st International Workshop on Multimedia Annotation. Tokyo, Japan: [s. n.], 2001. 被引量：1
2Yarowsky D. Homograph Disambiguation in Speech Synthesis[C]// Proc. of Progress in Speech Synthesis. [S. l.]: Springer-Verlag, 1997: 159-175. 被引量：1
3Wang Wern-Jun, Hwang Shaw-Hwa, Chen Sin-Horng. The Broad Study of Homograph Disambiguity for Mandarin Speech Synthesis[C]//Proc. of the 4th International Conference on Spoken Language. [S. l.]: IEEE Press, 1996: 1389-1392. 被引量：1
4Zheng Min, Shi Qin, et al. Grapheme-to-Phoneme Conversion Based on TBL Algorithm in Mandarin TTS System[C]//Proc. of the 9th European Conference on Speech Communication and Technology. Lisbon, Portugal: [s. n.], 2005: 1897-1900. 被引量：1
5Liu Fangzhou, Shi Qin, Tao Jianhua. Tree-guided Transformation- based Homograph Disambiguation in Mandarin TTS System[C]// Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing. [S. l.]: IEEE Press, 2008: 4657-4660. 被引量：1
6阿不都沙拉木?阿巴斯. 维吾尔语同形词词典[M]. 北京: 民族出版社, 1996. 被引量：1
7Ablimit M, Eli M, Kawahara T. Partly Supervised Uyghur Morpheme Segmentation[C]//Proc. of Oriental COCOSDA Workshop. Marrakech, Morocco: [s. n.], 2008: 71-76. 被引量：1
8米热古丽.艾力,米吉提.阿不力米提,艾斯卡尔.艾木都拉.基于词法分析的维吾尔语元音弱化算法研究[J].中文信息学报,2008,22(4):43-47. 被引量：17

二级参考文献14

1古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
2CHRISTOPHER D,MANNING,HINRICH SCHUTZE.统计自然语言处理基础[M].苑春法译.北京:电子工业出版社,2005:143-163. 被引量：5
3James Allen.自然语言处理[M].北京:电子工业出版社,2005. 被引量：2
4Daniel Jurafsky,James H.Martin.自然语言处理综论[M].北京:电子工业出版社,2005. 被引量：4
5米吉提·阿不力米提,等:维吾尔语中的语音和谐规律及算法的实现[C]//中国科协,2005年会.2005. 被引量：1
6米尔苏里坦·吾斯曼.现代维吾尔语文拼写与发音词典[M].乌鲁木齐:新疆人民出版社.1997.10. 被引量：1
7米吉提·阿不力米提,古丽拉·阿东别克.新疆少数民族多文种文字处理技术[C]//中日自然语言处理国际研讨会.北京大学,2001.11. 被引量：1
8海米体·铁木尔.现代维吾尔语语法(词汇学)[M].北京:民族出版社,1987. 被引量：2
9米吉提·阿不力米提,艾斯卡尔·艾木都拉吐尔地·托合提.维语词法分析器研究开发[C]//全国第11届少数民族语言文字信息处理学术研讨会.西双版纳,2007.2. 被引量：1
10Gulila Adongbieke. Research of Proofreading for the Uighur Character [C]//The 2001 IEEE International Conference on System, Man and Cybernetics (SMC2001). Tucson, Arizona, U. S. A: 2001. 874- 876. 被引量：1

共引文献16

1早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,艾斯卡尔.艾木都拉.维吾尔语名词构形词缀有限状态自动机的构造[J].中文信息学报,2009,23(6):116-121. 被引量：20
2汪漪,李皓,李晓,周俊林,王磊.多语种构件模型的研究与实现[J].计算机工程与应用,2010,46(14):143-147.
3薛化建,董兴华,王磊,吐尔洪.吾司曼,蒋同海.基于词缀库的非监督维吾尔语词切分方法[J].计算机工程与设计,2011,32(9):3191-3194. 被引量：7
4吐尔根·依布拉音,袁保社.新疆少数民族语言文字信息处理研究与应用[J].中文信息学报,2011,25(6):149-156. 被引量：27
5麦热哈巴.艾力,姜文斌,吐尔根.依布拉音.维吾尔语词法中音变现象的自动还原模型[J].中文信息学报,2012,26(1):91-96. 被引量：8
6麦热哈巴·艾力,姜文斌,王志洋,吐尔根·依布拉音,刘群.维吾尔语词法分析的有向图模型[J].软件学报,2012,23(12):3115-3129. 被引量：22
7早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,帕里旦.吐尔逊,吴小川.混合策略的维吾尔语名词词干提取系统[J].计算机工程与应用,2013,49(1):171-175. 被引量：11
8王峰,张浩军,阎娟,侯惠芳.编译原理课程教学中的词法分析及其应用[J].计算机教育,2013(17):19-23. 被引量：3
9麦合甫热提,艾山.吾买尔,麦热哈巴.艾力,吐尔根.伊布拉音,张健.基于词典和统计相结合的维吾尔语拼写检查方法[J].中文信息学报,2014,28(2):66-71. 被引量：2
10张海波,蔡洽吾,姜文斌,吕雅娟,刘群.基于联合音变还原和形态切分的形态分析方法[J].中文信息学报,2014,28(6):9-17. 被引量：3

同被引文献15

1王敬欣,徐倩倩,郝立莎,张雪.汉字间空格大小对青年人和老年人阅读的影响:眼动研究[J].心理科学,2020,43(1):68-74. 被引量：8
2白学军,田瑾,闫国利,王天琳.词切分对美国大学生汉语阅读影响的眼动研究[J].南开语言学刊,2009(1):140-153. 被引量：21
3丁国盛,彭聃龄.汉语逆序词识别中整词与词素的关系[J].当代语言学,2006,8(1):36-45. 被引量：27
4梁菲菲,白学军.切分空间和切分方式对中文阅读绩效影响的眼动研究[J].心理研究,2010,3(1):21-28. 被引量：10
5沈德立,白学军,臧传丽,闫国利,冯本才,范晓红.词切分对初学者句子阅读影响的眼动研究[J].心理学报,2010,42(2):159-172. 被引量：73
6李馨,白学军,闫国利,臧传丽,梁菲菲.空格在文本阅读中的作用[J].心理科学进展,2010,18(9):1377-1385. 被引量：13
7李兴珊,刘萍萍,马国杰.中文阅读中词切分的认知机理述评[J].心理科学进展,2011,19(4):459-470. 被引量：71
8白学军,郭志英,顾俊娟,曹玉肖,闫国利.词切分对日-汉双语者汉语阅读影响的眼动研究[J].心理学报,2011,43(11):1273-1282. 被引量：22
9谢枝龙.双语水平与认知控制心智转换[J].心理发展与教育,2014,30(5):512-519. 被引量：13
10余香莲,任志洪,叶一舵.词空格在汉语文本阅读中的作用:基于眼动研究的元分析[J].心理科学进展,2015,23(11):1894-1909. 被引量：9

引证文献1

1阿依古丽·艾尼,买合甫来提·坎吉,刘贵雄,帕里扎·布拉提汗.词间空格对维吾尔族大学生词汇加工的影响[J].心理与行为研究,2023,21(2):163-168.

1王永生,李梅.英语语音合成中基于WordNet的多音词消歧算法[J].计算机工程与应用,2008,44(26):138-140. 被引量：1
2姑丽加玛丽.麦麦提艾力,艾斯卡尔.肉孜,艾斯卡尔.艾木都拉.维吾尔语多音词消歧混合方法[J].计算机工程与应用,2011,47(35):158-160.
3王峥,李江.多媒体领域中的关键词检索[J].电视技术,2013,37(S2):178-179.
4程维刚,王宁,田勇.基于关键词匹配技术的相似试题检测方法研究[J].北华航天工业学院学报,2015,25(3):24-26. 被引量：5
5杨小军,潘泉,张洪才.基于粒子滤波和似然比的联合检测与跟踪[J].控制与决策,2005,20(7):837-840. 被引量：14
6中国科协《关于在学术论文中规范关键词选择的规定（试行）》[J].系统工程,2004,22(5). 被引量：1
7搜索技巧杂谈[J].计算机与网络,2004,30(16):41-41.
8王永生,柴佩琪.英文文语转换系统中基于决策树的词性标注的非监督学习[J].计算机应用,2006,26(3):651-654.
9王明文,李苏阳.不确定性推理的似然比方法[J].计算机与现代化,1997(3):5-8. 被引量：1
10唐正军,刘代志.智能化网络入侵检测中的关键词选择[J].计算机工程与应用,2004,40(6):178-180.

计算机工程

2012年第18期

浏览历史

内容加载中请稍等...

基于分类及最佳匹配读音的维吾尔多音词消歧被引量：1

参考文献8

二级参考文献14

共引文献16

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于分类及最佳匹配读音的维吾尔多音词消歧 被引量：1

参考文献8

二级参考文献14

共引文献16

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于分类及最佳匹配读音的维吾尔多音词消歧被引量：1