N元模型在藏文文本局部查错中的应用研究被引量：18

Research on the Application of the N-Gram Model in Tibetan Text Error Correction Partially by N-Gram

下载PDF

导出

摘要本文阐述了藏文文本的错误形式的多样性。要对藏文文本进行局部查错,先要对文本中的音节进行纠错,音节的纠错又离不开对音节组成成分的纠错。本文利用N元模型对藏文音节内的各组成成分建立模型,并用此模型来判断一个音节的对与错。 This paper describes the varieties of errors in Tibetan texts. To correct the partial errors, we need to correct the syllables firstly, which are made up of different parts. So it is important to correct the compositions of syllables. Based on these compositions of syllables, this paper establishes a model for error- correcting Tibetan texts. Therefore, the model can estimate if a syllable is right or not.

作者多杰卓玛

机构地区西北民族大学中国民族信息技术研究院

出处《计算机工程与科学》 CSCD 北大核心 2009年第4期117-119,123,共4页 Computer Engineering & Science

基金甘肃省科技攻关项目(2GS064-A52-035-04)

关键词 N元模型藏文音节字丁同现概率 N -gram Tibetan text char probability

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1[美]Jurafsky D,Martin J H.自然语言处理综论[M].冯志伟,孙乐译.北京:电子工业出版社,2005:118-127. 被引量：1
2施得胜等.基于统计的中文错字侦测法[J].电脑与通讯,1992,(8). 被引量：4
3郑雅丽颜国伟.语言同现的概念与应用.世界汉语教学,1998,(3):76-80. 被引量：1
4扎西次仁.一个藏文拼写检查系统的设计[C]//1998年中文信息处理国际会议论文集.北京:清华大学出版社,1998. 被引量：2

共引文献4

1张磊,周明,黄昌宁,潘海华.中文文本自动校对[J].语言文字应用,2001(1):19-26. 被引量：23
2马金山,张宇,刘挺,李生.利用三元模型及依存分析查找中文文本错误[J].情报学报,2004,23(6):723-728. 被引量：7
3关白,才科扎西.现代藏文音节字自动校对研究[J].计算机工程与应用,2012,48(29):151-156. 被引量：16
4刘亮亮,王石,王东升,汪平仄,曹存根.领域问答系统中的文本错误自动发现方法[J].中文信息学报,2013,27(3):77-83. 被引量：19

同被引文献92

1华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
2李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
3张磊,周明,黄昌宁,潘海华.中文文本自动校对[J].语言文字应用,2001(1):19-26. 被引量：23
4张仰森,曹元大,徐波.中文文本自动校错系统中知识库及其构造方法研究[J].小型微型计算机系统,2004,25(12):2237-2242. 被引量：3
5高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：32
6蒋辅昆.“要从整体上把握事物的联系”教学的几点思考[J].中学政治教学参考,2000(8):37-38. 被引量：1
7陈笑蓉,秦进,汪维家,陆汝占.中文文本校对技术的研究与实现[J].计算机科学,2003,30(11):53-55. 被引量：6
8江荻,董颖红.藏字叠加结构线性处理统计分析[J].中文信息,1994,11(4):44-46. 被引量：11
9张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
10张仰森,曹元大,俞士汶.基于规则与统计相结合的中文文本自动查错模型与算法[J].中文信息学报,2006,20(4):1-7. 被引量：33

引证文献18

1华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
2关白.自动校对中现代藏文音节字研究[J].西藏大学学报（社会科学版）,2011,26(2):69-75. 被引量：11
3关白,洛藏,才科扎西.现代藏文自动校对现状分析[J].西藏科技,2011(8):78-80. 被引量：7
4关白,才科扎西.现代藏文音节字自动校对研究[J].计算机工程与应用,2012,48(29):151-156. 被引量：16
5珠杰,李天瑞,刘胜久.藏文文本自动校对方法及系统设计[J].北京大学学报（自然科学版）,2014,50(1):142-148. 被引量：13
6陈小莹,艾金勇.藏文音节拼写自动校对系统的设计[J].语文学刊（高等教育版）,2014(3):31-32. 被引量：4
7珠杰,李天瑞,刘胜久.TSRM藏文拼写检查算法[J].中文信息学报,2014,28(3):92-98. 被引量：11
8向令,扎西加,马伟珍,卢超.基于贝叶斯算法的藏语拼写检查的研究与实现[J].科技创业月刊,2016,29(11):137-137. 被引量：1
9刘汇丹,洪锦玲,诺明花,吴健.基于大规模网络语料的藏文音节拼写错误统计与分析[J].中文信息学报,2017,31(2):61-70. 被引量：6
10才智杰,孙茂松,才让卓玛.一种基于向量模型的藏文字拼写检查方法[J].中文信息学报,2018,32(9):47-55. 被引量：11

二级引证文献45

1华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
2才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020(5):44-49. 被引量：3
3仁青诺布,高红梅,王国宏,杨鹏,索朗旺堆.藏文在线输入法的设计与实现[J].西藏大学学报（社会科学版）,2013,28(4):65-69. 被引量：1
4陈小莹,艾金勇.藏文音节拼写自动校对系统的设计[J].语文学刊（高等教育版）,2014(3):31-32. 被引量：4
5才让叁智,高定国,扎西加,关白.基于基字识别的藏文音节字检错算法研究[J].中国科技博览,2014(42):260-262. 被引量：1
6蒋凯,刘欣亮,王平,韩飞.一种基于粗糙集的兼类词词性自动校对方法[J].软件导刊,2014,13(9):139-141. 被引量：1
7艾金勇,陈小莹,华侃.面向Web的藏文文本分词策略研究[J].图书馆学研究,2014(21):42-46. 被引量：5
8扎西本,安见才让.紧缩词的校对方法研究[J].中国科技博览,2015,0(45):269-269.
9普布旦增,关白.基于统计的藏文音节字校对系统开发研究[J].西藏大学学报（社会科学版）,2015,30(2):74-78. 被引量：4
10李苗苗,高定国,普次仁,扎西仓觉.藏文字频统计软件的设计与实现[J].电脑知识与技术,2016,0(2):179-181. 被引量：1

1曾华琳,李堂秋.基于上下文信息提取的概率分词算法[J].学术问题研究,2006,0(1):127-131.
2杜璞.中文信息处理的主流技术[J].科技创新导报,2009,6(24):172-172. 被引量：1
3曾华琳,李堂秋,史晓东.一种基于提取上下文信息的分词算法[J].计算机应用,2005,25(9):2025-2027. 被引量：9
4康铁钢,戴汝为.一种基于大规模标注语料库的词语聚类方法[J].系统仿真学报,2003,15(10):1439-1442. 被引量：3
5王成平.计算机彝文信息处理主流技术的分析与探讨[J].信息系统工程,2012,25(7):148-150. 被引量：1
6贾剑峰,史晓东,赖兴邦.基于HMM的汉语整句拼音输入法研究[J].现代计算机,2008,14(4):4-6.
7刘长松,丁晓青.利用字形风格约束的字符识别研究[J].自动化学报,2007,33(11):1121-1127. 被引量：2
8尼加提·纳吉米,买合木提·买买提,吐尔根·依布拉音.基于N元模型的维吾尔语词性标注实验研究[J].计算机工程与应用,2012,48(25):137-140. 被引量：2
9刘小虎,李生.基于语料库的译文选择[J].情报学报,1997,16(3):189-194. 被引量：4
10夏莹,马少平,常新功,朱小燕,金奕江.基于统计的汉字识别文本自动后处理方法[J].模式识别与人工智能,1996,9(2):172-178. 被引量：14

计算机工程与科学

2009年第4期

浏览历史

内容加载中请稍等...

N元模型在藏文文本局部查错中的应用研究被引量：18

参考文献4

共引文献4

同被引文献92

引证文献18

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

N元模型在藏文文本局部查错中的应用研究 被引量：18

参考文献4

共引文献4

同被引文献92

引证文献18

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

N元模型在藏文文本局部查错中的应用研究被引量：18