期刊文献+

N元模型在藏文文本局部查错中的应用研究 被引量:18

Research on the Application of the N-Gram Model in Tibetan Text Error Correction Partially by N-Gram
下载PDF
导出
摘要 本文阐述了藏文文本的错误形式的多样性。要对藏文文本进行局部查错,先要对文本中的音节进行纠错,音节的纠错又离不开对音节组成成分的纠错。本文利用N元模型对藏文音节内的各组成成分建立模型,并用此模型来判断一个音节的对与错。 This paper describes the varieties of errors in Tibetan texts. To correct the partial errors, we need to correct the syllables firstly, which are made up of different parts. So it is important to correct the compositions of syllables. Based on these compositions of syllables, this paper establishes a model for error- correcting Tibetan texts. Therefore, the model can estimate if a syllable is right or not.
作者 多杰卓玛
出处 《计算机工程与科学》 CSCD 北大核心 2009年第4期117-119,123,共4页 Computer Engineering & Science
基金 甘肃省科技攻关项目(2GS064-A52-035-04)
关键词 N元模型 藏文音节 字丁 同现概率 N -gram Tibetan text char probability
  • 相关文献

参考文献4

  • 1[美]Jurafsky D,Martin J H.自然语言处理综论[M].冯志伟,孙乐译.北京:电子工业出版社,2005:118-127. 被引量:1
  • 2施得胜等.基于统计的中文错字侦测法[J].电脑与通讯,1992,(8). 被引量:4
  • 3郑雅丽 颜国伟.语言同现的概念与应用.世界汉语教学,1998,(3):76-80. 被引量:1
  • 4扎西次仁.一个藏文拼写检查系统的设计[C]//1998年中文信息处理国际会议论文集.北京:清华大学出版社,1998. 被引量:2

共引文献4

同被引文献92

引证文献18

二级引证文献45

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部