期刊文献+

Skip-N蒙古文统计语言模型 被引量:8

Skip-N Mongolian Statistical Language Model
下载PDF
导出
摘要 蒙古文具有典型的构词词缀的特点,一个词往往可以切分成词干和词缀等若干个部分.如果采用通常的N-gram语言模型很难描述词干、词缀等的长距离依赖关系.提出了一种利用长距离依赖的Skip-N语言模型,给出了相隔N个词的二元依赖关系.对这种方法进行了实现,并在一个基于实例的汉蒙机器翻译系统上进行了实验,实验证明Skip-N语言模型能够有效地提高汉蒙机器翻译的效果. Etymas and suffixes are the typical characters of Mongolian. A Mongolian word could usually be divided into an etyma and several suffixes. It is difficult to describe the dependent relationship of long distance between an etyma and suffixes if using the N-gram language model. Based on long-distance dependence ,a new kind of language model called Skip-N model is presented, and the relation of N-word separated bigram dependence is given. The technique is realized, to applied to a Chinese-Mongolian machine translation system. The experiments prove that the Skip-N language model can improve the translation result.
出处 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第2期220-224,共5页 Journal of Inner Mongolia University:Natural Science Edition
基金 内蒙古自然基金项目“蒙古语文本语言模型的构建研究”(200607010805) 国家自然基金项目“基于短语结构转换模板的统计机器翻译方法研究”(60573188)资助
关键词 机器翻译 蒙古语 语言模型 machine translation Mongolian language model
  • 相关文献

参考文献6

  • 1那顺乌日图.关于在蒙古语文研究中运用统计学方法的问题[J].民族语文,1993(5):46-50. 被引量:4
  • 2那顺乌日图.关于“汉蒙机器翻系统”.ALTAIHAKPO(Journal of the Altaisociety of Korea),2001,. 被引量:1
  • 3刘群,詹卫东,常宝宝,等.一个汉英机器翻译系统的计算模型与语言模型[C]//吴泉源,钱跃良.智能计算机接口与应用进展-第三届全国智能接口与智能应用学术会议论文集.北京:电子工业出版社,1997. 被引量:3
  • 4Andreas Stolcke. SRILM - an extensible language modeling toolkit [C]. In Proceedings of International Conference on Spoken Language Processing, 2002,2 : 901-904. 被引量:1
  • 5Hongxu Hou,Dan Deng,Gang Zou,et al. An EBMT System Based on Word Alignment [C]. Proceeding of International Workshop of Spoken Language Translation, 2004,47-49. 被引量:1
  • 6侯宏旭,刘群,张玉洁,井佐原均.2005年度863机器翻译评测方法研究与实施[J].中文信息学报,2006,20(B03):7-18. 被引量:6

二级参考文献5

  • 1http://www. nist. gov/speech/tests/mt [EB]. 被引量:1
  • 2http://nlp. cs. nyu. edu/GTM/[EB]. 被引量:1
  • 3F. J. Och, Minimum error rate training in statistical machine translation[C]. In:Proc. of the 41st ACL, Sapporo, Japan, 2003, 160-167. 被引量:1
  • 4F. J. Oeh, Statistical Machine Translation: From Single-Word Models to Alignment Templates [D], 38-39. 被引量:1
  • 5Yasuhiro Akiba, etc. Overview of the IWSLTD4 Evaluation Campaign[C]. 2004. 被引量:1

共引文献7

同被引文献63

引证文献8

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部