期刊文献+

藏文虚词知识融合的藏汉机器翻译方法研究

Study on the Tibetan-Chinese Machine Translation Method with the Fusion of Tibetan Function Words Knowledge
下载PDF
导出
摘要 针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer模型和mBART模型上进行了实验,使用轮数集成和不同网络结构集成来提高最终模型的泛化能力。对比实验证明,藏文虚词知识融合算法与模型集成策略可以提升藏汉机器翻译的翻译效果,最高可以达到38.05个BLEU。 This paper designs a method based on the knowledge fusion of Tibetan function words for the grammatical characteristics of Tibetan function words,which can improve the effectiveness of Tibetan-Chinese translation.Firstly,four corresponding corpora are obtained by all Tibetan function word knowledge fusion filtering-cum-class function word knowledge fusion,monosyllabic function word knowledge fusion and multisyllabic function word knowledge fusion.Secondly,they are experimented on Transformer model and mBART model,and the number of rounds integration and different network structure integration are used to improve the generalization ability of the final model.The comparative experiments demonstrate that the Tibetan function word knowledge fusion algorithm and model integration strategy can improve the translation of Tibetan-Chinese machine translation up to 38.05 BLEU.
作者 严松思 珠杰 汪超 刘亚姗 许泽洲 徐泽辉 YAN Songsi;ZHU Jie;WANG Chao;LIU Yashan;XU Zezhou;XU Zehui(School of Information Science and Technology,Tibet University,Lhasa 540000,China;Provincial and Ministerial Collaborative Innovation Centre for Informatization in Tibet,Lhasa 540000,China)
出处 《中央民族大学学报(自然科学版)》 2024年第1期20-27,共8页 Journal of Minzu University of China(Natural Sciences Edition)
基金 国家自然基金项目(62066042) 教育部人文社会科学研究项目(21YJCZH059) 2021年西藏自治区高校人文社会科学研究项目(SK2021-24) 西藏大学提升计划项目(ZDTSJH21-07) 西藏大学培育计划项目(ZDCZJH21-10) 西藏大学珠峰学科建设计划项目(zf22002001) 西藏大学2020级高水平项目(2020-GSP-S176)。
关键词 藏文虚词知识融合 机器翻译 模型集成 knowledge fusion of Tibetan function words machine translation model integration
  • 相关文献

参考文献10

二级参考文献41

  • 1那顺乌日图,淑琴.面向信息处理的蒙古语规范化研究[J].中央民族大学学报(哲学社会科学版),2007,34(6):115-122. 被引量:6
  • 2江荻.现代藏语动词的句法语义分类及相关语法句式[J].中文信息学报,2006,20(1):37-43. 被引量:16
  • 3艾山.吾买尔,吐尔根.伊布拉音.英文维文人名机器翻译算法的研究与实现[J].新疆大学学报(自然科学版),2007,24(1):97-101. 被引量:8
  • 4Nagao M.A framework of a mechanical translationbetween Japanese and English by analogy principle[C] //Proceedings of the international NATOsymposium on Artificial and human intelligence,NewYork,USA,PublisherElsevier North-Holland,1984:173-180. 被引量:1
  • 5Jrg Tiedemann.Automatical Lexicon Extraction fromAligned Bilingual Corpora[D].MagdeburgUniversity,Department of Computer Science,1997. 被引量:1
  • 6Ying Zhang,Ralf Brown,Robert Frederking,et al.Pre-processing of Bilingual Corpora for Mandarin-English EBMT[C] //Proceedings of the MT Summit8.Santinago de Compostela,Spain,2001. 被引量:1
  • 7Koehn P,Och F J,Marcu D.Statistical phrase basedtranslation[C] //Proceedings of the 2003Conference ofthe North American Chapter of the Association forComputational Linguistics on Human LanguageTechnology.Morristown NJ:Association forComputational Linguistics,2003:48-54. 被引量:1
  • 8Xueqiang Lv,Le Zhang,Junfeng Hu.StatisticalSubstring Reduction in Linear Time[C] //Proceedingsof IJCNLP-2004,Springer,2004:320-327. 被引量:1
  • 9DanielJurafsky,JamesH.Martin著,冯志伟,孙乐翻译.自然语言处理综论[M].电子工业出版社,2005. 被引量:2
  • 10孙茂松,陈群秀.中国计算语言学研究前沿进展(20072009)[M].清华大学出版社,2009. 被引量:1

共引文献60

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部