-
题名基于混淆网络解码的机器翻译多系统融合
被引量:3
- 1
-
-
作者
杜金华
魏玮
徐波
-
机构
中国科学院自动化研究所数字内容技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2008年第4期48-54,共7页
-
基金
国家863计划资助项目(2006AA01Z194)
-
文摘
在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险解码器选择一个风险最小的假设作为对齐参考;(2)将其余的-best假设结果与该参考对齐,从而构建混淆网络。多特征混淆网络基于对数线性模型,引入了更多有效的知识源参与最优路径选择,融合后的BLEU得分比融合前最好的单系统BLEU得分提高了2.19%。在对齐方法上,我们提出了一种改进的翻译错误率(Translation Error Rate,TER)准则——GIZA-TER准则,该准则可以对CN网络进行更有效的短语调序。实验中的显著性检验证明了本文方法的有效性。
-
关键词
人工智能
机器翻译
多系统融合
最小贝叶斯风险解码
多特征混淆网络
giza—ter
-
Keywords
artificial intelligence
machine translation
system combination
minimum hayes-risk decoding
multi features confusion network
giza-ter
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-