期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
面向层次短语翻译的词汇化调序方法研究 被引量:6
1
作者 肖欣延 刘洋 +1 位作者 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2012年第1期37-41,50,共6页
词汇化信息在短语调序中有重要的作用。然而层次短语翻译模型调序时并不考虑变量所泛化的短语的词汇化信息,因此该模型调序的歧义性较大。为此该文提出面向层次短语模型的词汇化调序方法。我们定义变量与邻接词语的调序关系,并使用变量... 词汇化信息在短语调序中有重要的作用。然而层次短语翻译模型调序时并不考虑变量所泛化的短语的词汇化信息,因此该模型调序的歧义性较大。为此该文提出面向层次短语模型的词汇化调序方法。我们定义变量与邻接词语的调序关系,并使用变量所泛化短语片段的边界词信息来指导调序。在大规模语料的汉语到英语翻译评测任务中,我们的方法在NIST 2003-2005测试数据上获得了0.6~1.2BLEU值的提高。 展开更多
关键词 统计机器翻译 层次短语 词汇化调序
下载PDF
维吾尔语词尾对汉维统计机器翻译影响的研究 被引量:8
2
作者 米莉万.雪合来提 麦热哈巴.艾力 +1 位作者 吐尔根.依布拉音 姜文斌 《计算机工程》 CAS CSCD 2014年第3期224-227,共4页
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使... 维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。 展开更多
关键词 黏着语 词尾 统计机器翻译 层次短语翻译模型 语言模型
下载PDF
基于树到串模型强化的层次短语机器翻译解码方法 被引量:5
3
作者 肖桐 朱靖波 《计算机学报》 EI CSCD 北大核心 2016年第4期808-821,共14页
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并... 文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果. 展开更多
关键词 统计机器翻译 层次短语模型 树到串模型 规则抽取 解码 社会媒体 社交网络 自然语言处理 机器翻译
下载PDF
层次短语翻译模型的介词短语调序 被引量:3
4
作者 冯洋 张冬冬 刘群 《中文信息学报》 CSCD 北大核心 2012年第1期31-36,共6页
在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会... 在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会导致规则的使用不当,从而引起翻译错误。该文在层次短语模型的基础上,针对介词短语进行处理。首先利用条件随机场模型识别出介词短语,然后抽取出带有介词短语的规则,构建一个新的同步上下文无关文法。解码的时候,在这个同步上下文无关文法定义的空间里搜索找到最优的译文。相对于层次短语模型,该方法在我们内部的英汉数据集上调高了0.8个BLEU百分点,在NIST 2008英汉翻译数据集上提高了0.5个BLEU百分点。 展开更多
关键词 统计机器翻译 层次短语模型 介词短语调序 条件随机场
下载PDF
层次短语翻译的神经网络调序模型 被引量:2
5
作者 李鹏 刘洋 孙茂松 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第12期1529-1533,共5页
调序歧义是层次短语翻译模型面临的主要挑战之一,但在该类模型中使用的上下文信息非常有限,制约了该类模型处理调序歧义的能力。为了更充分地利用上下文信息,提出了一种面向层次短语翻译模型的神经网络调序模型。该模型将调序看作分类问... 调序歧义是层次短语翻译模型面临的主要挑战之一,但在该类模型中使用的上下文信息非常有限,制约了该类模型处理调序歧义的能力。为了更充分地利用上下文信息,提出了一种面向层次短语翻译模型的神经网络调序模型。该模型将调序看作分类问题,首先使用递归自动编码器为任意长度的字符串计算向量表示,然后使用这些向量表示作为分类特征,用于预测不同调序方式的概率,最后将这些概率作为新的特征加入翻译模型中进行翻译。实验结果显示:在中—英翻译任务上,该模型相比基线系统获得了0.3~0.8的BLEU值提升,具有更好的调序能力。 展开更多
关键词 计算机科学与技术 神经网络 调序模型 递归自动编码器 层次短语翻译模型
原文传递
基于层次短语的汉蒙统计机器翻译研究 被引量:2
6
作者 王春荣 王斯日古楞 阿荣 《内蒙古师范大学学报(自然科学汉文版)》 CAS 北大核心 2013年第3期350-353,357,共5页
使用形式化的句法分析方法——基于层次短语的翻译模型进行汉蒙统计机器翻译研究.实验证明,基于层次短语的6元模型实验结果比基于短语的3、4、5和6元的结果都要好.进一步对基于层次短语的汉蒙统计机器翻译系统译文中的汉语未登录数词进... 使用形式化的句法分析方法——基于层次短语的翻译模型进行汉蒙统计机器翻译研究.实验证明,基于层次短语的6元模型实验结果比基于短语的3、4、5和6元的结果都要好.进一步对基于层次短语的汉蒙统计机器翻译系统译文中的汉语未登录数词进行后处理,从而提高了翻译系统性能. 展开更多
关键词 形式化句法 基于层次短语的翻译模型 汉蒙统计机器翻译 数词后处理
下载PDF
基于强制对齐的层次短语模型过滤和优化 被引量:1
7
作者 付晓寅 魏玮 +1 位作者 卢世祥 徐波 《中文信息学报》 CSCD 北大核心 2013年第6期134-138,150,共6页
该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法... 该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法不需要引入任何语言学知识,适合大规模语料训练模型.在大规模中英翻译评测任务中,采用该方法训练的模型与传统层次短语模型相比,不仅能够过滤50%左右规则,同时获得0.8~1.2BLEU值的提高. 展开更多
关键词 统计机器翻译 层次短语 强制对齐 模型训练
下载PDF
利用依存限制抽取长距离调序规则
8
作者 涂兆鹏 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2011年第2期55-60,共6页
长距离调序是统计机器翻译领域的一个重要问题。层次短语模型提供了一个很好的解决方案,它使用层次短语规则可以很好地表示局部调序和长距离调序。但是,使用传统的算法抽取长距离层次规则将会导致规则表数量急剧增加,从而加大解码内存... 长距离调序是统计机器翻译领域的一个重要问题。层次短语模型提供了一个很好的解决方案,它使用层次短语规则可以很好地表示局部调序和长距离调序。但是,使用传统的算法抽取长距离层次规则将会导致规则表数量急剧增加,从而加大解码内存和时间消耗。为了解决这个问题,该文提出了一种利用依存限制抽取长距离调序规则的新方法。实验表明,该文的方法可以比基准系统高出0.74个BLEU点。 展开更多
关键词 统计机器翻译 层次短语模型 长距离调序 依存限制
下载PDF
融合时态特征的日英层次短语翻译模型
9
作者 明芳 徐金安 +2 位作者 王楠 陈钰枫 张玉洁 《计算机与现代化》 2017年第6期1-7,共7页
针对基于层次短语翻译模型的统计机器翻译使用上下文信息有限,时态翻译质量不高的问题,提出一种融合时态特征的日英统计机器翻译方法。该方法通过引入翻译规则的时态分类约束信息,解码器可以根据每条规则的潜在时态分类,为相应时态的句... 针对基于层次短语翻译模型的统计机器翻译使用上下文信息有限,时态翻译质量不高的问题,提出一种融合时态特征的日英统计机器翻译方法。该方法通过引入翻译规则的时态分类约束信息,解码器可以根据每条规则的潜在时态分类,为相应时态的句子匹配到最合适的规则进行翻译。首先从双语训练语料中抽取时态特征构建最大熵分类模型,然后再抽取包含各类时态信息的层次短语规则的时态特征,最后将规则的时态分类结果作为一类新特征,融入基于层次短语的翻译系统中。实验结果表明,与基线系统相比,该方法在多个测试集上提高了翻译质量,在一定程度上解决了日英层次短语模型的时态翻译问题。 展开更多
关键词 层次短语翻译模型 时态特征 最大熵分类模型
下载PDF
引入韵律结构信息的层次短语模型改进研究
10
作者 甘星超 陈毅东 《电脑知识与技术》 2013年第4X期2860-2863,2890,共5页
随着自然语言处理研究的不断深入,人们不但迫切需要挖掘文本更多的潜在语言学信息,而且还力图通过机器学习预测这些潜在的语言学知识,以便更加有效地提高机器翻译的性能,同时为计算语言学服务。韵律作为语音学方面的知识,已经广泛用于... 随着自然语言处理研究的不断深入,人们不但迫切需要挖掘文本更多的潜在语言学信息,而且还力图通过机器学习预测这些潜在的语言学知识,以便更加有效地提高机器翻译的性能,同时为计算语言学服务。韵律作为语音学方面的知识,已经广泛用于到语音合成、文音转换、语音翻译各个语音方面,对基于语音的自然语言处理起到不可替代的作用。该文对韵律信息如何,并以何种方式改进机器翻译进行了介绍,并通过实验验证韵律信息对层次短语模型有改进。 展开更多
关键词 统计机器翻译 层次短语模型 韵律结构信息 计算语言学 语音学
下载PDF
基于分层语块分析的统计翻译研究 被引量:7
11
作者 魏玮 杜金华 徐波 《中文信息学报》 CSCD 北大核心 2007年第5期87-90,117,共5页
本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统... 本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。 展开更多
关键词 人工智能 机器翻译 基于分层语块分析的统计翻译模型 条件随机场 CKY算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部