-
题名基于双语短语约束的交互式机器翻译方法
被引量:7
- 1
-
-
作者
徐萍
叶娜
吴闯
张桂平
-
机构
沈阳航空航天大学人机智能研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2018年第9期1-10,共10页
-
基金
国家自然科学基金(61402299)
-
文摘
交互式机器翻译(Interactive Machine Translation,IMT)是一种通过机器翻译系统与译员之间的相互作用指导计算机解码并改善输出译文质量的技术。目前主流的IMT方法使用译员确定的前缀作为唯一约束指导解码,交互方式受限,交互效率低。该文从交互方式和解码算法两个方面对IMT方法进行改进。在交互方式方面,允许译员译前从短语译项列表中为源语言短语选择正确译项。该文还提出了基于短语表的多样性排序算法,来提高短语候选译项的多样性,并根据译员的翻译认知过程设计交互界面,改善译员在翻译过程中的用户体验。在解码算法方面,将双语短语与前缀一同作为约束参与指导解码过程,提高翻译假设评价和过滤的准确性。在LDC汉英平行语料上进行了人工评测,实验结果表明该方法较传统的IMT方法能够减轻译员的认知负担,减少翻译时间,提升翻译效率。
-
关键词
交互式机器翻译
双语短语
短语译项
多样性
解码
-
Keywords
interactive machine translation
bilingual phrase
phrase translation option
diversity
decoding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Map-Reduce的自适应双语短语挖掘系统
- 2
-
-
作者
李彬
杨世泉
陈文杰
-
机构
中国人民解放军
阿里云计算有限公司
-
出处
《昆明学院学报》
2013年第3期83-87,共5页
-
文摘
对于跨语言信息检索,统计翻译等应用,双语短语都是极其重要的资源.提出了基于自适应模式的双语短语挖掘算法,该算法可以自动的学习当前Web页面的翻译模式,然后利用学习到的模式抽取当前页面中的双语短语.同时,将自适应双语短语挖掘算法与Map-Reduce并行编程模型融合起来,大大提高了系统的运行效率,并且通过实验验证了该方法的有效性.
-
关键词
自适应模式
双语短语
Map-Reduce并行计算框架
分布式计算
-
Keywords
adaptive pattern
bilingual term
Map-Reduce parallel programming model
distributed computing
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于有效句型的英汉双语短语对齐
被引量:6
- 3
-
-
作者
屈刚
陈笑蓉
陆汝占
-
机构
上海交通大学计算机科学与工程系
贵州大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第2期143-149,共7页
-
基金
国家重点基础研究发展规划基金 (G19980 3 0 5 0 1A 0 7)
-
文摘
双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧义 ,选出正确的句法树 ,并揭示其短语层次上的对应关系 ,是双语短语对齐的主要困难 提出的基于“有效句型”概念和“翻译中相对不变准则”的短语对齐模型基本解决了上述问题 双语短语对齐本身是一个复杂度较高的处理过程 ,提出的有关定理和算法使系统在保证对齐正确率的前提下 。
-
关键词
有效包型
英汉双语短语对齐
自然语言处理
语料库
语言翻译
-
Keywords
bilingual
corpus
alignment
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
H315.9
[自动化与计算机技术—计算机科学与技术]
-
-
题名汉英双语短语信息数据库的构建
- 4
-
-
作者
吴云芳
常宝宝
詹卫东
-
机构
北京大学
-
出处
《术语标准化与信息技术》
2003年第4期41-45,共5页
-
文摘
本文扼要介绍了一个汉英双语短语信息数据库的构建情况:汉语短语的描述信息;英语短语的描述信息;描述中的疑难问题;短语库的实施和应用。短语库是综合型语言知识库的有机组成部分,它的建设将为短语结构研究、句法分析和机器翻译提供强大的语言知识支撑。
-
关键词
短语结构分析
汉语信息处理
汉英双语短语信息数据库
英语短语
短语库
机器翻译系统
-
Keywords
Chinese-English bilingual phrase,phrase structure,database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
H085
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于英汉双语短语级平行语料的类别知识挖掘研究
被引量:1
- 5
-
-
作者
王东波
韩普
沈思
魏向清
-
机构
南京农业大学信息科学技术学院
南京大学信息管理学院
南京大学双语词典研究中心
-
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第11期40-46,共7页
-
基金
国家高技术研究发展计划(863计划)"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206)
国家社会科学基金重点项目"人文社会科学汉英动态术语数据库的构建研究"(项目编号:11AYY002)
江苏省研究生培养创新工程"基于异构社会网络数据的信息集成与检索研究"(项目编号:CXZZ12-0073)的研究成果之一
-
文摘
在已有聚类算法的基础上,基于英汉双语短语级人文社会科学平行语料,进行类别知识挖掘的实验。根据实验数据并结合具体的研究需求,确定相应的聚类算法和英语形态转换的算法。通过对汉语、英语和英汉双语词汇级知识聚类的性能进行对比,确定英汉双语词汇特征的性能优于单语。获取的类别知识可以直接应用到知识库、机器翻译模型的构建中,同时探究英汉两种词汇在类别知识获取过程中具体表现。
-
关键词
CSSCI英汉双语短语级平行语料Bisecting
K—means
Clustering算法类别知识
-
Keywords
CSSCI English- Chinese parallel corpus in phrase level Bisecting Kmeans clustering algorithm Category knowledge
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融入双语最大名词短语的机器翻译模型
被引量:9
- 6
-
-
作者
李业刚
梁丽君
孙福振
王绍卿
于潇
-
机构
山东理工大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第5期1316-1320,共5页
-
基金
国家"973"计划资助项目(2013CB329303)
国家自然科学基金重点资助项目(61132009)
-
文摘
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。
-
关键词
统计机器翻译
短语翻译模型
最大名词短语
双语最大名词短语
-
Keywords
statistical machine translat ion
phrase-based translation model
maximal-length noun phrase
bilingual maiallength noun phrase
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种融合句法短语的汉英统计机器翻译方法
被引量:6
- 7
-
-
作者
宋鼎新
黄德根
-
机构
大连理工大学计算机学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第10期2197-2201,共5页
-
基金
国家自然科学基金项目(61672127
61173100)资助
福建省中青年教师教育科研项目(JA14217)资助
-
文摘
基于短语的统计机器翻译所使用的短语并不限制句法边界,因而得到的翻译结果存在大量不符合句法结构的表达.为此,分析短语模型与句法模型各自的优势与不足,提出将句法分析结果中获得的双语句法短语对融入在短语模型中,以改善机器翻译质量.首先对平行语料分别进行句法分析并从中获取中英文单语句法短语,而后利用短语表与一致性短语原则获取双语句法短语对,最后将其与短语翻译模型的原有短语表相结合.实验结果表明:双语句法短语能够提高基于短语的统计机器翻译质量,在十万句对与百万句对规模双语平行训练语料中BLEU值分别提高0.56%与0.62%.
-
关键词
统计机器翻译
双语句法短语
短语翻译模型
短语表
-
Keywords
statistical machine translation
bilingual syntactic phrases
phrase translation model
phrase table
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用句法短语改善统计机器翻译性能
被引量:5
- 8
-
-
作者
孙水华
丁鹏
黄德根
-
机构
大连理工大学计算机科学与技术学院
福建工程学院信息科学与工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期95-102,共8页
-
基金
跨语言信息检索中的机器翻译研究(61173100
61173101
61272375)
-
文摘
短语表是基于短语的统计机器翻译系统的一个核心组成部分,基于启发式方法抽取到的短语表受单词对齐错误和未对齐词的影响严重,同时抽取到的短语也并非句法意义上的短语。该文提出一种基于EM(Expectation-maximization)算法的双语句法短语抽取方法来抽取双语句法短语,此方法可以通过不断迭代的方式使各参数值达到最优。通过加入双语句法短语、增加新特征、重新训练三种不同的方法,将获得的双语句法短语与基于短语的统计机器翻译方法结合以提高统计机器翻译系统的性能。结果表明:三种方法都不同程度提高了译文的BLEU(BiLingual Evaluation Understudy)值,其中增加新特征方法提高了0.64个点。
-
关键词
统计机器翻译
EM算法
双语句法短语
-
Keywords
statistical machine tranglation
Expectation-maximization algorithm
bilingual syntactic phrases
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-