期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于单语语料和词向量对齐的蒙汉神经机器翻译研究
被引量:
12
1
作者
曹宜超
高翊
+3 位作者
李淼
冯韬
王儒敬
付莎
《中文信息学报》
CSCD
北大核心
2020年第2期27-32,37,共7页
近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器-解码器神...
近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器-解码器神经机器翻译架构,提出一种改善蒙汉神经机器翻译结果的方法。首先将蒙古语和汉语的词向量空间进行对齐并用它来初始化模型的词嵌入层,然后应用联合训练的方式同时训练蒙古语到汉语的翻译和汉语到蒙古语的翻译。并且在翻译的过程中,最后使用蒙古语和汉语的单语语料对模型进行去噪自编码的训练,增强编码器的编码能力和解码器的解码能力。实验结果表明该文所提出方法的效果明显高于基线模型,证明该方法可以提高蒙汉神经机器翻译的性能。
展开更多
关键词
蒙汉神经机器翻译
单语语料
词
向量
对齐
下载PDF
职称材料
基于跨语言对齐词向量的汉日词汇意义比较研究
被引量:
1
2
作者
胡楠
张文强
胡韧奋
《语言文字应用》
CSSCI
北大核心
2022年第2期133-143,共11页
跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通...
跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通过汉语和日语预训练词向量获得两种语言中的词汇语义表示,然后,对预训练的两种语言词向量进行空间对齐,以此为基础,分别从词汇概念语义场和同形汉字词两个角度探究汉语和日语词汇的语义相似程度。考察汉日词汇概念语义场时,本文构建了涵盖20个语义场、897个词对的概念词表,通过跨语言词向量计算揭示了两种语言的语义场异同。在同形汉字词分析中,本文通过分类和聚类方法系统考察了3380对同形汉字词的意义分布情况,以期为跨语言词汇意义比较研究提供新的视角。
展开更多
关键词
词
向量
对齐
跨语言
词
义比较
汉日同形
词
词
汇类型学
下载PDF
职称材料
低资源语种傣汉神经机器翻译方法
被引量:
2
3
作者
高翊
付莎
+3 位作者
胡泽林
李淼
冯韬
麻之润
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2020年第4期57-63,共7页
近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich...
近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich resource language)翻译任务上,神经机器翻译机器的表现几乎可以媲美人类的水平.对于一些小语种(俗称低资源语种:Low resource language),无法提供足够多的双语数据,导致NMT出现过拟合问题,从而降低翻译效果.据此本文以低资源的汉傣语翻译为例,针对神经机器在低资源汉傣语机器翻译表现不佳的问题现状,开展了如下研究:(1)构造了以词向量为基础的初始化模型,利用傣汉词向量空间对齐的方法,来初始化神经翻译模型的词嵌入层以提高翻译的性能;(2)设计了傣汉词向量空间的对齐方法;(3)提出了一种基于词对齐的神经机器翻译框架.通过汉/傣、傣/汉双向翻译实验证明,该方法可以分别使汉/傣、傣/汉机器翻译的BLEU值提高2.38个和0.43个BLEU点.
展开更多
关键词
低资源神经机器翻译
初始化模型
词
向量
对齐
注意力机制
原文传递
题名
基于单语语料和词向量对齐的蒙汉神经机器翻译研究
被引量:
12
1
作者
曹宜超
高翊
李淼
冯韬
王儒敬
付莎
机构
中国科学院合肥智能机械研究所
中国科学技术大学
云南省少数民族语文指导工作委员会办公室
出处
《中文信息学报》
CSCD
北大核心
2020年第2期27-32,37,共7页
基金
国家自然科学基金(61572462)
中国科学院“十三五”信息化专项科学大数据工程(XXH13505-03-203)。
文摘
近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器-解码器神经机器翻译架构,提出一种改善蒙汉神经机器翻译结果的方法。首先将蒙古语和汉语的词向量空间进行对齐并用它来初始化模型的词嵌入层,然后应用联合训练的方式同时训练蒙古语到汉语的翻译和汉语到蒙古语的翻译。并且在翻译的过程中,最后使用蒙古语和汉语的单语语料对模型进行去噪自编码的训练,增强编码器的编码能力和解码器的解码能力。实验结果表明该文所提出方法的效果明显高于基线模型,证明该方法可以提高蒙汉神经机器翻译的性能。
关键词
蒙汉神经机器翻译
单语语料
词
向量
对齐
Keywords
Mongolian-Chinese neural machine translation
monolingual corpora
word embedding alignment
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于跨语言对齐词向量的汉日词汇意义比较研究
被引量:
1
2
作者
胡楠
张文强
胡韧奋
机构
北京师范大学汉语文化学院、中文信息处理研究所
北京师范大学汉语文化学院、人文宗教高等研究院
出处
《语言文字应用》
CSSCI
北大核心
2022年第2期133-143,共11页
基金
国家自然科学基金青年项目“面向古籍整理智能化的知识表示与加工研究”(62006021)
北京市社科重点项目“古典文献的智能化分析与关联技术研究”(21DTR037)资助。
文摘
跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通过汉语和日语预训练词向量获得两种语言中的词汇语义表示,然后,对预训练的两种语言词向量进行空间对齐,以此为基础,分别从词汇概念语义场和同形汉字词两个角度探究汉语和日语词汇的语义相似程度。考察汉日词汇概念语义场时,本文构建了涵盖20个语义场、897个词对的概念词表,通过跨语言词向量计算揭示了两种语言的语义场异同。在同形汉字词分析中,本文通过分类和聚类方法系统考察了3380对同形汉字词的意义分布情况,以期为跨语言词汇意义比较研究提供新的视角。
关键词
词
向量
对齐
跨语言
词
义比较
汉日同形
词
词
汇类型学
Keywords
word embedding alignment
cross-lingual comparison of lexical meanings
Chinese and Japanese homographs
lexical typology
分类号
H087 [语言文字—语言学]
下载PDF
职称材料
题名
低资源语种傣汉神经机器翻译方法
被引量:
2
3
作者
高翊
付莎
胡泽林
李淼
冯韬
麻之润
机构
云南省少数民族语文指导工作委员会
中国科学院合肥智能机械研究所
出处
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2020年第4期57-63,共7页
基金
国家自然科学基金项目(61572462)
中国科学院信息化专项子课题(XXH13505-03-203)
云南省民族事务委员会农业信息化项目(SZKM201835035)
文摘
近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich resource language)翻译任务上,神经机器翻译机器的表现几乎可以媲美人类的水平.对于一些小语种(俗称低资源语种:Low resource language),无法提供足够多的双语数据,导致NMT出现过拟合问题,从而降低翻译效果.据此本文以低资源的汉傣语翻译为例,针对神经机器在低资源汉傣语机器翻译表现不佳的问题现状,开展了如下研究:(1)构造了以词向量为基础的初始化模型,利用傣汉词向量空间对齐的方法,来初始化神经翻译模型的词嵌入层以提高翻译的性能;(2)设计了傣汉词向量空间的对齐方法;(3)提出了一种基于词对齐的神经机器翻译框架.通过汉/傣、傣/汉双向翻译实验证明,该方法可以分别使汉/傣、傣/汉机器翻译的BLEU值提高2.38个和0.43个BLEU点.
关键词
低资源神经机器翻译
初始化模型
词
向量
对齐
注意力机制
Keywords
low-resource neural machine translation
model initialization
word vector aligning
attention mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于单语语料和词向量对齐的蒙汉神经机器翻译研究
曹宜超
高翊
李淼
冯韬
王儒敬
付莎
《中文信息学报》
CSCD
北大核心
2020
12
下载PDF
职称材料
2
基于跨语言对齐词向量的汉日词汇意义比较研究
胡楠
张文强
胡韧奋
《语言文字应用》
CSSCI
北大核心
2022
1
下载PDF
职称材料
3
低资源语种傣汉神经机器翻译方法
高翊
付莎
胡泽林
李淼
冯韬
麻之润
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2020
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部