基于语种关联度课程学习的多语言神经机器翻译被引量：1

Similarity-based Curriculum Learning for Multilingual Neural Machine Translation

下载PDF

导出

摘要近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。 Multilingual neural machine translation(MNMT)with a single model has drawn more attention due to its capability to deal with multiple languages.However,the current multilingual translation paradigm does not make use of the similar features embodied in different languages,which has already been proven useful for improving the multilingual translation.Besides,the training of multilingual model is usually very time-consuming due to the huge amount of training data.To address these problems,we propose a similarity-based curriculum learning method to improve the overall performance and convergence speed.We propose two hierarchical criteria for measuring the similarity,one is for ranking different languages(inter-language)with singular vector canonical correlation analysis,and the other is for ranking different sentences in a particular language(intra-language)with cosine similarity.At the same time,the paper proposes a curriculum learning strategy that takes the loss of validation set as the curriculum replacement standard.We conduct experiments on balanced and unbalanced IWSLT multilingual data sets and Europarl corpus datasets.The results demonstrate that the proposed method outperforms strong multilingual translation systems and can achieve up to a 64%decrease in training time.

作者于东谢婉莹谷舒豪冯洋 YU Dong;XIE Wan-ying;GU Shu-hao;FENG Yang(College of Information Sciences,Beijing Language and Culture University,Beijing 100083,China;Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区北京语言大学信息科学学院中国科学院计算技术研究所中国科学院大学

出处《计算机科学》 CSCD 北大核心 2022年第1期24-30,共7页 Computer Science

基金教育部人文社会科学研究青年基金项目(19YJCZH230) 北京语言大学研究生创新基金资助项目(20YCX138)。

关键词机器翻译多语言课程学习关联度评估语种排序句子排序 Machine translation Multilingual Curriculum learning Similarity evaluation Language ranking Sentence ranking

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1薛擎天,李军辉,贡正仙.多语言的无监督神经机器翻译[J].厦门大学学报（自然科学版）,2020,59(2):192-197. 被引量：7
2王素,范意兴,郭嘉丰,张儒清,程学旗.基于样本难度的神经机器翻译动态学习方法[J].广西师范大学学报（自然科学版）,2021,39(2):13-20. 被引量：2

二级参考文献1

1李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：106

共引文献7

1王新宇,王宏生.基于深度学习的文本匹配技术的研究综述[J].信息与电脑,2020,32(15):73-74. 被引量：1
2杨娇.基于句子级上下文内容的神经机器翻译方法[J].计算机测量与控制,2021,29(1):194-199. 被引量：4
3文丽颖.无监督学习的多语言神经机器翻译模型[J].电子设计工程,2021,29(20):48-51. 被引量：5
4杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：3
5朱亚辉.基于单语语料库和无监督学习的翻译系统研究[J].自动化与仪器仪表,2022(10):161-165. 被引量：1
6陈银娣,王秀珍.利用人工智能技术提升机器翻译质量的方法应用[J].中华医学图书情报杂志,2022,31(7):64-71. 被引量：1
7尚春磊,李颖俊,张璐.基于数据挖掘的自动化翻译系统优化设计研究与应用[J].自动化与仪器仪表,2023(8):273-276.

同被引文献12

1熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
2葛君伟,涂兆昊,方义秋.基于融合CNN和Transformer的分离结构机器翻译模型[J].计算机应用研究,2022,39(2):432-435. 被引量：7
3苗国义,刘明童,陈钰枫,徐金安,张玉洁,冯文贺.融合小句对齐知识的汉英神经机器翻译[J].北京大学学报（自然科学版）,2022,58(1):61-68. 被引量：5
4薛擎天,李军辉,贡正仙,徐东钦.基于预训练的无监督神经机器翻译模型研究[J].计算机工程与科学,2022,44(4):730-736. 被引量：9
5胡章芳,蹇芳,唐珊珊,明子平,姜博文.DFSMN-T:结合强语言模型Transformer的中文语音识别[J].计算机工程与应用,2022,58(9):187-194. 被引量：10
6阿里木·赛买提,斯拉吉艾合麦提·如则麦麦提,麦合甫热提,艾山·吾买尔,吾守尔·斯拉木,吐尔根·依不拉音.神经机器翻译面对句长敏感问题的研究[J].计算机工程与应用,2022,58(9):195-200. 被引量：1
7于志强,余正涛,黄于欣,郭军军,高盛祥.基于变分信息瓶颈的半监督神经机器翻译[J].自动化学报,2022,48(7):1678-1689. 被引量：5
8王煦,贾浩,季佰军,段湘煜.基于词典模型融合的神经机器翻译[J].计算机工程与科学,2022,44(8):1481-1487. 被引量：3
9席红旗,蒋亚平.基于动态词汇编码的树形神经机器翻译[J].计算机工程与设计,2022,43(9):2678-2685. 被引量：4
10李治瑾,赖华,文永华,高盛祥.融合双向依存自注意力机制的神经机器翻译[J].计算机应用,2022,42(12):3679-3685. 被引量：5

引证文献1

1白雯.融合跨语言记忆网络与语义信息的神经机器翻译系统架构设计研究[J].自动化与仪器仪表,2024(5):178-181.

1屈鸿伟,花良发,王志会,胡忠明.基层雷达站整体训练存在的问题及对策探讨[J].空军预警学院学报,2021,35(5):388-390. 被引量：2
2李露琪,刘燕,侯丽.基于对抗神经网络的突发公共卫生事件虚假新闻检测[J].中华医学图书情报杂志,2021,30(7):1-9. 被引量：1
3刘创,熊德意.多语言问答研究综述[J].计算机科学,2022,49(1):65-72.
4邢杰,黄静怡.卢曼社会系统论视阈下翻译系统定位再探[J].中国翻译,2021,42(6):15-22. 被引量：2
5银晴,田静,苏新春.语言何以助力乡村振兴[J].语言战略研究,2022,7(1):25-35. 被引量：39
6胡庚申.以“生”为本的向“生”译道--生态翻译学的哲学“三问”审视[J].中国翻译,2021,42(6):5-14. 被引量：38
7邹丽,孙健,刘卓娅,陈凤萍,程郁离.小学生语言发育影响因素与汉语阅读障碍的关联[J].中国学校卫生,2021,42(12):1903-1906. 被引量：1
8尹小艳,潘铭樱.奇异值分解教学中的若干问题及注记[J].大学数学,2021,37(6):72-77.
9卢文锋,佀同光,韩国勇.基于稀疏表示和低秩矩阵逼近的图像去噪算法的研究[J].首都师范大学学报（自然科学版）,2022,43(1):19-23. 被引量：1
10谢冰欣.中文电影片名与字幕的翻译——以《我和我的祖国》为例[J].课程教育研究,2021(24):71-72.

计算机科学

2022年第1期

浏览历史

内容加载中请稍等...

基于语种关联度课程学习的多语言神经机器翻译被引量：1

参考文献2

二级参考文献1

共引文献7

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语种关联度课程学习的多语言神经机器翻译 被引量：1

参考文献2

二级参考文献1

共引文献7

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语种关联度课程学习的多语言神经机器翻译被引量：1