从粗粒度到细粒度的神经机器翻译系统推断加速方法被引量：7

Inference acceleration method of neural machine translation system based on coarse-to-fine

下载PDF

导出

摘要近年来,Transformer模型中多层注意力网络的使用有效提升了翻译模型的译文质量,但同时大量注意力操作的使用也导致模型整体的推断效率相对较低.基于此,提出了从粗粒度到细粒度(coarse-to-fine,CTF)的方法,根据注意力权重中的信息量差异对信息表示进行细粒度压缩,最终达到加速推断的目的.实验发现,在NIST中英和WMT英德翻译任务上,该方法在保证模型性能的同时,推断速度分别提升了13.9%和12.8%.此外,还进一步分析了注意力操作在不同表示粒度下的信息量差异,对该方法的合理性提供支持. In recent years,Transformer system has effectively improved the translation quality of the translation model through the introduction of multi-layer attention network.At the same time,the use of a large number of attention operations has also led to low overall inference efficiencies of the model.In order to solve this problem,we propose a method based on coarse-to-fine algorithm,which compresses the information representation according to the difference of the amount of information in the attention weight,and finally achieves the purpose of accelerating decoding.Experimental results show that,on the Chinese-English translation task of NIST and the English-German translation task of WMT,the inference speed of this method can be improved by 13.9%and 12.8%respectively on the premise of ensuring the performance of the model.At the same time,we further analyze the information difference of attention operation under different representation granularity,which provides support for the rationality of coarse-to-fine method.

作者张裕浩许诺李垠桥肖桐朱靖波 ZHANG Yuhao;XU Nuo;LI Yinqiao;XIAO Tong;ZHU Jingbo(Natural Language Processing Laboratory,Northeastern University,Shenyang 110819,China;Shenyang Yatrans Network Technology Co.,Ltd.,Shenyang 110004,China)

机构地区东北大学自然语言处理实验室沈阳雅译网络技术有限公司

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2020年第2期175-184,共10页 Journal of Xiamen University：Natural Science

基金国家自然科学基金重点项目(61732005,61432013) 国家重点研发计划(2019QY1801) 国家自然科学基金(61876035) 网络文化与数字传播北京市重点实验室开放课题。

关键词神经机器翻译模型加速从粗粒度到细粒度 neural machine translation inference acceleration coarse-to-fine

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献61

1张培,张旭,熊德意.基于补全信息的篇章级神经机器翻译[J].中文信息学报,2020(7):60-67. 被引量：1
2曹骞,熊德意.基于数据扩充的翻译记忆库与神经机器翻译融合方法[J].中文信息学报,2020(5):36-43. 被引量：6
3明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
4任众,侯宏旭,武静,王洪彬,李金廷,樊文婷,申志鹏.基于统计和神经网络的蒙汉机器翻译研究[J].中文信息学报,2018,32(11):1-7. 被引量：6
5王长胜,刘群.基于实例的汉英机器翻译系统研究与实现[J].计算机工程与应用,2002,38(8):126-127. 被引量：13
6张婷婷.基于语义规则的词义消歧方法的研究[J].数码世界,2017,0(3):131-132. 被引量：2
7杨陟卓.基于上下文翻译的有监督词义消歧研究[J].计算机科学,2017,44(4):252-255. 被引量：11
8罗霞.海量互联网数据中英语翻译术语高效搜索系统设计[J].现代电子技术,2017,40(13):134-136. 被引量：6
9曾柏羲,宋鸿陟,司国东.基于B/S结构的多终端交互式幻灯片演示系统[J].现代电子技术,2018,41(4):18-22. 被引量：5
10余倩.基于特征提取算法的交互式英汉翻译系统设计[J].现代电子技术,2018,41(4):161-163. 被引量：9

引证文献7

1林睿睿,黄锦桥.基于B/S框架的交互式在线翻译系统设计[J].现代电子技术,2021,44(9):115-119. 被引量：13
2吕洋,张静,华芳.基于数据挖掘算法的汉英机器翻译二元语义模式规则[J].微型电脑应用,2021,37(11):19-21. 被引量：3
3张启振,孙先洪.基于B/S框架的交互式英汉机器翻译系统设计[J].现代电子技术,2021,44(24):69-73. 被引量：9
4尹天涯.基于BP神经网络的机器翻译自动化评判模型研究[J].自动化与仪器仪表,2022(2):167-171. 被引量：2
5郭慧骏.基于人工智能技术和语音识别的机器同步翻译系统[J].现代电子技术,2022,45(9):152-156. 被引量：13
6赵崇俊.基于CNN的英语机器翻译微小误差检测系统设计[J].自动化与仪器仪表,2022(4):210-213. 被引量：5
7孙静.基于B/S结构的交互式英语翻译系统设计和实现[J].信息与电脑,2022,34(16):128-130.

二级引证文献43

1赵崇俊.基于Spark的大规模机器翻译系统研究[J].自动化与仪器仪表,2022(3):73-77. 被引量：3
2王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
3付敏.基于特征提取的英汉机器自动转换翻译系统设计[J].自动化与仪器仪表,2022(5):166-169. 被引量：1
4王景兰,方晓.基于层次频繁模式树的数据自动挖掘算法[J].上海电机学院学报,2022,25(4):239-242. 被引量：2
5刘渝.基于移动云计算模式的英语地名机器翻译系统设计[J].自动化与仪器仪表,2022(8):240-244. 被引量：1
6洪育坤,陈燕,邓翔宇,陈科亨,王静.智能玩具车语音控制系统设计[J].电子设计工程,2022,30(19):159-163. 被引量：3
7宋梦媛.一种基于多任务CNN的多模态人脸识别模型[J].云南师范大学学报（自然科学版）,2022,42(5):47-52. 被引量：2
8左广明,胡庭树.基于语音识别的英语翻译器设计研究[J].自动化与仪器仪表,2022(9):106-109. 被引量：2
9向成洪,黄小燕.基于数据挖掘算法的英语发音机器质量自动评估系统[J].自动化与仪器仪表,2022(9):147-151. 被引量：1
10王国英.基于多粒度与动态词向量的机器翻译关键技术研究[J].自动化与仪器仪表,2022(9):181-185. 被引量：1

1柴欣欣.用自拟的温中舒肝健脾汤治疗胃溃疡的效果研究[J].当代医药论丛,2019,17(20):166-167. 被引量：4
2张鑫,程华,房一泉.基于Transformer的DGA域名检测方法[J].计算机工程与科学,2020,42(3):411-417. 被引量：4
3陈珂,谢博,朱兴统.基于情感词典和Transformer模型的情感分析算法研究[J].南京邮电大学学报（自然科学版）,2020,40(1):55-62. 被引量：13
4于玲,张喜文,张清,仲玉芳,李春.智能手环对心衰患者康复运动依从性及预后的影响研究[J].中国数字医学,2019,14(12):33-35. 被引量：10
5叶鹏飞.一种针对大规模CGRA的编译器后端设计[J].现代计算机,2020,26(6):3-6.
6Jing Qiu,Yan Liu,Yuhan Chai,Yaqi Si,Shen Su,Le Wang,Yue Wu.Dependency-Based Local Attention Approach to Neural Machine Translation[J].Computers, Materials & Continua,2019(5):547-562. 被引量：2
7薛擎天,李军辉,贡正仙.多语言的无监督神经机器翻译[J].厦门大学学报（自然科学版）,2020,59(2):192-197. 被引量：7
8刘晓峰.《富国策》译者及翻译模式重考——兼与张登德等先生商榷[J].中国翻译,2020,41(1):145-150.
9宋炎侃,陈颖,于智同,刘正元,黄少伟,苏大威,徐春雷.基于同构有向图的电网多场景仿真GPU批量并行加速方法[J].电工电能新技术,2020,39(3):17-23. 被引量：8
10高晶,杨琼玉,冯耀恒,毛润乾.nC22矿物油及其与吡虫啉混用对柑橘木虱的室内毒力评价[J].昆虫学报,2020,63(2):191-198. 被引量：8

厦门大学学报（自然科学版）

2020年第2期

浏览历史

内容加载中请稍等...

从粗粒度到细粒度的神经机器翻译系统推断加速方法被引量：7

同被引文献61

引证文献7

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

从粗粒度到细粒度的神经机器翻译系统推断加速方法 被引量：7

同被引文献61

引证文献7

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

从粗粒度到细粒度的神经机器翻译系统推断加速方法被引量：7