基于改进seq2seq模型的英汉翻译研究被引量：19

English-Chinese translation based on an improved seq2seq model

下载PDF

导出

摘要目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型—seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理和嵌入层参数初始化方法,并改进seq2seq模型结构,在编码器和解码器之间添加一层用于语法变化的转换层。通过预处理,能缩减翻译模型的参数规模和训练时间20%,且翻译性能提高0.4BLEU。使用转换层的seq2seq模型在翻译性能上提升0.7~1.0BLEU。实验表明,在规模大小不同的语料英汉翻译任务中,该模型与现有的基于注意力机制的seq2seq主流模型相比,训练时长一致,性能提高了1~2BLEU。 Current machine translation systems optimize and evaluate the translation process in Indo-European languages to enhance translation accuracy.But researches about Chinese language are few.At present the seq2seq model is the best method in the field of machine translation,which is a neural machine translation model based on the attention mechanism.However,it does not take into account the grammar transformation between different languages.We propose a new optimized English-Chinese translation model.It uses different methods to preprocess texts and initialize embedding layer parameters.Additionally,to improve the seq2seq model structure,a transform layer between the encoder and the decoder is added to deal with grammar transformation problems.Preprocessing can reduce the parameter size and training time of the translation model by 20%,and the translation performance is increased by 0.4 BLEU.The translation performance of the seq2seq model with a transform layer is improved by 0.7 to 1.0 BLEU.Experiments show that compared to the existing seq2seq mainstream model based on the attention mechanism,the training time for English-Chinese translation tasks is the same for corpus of different sizes,but the translation performance of the proposal is improved by 1 to 2 BLEU.

作者肖新凤李石君余伟刘杰刘倍雄 XIAO Xin-feng;LI Shi-jun;YU Wei;LIU Jie;LIU Bei-xiong(Department of Mechanical and Electrical Engineering,Guangdong Polytechnic of Environmental Protection Engineering,Foshan 528216;School of Computer Science,Wuhan University,Wuhan 430079,China)

机构地区广东环境保护工程职业学院机电工程系武汉大学计算机学院

出处《计算机工程与科学》 CSCD 北大核心 2019年第7期1257-1265,共9页 Computer Engineering & Science

基金国家自然科学基金(61502350) 2017广东高校省级重点平台和重大科研项目(2017GKTSCX042)

关键词深度学习神经机器翻译 seq2seq模型注意力机制命名实体识别 deep learning neural machine translation seq2seq model attention mechanism named entity recognition

分类号 H085 [语言文字—语言学]

引文网络
相关文献

参考文献1

1韩冬煦,常宝宝.中文分词模型的领域适应性方法[J].计算机学报,2015,38(2):272-281. 被引量：59

二级参考文献28

1黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249
2Xue Nianwen. Chinese word segmentation as character tagging. Computational Linguistics and Chinese Language Processing, 2003, 8(1): 29-48. 被引量：1
3Feng Haodi, et al. Aecessor variety criteria for Chinese word extraction. Association for Computational Linguistics, 2004, 30(1) : 75-93. 被引量：1
4Feng Haodi, et al. Unsupervised segmentation of Chinese corpus using aceessor variety//Proceedings of the 1st Inter- national Joint Conference on Natural Language Processing. Hainan Island, China, 2004:255-261. 被引量：1
5Huang Degen, Tong Deqin, Luo Yanyan. HMM revises low marginal probability by CRF for Chinese word segmentation //Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing 2010. Beijing, China, 2010:216-220. 被引量：1
6Chang Baobao, Han Dongxu. Enhancing domain portability of Chinese segmentation model using chi-square statistics and bootstrapping//Proceedings of the 2010 Conference on Empirical Methods on Natural Language Processing. Massa- chusetts, USA, 2010: 789-798. 被引量：1
7Shen Jianping, et al. Chinese word segmentation based on mixing multiple preprocessor and CRF//Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing 2010. Beijing, China, 2010:270-273. 被引量：1
8Xu Xiaoming, et al. High OOV-recall Chinese word segmenter //Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing 2010. Beijing, China, 2010:252-255. 被引量：1
9Jiang Huixing, Dong Zhe. An double hidden HMM and an CRF for segmentation tasks with Pinyin's finals//Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing 2010. Beijing, China, 2010:277-281. 被引量：1
10Wang Kun, et al. A characte:based joint model for CIPS SIGHAN word segmentation Bakeoff 2010//Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing 2010. Beijing, China, 2010:245-248. 被引量：1

共引文献58

1李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
2丁洁.基于Lucene的中文分词系统设计与实现[J].自动化与仪器仪表,2016(5):208-210. 被引量：5
3丁洁.基于最佳粒度匹配的中文分词算法的研究[J].自动化与仪器仪表,2016(7):169-170. 被引量：1
4黄水清,王东波,何琳.以《汉学引得丛刊》为领域词表的先秦典籍自动分词探讨[J].图书情报工作,2015,59(11):127-133. 被引量：21
5黄鹏,张姝,陈玉华,文斌.一种基于无监督学习的交集型歧义处理改进方法[J].云南师范大学学报（自然科学版）,2015,35(6):45-49. 被引量：1
6陆钊.内容管理系统的文章关键词提取组件分析与优化[J].玉林师范学院学报,2015,36(5):135-141. 被引量：3
7杨进才,陈忠忠,谢芳,胡金柱.基于汉语拼音首字母索引的混合分词算法[J].计算机系统应用,2016,25(4):221-225. 被引量：1
8梁礼铿,黎敬波.基于最大概率法探讨中医症状信息提取与标准化[J].中华中医药杂志,2017,32(5):2159-2162. 被引量：5
9徐宏博,赵文涛,孟令军.一种基于MapReduce的改进文本输入方式的并行分词方法研究[J].电脑知识与技术,2016,0(8):171-175.
10孟繁疆,姬祥,袁琦,刘东,侯哲鹏.农产品价格主题搜索引擎的研究与实现[J].东北农业大学学报,2016,47(9):64-71. 被引量：6

同被引文献178

1徐林明,李美娟.动态综合评价中的数据预处理方法研究[J].中国管理科学,2020,0(1):162-169. 被引量：50
2张阔,陈莹,刘丹.基于深度学习的胎心监护对胎儿窘迫风险的识别分析[J].中国数字医学,2021,16(10):86-92. 被引量：5
3王晨,李春晓,杨郁青.基于电子病历后结构化技术的辅助诊疗应用研究[J].中国数字医学,2021,16(6):48-52. 被引量：11
4谭咏梅,王枞,王小捷,钟义信.基于实例的机器辅助写作翻译系统[J].北京邮电大学学报,2006,29(z2):202-206. 被引量：1
5杨惠中.语料库语言学与机器翻译[J].上海交通大学学报（哲学社会科学版）,1993,1(1):98-111. 被引量：25
6刘群.机器翻译技术现状与展望[J].集成技术,2012,1(1):48-54. 被引量：16
7梁三云.机器翻译与计算机辅助翻译比较分析[J].外语电化教学,2004(6):42-45. 被引量：43
8胡清平.机器翻译中的受控语言[J].中国科技翻译,2005,18(3):24-27. 被引量：14
9刘群.机器翻译研究新进展[J].当代语言学,2009,11(2):147-158. 被引量：42
10林丽惠,冯少荣.领航计划报预处理方法探讨[J].计算机与现代化,2010(9):147-151. 被引量：1

引证文献19

1黎亚飞,张瑞华.机器翻译发展与现状[J].中国轻工教育,2019,0(5):38-45. 被引量：4
2杜刚,朱艳云,张晨,杜雪涛.变体垃圾短信翻译技术研究[J].电信工程技术与标准化,2020,33(7):83-88. 被引量：1
3姚兰.基于改进短语翻译模型的计算机智能化校对系统研究[J].电子设计工程,2020,28(18):52-55. 被引量：10
4李强,杨红雨,刘洪,武喜萍,胡浩亮.基于seq2seq模型的民航报文智能纠错研究[J].长江信息通信,2021(2):29-31. 被引量：2
5陈敏.基于句法的神经机器英语翻译研究[J].电子设计工程,2021,29(10):24-27. 被引量：3
6陈家乐,张艳玲.计算机算法类资料的中英文智能翻译[J].计算机技术与发展,2021,31(7):176-181. 被引量：2
7宋晓焕,梁金伟,刘晓连.基于改进GLR算法的英语翻译智能识别模型设计[J].电子设计工程,2021,29(19):64-68. 被引量：2
8张启振,孙先洪.基于B/S框架的交互式英汉机器翻译系统设计[J].现代电子技术,2021,44(24):69-73. 被引量：9
9张超轶,陈媛,张聚伟.融合术语信息的神经机器翻译参数初始化研究[J].河南科技大学学报（自然科学版）,2022,43(4):61-66. 被引量：1
10李冬艳.基于人机交互的自动化英汉翻译系统设计[J].自动化与仪器仪表,2022(6):181-185.

二级引证文献44

1成洁.汉英机器翻译中从句复杂度的错误分析[J].微型电脑应用,2020,36(9):51-53. 被引量：3
2刘艳茹.智能化计算机网络监控系统设计[J].技术与教育,2020,34(3):24-26.
3尹锋林,赵旖鑫.挑战与应对:机器翻译的发展与翻译权行使的未来[J].科技与法律（中英文）,2021(3):45-54. 被引量：4
4黄钧妍,邓美宝,黄家敏,梁绮琳,孔海晴,杨曙.机器翻译与人工翻译对比研究——以《围城》中词语的评价意义为例[J].海外英语,2021(20):6-9. 被引量：1
5王小迁.基于计算机智能的英语译文语境化自动校准系统[J].微型电脑应用,2021,37(11):158-160. 被引量：2
6褚喜之,侯维刚.基于约束优化的神经机器翻译系统研究[J].自动化与仪器仪表,2021(11):120-122. 被引量：4
7赵石楠,杜文.基于改进短语翻译模型的外语数据库智能校对系统[J].自动化与仪器仪表,2022(2):90-93. 被引量：5
8王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
9李静.基于人工智能技术的计算机辅助翻译软件设计[J].信息技术与信息化,2022(3):70-73. 被引量：5
10张晨,杜刚,朱艳云,杜雪涛.5G环境下新型内容管控策略模型研究[J].电信工程技术与标准化,2022,35(5):22-26.

1顾凌云.基于多注意力的中文命名实体识别[J].信息与电脑,2019,0(9):41-44.
2徐凯,王崎,康培培,李振彰,刘文印.基于注意力迭代扩张卷积网络的医学实体识别[J].现代计算机,2019,25(16):3-6.
3吴凯,杨军,陈拥军.浅析解码器终端的节能降耗[J].数码世界,2019,0(6):60-60.
4裴于兵.认知语言学在英语翻译领域的现状与启示[J].新一代（理论版）,2019,0(8):27-27.
5宋慧姝.浅谈能源互利网中的系统模型构建[J].科技风,2019(16):92-92.
6罗钰敏,刘丹,尹凯,赵宏森.加权平均Word2Vec实体对齐方法[J].计算机工程与设计,2019,40(7):1927-1933. 被引量：6
7张晓孪,王西锋.基于语义的Web招聘信息抽取关键技术的研究[J].微型电脑应用,2019,35(6):69-70. 被引量：2
8陈文瑞,姜开,杨春雷.结构化知识库构建技术研究[J].航天工业管理,2019,0(4):21-24.
9林亦修.论温州杨府侯王信俗文化研究的意义[J].非物质文化遗产研究集刊,2012(1):26-33. 被引量：1
10陈佳沣,滕冲.基于强化学习的实体关系联合抽取模型[J].计算机应用,2019,39(7):1918-1924. 被引量：7

计算机工程与科学

2019年第7期

浏览历史

内容加载中请稍等...

基于改进seq2seq模型的英汉翻译研究被引量：19

参考文献1

二级参考文献28

共引文献58

同被引文献178

引证文献19

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于改进seq2seq模型的英汉翻译研究 被引量：19

参考文献1

二级参考文献28

共引文献58

同被引文献178

引证文献19

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于改进seq2seq模型的英汉翻译研究被引量：19