期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

语料循环推进低资源神经机器翻译被引量：1

Boost Corpus for Low-Resource Neural Machine Translation

下载PDF

导出

摘要双语句对资源稀缺导致一些基于深度学习的机器翻译算法无法在低资源机器翻译中取得更优的性能。因此该文针对低资源机器翻译中语言资源建设问题,提出语料循环推进思想,设计了多趟循环框架和半监督算法。这种框架是与具体机器翻译算法无关的元框架。而这种算法充分利用适当规模的双语种子资源和超大规模单语资源增量扩建双语句对资源,逐级训练机器翻译模型提高译文质量。多个语种的神经机器翻译实验结果证明,该文提出的语料循环推进能够利用源源不断的单语资源自我进化。其有效性不仅体现在易于实现高性能低资源机器翻译,更体现在是快速搭建精准领域机器翻译系统的实用选项。 The scarcity of bilingual sentence pair resources prevents neural machine translation algorithms from better performance.To deal with the problem of language resource construction in low-resource machine translation,this paper proposes a corpus boosting strategy in a multi-loop framework and a semi-supervised algorithm.This framework is a meta-framework independent of specific machine translation algorithms.This algorithm makes full use of bilingual seed resources and large-scale monolingual resources to incrementally expand bilingual sentence pair resources.The experimental results of neural machine translation in multiple languages prove that our method can use a steady stream of monolingual resources to self-evolve.

作者刘伍颖王琳 LIU Wuying;WANG Lin(Center for Lingnistics and Applied Linguistics,Guangdong University of Foreign Studies,Guangzhou,Guangdong 510-120,China;Xianda College of Economics and Humanities,Shanghai International Studies University,Shanghai 200083,China)

机构地区广东外语外贸大学外国语言学及应用语言学研究中心上海外国语大学贤达经济人文学院

出处《中文信息学报》 CSCD 北大核心 2023年第6期89-95,共7页 Journal of Chinese Information Processing

基金教育部人文社会科学研究规划基金(20YJAZH069) 上海市哲学社会科学“十三五”规划课题(2019BYY028) 教育部人文社会科学研究青年基金(20YJC740062) 广州市科技计划项目(202201010061)。

关键词语料循环推进机器翻译低资源语言半监督学习增量学习 corpus boosting machine translation low-resource language semi-supervised learning incremental learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1胡开宝,田绪军.语言智能背景下的MTI人才培养:挑战、对策与前景[J].外语界,2020(2):59-64. 被引量：28
2赵会军,林国滨.机器翻译智能化的语言学路径研究[J].外语电化教学,2020(2):42-47. 被引量：8
3冯志伟.罗塞塔石碑与机器翻译[J].外语学刊,2020,0(1):1-17. 被引量：6

二级参考文献26

1贺学耘,陈溪辉.语境分析:机器翻译不可忽视的因素[J].外语与外语教学,2007(4):51-53. 被引量：13
2李学宁,董剑桥.韩礼德的机器翻译思想初探[J].中国外语,2012,9(3):90-93. 被引量：8
3赵会军.双关语语用翻译量化模型[J].外语研究,2012,29(5):72-76. 被引量：9
4冯志伟.《统计机器翻译》述评[J].外语教学与研究,2013,45(4):629-633. 被引量：8
5冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018,41(6):35-48. 被引量：83
6仲伟合.我国翻译专业教育的问题与对策[J].中国翻译,2014,35(4):40-44. 被引量：148
7冯全功,张慧玉.全球语言服务行业背景下译后编辑者培养研究[J].外语界,2015(1):65-72. 被引量：44
8王克非,秦洪武.论平行语料库在翻译教学中的应用[J].外语教学与研究,2015,47(5):763-772. 被引量：92
9冯志伟.基于短语和句法的统计机器翻译[J].燕山大学学报,2015,39(6):546-554. 被引量：20
10朱一凡,王金波,杨小虎.语料库与译者培养:探索与展望[J].外语教学,2016,37(4):91-95. 被引量：15

共引文献38

1卢茜.计算机辅助翻译重构高职院校英语教育发展理念[J].司法警官职业教育研究,2020(4):85-90. 被引量：2
2韩子满,徐珊珊.面向翻译工程师培养的翻译工程教育探索[J].外语界,2023(6):40-46.
3王宪,王清怡.论翻译硕士(MTI)的"专业性"特征[J].东方翻译,2020(5):26-29.
4孔莹.语音识别技术在口译实战中的应用[J].科技视界,2020(33):51-52. 被引量：1
5冯志伟,李颖.自然语言处理中的预训练范式[J].外语研究,2021,38(1):1-14. 被引量：14
6孙李丽,郭琳,文旭,张文诺.基于双向GRU神经机器模型的乡土小说翻译方法[J].计算机与现代化,2021(4):27-31. 被引量：1
7秦殿启.论智慧图书馆时代情报语言的发展趋势[J].情报杂志,2021,40(5):100-103. 被引量：5
8王华树,李莹.新时代我国翻译技术教学研究:问题与对策——基于《翻译专业本科教学指南》的思考[J].外语界,2021(3):13-21. 被引量：29
9彭炳,胡景谱,刘怀远.人工智能背景下人类译者在翻译行业中的SWOT分析[J].长沙大学学报,2021,35(6):93-98. 被引量：5
10胡开宝,王晓莉.语言智能视域下外语教育的发展——问题与路径[J].中国外语,2021,18(6):4-9. 被引量：14

同被引文献11

1吕欣,程雨夏.基于语义相似度与XGBoost算法的英语作文智能评价框架研究[J].浙江大学学报（理学版）,2020,47(3):329-336. 被引量：11
2杨云,王全.EM算法在神经机器翻译模型中的应用研究[J].计算机应用与软件,2020,37(8):250-255. 被引量：3
3头旦才让,仁青东主,尼玛扎西,于永斌,邓权芯.基于改进字节对编码的汉藏机器翻译研究[J].电子科技大学学报,2021,50(2):249-255. 被引量：12
4范洪博,郑棋.多机制合并注意力的多路径神经机器翻译方法[J].光电子．激光,2021,32(5):491-498. 被引量：4
5周小诗,张梓葳,文娟.基于神经网络机器翻译的自然语言信息隐藏[J].计算机科学,2021,48(S02):557-564. 被引量：4
6王琳,刘伍颖.基于集成机器翻译的双语平行语料无监督质量评价[J].山西大学学报（自然科学版）,2023,46(3):528-536. 被引量：1
7朱鑫洋,迟呈英,战学刚.基于Transformer的英文粘连词还原方法[J].计算机应用与软件,2023,40(8):45-49. 被引量：1
8王清然,徐珺.新时代翻译教学与翻译人才培养跨学科研究——以商务翻译教学为例[J].中国外语,2023,20(4):28-36. 被引量：5
9郑鑫,陈海龙,马玉群,王青.融合依存句法和LSTM的神经机器翻译模型[J].哈尔滨理工大学学报,2023,28(3):20-27. 被引量：4
10汪浩,李军辉,贡正仙.融合零指代识别的篇章级机器翻译[J].中文信息学报,2023,37(8):25-33. 被引量：1

引证文献1

1雷宏友.融合聚类算法与改进粒子群算法的机器翻译句式一致性研究[J].自动化与仪器仪表,2024(6):179-183.

1李颖.探析西安城市小剧场运营策略[J].大众文艺（学术版）,2023(2):196-198.
2薛俊超.以“三融合”把基层党建沉入社区治理[J].党的生活（江苏）,2023(5):30-30.
3文桂芳.基于学情分析的小学数学精准教学策略研究——以低年级“角的初步认识”为例[J].数学学习与研究,2023(18):126-128. 被引量：1
4张立国,郭春贵,常立春,郭新磊,张涛,武剑,梁建丽,高杰,王晓武.白菜抗根肿病分子标记开发与种质资源鉴定[J].新疆农业科学,2023,60(9):2281-2290.
5郭建强.生的启示和召唤[J].诗刊,2023(17):24-25.
6彭馨乐.适当规模压裂工艺技术的开发与应用[J].化学工程与装备,2023(6):116-119.
7刘洋.高职院校红色文化生态构建的实践探索[J].河北旅游职业学院学报,2023,28(3):88-91.
8葛兰,贾振堂.深浅层特征结合的自监督立体匹配[J].电子测量技术,2023,46(12):143-149. 被引量：1
9李小楠.农业农村现代化背景下土地适度规模经营问题研究[J].中文科技期刊数据库（全文版）社会科学,2023(10):73-76.
10李升波,占国建,蒋宇轩,兰志前,张宇航,邹文俊,陈晨,成波,李克强.类脑学习型自动驾驶决控系统的关键技术[J].汽车工程,2023,45(9):1499-1515. 被引量：3

中文信息学报

2023年第6期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部