期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多语言专利机器翻译平行语料构建方法研究 被引量:1
1
作者 曹竟成 邬小倩 +2 位作者 王倩 孙小宇 邓汇娟 《中国发明与专利》 2022年第6期70-75,80,共7页
神经网络机器翻译技术本质上是数据驱动型技术,大规模、高质量的语料资源是构建高性能多语种神经网络机器翻译系统的基础条件,语料资源建设至关重要。本文基于现有专利机器翻译引擎训练语料扩充及特定语言方向专利语料资源建设的需求,... 神经网络机器翻译技术本质上是数据驱动型技术,大规模、高质量的语料资源是构建高性能多语种神经网络机器翻译系统的基础条件,语料资源建设至关重要。本文基于现有专利机器翻译引擎训练语料扩充及特定语言方向专利语料资源建设的需求,对基于标准BLEU4算法、基于伪数据构建及基于同族专利数据进行多语言专利平行语料构建的方法分别进行研究,并分析总结不同的专利平行语料构建方法的优劣及各自的适用场景,以期探索多语言专利平行语料构建的可靠方案,有效扩充现有专利语料资源。 展开更多
关键词 多语言平行语料构建 中间语言匹配 标准bleu4算法 伪数据构建 同族专利
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部