期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于汉维医疗平行语料的双语术语抽取研究 被引量:5
1
作者 于清 常乐 +2 位作者 徐健 刘天毅 LI Xiao-long 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2018年第5期528-533,共6页
为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人... 为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为27.28%;实验结果表明,新方法更需要大量平行语料支持,但是两种方法都有助于提高汉维医学领域机器翻译质量,使提取和翻译大量医学术语自动化. 展开更多
关键词 双语术语抽取 词向量 机器翻译 平行语料库 GIZA++
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部