-
题名基于上下文翻译的有监督词义消歧研究
被引量:11
- 1
-
-
作者
杨陟卓
-
机构
山西大学计算机科学与信息技术学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第4期252-255,280,共5页
-
基金
国家自然科学基金项目(61502287)
山西省高校科技创新项目(2015105)
国家863计划项目(2015AA015407)资助
-
文摘
针对目前有监督词义消歧方法存在的数据稀疏问题,提出一种基于上下文翻译的词义消歧方法。该方法假设由歧义词上下文的译文所组成的语境与原上下文语境所表述的意义相似。根据此假设,首先,将译文所组成的上下文生成大量的伪训练语料;然后,利用真实训练语料和伪训练语料训练一个贝叶斯消歧模型;最后,利用该消歧模型决策歧义词的词义。实验结果表明,与传统的消歧方法相比,所提出的方法消歧准确率提高了4.35%,并且超过了参加SemEval-2007测评的最好的有监督消歧系统。
-
关键词
词义消歧
上下文扩充
机器翻译
伪训练语料
贝叶斯模型
-
Keywords
Data sparseness
Context expansion
Machine translation
Pseudo training data
Bayesian model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-