-
题名基于锚点词对的双语词对齐算法
被引量:10
- 1
-
-
作者
张孝飞
陈肇雄
黄河燕
王建德
-
机构
中国科学院计算机语言信息工程研究中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2006年第2期330-334,共5页
-
基金
国家自然科学基金项目(60272088
60502048)资助
国家"八六三"计划基金项目(2002AA117010-02)资助
-
文摘
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求.
-
关键词
自然语言处理
双语词对齐
语料
锚点词对
-
Keywords
NLP
bilingual word-alignment
corpora
anchor word-pair
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-