期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于锚点词对的双语词对齐算法 被引量:10
1
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 王建德 《小型微型计算机系统》 CSCD 北大核心 2006年第2期330-334,共5页
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要... 双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求. 展开更多
关键词 自然语言处理 语词对齐 语料 锚点词对
下载PDF
一种高效的基于启发式规则和词典相结合的双语词对齐方法 被引量:2
2
作者 任志敏 蔡东风 尹宝生 《沈阳航空工业学院学报》 2010年第5期73-77,共5页
双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法... 双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法,该方法充分利用现有资源,同时考虑到了后续的应用问题。实验表明,该方法在训练语料规模较小的情况下,取得了较好的对齐结果。 展开更多
关键词 自然语言处理 语词对齐 锚点 启发式规则 高效
下载PDF
嵌入式多语言模板翻译引擎的设计与实现
3
作者 马建敏 《内蒙古科技与经济》 2007年第10S期71-72,74,共3页
文章认为,随着全球化经济的发展,国际间交往和合作日益增多,语言障碍是亟待解决的问题。嵌入式设备的方便灵活性,使得越来越多的人们希望携带便利的手持设备,便可以很自由的与世界各国的人们进行交流。本文介绍了一种将翻译技术应用于... 文章认为,随着全球化经济的发展,国际间交往和合作日益增多,语言障碍是亟待解决的问题。嵌入式设备的方便灵活性,使得越来越多的人们希望携带便利的手持设备,便可以很自由的与世界各国的人们进行交流。本文介绍了一种将翻译技术应用于手持设备(如PDA,Smartphone等)的翻译引擎的设计与实现,阐述了该引擎的架构,应用的中文分词算法和双语词对齐算法。 展开更多
关键词 翻译模板 中文分词 语词对齐
下载PDF
融合句法特征的汉-老双语词语对齐算法研究
4
作者 李思卓 周兰江 +1 位作者 周枫 郭剑毅 《软件导刊》 2018年第4期9-12,共4页
词语对齐技术一直是自然语言处理的基础问题。为实现汉―老双语自动词对齐,首先对老挝语存在的修饰词与中心词顺序倒置、结构和位置上的差异性等特征进行了分析,通过分析筛选出一些汉―老双语特征并将这些特征融合,对其构建特征函数,以... 词语对齐技术一直是自然语言处理的基础问题。为实现汉―老双语自动词对齐,首先对老挝语存在的修饰词与中心词顺序倒置、结构和位置上的差异性等特征进行了分析,通过分析筛选出一些汉―老双语特征并将这些特征融合,对其构建特征函数,以最小错误率算法为条件,在对数线性模型框架下训练模型参数,将IBM3模型作为基础比较模型,通过逐步添加特征函数从而实现与基础模型的对比。实验证明,该方法可有效提高汉-老双语词对齐质量。 展开更多
关键词 汉―老语词对齐 特征函数 最小错误率算法 对数线性模型 IBM3模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部