-
题名基于熵模型的英汉人名对齐
被引量:1
- 1
-
-
作者
刘颖
曹项
-
机构
清华大学中文系
-
出处
《中文信息学报》
CSCD
北大核心
2016年第3期52-59,共8页
-
基金
国家自然科学基金(61171114)
教育部自主科研项目(20111081010)
教育部回国人员启动项目(20101021603)
-
文摘
该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。
-
关键词
人名对齐
熵模型
音译相似度
最小编辑距离
词典
-
Keywords
person name alignment
entropy model
transliteration similarity
minimum edit distance
dictionary
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络搜索的英汉人名翻译
- 2
-
-
作者
刘颖
曹项
-
机构
清华大学中文系
-
出处
《中文信息学报》
CSCD
北大核心
2017年第2期49-54,共6页
-
基金
国家自然科学基金(61171114)
北京市社科基金(16YYB021)
清华大学人文社科振兴基金(20145081042)
-
文摘
该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规则和英文人名的发音音节长度结合起来提取翻译候选词。翻译辅助词有助于搜索与英文人名更相关的信息,英中人名共现规则和发音音节长度进一步缩小英文人名的翻译范围,使得英文人名的翻译搜索符合人名共现规律和发音规律。然后,根据音译相似度和翻译概率对候选词进行排序。人名翻译的绝大部分是根据发音翻译过来的,音译相似度是帮助判断两个词在发音上的相似性。翻译概率从统计上判断两个词互为翻译的可能性。实验结果表明,翻译辅助词、规则、音译相似度和翻译概率都有助于提高人名翻译的正确率。
-
关键词
人名翻译
音译相似度
规则
翻译概率
-
Keywords
name translation
transliteration similarity
rule
translation probability
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-