-
题名藏族人名汉译名识别研究
被引量:3
- 1
-
-
作者
罗镭贾
宋柔
朱小杰
-
机构
北京语言大学语言信息处理研究所
-
出处
《情报学报》
CSSCI
北大核心
2009年第3期475-480,共6页
-
基金
基金项目:本文得到国家自然科学基金(60572159)、教育部科学技术研究重点项目(107017)的资助.
-
文摘
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊。本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库 通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统。真实语料库开放测试F值达到87.12%。
-
关键词
藏族人名识别
未登录词
可信度
自动分词
-
Keywords
recognition of Tibetan names, out-of-vocabulary words, reliability, segmentation
-
分类号
H315.9
[语言文字—英语]
TP391.41
[自动化与计算机技术—计算机应用技术]
-