-
题名基于多步聚类的汉语命名实体识别和歧义消解
被引量:17
- 1
-
-
作者
李广一
王厚峰
-
机构
北京大学计算语言学教育部重点实验室
北京大学计算语言学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2013年第5期29-34,42,共7页
-
基金
国家社科基金重大资助项目(12&ZD227)
国家863计划资助项目(2012AA0111101)
国家自然科学基金资助项目(91024009)
-
文摘
命名实体识别和歧义消解是自然语言理解的重要研究内容。针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法。首先通过两轮聚类将命名实体与知识库实体定义链接,然后通过层次聚合式聚类对知识库中未出现的实体进行聚类,最后进行普通词的识别和基于K-Means聚类的结果调整。在CLP-2012的汉语命名实体识别和歧义消解评测数据上的实验表明,该文的方法表现出良好的性能,在测试集上的F值高出评测参赛队伍最好水平6.46%,达到86.68%。
-
关键词
命名实体识别
命名实体消歧
聚类
-
Keywords
named entity recognition
name entity disambiguation
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于融合特征相似度的实体消歧方法研究
被引量:7
- 2
-
-
作者
张雄
陈福才
黄瑞阳
-
机构
国家数字交换系统工程技术研究中心
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第2期347-350,396,共5页
-
基金
国家自然科学基金资助项目(61171108)
国家"973"计划资助项目(2012CB315901
+1 种基金
2012CB315905)
国家科技支撑计划资助项目(2014BAH30B01)
-
文摘
在数字资源日益丰富的环境下,人名歧义现象为数据检索带来了很多不确定性,降低了数据检索的准确度。运用人名实体的个人信息特征和作者文献话题等特征,采用多特征的融合方法充分挖掘与实体相关联的信息,实现人名消歧。实验使用爬取的某数据库文献数据,进行了人名消歧特征的选取和参数的确定等实验,结果表明提出的方法具有较好的性能。
-
关键词
实体特征
主题信息
特征相似度
人名消歧
-
Keywords
entity characteristics
topic information
features similarity
personal name entity disambiguation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-