摘要
互联网Web2.0技术的不断发展促进了以"用户制造"为中心的新一代网络出版载体的发展,维基类百科全书也应运而生。从维基类百科出现开始,维基类百科崇尚自由、开放、共享的精神受到互联网用户的关注。时至今日,维基类百科已经成为了最具活力、影响力最大、传播效力最广的网络出版类型之一。例如维基百科,百度百科,互动百科。维基类百科自身数据间的关系链接为语义网应用服务的发展提供了可能。然而维基类百科编辑者们在编辑词条时并未对一些实体提供语义标注,这导致维基类百科数据间实体关系链接的缺失。本文在前人实体链接技术的基础上,提出了针对百度百科等中文知识百科自动化建立实体链接的方法并建立可信赖的链接。首先识别信息框和正文中的所有实体,然后为每一个实体建立候选匹配表,之后计算一系列的特征值,并通过机器学习方法确定特征值之间的权重,最终选出最佳匹配,建立链接。本文选取百度百科作为数据源,实验结果证明本文的方法可以高效地发现缺失的关系。
出处
《电子技术与软件工程》
2015年第18期170-173,共4页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING