期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
专利发明人英文重名识别判据及效度比较分析 被引量:5
1
作者 王道仁 杨冠灿 傅俊英 《数字图书馆论坛》 CSSCI 2016年第8期2-9,共8页
本文针对英文专利发明人姓名的字符串匹配问题,利用USPTO发明人姓名的数据集,探索现有字符串匹配算法的适用性。对指向同一发明人不能精确匹配的姓名字符串,分别用10种常用的字符串匹配算法进行处理。比较匹配结果发现:Jaro-Winkler算... 本文针对英文专利发明人姓名的字符串匹配问题,利用USPTO发明人姓名的数据集,探索现有字符串匹配算法的适用性。对指向同一发明人不能精确匹配的姓名字符串,分别用10种常用的字符串匹配算法进行处理。比较匹配结果发现:Jaro-Winkler算法对同一发明人姓名字符串匹配效果最好,且结果稳定。通过回归分析可知,杰卡德算法对于发明人的识别效果最佳,基于q-gram的算法在发明人姓名消歧中有重要意义;在发明人消歧中,多种字符串匹配算法的组合运用效果更佳。 展开更多
关键词 发明人姓名 字符串匹配 Jaro—Winkler算法 杰卡德算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部