期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多SimHash指纹的近似文本检测 被引量:21
1
作者 董博 郑庆华 +2 位作者 宋凯磊 田锋 马瑞 《小型微型计算机系统》 CSCD 北大核心 2011年第11期2152-2157,共6页
近似文本检测已成为当前研究热点.基于SimHash指纹的近似文本检测是主流的检测方法之一.但使用SimHash进行近似文本检测存在如下问题:指纹位数单一,丢失了一定量的信息.针对该问题,为使SimHash指纹尽可能多地代表文档的内容或特征,通过... 近似文本检测已成为当前研究热点.基于SimHash指纹的近似文本检测是主流的检测方法之一.但使用SimHash进行近似文本检测存在如下问题:指纹位数单一,丢失了一定量的信息.针对该问题,为使SimHash指纹尽可能多地代表文档的内容或特征,通过对术语集的统计特征分析,提出基于多SimHash指纹和k维超曲面的近似文本检测算法.实验表明基于多Sim-Hash指纹的近似文本检测算法提高了检测的准确率,而且所增加的时间代价很小. 展开更多
关键词 近似文本检测 simhash simhash指纹 术语统计
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部