期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Simhash算法的重复数据删除技术的研究与改进
被引量:
15
1
作者
陈春玲
陈琳
+1 位作者
熊晶
余瀚
《南京邮电大学学报(自然科学版)》
北大核心
2016年第3期85-91,共7页
为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征...
为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征值的词性与词长两大影响因素考虑其中。然后对产生的签名值进行汉明距离的比较,从而精确地判定出待比较者是否为相似数据。实验结果表明:改进的算法性能得到提高,并且总体优于Shingle算法和原Simhash算法。通过提高签名值的精度能够实现大规模文档中相似技术的精确检测,达到理想的去重效果。
展开更多
关键词
相似检测
Simhash算法
TF-IDF技术
指纹计算
汉明距离
下载PDF
职称材料
测试向量中未确定位对测试功耗优化的影响
被引量:
1
2
作者
骆祖莹
李晓维
洪先龙
《微电子学与计算机》
CSCD
北大核心
2003年第2期52-55,共4页
文章通过调整测试向量中未确定位的数目,来考察测试向量中未确定位对测试功耗优化的影响。ISCAS85和ISCAS89电路集的实验结果表明:无论对于组合电路还是时序电路,随着测试向量中未确定位数目的增加,未优化测试功耗有明显的降低,同时对...
文章通过调整测试向量中未确定位的数目,来考察测试向量中未确定位对测试功耗优化的影响。ISCAS85和ISCAS89电路集的实验结果表明:无论对于组合电路还是时序电路,随着测试向量中未确定位数目的增加,未优化测试功耗有明显的降低,同时对于本文所考察的三种测试功耗优化方法,它们的优化效果均有明显的改善。其中海明距离优化方法的优化效果改善最大,当未确定位数目增加到90%以上时,可以用海明距离优化方法替代另外两种耗时的优化方法,直接对CMOSVLSI时序电路测试功耗进行优化。
展开更多
关键词
功耗
海明距离
集成电路
向量测试
电路功耗
时序电路
下载PDF
职称材料
题名
基于Simhash算法的重复数据删除技术的研究与改进
被引量:
15
1
作者
陈春玲
陈琳
熊晶
余瀚
机构
南京邮电大学计算机学院
出处
《南京邮电大学学报(自然科学版)》
北大核心
2016年第3期85-91,共7页
基金
国家自然科学基金(11501302)资助项目
文摘
为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征值的词性与词长两大影响因素考虑其中。然后对产生的签名值进行汉明距离的比较,从而精确地判定出待比较者是否为相似数据。实验结果表明:改进的算法性能得到提高,并且总体优于Shingle算法和原Simhash算法。通过提高签名值的精度能够实现大规模文档中相似技术的精确检测,达到理想的去重效果。
关键词
相似检测
Simhash算法
TF-IDF技术
指纹计算
汉明距离
Keywords
similarity
detection
Simhash
algorithm
TF-IDF
technology
fingerprint
calculation
ham
-
ming
distance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
测试向量中未确定位对测试功耗优化的影响
被引量:
1
2
作者
骆祖莹
李晓维
洪先龙
机构
清华大学计算机科学与技术系
中国科学院计算技术研究所
出处
《微电子学与计算机》
CSCD
北大核心
2003年第2期52-55,共4页
基金
国家自然科学基金重点项目(90207002)
国家863计划项目(2001AA111070)
文摘
文章通过调整测试向量中未确定位的数目,来考察测试向量中未确定位对测试功耗优化的影响。ISCAS85和ISCAS89电路集的实验结果表明:无论对于组合电路还是时序电路,随着测试向量中未确定位数目的增加,未优化测试功耗有明显的降低,同时对于本文所考察的三种测试功耗优化方法,它们的优化效果均有明显的改善。其中海明距离优化方法的优化效果改善最大,当未确定位数目增加到90%以上时,可以用海明距离优化方法替代另外两种耗时的优化方法,直接对CMOSVLSI时序电路测试功耗进行优化。
关键词
功耗
海明距离
集成电路
向量测试
电路功耗
时序电路
Keywords
Test
pattern,Test
power,Power
optimization,
ham
-
ming
distance
分类号
TN407 [电子电信—微电子学与固体电子学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Simhash算法的重复数据删除技术的研究与改进
陈春玲
陈琳
熊晶
余瀚
《南京邮电大学学报(自然科学版)》
北大核心
2016
15
下载PDF
职称材料
2
测试向量中未确定位对测试功耗优化的影响
骆祖莹
李晓维
洪先龙
《微电子学与计算机》
CSCD
北大核心
2003
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部