期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Simhash算法的重复数据删除技术的研究与改进 被引量:15
1
作者 陈春玲 陈琳 +1 位作者 熊晶 余瀚 《南京邮电大学学报(自然科学版)》 北大核心 2016年第3期85-91,共7页
为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征... 为了在大规模文档去重中提高相似数据检测的精度,对基于Simhash算法的大规模文档去重技术进行深入研究。在原有算法的基础之上对Simhash签名值的计算过程作出改进,引入ICTCLAS分词技术,将TF-IDF技术作为计算权重的主要方法,同时将特征值的词性与词长两大影响因素考虑其中。然后对产生的签名值进行汉明距离的比较,从而精确地判定出待比较者是否为相似数据。实验结果表明:改进的算法性能得到提高,并且总体优于Shingle算法和原Simhash算法。通过提高签名值的精度能够实现大规模文档中相似技术的精确检测,达到理想的去重效果。 展开更多
关键词 相似检测 Simhash算法 TF-IDF技术 指纹计算 汉明距离
下载PDF
一种基于时域空域的视音频指纹特征计算与比对技术方案 被引量:1
2
作者 吴雪松 沈建展 +2 位作者 平强国 赵煊 常江 《广播与电视技术》 2024年第6期44-50,共7页
本文阐述视音频指纹特征技术的一种实现思路,能够计算视音频的指纹特征并通过指纹特征比对获得不同视音频之间的量化相似情况。
关键词 视音频指纹特征 指纹计算 指纹比对
下载PDF
刺五加HPLC数字化指纹图谱研究 被引量:7
3
作者 孙国祥 于秀明 毕开顺 《中成药》 CAS CSCD 北大核心 2007年第9期1249-1253,共5页
目的:建立刺五加HPLC数字化指纹图谱。方法:采用反相高效液相色谱法,使用Century SIL BDS(20 cm×4.6mm,5μm)柱,以1%醋酸水-1%醋酸乙腈为流动相,线性梯度洗脱,流速1.0 mL/mL,检测波长265 nm,柱温(30.0±0.15)℃,进样量10μL。... 目的:建立刺五加HPLC数字化指纹图谱。方法:采用反相高效液相色谱法,使用Century SIL BDS(20 cm×4.6mm,5μm)柱,以1%醋酸水-1%醋酸乙腈为流动相,线性梯度洗脱,流速1.0 mL/mL,检测波长265 nm,柱温(30.0±0.15)℃,进样量10μL。以定性、定量相似度和色谱指纹图谱指数等数字化指标评价药材质量。结果:以绿原酸峰为参照物峰,确定31个共有指纹峰,建立了刺五加HPLC数字化指纹图谱。应用色谱指纹图谱指数F和相对指数Fr参数对不同产地刺五加HPLC指纹图谱的超信息特征进行了数字化评价。结论:所建立的HPLC指纹图谱具有较好的精密度和重现性,适用于刺五加药材的质量控制。 展开更多
关键词 刺五加 HPLC 数字化指纹图谱 色谱指纹图谱指数F 投影含量相似度C% 宏观含量相似度R% 定量相似度P%
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部