迭代自组织哈希算法

Iterative self-organizing hashing algorithm

下载PDF

导出

摘要为了解决现有哈希算法的中心点不确定性和离散编码表达有限的问题,提出迭代自组织哈希算法(iterative self-organizing hashing,ISOH)。该算法采用迭代自组织数据分析量化空间,以提高近邻检索准确率;在聚类中心初始化方面,使用最远平均距离方法选择初始聚类中心,避免初始聚类中心的随机性;为解决固定编码长度所表示的二值编码种类有限的问题,提出建立多重编码机制;在时间复杂度方面,ISOH算法采用乘积空间,以较低的代价得到更长的编码。实验结果表明,在SIFT、GIST和CIFAR10数据集上与K-均值哈希和可扩展图哈希等具体化哈希算法相比,ISOH算法能有效提高近邻检索的准确率。 To fix the randomness of the cluster centers and the limited representation of the discrete binary codes,this paper presented a method termed ISOH.This algorithm employed the iterative self-organizing data analysis to quantify the original space.As a result,the above measurement improved the retrieval accuracy largely.During initializing the clustering centers,this method utilized the farthest average distance to fix the randomness problem.As the fixed binary bits could represent a limited number of the codes,the hash based image ANN retrieval method had poor performance,this paper established the multiencoding mechanism.In terms of the training time complexity,this method employed the product space mechanism to obtain longer encoding results at a lower cost.This paper conducted the comparative experiments in SIFT,GIST and CIFAR10 datasets.The experimental results show that ISOH is superior K-means hashing and scalable graph hashing etc.in achieving image ANN retrieval.

作者韩雪莲田爱奎王振卢海涛 Han Xuelian;Tian Aikui;Wang Zhen;Lu Haitao(School of Computer Science&Technology,Shandong University of Technology,Zibo Shandong 255000,China)

机构地区山东理工大学计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2020年第5期1416-1420,共5页 Application Research of Computers

基金山东省自然科学基金资助项目(ZR2018PF005) 国家自然科学基金应急管理项目(61841602)。

关键词迭代自组织数据分析多重编码乘积空间最远平均距离 iterative self-organizing data analysis multiple coding product space farthest average distance

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1江波,张黎.基于Prim算法的最小生成树优化研究[J].计算机工程与设计,2009,30(13):3244-3247. 被引量：38
2顾洪博,赵万平.基于MMD聚类算法及在高校成绩分析中的应用[J].河北工程大学学报（自然科学版）,2010,27(1):96-98. 被引量：7

二级参考文献14

1陶午沙,沈振康,李吉成.一种新颖的基于模糊信息融合的目标空间分布结构检测算法[J].计算机工程与应用,2004,40(17):7-11. 被引量：1
2杜玲玲.改进的Prim算法在GIS中的应用[J].测绘信息与工程,2006,31(1):28-29. 被引量：4
3周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：71
4韩丽霞,王宇平.求解度约束最小生成树的新的遗传算法[J].计算机工程与应用,2006,42(31):13-15. 被引量：8
5段智,袁振洲.基于Prim算法的农村公路网布局重要度最大树求解方法[J].公路,2007,52(5):111-114. 被引量：11
6袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
7HUANG Z.A fast clustering algorithm to cluster very large categorical data.sets in data mining.In:Proc.of the SIGMOD Workshop on Research Issues on Data Mining and Knowledge Discovery.Tucson,1997.146-151[EB/OL].http://www.informatik.uni-trier.de/～ ley/db/conf/sigmod/sigmod97.html. 被引量：1
8SAMBASIVAM S,THEODDOSOPULOS N.Advanced data clustering methods of mining Web documents[J].Issues in Informing Science and Information Technology,2006,(3):563-579. 被引量：1
9MARQUES J P,WRITTEN,WU Y F,TRANS.Pattern recognition concepts,methods and applications.2nd ed[M].Beijing:TsinghuaUniversity Press,2002. 被引量：1
10杨成慧,殷红,孟建军,姜虎强.基于Prim算法的通信网络架设仿真研究与应用[J].计算机仿真,2007,24(10):144-147. 被引量：9

共引文献43

1程媛媛.基于Prim最小生成树算法的时间成本研究[J].河北北方学院学报（自然科学版）,2013,29(6):24-28. 被引量：2
2庞彦军,刘立民,刘开第.未确知均值聚类[J].河北工程大学学报（自然科学版）,2010,27(4):98-100. 被引量：4
3黄冬梅,张岭,韩彦岭.并行搜救算法在确定灾后搜救路线中的应用[J].计算机应用研究,2011,28(2):472-473. 被引量：2
4孙柳林,郭建丁,邓建良.无线传感器网络LEACH簇树路由协议研究[J].北京联合大学学报,2011,25(2):24-27.
5龚承柱,诸克军,郭海湘.基于蚁群算法的多目标网络铺设策略研究[J].计算机工程,2011,37(15):177-180. 被引量：3
6任文轩.贪婪算法在构建物流网络中的应用[J].微型机与应用,2011,30(23):16-18. 被引量：1
7李萍,王春红,王文霞,任姚鹏.最小生成树算法在旅行商问题中的应用[J].电脑开发与应用,2012,25(1):62-63. 被引量：2
8吴爱祥,武力聪,刘晓辉,王春来,黄武胜,朱权洁.矿山微地震活动时空分布[J].北京科技大学学报,2012,34(6):609-613. 被引量：16
9曾旭,司马宇.K-Means算法在计算机等级考试成绩分析中的应用[J].软件导刊,2012,11(11):19-21. 被引量：8
10董超,修春亮,魏冶.基于通信流的吉林省流空间网络格局[J].地理学报,2014,69(4):510-519. 被引量：101

1陈金戈,龙伟,李炎炎,俞晓红,杜玉龙.一种鬼影及边缘传播抑制的ViBe目标检测算法[J].四川大学学报（自然科学版）,2020,57(2):284-288. 被引量：6
2赵丹枫,黄洲,许强,黄冬梅.基于LSH方法的珊瑚礁鱼类竞争压力查询和资源分配方法[J].热带海洋学报,2020,39(2):118-126.
3黄颖,张豹,陈伟荣,戴鹏.基于分层索引的高维数据对象检索[J].指挥信息系统与技术,2019,10(6):81-85.
4Zhai Qi,Jiang Mingyan.Supervised learning of enhancing convolutional Hash for image retrieval[J].The Journal of China Universities of Posts and Telecommunications,2019,26(4):51-61. 被引量：1
5刘淑伟,陈威,赵伟,陈进才,卢萍.基于簇内乘积量化的最近邻检索方法[J].计算机学报,2020,43(2):303-314. 被引量：6
6夏小娜,邹麒.基于兴趣相似度传递的增强LSH统计预测算法[J].计算机应用与软件,2020,37(3):286-291. 被引量：1
7刘悦,崔丹丹.基于结构自组织ELM的铝热连轧轧制力预测[J].湖南科技大学学报（自然科学版）,2020,35(1):77-82. 被引量：2
8Oliver Szasz,Andras Szasz.Parametrization of Survival Measures, Part I: Consequences of Self-Organizing[J].International Journal of Clinical Medicine,2020,11(5):316-347. 被引量：2
9Lei XU.Learning deep IA bidirectional intelligence[J].Frontiers of Information Technology & Electronic Engineering,2020,21(4):558-562. 被引量：1
10Peng Weiping,Su Zhe,Song Cheng,Jia Zongpu.Research on adaptive dual task offloading decision algorithm for parking space recommendation service[J].The Journal of China Universities of Posts and Telecommunications,2019,26(6):30-42.

计算机应用研究

2020年第5期

浏览历史

内容加载中请稍等...

迭代自组织哈希算法

参考文献2

二级参考文献14

共引文献43

相关作者

相关机构

相关主题

浏览历史