摘要
SIFT特征被广泛运用于图像检索,由于其高维度的特性,对于大量图像检索而言,很难在保证准确度的前提下达到理想的速度。本文提出一种基于分布式并行计算的SIFT算法,在hadoop集群下利用K-Means将特征聚类,将聚类中心作为Bag-of-Words模型的视觉词袋,得到所有图像直方图,最终计算这些图像与检索图像特征向量之间的相似度,返回相似度最大的一些图像。
SIFT feature is widely used in image retrieval to ensure the accuracy of image retrieval in a large - scale image dataset, which, however, can hardly achieve a desired speed because of its high dimension. This paper presents a kind of SIFT algorithm based on distributed parallel computation. Cluster centroids acquired by K - Means clustering algorithm are used to generate a visual dictionary of Bag - of - Words model, then we can get the histogram for each image. Finally we calculate the similarity between the images, and return a certain number of images with the largest similarity.
作者
徐文博
吴恋
于国龙
XU Wen-Bo WU Lian YU Guo-Long(College of Computer Science & Information, Guizhou University, Guiyang, Guizhou, 550025 Industrial Internet of Things Engineering Research Center of the Higher Education Institutions of Guizhou Province, Guizhou Education University, Guiyang, Guizhou, 550018)
出处
《贵州师范学院学报》
2016年第9期13-17,共5页
Journal of Guizhou Education University
基金
2016年贵州省省级重点支持学科"计算机应用技术"(黔学位合字ZDXK[2016]20号)
2016年度贵州省科技平台及人才团队专项资金项目(项目编号:黔科合平台人才[2016]5609)
2016年度省教育厅高校自然科学研究项目(黔教合字[2016]015
黔教合KY字[2016]040)
2015年省级高技术产业示范工程专项(黔发改投资[2015]1588号)
2014年省级本科教学工程项目"计算机科学与技术"专业综合改革(黔教高发[2014]378号)
2015年省级本科教学工程建设项目"贵州师范学院大学生互联网+创新创业训练中心"(黔教高发[2015]337号)
关键词
SIFT
图像检索
分布式
SIFT
Image retrieval
Distributed computation