-
题名在线哈希算法研究综述
被引量:4
- 1
-
-
作者
郭一村
陈华辉
-
机构
宁波大学信息科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第4期1106-1112,共7页
-
基金
国家自然科学基金资助项目(61572266)。
-
文摘
在当前大规模数据检索任务中,学习型哈希方法能够学习紧凑的二进制编码,在节省存储空间的同时能快速地计算海明空间内的相似度,因此近似最近邻检索常使用哈希的方式来完善快速最近邻检索机制。对于目前大多数哈希方法都采用离线学习模型进行批处理训练,在大规模流数据的环境下无法适应可能出现的数据变化而使得检索效率降低的问题,提出在线哈希方法并学习适应性的哈希函数,从而在输入数据的过程中连续学习,并且能实时地应用于相似性检索。首先,阐释了学习型哈希的基本原理和实现在线哈希的内在要求;接着,从在线条件下流数据的读取模式、学习模式以及模型更新模式等角度介绍在线哈希不同的学习方式;而后,将在线学习算法分为六类:基于主-被动算法、基于矩阵分解技术、基于无监督聚类、基于相似性监督、基于互信息度量和基于码本监督,并且分析这些算法的优缺点及特点;最后,总结和讨论了在线哈希的发展方向。
-
关键词
在线学习
学习型哈希
无监督学习
监督学习
最近邻检索
-
Keywords
online learning
learning to hash
unsupervised learning
supervised learning
nearest neighbor search
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名加权自学习哈希高维数据最近邻查询算法
被引量:3
- 2
-
-
作者
熊一利
-
机构
江西省教育考试院信息处
-
出处
《计算机工程与设计》
北大核心
2018年第12期3739-3745,共7页
-
文摘
对学习型哈希算法用于最近邻查询,出现二进制编码的海明距离小导致重排序的问题进行研究,提出一种基于加权自学习框架的哈希方法。给定一个查询对象,通过自学习哈希方法返回满足特定海明距离的候选对象,根据所得候选集求得二进制编码各位的权重,计算查询对象与候选集中各个数据对象的加权海明距离,得到在更细粒度上排序的候选集。实验结果表明,我们的方法能够高效的对具有相同海明距离的不同海明编码进行重排序。
-
关键词
最近邻查询
学习型哈希
加权自学习
高维数据
海明距离
-
Keywords
nearest neighbor search
learning-type hashing
weighted self-taught
high dimensional data
Hamming distance
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于在线学习型哈希的最近邻查找算法研究进展
- 3
-
-
作者
胡伟
任艳多
孙瑶
-
机构
宁波大学信息科学与工程学院
-
出处
《数据通信》
2018年第1期22-27,37,共7页
-
文摘
快速最近邻搜索在大规模数据的计算机应用变得越来越重要。具有快速搜索机制和紧凑的索引结构的哈希方法有着至关重要的作用。大多数目前的监督哈希方法都采用批量模型。但是,批量学习策略在面对大型数据集时可能效率不高。而且,对于批量学习来说,随着数据集的不断发展和随着时间的推移出现新的变化,在线监督哈希技术提出适应性数据的哈希函数。本文讨论了多种在线学习哈希方法的异同,并针对目前研究现状分析在线哈希后续工作研究方向。
-
关键词
在线
学习型哈希
监督学习
最近邻查找
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于学习型哈希的最近邻查找算法研究进展
- 4
-
-
作者
彭聪
-
机构
宁波大学信息科学与工程
-
出处
《数据通信》
2017年第5期42-49,共8页
-
文摘
最近邻查找的目的是从数据集中找出与查询点距离最近的数据。大数据背景下,最近邻查找主要面临效率和准确率两大难题。基于机器学习的哈希方法在解决最近邻查找问题上表现出良好的性能。根据学习模型是否利用监督信息,可将学习型哈希分为无监督型、半监督型、监督型。近年来在线、深度学习、分布式的思想相继引入到哈希学习,本文从不同角度分析了多种哈希学习方法的异同和优缺点,最后还讨论了这一领域未来的发展方向和趋势。
-
关键词
最近邻查找
学习型哈希
在线
深度学习
分布式
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-