-
题名大规模数据检索中基于哈希编码的量化技术综述
被引量:1
- 1
-
-
作者
任艳多
-
机构
宁波大学
-
出处
《数据通信》
2018年第2期45-48,54,共5页
-
文摘
随着信息技术的飞速发展,各行业的数据呈爆炸式增长。大规模数据的检索与分析是大数据研究的关键内容之一。量化技术是基于哈希编码的数据检索算法的一个研究热点。探讨了基于哈希编码的量化技术在数据检索中的目标,介绍了四类典型的基于哈希编码的量化技术,即基于超平面的量化、基于笛卡尔积的量化、基于深度学习的量化以及基于优化编码的量化。阐述了每类量化技术的特点,对基于哈希编码的量化领域未来的研究方向提出了一些思考和建议。
-
关键词
大规模数据检索
哈希编码
量化
保相似性
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向大规模数据检索的哈希学习研究进展
被引量:1
- 2
-
-
作者
任艳多
胡伟
孙瑶
-
机构
宁波大学信息科学与工程学院
-
出处
《无线通信技术》
2017年第4期21-25,共5页
-
文摘
随着机器学习、深度学习等人工智能技术的发展,基于哈希的大规模数据检索有了新的发展。哈希学习是机器学习方法在传统哈希检索领域的应用。探讨了哈希学习的主要研究内容,即哈希函数、相似度量以及损失函数。根据度量阶段的不同,将现有的哈希学习算法分为三类:基于主成分分析的哈希学习、基于聚类的哈希学习以及基于神经网络的哈希学习。阐述了每类哈希学习算法的特点,对哈希学习未来的研究方向提出了一些思考和建议。
-
关键词
大规模数据检索
哈希学习
保相似性
-
Keywords
large-scale data retrieval
learning to hash
similarity preserving
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于在线学习型哈希的最近邻查找算法研究进展
- 3
-
-
作者
胡伟
任艳多
孙瑶
-
机构
宁波大学信息科学与工程学院
-
出处
《数据通信》
2018年第1期22-27,37,共7页
-
文摘
快速最近邻搜索在大规模数据的计算机应用变得越来越重要。具有快速搜索机制和紧凑的索引结构的哈希方法有着至关重要的作用。大多数目前的监督哈希方法都采用批量模型。但是,批量学习策略在面对大型数据集时可能效率不高。而且,对于批量学习来说,随着数据集的不断发展和随着时间的推移出现新的变化,在线监督哈希技术提出适应性数据的哈希函数。本文讨论了多种在线学习哈希方法的异同,并针对目前研究现状分析在线哈希后续工作研究方向。
-
关键词
在线
学习型哈希
监督学习
最近邻查找
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-