期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
Short-term local prediction of wind speed and wind power based on singular spectrum analysis and locality-sensitive hashing 被引量:11
1
作者 Ling LIU Tianyao JI +2 位作者 Mengshi LI Ziming CHEN Qinghua WU 《Journal of Modern Power Systems and Clean Energy》 SCIE EI 2018年第2期317-329,共13页
With the growing penetration of wind power in power systems, more accurate prediction of wind speed and wind power is required for real-time scheduling and operation. In this paper, a novel forecast model for shortter... With the growing penetration of wind power in power systems, more accurate prediction of wind speed and wind power is required for real-time scheduling and operation. In this paper, a novel forecast model for shortterm prediction of wind speed and wind power is proposed,which is based on singular spectrum analysis(SSA) and locality-sensitive hashing(LSH). To deal with the impact of high volatility of the original time series, SSA is applied to decompose it into two components: the mean trend,which represents the mean tendency of the original time series, and the fluctuation component, which reveals the stochastic characteristics. Both components are reconstructed in a phase space to obtain mean trend segments and fluctuation component segments. After that, LSH is utilized to select similar segments of the mean trend segments, which are then employed in local forecasting, so that the accuracy and efficiency of prediction can be enhanced. Finally, support vector regression is adopted forprediction, where the training input is the synthesis of the similar mean trend segments and the corresponding fluctuation component segments. Simulation studies are conducted on wind speed and wind power time series from four databases, and the final results demonstrate that the proposed model is more accurate and stable in comparison with other models. 展开更多
关键词 WIND power WIND speed locality-sensitive hashing(LSH) SINGULAR spectrum analysis(SSA) LOCAL forecast Support vector regression(SVR)
原文传递
面向视频语义分析的局部敏感的可鉴别稀疏表示 被引量:3
2
作者 王敏超 詹永照 +1 位作者 苟建平 毛启容 《计算机科学》 CSCD 北大核心 2015年第9期313-318,F0003,共7页
视频语义分析已经成为人们研究的热点。在传统稀疏表示方法中,相似视频特征未必能产生相近稀疏表示结果。在基于稀疏表示的视频语义分析中,假定相似的视频数据样本的稀疏表示也相似,即两个相似视频特征的稀疏系数之间的距离较小。为了... 视频语义分析已经成为人们研究的热点。在传统稀疏表示方法中,相似视频特征未必能产生相近稀疏表示结果。在基于稀疏表示的视频语义分析中,假定相似的视频数据样本的稀疏表示也相似,即两个相似视频特征的稀疏系数之间的距离较小。为了提高视频语义分析的准确性,基于该假设提出一种面向视频语义分析的局部敏感的可鉴别稀疏表示方法。该方法在局部敏感稀疏表示中引入基于稀疏系数的鉴别损失函数,优化构建稀疏表示的字典,使稀疏表示特征满足类内离散度小、类间离散度大的Fisher准则,并建立可鉴别稀疏模型。为验证所提方法的有效性,在相关视频数据库中将其与多种算法进行对比,实验结果表明,该方法显著地提高了视频特征稀疏表示的鉴别性,有效地提高了视频语义分析的准确性。 展开更多
关键词 视频语义 稀疏表示 局部敏感 可鉴别
下载PDF
特征聚类的局部敏感稀疏图像修复 被引量:3
3
作者 薛俊韬 倪晨阳 杨斯雪 《红外与激光工程》 EI CSCD 北大核心 2018年第11期423-431,共9页
针对图像修复过程中单一的字典迭代时间长、适应性差、修复效果不理想的缺点,提出了一种结合图像特征聚类与字典学习的改进的图像修复方式。首先破损的图像被分割成小块,并产生索引矩阵。然后使用控制核回归权值算法,对其进行图像聚类... 针对图像修复过程中单一的字典迭代时间长、适应性差、修复效果不理想的缺点,提出了一种结合图像特征聚类与字典学习的改进的图像修复方式。首先破损的图像被分割成小块,并产生索引矩阵。然后使用控制核回归权值算法,对其进行图像聚类。通过对图像内在结构与未破损区域信息的挖掘,分割的图像块根据SKRW的相似性进行了分类。之后针对不同类型结构的图像,通过自适应局部明感字典学习的方式,获取每类字典的过完备字典。然后,通过构建自适应局部配适器,提高字典更新的收敛速度与稀疏字典的适应性。因为是通过多个字典匹配不同结构的图像,因此图像的稀疏表示更为准确。各个字典在达到收敛之前不断进行更新,而图像的稀疏因子也会随着改变。在对破损区域进行补丁更换之后,实现了对破损图像的修复。实验结果表明,该算法相较于目前的修复算法,视觉效果和客观评价上更好,且所需的修复时间更短。 展开更多
关键词 图像修复 稀疏表示 图像聚类 字典学习 局部敏感
下载PDF
Improved locality-sensitive hashing method for the approximate nearest neighbor problem
4
作者 陆颖华 马廷淮 +3 位作者 钟水明 曹杰 王新 Abdullah Al-Dhelaane 《Chinese Physics B》 SCIE EI CAS CSCD 2014年第8期217-225,共9页
In recent years, the nearest neighbor search (NNS) problem has been widely used in various interesting applications. Locality-sensitive hashing (LSH), a popular algorithm for the approximate nearest neighbor probl... In recent years, the nearest neighbor search (NNS) problem has been widely used in various interesting applications. Locality-sensitive hashing (LSH), a popular algorithm for the approximate nearest neighbor problem, is proved to be an efficient method to solve the NNS problem in the high-dimensional and large-scale databases. Based on the scheme of p-stable LSH, this paper introduces a novel improvement algorithm called randomness-based locality-sensitive hashing (RLSH) based on p-stable LSH. Our proposed algorithm modifies the query strategy that it randomly selects a certain hash table to project the query point instead of mapping the query point into all hash tables in the period of the nearest neighbor query and reconstructs the candidate points for finding the nearest neighbors. This improvement strategy ensures that RLSH spends less time searching for the nearest neighbors than the p-stable LSH algorithm to keep a high recall. Besides, this strategy is proved to promote the diversity of the candidate points even with fewer hash tables. Experiments are executed on the synthetic dataset and open dataset. The results show that our method can cost less time consumption and less space requirements than the p-stable LSH while balancing the same recall. 展开更多
关键词 approximate nearest neighbor problem locality-sensitive hashing
下载PDF
An Efficient Webpage Classification Algorithm Based on LSH
5
作者 Junjun Liu Haichun Sun Zhijun Ding 《国际计算机前沿大会会议论文集》 2015年第1期73-75,共3页
With the explosive growth of Internet information, it is more and more important to fetch real-time and related information. And it puts forward higher requirement on the speed of webpage classification which is one o... With the explosive growth of Internet information, it is more and more important to fetch real-time and related information. And it puts forward higher requirement on the speed of webpage classification which is one of common methods to retrieve and manage information. To get a more efficient classifier, this paper proposes a webpage classification method based on locality sensitive hash function. In which, three innovative modules including building feature dictionary, mapping feature vectors to fingerprints using Localitysensitive hashing, and extending webpage features are contained. The compare results show that the proposed algorithm has better performance in lower time than the naive bayes one. 展开更多
关键词 EXPLOSIVE growth Webpage classification locality-sensitive HASHING FINGERPRINT EXTENDING webpage features
下载PDF
基于最优排序的局部敏感哈希索引 被引量:9
6
作者 冯小康 彭延国 +2 位作者 崔江涛 刘英帆 李辉 《计算机学报》 EI CSCD 北大核心 2020年第5期930-947,共18页
针对外存环境中海量高维数据近似最近邻(Approximate Nearest Neighbor,ANN)查询面临的"维度灾难"和I/O性能瓶颈难题,本文提出了一种基于最优排序的局部敏感哈希(Locality-Sensitive Hashing,LSH)索引方案O2LSH(Optimal Order... 针对外存环境中海量高维数据近似最近邻(Approximate Nearest Neighbor,ANN)查询面临的"维度灾难"和I/O性能瓶颈难题,本文提出了一种基于最优排序的局部敏感哈希(Locality-Sensitive Hashing,LSH)索引方案O2LSH(Optimal Order LSH).通过引入空间填充曲线为复合哈希键值建立线序并排序,使近邻候选点更多地分布在相同或相邻磁盘页面,实现用少量顺序I/O加载到足够多的候选点.本文对多种常用空间曲线技术进行了量化分析,发现:(1)基本排序方案SK-LSH使用的row-wise曲线具有"维度优先遍历"的特性,容易对ANN查询造成多种局限;(2)另一类"邻域优先遍历"特性的曲线能够产生更好的候选点局部分布,且排序性能更加稳定.通过对比,我们选取了一种最优的"邻域优先遍历"曲线构造线序,该线序能够最大程度地改善近邻候选点的局部分布,进一步提升磁盘访问效率和查询精度.在多个真实多媒体数据集上进行了对比实验,证实了O2LSH相对于先进LSH方案(包括C2LSH、SK-LSH、SRS以及QALSH)在查询精度和I/O效率上的优越性.特别地,O2LSH克服了基本排序方案SK-LSH对LSH关键参数的敏感性,算法实用性进一步提升. 展开更多
关键词 近似最近邻 高维索引 局部敏感哈希 空间线序 局部分布
下载PDF
高维分布式局部敏感哈希索引方法 被引量:9
7
作者 林朝晖 于俊清 +2 位作者 何云峰 管涛 艾列富 《计算机科学与探索》 CSCD 2013年第9期811-818,共8页
为了解决基于内容的图像检索中存在的索引存储量大和构建索引计算开销大等问题,在系统地分析局部敏感哈希索引算法及Hadoop分布式系统的基础上,改进了现有高维索引计算模型和索引结构方法。根据局部敏感哈希索引的特点,将现有局部敏感... 为了解决基于内容的图像检索中存在的索引存储量大和构建索引计算开销大等问题,在系统地分析局部敏感哈希索引算法及Hadoop分布式系统的基础上,改进了现有高维索引计算模型和索引结构方法。根据局部敏感哈希索引的特点,将现有局部敏感哈希索引改为松耦合的索引结构,将索引文件分布式部署在多个查询节点中实现了高并发的索引查询。通过MapReduce分布式计算模型实现了索引的并行构造,提高了索引构造的效率,并采用分布式数据库存储海量高维索引数据,增强了系统可扩展性。实验结果表明,该算法具有一定的可行性。 展开更多
关键词 局部敏感哈希 分布式索引 基于内容图像检索
下载PDF
面向加密云数据的多关键词模糊检索方法 被引量:9
8
作者 申艳光 张猛 范永健 《计算机工程与设计》 北大核心 2016年第12期3156-3160,共5页
现有密文检索方案无法有效解决模糊检索及陷门关联性问题,为此提出一种面向加密云数据的多关键词模糊检索方法 (multi-keyword fuzzy query,MKFQ)。对关键词的二元向量集合进行二进制编码,结合Bloom Filter和LSH函数对二进制编码进行哈... 现有密文检索方案无法有效解决模糊检索及陷门关联性问题,为此提出一种面向加密云数据的多关键词模糊检索方法 (multi-keyword fuzzy query,MKFQ)。对关键词的二元向量集合进行二进制编码,结合Bloom Filter和LSH函数对二进制编码进行哈希,分别选取常数和正态随机数对索引位进行扩展及加密,采用内积相似性算法计算相似分数并排序。实验通过安全性分析,以Enron邮件数据集作为测试数据集,验证了MKFQ方案的高效性和正确性。 展开更多
关键词 云环境 隐私保护 布隆过滤器 局部敏感哈希 模糊检索
下载PDF
基于精确欧氏局部敏感哈希的协同过滤推荐算法 被引量:9
9
作者 李红梅 郝文宁 陈刚 《计算机应用》 CSCD 北大核心 2014年第12期3481-3486,共6页
针对推荐系统中用户评分数据的海量高维与稀疏性,以及直接利用传统相似性度量方法来获取近邻的计算量大、结果不准等对推荐质量的影响,提出基于精确欧氏局部敏感哈希(E2LSH)的协同过滤推荐算法。首先利用精确欧氏局部敏感哈希算法对用... 针对推荐系统中用户评分数据的海量高维与稀疏性,以及直接利用传统相似性度量方法来获取近邻的计算量大、结果不准等对推荐质量的影响,提出基于精确欧氏局部敏感哈希(E2LSH)的协同过滤推荐算法。首先利用精确欧氏局部敏感哈希算法对用户评分数据进行降维处理并构建索引,以快速获取目标用户的近邻用户;然后利用加权策略来预测用户评分,进而完成协同过滤推荐。实验结果表明,该算法能有效解决用户数据的海量高维与稀疏性问题,且运行效率高,具有较好的推荐质量。 展开更多
关键词 精确欧氏局部敏感哈希 协同过滤 相似性度量 推荐系统 近似近邻
下载PDF
监控系统预警视频的分布式检索设计与实现 被引量:8
10
作者 于萧榕 席屏 黄健荣 《计算机测量与控制》 2015年第7期2511-2514,共4页
视频监控系统在日积月累的监控过程中会产生大量的视频信息,如何在海量视频中基于内容快速检索出需要的信息成为亟待解决的问题;文章在视频检索过程中,将视频图像的SIFT特征提取匹配与MapReduce并行模式相结合,同时利用LSH映射对视频图... 视频监控系统在日积月累的监控过程中会产生大量的视频信息,如何在海量视频中基于内容快速检索出需要的信息成为亟待解决的问题;文章在视频检索过程中,将视频图像的SIFT特征提取匹配与MapReduce并行模式相结合,同时利用LSH映射对视频图像进行分组并存储在HBase数据库中,在配合并行分析的同时减少了计算量;最后实验证明,采用MapReduce并行模式提取图像SIFT特征值,时间会随着集群节点的增加而不断降低,并最终趋于稳定;由此可知,对基于内容的视频检索采用并行化分析可以显著提高效率,实现了Hadoop架构在视频分析方面的应用拓展。 展开更多
关键词 分布式视频检索 HADOOP HBASE 尺度不变特征转换 局部敏感哈希
下载PDF
开放环境多分布特性的局部敏感哈希检索方法 被引量:6
11
作者 张仕 赖会霞 +3 位作者 肖如良 潘淼鑫 张路路 陈伟林 《软件学报》 EI CSCD 北大核心 2022年第4期1200-1217,共18页
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境... 基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境下多种分布特性的基于Laplacian算子的局部敏感哈希搜索方法(LPLSH).该方法把Laplacian算子应用于数据投影的概率密度分布,找到数据投影分布的剧烈变化位置作为超平面的偏移量.从理论上证明了精简维度的哈希函数能够保持局部敏感性及低投影密度区间分割的有效性,分析了利用Laplacian算子计算的二阶导数对超平面偏移量设置的指导意义.与其他8种方法对比,LPLSH算法的F1值是其他方法最优值的0.8倍-5倍,耗费时间也大幅减少.通过对具有多种分布特性数据集上的实验验证,结果表明:LPLSH方法能够同时兼顾效率、精度和召回率,可满足开放环境下多分布特性的大规模高维检索的鲁棒性需求. 展开更多
关键词 开放环境 近似近邻检索 数据多分布特性 局部敏感哈希 数据检索
下载PDF
基于差分隐私保护知识迁移的联邦学习方法 被引量:3
12
作者 徐晨阳 葛丽娜 +3 位作者 王哲 周永权 秦霞 田蕾 《计算机应用研究》 CSCD 北大核心 2023年第8期2473-2480,共8页
联邦学习解决了机器学习的数据孤岛问题,然而,各方的数据集在数据样本空间和特征空间上可能存在较大差异,导致联邦模型的预测精度下降。针对上述问题,提出了一种基于差分隐私保护知识迁移的联邦学习方法。该方法使用边界扩展局部敏感散... 联邦学习解决了机器学习的数据孤岛问题,然而,各方的数据集在数据样本空间和特征空间上可能存在较大差异,导致联邦模型的预测精度下降。针对上述问题,提出了一种基于差分隐私保护知识迁移的联邦学习方法。该方法使用边界扩展局部敏感散列计算各方实例之间的相似度,根据相似度对实例进行加权训练,实现基于实例的联邦迁移学习。在此过程中,实例本身无须透露给其他方,防止了隐私的直接泄露。同时,为了减少知识迁移过程的隐私间接泄露,在知识迁移过程中引入差分隐私机制,对需要在各方之间传输的梯度数据进行扰动,实现知识迁移过程的隐私保护。理论分析表明,知识迁移过程满足ε-差分隐私保护。在XGBoost梯度提升树模型上实现了所提方法,实验结果表明,与无知识迁移方法相比,所提方法使联邦模型测试误差平均下降6%以上。 展开更多
关键词 联邦学习 迁移学习 局部敏感散列 差分隐私 梯度提升树
下载PDF
面向大型数据集的局部敏感哈希K−means算法 被引量:2
13
作者 魏峰 马龙 《工矿自动化》 CSCD 北大核心 2023年第3期53-62,共10页
大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进... 大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进行优化,提出了数据组构建算法LSH−G,将大型数据集合理划分为子数据组,并对数据集中的噪声点进行有效删除;基于LSH−G算法优化密度偏差抽样(DBS)算法中的子数据组划分过程,提出了数据组抽样算法LSH−GD,使样本集能更真实地反映原始数据集的分布规律;在此基础上,通过K−means算法对生成的样本集进行聚类,实现较低时间复杂度情况下从大型数据集中高效挖掘有效数据。实验结果表明:由10个AND操作与8个OR操作组成的级联组合为最优级联组合,得到的类中心误差平方和(SSEC)最小;在人工数据集上,与基于多层随机抽样(M−SRS)的K−means算法、基于DBS的K−means算法及基于网格密度偏差抽样(G−DBS)的K−means算法相比,基于LSH−GD的K−means算法在聚类准确性方面的平均提升幅度分别为56.63%、54.59%及25.34%,在聚类高效性方面的平均提升幅度分别为27.26%、16.81%及7.07%;在UCI标准数据集上,基于LSH−GD的K−means聚类算法获得的SSEC与CPU消耗时间(CPU−C)均为最优。 展开更多
关键词 智慧矿山 大型数据集 K−means聚类 局部敏感哈希 噪声点筛选 密度偏差抽样
下载PDF
融合煤矿多维时序数据的瓦斯异常检测算法 被引量:5
14
作者 丁汀 颜登程 +1 位作者 张以文 周珊 《计算机集成制造系统》 EI CSCD 北大核心 2020年第6期1651-1659,共9页
瓦斯是引起煤矿安全隐患的重大因素,高效准确地检测瓦斯异常在煤矿安全生产过程中扮演着重要角色。传统的瓦斯异常检测方法通常仅基于来自瓦斯传感器的单一监测数据,而矿井下的恶劣环境可能造成瓦斯传感器失效,监测数据可信度较低,从而... 瓦斯是引起煤矿安全隐患的重大因素,高效准确地检测瓦斯异常在煤矿安全生产过程中扮演着重要角色。传统的瓦斯异常检测方法通常仅基于来自瓦斯传感器的单一监测数据,而矿井下的恶劣环境可能造成瓦斯传感器失效,监测数据可信度较低,从而导致误报、漏报等问题。为解决上述问题,基于多种传感器监测数据,提出一种融合煤矿多维时序数据的瓦斯异常检测算法。该方法首先对煤矿中多维时序数据进行滑动窗口采样;然后建立局部敏感哈希孤立森林;最后根据待检测样本在森林中每棵树上的路径长度计算异常得分及异常率,当滑动窗口中的异常率超出指定阈值时,则自动更新森林。通过在真实的淮南朱集煤矿数据集上进行的大量实验,表明了所提方法在提高检测精度上的有效性。 展开更多
关键词 瓦斯浓度 异常检测 滑动窗口 局部敏感哈希 孤立森林
下载PDF
基于局部敏感核稀疏表示的视频跟踪 被引量:5
15
作者 黄宏图 毕笃彦 +2 位作者 高山 查宇飞 侯志强 《电子与信息学报》 EI CSCD 北大核心 2016年第4期993-999,共7页
为了解决?1范数约束下的稀疏表示判别信息不足的问题,该文提出基于局部敏感核稀疏表示的视频目标跟踪算法。为了提高目标的线性可分性,首先将候选目标的SIFT特征通过高斯核函数映射到高维核空间,然后在高维核空间中求解局部敏感约束下... 为了解决?1范数约束下的稀疏表示判别信息不足的问题,该文提出基于局部敏感核稀疏表示的视频目标跟踪算法。为了提高目标的线性可分性,首先将候选目标的SIFT特征通过高斯核函数映射到高维核空间,然后在高维核空间中求解局部敏感约束下的核稀疏表示,将核稀疏表示经过多尺度最大值池化得到候选目标的表示,最后将候选目标的表示代入在线的SVMs,选择分类器得分最大的候选目标作为目标的跟踪位置。实验结果表明,由于利用了核稀疏表示下数据的局部性信息,使得算法的鲁棒性得到一定程度的提高。 展开更多
关键词 视频跟踪 核稀疏表示 局部敏感约束 支持向量机
下载PDF
面向近重复图像匹配的SIFT特征裁减算法 被引量:5
16
作者 王金德 李晓燕 +1 位作者 寿黎但 陈刚 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第6期1042-1049,1055,共9页
针对图像提取出的SIFT特征数目通常很大、无法精确控制,导致系统效率不高且不稳定的问题,提出一种SIFT特征裁减算法.通过对SIFT关键点的对比度和主曲率比加权来衡量其匹配能力;在定位关键点和计算关键点方向2个步骤增加对关键点的二次筛... 针对图像提取出的SIFT特征数目通常很大、无法精确控制,导致系统效率不高且不稳定的问题,提出一种SIFT特征裁减算法.通过对SIFT关键点的对比度和主曲率比加权来衡量其匹配能力;在定位关键点和计算关键点方向2个步骤增加对关键点的二次筛选,提取出设定阈值数目内对匹配最有效的关键点.实验结果表明,该算法能有效地控制SIFT特征数量,比已有裁减算法具有更高的匹配准确度;与原始未裁减算法相比,在保证匹配准确度的同时,大大提高了系统的效率和稳定性. 展开更多
关键词 近重复图像 图像匹配 尺度不变特征变换 局部敏感哈希
下载PDF
基于卷积神经网络和LSH的图像检索算法 被引量:4
17
作者 杨荣 张建刚 贾晖 《西安邮电大学学报》 2022年第2期88-94,共7页
为了提高图像检索的准确度和检索效率,提出一种基于卷积神经网络和局部敏感哈希(Locality-Sensitive Hashing,LSH)算法的图像检索算法。使用图像库ImageNet对视觉几何小组16(Visual Geometry Group 16,VGG16)网络进行训练,获取初始化参... 为了提高图像检索的准确度和检索效率,提出一种基于卷积神经网络和局部敏感哈希(Locality-Sensitive Hashing,LSH)算法的图像检索算法。使用图像库ImageNet对视觉几何小组16(Visual Geometry Group 16,VGG16)网络进行训练,获取初始化参数。以卷积神经网络为基础,增加哈希层代替VGG16全连接层,获取图像的高维特征向量。利用哈希函数满足p-稳定分布的LSH算法将高维特征向量映射为哈希码,并将相似图像映射到同一个哈希桶中作为粗检候选集,计算并排序候选集中特征向量欧氏距离完成图像检索,从而得到最终的检索结果。实验结果表明,与其他基于不同哈希算法的图像检索算法相比,所提算法具有较高的准确性和较快的检索速度。 展开更多
关键词 图像检索 卷积神经网络 局部敏感哈希算法 高维特征向量
下载PDF
基于局部敏感哈希的导航星库快速搜索算法 被引量:4
18
作者 朱海龙 梁斌 张涛 《西北工业大学学报》 EI CAS CSCD 北大核心 2018年第5期988-994,共7页
为提高星图识别过程中导航星库的搜索速度,提出基于局部敏感哈希的导航星库快速搜索算法。通过分析星图识别原理,以角距误差限为基准,量化星角距,将有序星点集星图识别模式转换为具有局部敏感特性的整数数组。然后引用STLport中整数哈... 为提高星图识别过程中导航星库的搜索速度,提出基于局部敏感哈希的导航星库快速搜索算法。通过分析星图识别原理,以角距误差限为基准,量化星角距,将有序星点集星图识别模式转换为具有局部敏感特性的整数数组。然后引用STLport中整数哈希函数对整数数组进行散列,得到哈希值以及对应的存储有序星点集模式中心星点编号的集合。实验结果表明:提出算法的时间复杂度为O(1),优于直接遍历搜索、二分查找搜索以及k-vector搜索算法。考虑实际工程应用情况,可以选择星角距误差限为1个像素对应角距,角距数量,此时星图识别过程中哈希表的冲突率为0.74%,平均搜索次数为1.007 4,星图平均识别时间22μs。 展开更多
关键词 星图识别 有序星点集 局部敏感哈希 星角距量化 角距误差限 仿真实验
下载PDF
一种基于局部敏感哈希的文本数据去重算法及其实现
19
作者 申峻宇 李东闻 +1 位作者 钟震宇 张玉志 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期29-35,共7页
预训练语言模型的发展激发对网络数据的大规模需求,而网络数据往往具有较高的重复性和相似性,需要经过去重才能更好地被用于模型训练.目前的去重算法可以去除相似和相同的文本数据,但存在运算效率较低的问题,难以用于处理大规模文本数据... 预训练语言模型的发展激发对网络数据的大规模需求,而网络数据往往具有较高的重复性和相似性,需要经过去重才能更好地被用于模型训练.目前的去重算法可以去除相似和相同的文本数据,但存在运算效率较低的问题,难以用于处理大规模文本数据.本研究提出一种面向大规模文本数据的去重算法,采用先局部后整体的去重策略,极大提高了去重的运算效率.实验结果表明,算法在50 h内完成371 GB数据的去重处理,较已有算法极大地提高了去重效率. 展开更多
关键词 文本去重 最小哈希 局部敏感哈希
原文传递
面向局部敏感哈希的压缩编码算法
20
作者 周文桦 《智能物联技术》 2023年第5期29-36,共8页
局部敏感哈希算法需要生成足够长的哈希码才能达到理想的检索精度,这导致哈希码携带了大量冗余信息。针对该问题,本文提出一种面向长局部敏感哈希码的压缩编码算法(Compression Coding for Locality-Sensitive Hashing,CCLSH)。该算法... 局部敏感哈希算法需要生成足够长的哈希码才能达到理想的检索精度,这导致哈希码携带了大量冗余信息。针对该问题,本文提出一种面向长局部敏感哈希码的压缩编码算法(Compression Coding for Locality-Sensitive Hashing,CCLSH)。该算法基于哈希位的平衡性、相似性结构保留能力和互信息设计了哈希位质量与相关性度量准则,通过融合上述两个准则去除长哈希码中低质量且具有高相关性的冗余哈希位,实现无损压缩的目的。在三个基准数据集上的实验结果表明,CCLSH所压缩的哈希码在检索性能上与原长哈希码保持一致,同时压缩率都达到了90%以上。此外,与经典的压缩和哈希算法相比,该算法展现出更优秀的检索性能。 展开更多
关键词 哈希学习 局部敏感哈希 压缩编码 二值码
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部