期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于路径与词林编码的词语相似度计算方法 被引量:8
1
作者 王松松 高伟勋 徐逸凡 《计算机工程》 CAS CSCD 北大核心 2018年第10期160-167,共8页
现有词语相似度计算方法主要针对词语的路径结构进行计算,较少深入考虑词语的语义信息,导致计算结果不够准确。针对该问题,提出一种改进的词语语义相似度计算方法。将词语的词林编码与路径结构相结合,同时利用局部敏感哈希算法和海明距... 现有词语相似度计算方法主要针对词语的路径结构进行计算,较少深入考虑词语的语义信息,导致计算结果不够准确。针对该问题,提出一种改进的词语语义相似度计算方法。将词语的词林编码与路径结构相结合,同时利用局部敏感哈希算法和海明距离计算词林编码之间的相似度。在MC和RG数据集上的实验结果表明,该方法可使皮尔逊相关系数分别达到0. 897 4和0. 866 8,较传统基于路径和深度的计算方法准确性更高。 展开更多
关键词 同义词 路径结构 编码 词语相似度 局部敏感哈希算法 语义
下载PDF
基于局部敏感哈希算法的图像高维数据索引技术的研究 被引量:6
2
作者 曹玉东 刘福英 蔡希彪 《辽宁工业大学学报(自然科学版)》 2013年第1期1-3,共3页
局部敏感哈希(LSH)算法是有效的高维数据索引方法之一,该算法成功地解决了"维数灾难"问题。分析了LSH算法中主要参数对索引性能的影响,在规模不同的图像数据集上应用了LSH算法,实验结果表明选择合适的参数时,其性能接近顺序... 局部敏感哈希(LSH)算法是有效的高维数据索引方法之一,该算法成功地解决了"维数灾难"问题。分析了LSH算法中主要参数对索引性能的影响,在规模不同的图像数据集上应用了LSH算法,实验结果表明选择合适的参数时,其性能接近顺序搜索方法。 展开更多
关键词 高维数据索引 图像检索 局部敏感哈希算法
下载PDF
基于局部敏感哈希算法的文档内容相似性判断算法
3
作者 曹雨 李刚 +3 位作者 金义 马路遥 宋永春 刘凯 《电子设计工程》 2024年第18期187-190,195,共5页
当前普遍采用全局逐一度量的方式进行文档内容相似性判断,工作量十分巨大,因此研究一种基于局部敏感哈希算法的文档内容相似性判断算法。针对文档实施中文分词、去停用词处理。筛选中心关键词并以此为基础将文档表示成空间向量的形式。... 当前普遍采用全局逐一度量的方式进行文档内容相似性判断,工作量十分巨大,因此研究一种基于局部敏感哈希算法的文档内容相似性判断算法。针对文档实施中文分词、去停用词处理。筛选中心关键词并以此为基础将文档表示成空间向量的形式。将语料库中的文档与待检测文档都哈希到哈希桶中,在哈希桶中度量待检测文档与语料库文档之间的相似性,并通过阈值实现文档内容相似程度的判断。实验结果表明,采用所研究算法可以实现对文档内容相似性度的计算并得出了对应的相似程度。 展开更多
关键词 局部敏感哈希算法 预处理 关键词筛选 内容相似性 空间向量
下载PDF
基于改进SIFT的无人机双目目标识别与定位 被引量:4
4
作者 姚艺 黄卫华 +2 位作者 章政 陈阳 张子然 《组合机床与自动化加工技术》 北大核心 2022年第6期49-53,共5页
对无人机自主着陆系统中双目视觉采集到的地标图像进行了研究,在分析地标图像中存在模糊噪声以及大量背景干扰问题,提出一种基于改进SIFT算法的无人机双目视觉目标识别与定位方法。首先,采用基于OTSU与HSV的ROI算法对无人机双目图像进... 对无人机自主着陆系统中双目视觉采集到的地标图像进行了研究,在分析地标图像中存在模糊噪声以及大量背景干扰问题,提出一种基于改进SIFT算法的无人机双目视觉目标识别与定位方法。首先,采用基于OTSU与HSV的ROI算法对无人机双目图像进行目标识别与分割预处理操作,将目标准确识别;其次,针对双目视觉获取三维信息效率慢的问题,采用基于改进的SIFT算法对已识别的地标进行特征提取,生成二进制描述符,并采用局部敏感哈希算法对特征点进行稀疏匹配,提高目标特征匹配准确度及效率;最后,采用相似三角形原理计算每个特征匹配点的三维距离,获得无人机与目标之间的平均三维距离。实验结果表明所设计的算法相较于传统的SIFT算法更具有可行性和有效性。 展开更多
关键词 SIFT BRIEF 局部敏感哈希算法 双目视觉 目标识别
下载PDF
基于卷积神经网络和LSH的图像检索算法 被引量:4
5
作者 杨荣 张建刚 贾晖 《西安邮电大学学报》 2022年第2期88-94,共7页
为了提高图像检索的准确度和检索效率,提出一种基于卷积神经网络和局部敏感哈希(Locality-Sensitive Hashing,LSH)算法的图像检索算法。使用图像库ImageNet对视觉几何小组16(Visual Geometry Group 16,VGG16)网络进行训练,获取初始化参... 为了提高图像检索的准确度和检索效率,提出一种基于卷积神经网络和局部敏感哈希(Locality-Sensitive Hashing,LSH)算法的图像检索算法。使用图像库ImageNet对视觉几何小组16(Visual Geometry Group 16,VGG16)网络进行训练,获取初始化参数。以卷积神经网络为基础,增加哈希层代替VGG16全连接层,获取图像的高维特征向量。利用哈希函数满足p-稳定分布的LSH算法将高维特征向量映射为哈希码,并将相似图像映射到同一个哈希桶中作为粗检候选集,计算并排序候选集中特征向量欧氏距离完成图像检索,从而得到最终的检索结果。实验结果表明,与其他基于不同哈希算法的图像检索算法相比,所提算法具有较高的准确性和较快的检索速度。 展开更多
关键词 图像检索 卷积神经网络 局部敏感哈希算法 高维特征向量
下载PDF
基于改进随机森林的海量结构化数据异常辨识算法
6
作者 宋冀峰 《微型电脑应用》 2023年第11期156-159,共4页
结构化数据同时具备现海量与复杂的特征,导致其异常辨识难度上升,为此提出基于改进随机森林的海量结构化数据异常辨识算法。凭借互补集合经验模态分解,获得海量结构化数据的本征模态函数,去除噪声点。随机选择特征子集分裂决策树节点,采... 结构化数据同时具备现海量与复杂的特征,导致其异常辨识难度上升,为此提出基于改进随机森林的海量结构化数据异常辨识算法。凭借互补集合经验模态分解,获得海量结构化数据的本征模态函数,去除噪声点。随机选择特征子集分裂决策树节点,采用AdaBoost算法对随机森林进行加权,完成随机森林改进。将改进随机森林的扩展空间范围定义为异常值范围,结合局部敏感哈希算法度量去除噪声点后的数据异常度,实现海量结构化数据异常辨识。通过实验表明,所提算法的海量结构化数据异常辨识精准度最高达到了95.8%,结构化数据量为400 G时的辨识耗时为2.52 min,说明该算法的海量结构化数据异常辨识精准率高、耗时短,具有较高的应用价值。 展开更多
关键词 改进随机森林 结构化数据 数据异常辨识 本征模态函数 局部敏感哈希算法
下载PDF
基于近似匹配的移动边缘计算缓存管理方法 被引量:2
7
作者 郦睿翔 毛莺池 郝帅 《计算机科学》 CSCD 北大核心 2021年第1期96-102,共7页
针对终端用户产生大量相同或相似计算请求的情况,可以通过近似匹配在边缘服务器缓存空间中查找相似数据,选取可复用的计算结果。现有算法大多未考虑数据分布不均的问题,导致计算量和时间开销较大,对此文中提出基于动态局部敏感哈希算法... 针对终端用户产生大量相同或相似计算请求的情况,可以通过近似匹配在边缘服务器缓存空间中查找相似数据,选取可复用的计算结果。现有算法大多未考虑数据分布不均的问题,导致计算量和时间开销较大,对此文中提出基于动态局部敏感哈希算法与加权k近邻算法的缓存数据选择策略(Cache Selection Strategy based on Dynamic-LSH algorithm and Weighted-KNN algorithm,CSS-DLWK)。其中,Dynamic-LSH算法能够针对数据分布不均的问题,根据数据分布的变化动态调整哈希桶粒度,从缓存空间中选出与输入数据相似的数据集合;Weighted-KNN算法以距离和样本数为权重,对由Dynamic-LSH算法获取的相似数据集合进行数据再选取,得到与输入数据最相似的数据,获取相应的计算结果以供复用。仿真实验结果表明,在CIFAR-10数据集中,与基于A-LSH算法与H-KNN算法的缓存选取策略相比,CSS-DLWK策略的平均选取准确率提高了4.1%;与传统的LSH算法相比,其平均选取准确率提高了16.8%。CSS-DLWK策略能够在可接受的数据选取时间开销内,有效地提高可复用数据选取的准确率,从而减少边缘服务器的重复计算。 展开更多
关键词 移动边缘计算 缓存替换 近似匹配 数据复用 局部敏感哈希算法
下载PDF
一种基于P稳定局部敏感哈希算法的相似人脸检索系统设计 被引量:1
8
作者 陈雯柏 黄至铖 刘琼 《智能系统学报》 CSCD 北大核心 2017年第3期392-396,共5页
针对智能移动终端、移动机器人安防巡检等应用需求,本文提出了一种基于P稳定局部哈希算法的相似人脸检索系统设计。首先,采用基于局部组合二值特征检测图像中的人脸。进而,通过深度自编码神经网络提取人脸特征。最后,基于所提取的图像... 针对智能移动终端、移动机器人安防巡检等应用需求,本文提出了一种基于P稳定局部哈希算法的相似人脸检索系统设计。首先,采用基于局部组合二值特征检测图像中的人脸。进而,通过深度自编码神经网络提取人脸特征。最后,基于所提取的图像的人脸区域特征使用稳定分布的局部敏感哈希算法对每幅图像构建高效索引。实验表明,本文所设计的相似人脸检索系统处理一幅图像的时间约400 ms,能满足实际应用需求,且返回检测结果的误检率低于经典AdaBoost算法。 展开更多
关键词 人脸图像检索 局部敏感哈希算法 P稳定分布 局部组合二值特征
下载PDF
基于MapReduce的相似矩阵并行构造 被引量:1
9
作者 罗莉霞 蒋盛益 《计算机工程与设计》 北大核心 2021年第5期1368-1375,共8页
随着用户数量与数据体量的飞速增长,传统基于相似性矩阵构造的协同过滤算法求解效率低下。针对这一问题,提出一种基于MapReduce框架下的并行相似矩阵构造算法。依据基于改进的局部敏感哈希(locality sensitive Hashing,LSH)算法将项目... 随着用户数量与数据体量的飞速增长,传统基于相似性矩阵构造的协同过滤算法求解效率低下。针对这一问题,提出一种基于MapReduce框架下的并行相似矩阵构造算法。依据基于改进的局部敏感哈希(locality sensitive Hashing,LSH)算法将项目集合划分为不相交的组,基于MapReduce框架进行组内部相似度和组间相似度计算,采用MovieLens数据集进行算例实验对比。实验结果表明,与传统串行和两轮次MapReduce构造方法相比,在相同的实验条件下,所提方法的平均执行时间分别节约26.4%和14.4%以上。所提方法在大规模数据集场景下具有更好的经济性与扩展性,改进的LSH算法有效提升了后续轮次的计算效率。 展开更多
关键词 相似矩阵构造 相似度计算 MAPREDUCE框架 协同过滤推荐算法 并行计算 局部敏感哈希算法
下载PDF
基于局部敏感哈希算法和神经网络学习的跨媒体检索方法 被引量:1
10
作者 白亮 贾玉华 +2 位作者 王昊冉 谢毓湘 于天元 《国防科技大学学报》 EI CAS CSCD 北大核心 2018年第1期93-98,共6页
为了提高跨媒体检索的效率,可行的方法是降低数据集中不相关内容的比例。采用局部敏感哈希算法将图像数据映射到汉明空间并利用神经网络学习将文本数据映射到汉明空间的哈希函数,提出一种可以显著提高数据集中相关文件比例的高效跨媒体... 为了提高跨媒体检索的效率,可行的方法是降低数据集中不相关内容的比例。采用局部敏感哈希算法将图像数据映射到汉明空间并利用神经网络学习将文本数据映射到汉明空间的哈希函数,提出一种可以显著提高数据集中相关文件比例的高效跨媒体检索方法。实验结果表明,提出的方法能够有效去除数据集中的不相关内容,相对于已有的跨媒体检索方法,其有效提高了检索效率与准确率。 展开更多
关键词 跨媒体检索 神经网络算法 局部敏感哈希算法 多模态数据索引
下载PDF
集中式环境下的局部敏感哈希算法综述 被引量:1
11
作者 刘根平 《移动通信》 2015年第10期46-51,共6页
局部敏感哈希算法是一种很流行的高维相似性查找算法。通过总结多篇已发表论文,介绍了集中式环境下的局部敏感哈希算法及其实现,分析了各种局部敏感哈希算法的特点和优缺点。在近似最近邻查询中的广泛应用证实了局部敏感哈希算法的有效性。
关键词 高维数据 相似性搜索 KNN查询 局部敏感哈希算法
下载PDF
基于改进局部敏感哈希的协同过滤推荐算法
12
作者 曹界杰 张娟 《软件》 2021年第5期151-156,共6页
传统推荐系统中存在用户评分数据高维稀疏、分布不均匀和传统用户相似度计算准确性低等问题,本文提出一种基于改进局部敏感哈希的协同过滤算法。首先利用改进局部敏感哈希算法对用户评分数据进行降维处理并构建索引,并使用相似度修正系... 传统推荐系统中存在用户评分数据高维稀疏、分布不均匀和传统用户相似度计算准确性低等问题,本文提出一种基于改进局部敏感哈希的协同过滤算法。首先利用改进局部敏感哈希算法对用户评分数据进行降维处理并构建索引,并使用相似度修正系数对用户相似度计算做出改进;然后利用索引敏捷切确地计算目标对象的近邻用户集合;之后选择近邻用户聚集的高相似度用户,使用加权算法对目标对象未评分项目进行评定预估。实验结果表明,对于非均匀用户评分数据的高维稀疏问题,该算法不仅能明显缩短近邻用户检索时间,且能有效提高推荐精度。 展开更多
关键词 推荐系统 协同过滤 局部敏感哈希算法 相似性度量 近似近邻检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部