-
题名利用分区和距离实现高维空间快速KNN查询
被引量:4
- 1
-
-
作者
梁俊杰
王长磊
-
机构
湖北大学数学与计算机科学学院
湖北省公安厅行动技术总队
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第11期1980-1985,共6页
-
基金
国家"八六三"高技术研究发展计划基金项目([2005]555)
-
文摘
在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,结合这两种思想,提出一种基于区位码和距离的索引结构(BD)以实现快速KNN查询.根据高维空间向量分布特点,合理分区使得大量分布在空间表面的点尽可能地划分到不同的分区中,提高检索剪枝效率.引入区位码概念和转换函数,将高维向量近似表示并转换为一维数值形式,组织成B+树索引.利用快速KNN查询算法,实现两层过滤,缩小搜索范围,降低树搜索代价.采用模拟数据和真实数据,大量实验验证了BD比其他同类索引具有更高的检索效率.
-
关键词
高维向量空间
KNN查询
区位码
近似向量
索引结构
-
Keywords
high-dimensional vector space
KNN search
bit code
approximate vector
index structure
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名大规模高维向量空间的快速范围查询
被引量:5
- 2
-
-
作者
梁俊杰
杨泽新
冯玉才
-
机构
华中科技大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第7期1225-1229,共5页
-
基金
国家"八六三"电子信息产业发展基金([2005]555)资助.
-
文摘
金字塔技术是目前针对高维空间范围查询的有效方法之一,但是随着数据量的增加,检索过程由于引入过多的误中点而导致不必要的高维距离计算,为此本文提出改进的金字塔技术.引入向量排序、活性维等概念,利用分段处理思想,将不包含候选点的误中分段剪枝,并通过逐维距离累加法过滤剩余分段内的误中点,从而快速排除所有的误中点,尽可能减少距离计算次数,实现大规模高维向量空间的快速范围查询.利用模拟数据和真实数据,实验验证了OPT方法的正确性和有效性.
-
关键词
大规模高维向量空间
范围查询
误中点
向量排序
活性维
-
Keywords
large high-dimensional vector space (LHDVS)
range query
false hit
vector order
active dimension
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名积分不等式Ⅱ
- 3
-
-
作者
盛立贵
-
机构
安徽大学数学系
-
出处
《安徽大学学报(自然科学版)》
CAS
2000年第4期10-14,共5页
-
文摘
用一种新方法处理了一类高维向量空间中的多变量非线性积分不等式 .主要结果即文中的定理 1 ,2 ,它的推论则是一些熟知的不等式 .
-
关键词
SCHAUDER不动点定理
高维向量空间
积分不等式
公共存在区间
平行定理
纯量函数
-
Keywords
Schauder fixpoint theorem
high dimension vector space
integral inequality
-
分类号
O175.5
[理学—数学]
-