-
题名基于实时数据和历史查询分布的时空索引新方法
被引量:2
- 1
-
-
作者
孟学潮
叶少珍
-
机构
福州大学数学与计算机科学学院
福建省医疗器械与医药技术重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2017年第3期860-865,共6页
-
基金
国家自然科学基金资助项目(61502106)
福建省区域重大科技专项资助项目(2014H4015)~~
-
文摘
在大数据时代,数据具有体量大、时空复杂性明显、对实时性要求较高等特点,而传统基于树形结构对大规模时空数据进行索引的方法存在存储空间浪费和查询效率较低的问题。为了解决该问题,提出了一种基于数据和历史查询记录分布建立时空索引的新方法 HDL-index。该算法一方面根据数据在空间上的分布,通过空间划分的思想建立索引网格;另一方面考虑到查询在时间上的延续性,对查询记录对象进行密度聚类后抽象出查询代表模型,然后根据模型的坐标位置和其查询粒度对整体查询区域进行分割。两部分所得到的索引网格都采用Geohash编码,最终合并得到最优的索引编码。HDL-index在考虑数据分布的同时充分考虑用户查询行为,使得频繁查询区域上的索引更加细化。在真实航空数据集上与同类方法进行比较测试的结果表明,其创建索引的效率提高了50%;同时在数据均匀分布的情况下对热点区域的查询效率可提高75%以上。
-
关键词
时空索引
大数据
GeoHash编码
密度聚类
热点区域查询
-
Keywords
spatio-temporal index
big data
GeoHash encoding
density clustering
hotspot region query
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-