-
题名压缩数据上的关系代数操作算法
被引量:2
- 1
-
-
作者
丁鑫哲
张兆功
李建中
谭龙
刘勇
-
机构
黑龙江大学计算机科学技术学院
哈尔滨工业大学计算机科学技术学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第1期21-26,51,共7页
-
基金
国家自然科学基金资助项目(81273649)
黑龙江省自然科学基金资助项目(F201434)~~
-
文摘
针对在大数据管理中,在压缩的数据上无需解压即可进行相关操作的问题,在数据服从正态分布的前提下,根据列数据存储的特点,提出了一种新的面向列存储的压缩方法——CCA。首先,通过对列数据的长度进行归类;然后,采用抽样的方法获得重复度较高的前缀;最后,使用字典编码进行压缩,提出了列索引(CI)和列实体(CR)作为数据压缩结构来降低大数据存储的空间需求,从而直接有效地在压缩数据上支持选择、投影、连接等基本操作,并实现了基于CCA的数据库原型系统——D-DBMS。理论分析和在1 TB数据上的实验结果表明,该压缩算法能够显著提高大数据的存储效率和数据操作性能,与BAP和TIDC压缩方法相比,在压缩率分别提高了51%、14%;在执行速度上提高了47%、42%。
-
关键词
大数据压缩
列索引
列实体
关系代数操作
-
Keywords
massive data compression
Column Index(CI)
Column Reality(CR)
relational algebraic operation
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名支持第三级存储器的查询优化方法的研究
- 2
-
-
作者
刘宝良
李建中
高宏
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第8期1379-1385,共7页
-
基金
国家自然科学基金项目(60273082)
国家"八六三"高技术研究发展计划基金项目(2002AA444110)
+1 种基金
国家"九七三"重点基础研究发展规划基金项目(G1999032704)
黑龙江省自然科学基金项目(zjg03-05)
-
文摘
目前的关系数据库代价模型及查询优化算法无法处理保存在第三级存储器中的海量数据.提出了估算第三级关系代数操作的代价模型,通过定义若干基本数据访问模式及两种模式合成方法的代价,导出关系代数操作的代价.提出了针对第三级存储器的查询优化方法,该方法不仅可以选择最高效的关系代数操作实现算法,而且可以选择I/O代价最小的关系副本,从而提高查询效率.实验结果表明,应用提出的代价模型及查询优化方法后可以显著地提高第三级存储器上数据的查询效率.关系副本的引入充分证明了用存储空间换取查询执行时间的策略的可行性.
-
关键词
代价模型
查询优化
第三级存储器
关系代数操作
数据访问模式
-
Keywords
cost model
query optimization
tertiary storage
relational operation
data access pattern
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名关系代数操作符的时态扩展
被引量:2
- 3
-
-
作者
黄如寿
汤庸
-
机构
中山大学计算机科学系
-
出处
《现代计算机》
2003年第10期6-9,共4页
-
文摘
时态数据库由时态数据结构、时态关系操作符和时态约束三部分构成。本文主要介绍在关系操作符的基础上进行时态扩展以构成时态关系操作符;并使用标准的SQL语句对时态关系操作符的语义进行了描述。它们包括时态并、时态交、时态减、时态投影、时态选取和时态除等几个时态关系操作。
-
关键词
时态数据库
时态数据结构
关系代数操作符
时态扩展
SQL语句
数据模型
数据库管理系统
-
Keywords
Temporal Database
Temporal Relational Operator
Temporal Extension
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-