-
题名一种列存储数据仓库中的数据复用策略
被引量:8
- 1
-
-
作者
王梅
周娇玲
乐嘉锦
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2013年第8期1626-1635,共10页
-
基金
国家自然科学基金(61070031
61103046)
上海市自然科学基金(11ZR1401200)资助~~
-
文摘
数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.
-
关键词
数据复用
数据仓库
列存储
模式匹配
可复用数据
-
Keywords
data reusing
data warehouse
column-store
schema mapping
reusable data
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名图像处理工作流内部的数据存储
被引量:5
- 2
-
-
作者
范军涛
李国庆
康琳
-
机构
中科院中国遥感卫星地面站重点实验室
中国人民解放军后勤指挥学院研一队
-
出处
《计算机仿真》
CSCD
2007年第8期182-184,204,共4页
-
文摘
图像处理由一系列的步骤组成,针对在处理序列中某个活动的处理参数变化后,从头开始重新则执行计算量大的问题,文中提出了增加"存储活动",从而图像处理时可以使用工作流技术进行处理链的动态自动优化,同时可以很容易地利用已有的图像处理程序。由于遥感图像巨大的数据量,不可能在每个步骤保存中间结果,文中提出的方法可以选择关键的活动以及保存适当的数据内容和格式,从而可以在工作流中某些活动发生变化的情况下快速重建图像。通过试验证明所提出的评估算法有效。
-
关键词
工作流
图像处理
活动
存储活动
可重用数据
-
Keywords
Workflow
Image processing
Activity
Cache activity
reusable data
-
分类号
TP751
[自动化与计算机技术—检测技术与自动化装置]
-