期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种大规模数据快速并行导入工具的研究与实现 被引量:1
1
作者 邵开丽 姜伟 吕举文 《计算机应用与软件》 CSCD 2015年第9期26-30,共5页
随着大规模数据的快速增长及高可靠性需求,将本地数据迁移到分布式数据库势在必行。针对这种情况,提出一种基于MapReduce的"快速并行导入"技术,充分利用集群的并行计算能力,直接向HBase底层存储文件HFile写入数据,既可避免上... 随着大规模数据的快速增长及高可靠性需求,将本地数据迁移到分布式数据库势在必行。针对这种情况,提出一种基于MapReduce的"快速并行导入"技术,充分利用集群的并行计算能力,直接向HBase底层存储文件HFile写入数据,既可避免上层数据导入时间的浪费,又节省资源开销。有效解决了从单机数据库向HBase分布式数据库导入数据功能低下、效率不高等问题。实验结果表明,在"快速并行导入"技术的基础上设计并实现的快速并行导入工具,支持多列族文本数据的快速导入。与传统使用API导入数据相比,速度提升一倍以上。 展开更多
关键词 HADOOP HBASE mapreduce分布式数据库 大规模数据导入
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部