期刊文献+

分布式计算框架的研究 被引量:6

下载PDF
导出
摘要 大数据时代的到来,需要对大量数据进行离线和实时分析,现在这种线上和线下共用数据源的大数据框架已经成为一种研究热点。本文介绍的就是把离线和实时的数据源作为同一个数据源,然后控制数据分别进入离线和实时的系统。文中分别介绍了这4个功能块的模式,以及利用现在Apache开源的Flume、Kafka、Storm和HDFS搭建这样的一个框架,分别实现框架的搭建和一个简单的数据线上和线下的分析。
机构地区 深圳报业集团
出处 《信息技术与信息化》 2015年第10期199-200,共2页 Information Technology and Informatization
  • 相关文献

参考文献3

  • 1夏俊鸾著..Spark大数据处理技术[M].北京:电子工业出版社,2015:336.
  • 2TomWhite.Hadoop权威指南[M].北京:清华大学出版社,2010. 被引量:9
  • 3Apache Flume[EB/OL].(2015-05-20)[2015-07-22]http://Flume.apache.org/. 被引量:1

共引文献8

同被引文献35

引证文献6

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部