期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Spark和Flink平台大数据批量处理的性能分析 被引量:6
1
作者 马黎 《中国电子科学研究院学报》 北大核心 2018年第2期191-195,213,共6页
为了研究Apache Spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析Spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的算法有:支持向量机(SVM)算法、线性回归(LR)算法和分布... 为了研究Apache Spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析Spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的算法有:支持向量机(SVM)算法、线性回归(LR)算法和分布式信息理论的特征选择(FS-DIT)算法,其中SVM和LR算法为平台固有算法,FS-DIT根据平台框架特点重新设计。三种机器学习算法的实验结果表明:Spark的性能优于Flink,且总体运行时长低于Flink。另外对Spark目前拥有的MLlib和ML性能也进行了分析研究。整个研究对新旧两种平台上的批处理应用具有一定指导作用。 展开更多
关键词 批量大数据处理 性能差异 APACHE SPARK APACHE Flink 机器学习算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部