期刊文献+

大数据挖掘中的MapReduce并行聚类优化算法研究 被引量:21

Research on MapReduce parallel clustering optimization algorithm in big data mining
下载PDF
导出
摘要 针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据分析需求,完成低成本、高性能的数据并行挖掘与处理。 The traditional data mining algorithm is only suitable for small-scale data mining and processing,and its disadvantages of low computational efficiency and insufficient memory are exposed gradually with the increase of data scale.MapReduce is used in the field of data mining to analyze the MapReduce parallelization improvement of the traditional data mining algorithms;and the corresponding parallelization implementation model is designed to meet the demand of big data analysis,and successfully complete the low-cost and high-performance data parallel mining and processing.
作者 吕国 肖瑞雪 白振荣 孟凡兴 LU Guo;XIAO Ruixue;BAI Zhenrong;MENG Fanxing(Modern Education Technology Center,Hebei University of Architecture,Zhangjiakou 075000,China)
出处 《现代电子技术》 北大核心 2019年第11期161-164,共4页 Modern Electronics Technique
基金 2018年河北省科学技术厅创新能力提升计划项目(184576131D) 2017年河北省高等学校科学技术研究项目(QN2017322) 2018年张家口市科学技术和地震局市级科技计划自筹经费项目(1821016B)~~
关键词 大数据 MAPREDUCE 并行化处理 聚类算法 数据挖掘 Map任务 big data MapReduce parallelization processing clustering algorithm data mining Map task
  • 相关文献

参考文献8

二级参考文献82

  • 1施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量:15
  • 2邹翔,张巍,刘洋,蔡庆生.分布式序列模式发现算法的研究[J].软件学报,2005,16(7):1262-1269. 被引量:19
  • 3Lam C.Hadoop实战[M].北京:人民邮电出版社,2011. 被引量:7
  • 4WHITET.Hadoop权威指南[M].北京:清华大学出版社,2011. 被引量:12
  • 5邢晓字.决策树分类算法的并行化研究及其应用[D].昆明:云南财经大学,2010:25-29. 被引量:1
  • 6Alham N K, Li Maozhen, Liu Yang. A MapReduce-based distributed SVM algorithm of automatic image annotation [J]. Computers and Mathematics with Applications, 2011, 62 (7) : 2801-2811. 被引量:1
  • 7Wu G, Li H, Hu X, et al. MReC4. 5: C4. 5 ensemble clas- sification with MapReduce [C] //ChinaGrid Annual Confe- rence. IEEE, 2009: 249-255. 被引量:1
  • 8He Q, Zhuang F, Li J, et al. Parallel implementation of classification algorithms based on MapReduce [M]. Rough Set and Knowledge Technology. Springer Berlin Heidelberg, 2010: 655-662. 被引量:1
  • 9Lichman K B A M. {UCI} machine learning repository [DB/ OL]. University of California, Irvine, School of Information and Computer Sciences. http://archive, ics. uci. edu/ml, 2013- 04-26. 被引量:1
  • 10LAN V,ALAGHBAND G.Novel parallel method for association rule mining on multi-core shared memory systems[J].Parallel Computing,2014,40(10):768-785. 被引量:1

共引文献75

同被引文献145

引证文献21

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部