摘要
研究大云数据快速挖掘优化控制问题。在大云数据环境下,产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用传统的集中式云计算算法对数据进行挖掘处理,会使算法陷入无穷对比的境地,造成算法不收敛,复杂度高的弊端。为解决上述问题,提出了一种并行Apriori算法的大云数据挖掘方法。对大云数据进行简化处理,去除其中的冗余数据,为大云数据快速挖掘提供数据基础。计算大云数据中的关联规则,从而获取大云数据之间的相关性。对大云数据进行处理,实现大云数据挖掘。实验结果表明,利用改进算法进行大云数据挖掘处理,能够有效提高数据挖掘的速度,存在较强的优越性。
Research the optimal control of large cloud fast data mining. This paper put forward a large cloud data mining method of parallel Apriori algorithm. Large cloud data can be simplified to remove the redundant data for fast data mining of large cloud data. Calculate the association rules in large cloud data, so as to obtain a correlation be- tween large cloud data. The big cloud data processing achieved data mining of large cloud. Experimental results show that the improved algorithm for large cloud data mining process can effectively improve the speed of data mining.
出处
《计算机仿真》
CSCD
北大核心
2013年第4期386-389,共4页
Computer Simulation
基金
浙江省教育厅(高校)科研项目(Y201122576)
关键词
大云数据
数据挖掘
云计算
Large cloud data
Data mining
Cloud computing