摘要
关联规则数据挖掘是目前大数据技术的关注热点,其在工业、金融、教育等领域得到了广泛的研究。研究提出了一种融合BPEclat与K-Means++算法的关联规则数据挖掘模型,该模型通过K-Means++算法完成操作变量和状态变量的聚类,并利用BPEclat实现数据并行化处理和分区数据计算。两种关联规则算法数据集测试显示,SPEclat算法和BPEclat算法6个节点间运行时间差值最大值分别为8.1 s和2.2 s。关联规则数据挖掘得出,反应器的内部温度、内部压力、内部液化与冷凝器冷却水流量等六个状态变量的规则。研究所构建的关联规则数据挖掘模型具有极高的运行效率,可应用于各个行业的数据挖掘。
association rule data mining is the focus of big data technology,which has been widely studied in the fields of industry,finance,education and so on.This paper proposes an association rule data mining model integrating bpeclat and K-means++algorithm.The model completes the clustering of operation variables and state variables through K-means++algorithm,and uses bpeclat to realize data parallel processing and partition data calculation.The data set test of the two association rule algorithms shows that the maximum running time difference between the six nodes of speclat algorithm and bpeclat algorithm is 8.1s and 2.2 s respectively.The rules of six state variables such as internal temperature,internal pressure,internal liquefaction and condenser cooling water flow of the reactor are obtained by association rule data mining.The association rule data mining model constructed by the research has high operation efficiency and can be applied to data mining in various industries.
作者
叶得学
YE De-xue(School of Information Engineering,Lanzhou Technology and Business College,Lanzhou 730101,Gansu,China)
出处
《贵阳学院学报(自然科学版)》
2022年第2期39-43,共5页
Journal of Guiyang University:Natural Sciences
基金
甘肃省科技计划资助项目“大数据助力区域突发公共疫情防控的应用研究”(项目编号:20CX9ZA021)
兰州市科技计划项目资助项目“深度学习在甘肃特色农产品推广中的应用研究”(项目编号:2019-ZD-167)
甘肃省高等学校创新基金项目“大数据在突发公共疫情防控中的应用研究”(项目编号:2020A-175)
兰州市科技计资助划项目“大数据技术在兰州高新区企业税收风险管理中的应用研究”(项目编号:2020-ZD-139)。