基于AP-CAN的增量关联挖掘算法研究被引量：1

Research on Incremental Association Mining Algorithm Based on AP-CAN

下载PDF

导出

摘要随着大数据时代的到来,增量关联规则挖掘已成为数据挖掘领域的热门话题。CAN-tree作为增量关联规则挖掘领域的重要算法,其按项目频次大小进行排序会使树(tree)的规模过大,降低算法效率。针对此问题,提出一种基于AP-CAN的增量关联挖掘算法,采用AP聚类思想将原始数据集按项目的支持度不同分为多个集群,修剪不满足最小支持度的集群,利用哈希头表替代项头表,并根据数据量对每条事务排序。实验结果表明,该方法可以显著削减CAN树的规模,降低项目查找时间,提高数据挖掘效率,在效率和稳定性上均优于现有的CAN-tree算法。 With the advent of the era of big data,incremental association rule mining has become a hot topic in the field of data mining.CAN-tree is an important algorithm in the field of incremental association rule mining,while sorting by item frequency will make the tree scale too large and the algorithm efficiency low.To solve this problem,an incremental association mining algorithm based on AP-CAN is proposed.The algorithm adopts the idea of AP clustering to divide the original data set into multiple clusters according to the different support degree of the project,pruning the clusters that do not meet the minimum support degree,replacing the item head table with the hash head table,and sorting each transaction according to the data volume.Experimental results show that this method CAN significantly reduce the scale of CAN-tree,reduce the search time of items,improve the efficiency of data mining,and is better than the existing CAN-tree algorithm in efficiency and stability.

作者洪炎张磊严加琪 HONG Yan;ZHANG Lei;YAN Jiaqi(College of Electrical and Information Engineering,Anhui University of Science and Technology,Huainan 232001,China)

机构地区安徽理工大学电气与信息工程学院

出处《安庆师范大学学报（自然科学版）》 2021年第2期20-25,共6页 Journal of Anqing Normal University(Natural Science Edition)

基金国家自然科学基金青年科学基金项目(61501006) 安徽省自然科学基金面上基金(1808085MF169) 安徽高校自然科学研究项目(KJ2018A0086)。

关键词关联规则数据挖掘 AP聚类 CAN-tree算法 association rules data mining AP clustering CAN-tree algorithm

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1刘冬霞.数据挖掘技术在大学生上网行为分析中的应用探讨[J].科学与信息化,2019,0(19):38-38. 被引量：1
2姜晗,范建淑,贾泂.基于FP-Tree快速挖掘频繁项集[J].计算机应用与软件,2010,27(10):36-37. 被引量：2
3邹力鹍,张其善.基于CAN-树的高效关联规则增量挖掘算法[J].计算机工程,2008,34(3):29-31. 被引量：9
4陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4
5胡军,潘皓安.基于Can树的关联规则增量更新算法改进[J].重庆邮电大学学报（自然科学版）,2018,30(4):558-563. 被引量：7
6彭浩,佃松宜.基于改进FP-growth的用户兴趣推荐算法的设计与实现[J].微电子学与计算机,2020,37(2):8-13. 被引量：5
7李洁,朱洪亮,陈玉玲,辛阳.基于哈希存储与事务加权的并行Apriori改进算法[J].计算机工程,2020,46(11):109-116. 被引量：8

二级参考文献30

1冯洁,陶宏才.快速挖掘最大频繁项集[J].微电子学与计算机,2007,24(5):123-126. 被引量：12
2Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C]//SIGMOD'93,Washington,D C.May,1993. 被引量：1
3Agrawal R,Srikant R.Fast algorithms for mining association rules[R].IBM Almaden Research Center,San Jose,C A,June,1994. 被引量：1
4Han J,Pei J,Yin Y.Mining frequent patterns without candidate generation[C]//SIGMOD'2000,Dallas,T X,May,2000. 被引量：1
5Liu Junqiang,Pan Yunhe,Wang Ke,et al.Mining frequent item sets by opportunistic projection[C]//Proc.Of the Eighth ACM SIGKDD Intl.Conf.on Knowledge Discovery and Data Mining,Alberta,Canada,July,2002:229-238. 被引量：1
6Park J S,Chen M S,Yu P S.An effective hash based algorithm for mining association rules[C]//Proc.1995 ACM-SIGMOD,San Jose,CA,Feb,1995:175-186. 被引量：1
7范明孟小峰.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.. 被引量：26
8Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Databases[C]//Proc. of ACM SIGMOD Conference on Management of Data. Washington D. C., USA: [s. n.], 1993. 被引量：1
9Han Jiawei, Pei Jian, Yin Yiwen. Mining Frequent Patterns Without Candidate Generation[C]//Proc. of ACM SIGMOD Conference on Management of Data. Dallas, TX, USA: [s. n.], 2000. 被引量：1
10Leung K C, Khan Q I, Hoque T. CanTree: A Tree Structure for Efficient Incremental Mining of Frequent Patterns[C]//Proceedings of the 5th IEEE International Conference on Data Mining. New Orleans, USA:[s. n.], 2005. 被引量：1

共引文献25

1周保琢,李传富,代亮亮,冯焕清.采用增量关联规则挖掘提高电子病历系统的用户体验度[J].中国医疗器械杂志,2009,33(2):83-86. 被引量：3
2周爱武,王琰,陈宝楼.一种基于FUP的TD-FP-Tree并行快速更新算法[J].计算机技术与发展,2013,23(4):91-95. 被引量：2
3陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4
4张步忠,江克勤,张玉州.增量关联规则挖掘研究综述[J].小型微型计算机系统,2016,37(1):18-23. 被引量：12
5师超,郎博,戴君,金颖,范晓龙.重大装备工业大数据平台的实现方案[J].西安文理学院学报（自然科学版）,2017,20(6):44-49.
6胡军,潘皓安.基于Can树的关联规则增量更新算法改进[J].重庆邮电大学学报（自然科学版）,2018,30(4):558-563. 被引量：7
7王帅,杨秋辉,曾嘉彦,万莹,樊哲宁,张光兰.加权增量关联规则挖掘在通信告警预测中的应用[J].计算机应用,2018,38(10):2875-2880. 被引量：10
8杜媛,张世伟.基于重构的改进自然排序树算法[J].计算机应用,2019,39(2):441-445.
9王星,李佳,陈吉.D-NSWRL:一种语义Web动态扩展的非单调规则语言[J].重庆邮电大学学报（自然科学版）,2020,32(1):154-163.
10刘雯婷,周军.基于缓冲区技术的增量数据关联规则挖掘算法[J].辽宁工业大学学报（自然科学版）,2020,40(2):71-74. 被引量：1

同被引文献14

1周惠子,张杰.基于双链量子遗传投影寻踪模型的自媒体网络舆情热度与应对等级研究[J].情报杂志,2019,38(9):126-133. 被引量：3
2张宇献,陈向文,钱小毅.基于双链量子遗传优化的分类规则挖掘算法[J].沈阳工业大学学报,2021,43(1):61-66. 被引量：5
3陈健.决策树数据挖掘技术在医学诊断中的实现[J].佛山科学技术学院学报（自然科学版）,2021,39(2):47-52. 被引量：5
4陈永健.基于距离离群点数据挖掘技术的防窃电算法研究[J].龙岩学院学报,2021,39(2):15-20. 被引量：1
5王彦,陆海,杨洋,张旭东,苏适.基于数据融合算法的电网用电量数据分析方法[J].节能技术,2021,39(2):153-158. 被引量：7
6熊中敏,汪博,陶然,郑宗生,陈明.一种基于主属性判定的关联规则挖掘约简算法[J].计算机工程与科学,2021,43(4):738-745. 被引量：7
7杨杉.基于聚类算法和决策树算法的网络学习行为研究[J].电脑知识与技术,2021,17(10):213-216. 被引量：4
8张德宇.基于数据挖掘技术的物联网流量建模与估计研究[J].现代电子技术,2021,44(11):42-46. 被引量：3
9郭成,张万达,王波.基于配电数据的关联规则挖掘方法[J].电力科学与工程,2021,37(5):32-39. 被引量：4
10王乐洋,靳锡波,许光煜.断层参数反演的动态惯性因子的粒子群算法[J].武汉大学学报（信息科学版）,2021,46(4):510-519. 被引量：7

引证文献1

1杨恒,李心愉.基于改进双链量子遗传算法的流数据挖掘方法[J].现代科学仪器,2022,39(5):206-212.

1王峰,李兴华,许伟军,赵永利,左颖敏.一种基于多维属性的光传输网络告警压缩方法[J].光通信技术,2021,45(5):7-10. 被引量：6
2朱海超,史凌川.如何缩短电缆故障查找时间探究[J].经济技术协作信息,2021(18):108-109.
3王得翊,焦澳琛,陈音拿,安静,康琦,汪镭.基于多阶局部度数峰值点的局部社区发现算法[J].微型电脑应用,2021,37(6):1-4. 被引量：1

安庆师范大学学报（自然科学版）

2021年第2期

浏览历史

内容加载中请稍等...

基于AP-CAN的增量关联挖掘算法研究被引量：1

参考文献7

二级参考文献30

共引文献25

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于AP-CAN的增量关联挖掘算法研究 被引量：1

参考文献7

二级参考文献30

共引文献25

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于AP-CAN的增量关联挖掘算法研究被引量：1