基于Can树的关联规则增量更新算法改进被引量：7

Improved incremental updating algorithm of association rules based on Can-tree

下载PDF

导出

摘要如何从动态数据中挖掘关联规则是目前知识发现中的一个研究热点。Can树是基于CATS树改进后提出的解决关联规则增量挖掘的一种有效算法,它要求事务中的每个项按照某种特定顺序进行排序后再构建Can树,其顺序一般采用字典序、字母序等。然而,Can树所使用的排序方法有可能使得Can树的规模过大,从而使得算法效率较低。针对该问题,在现有Can树挖掘算法的基础上,使用数据量排序替代现有排序方法,提出了一种基于数据量排序的Can树,并基于新的Can树对原有Can树的建树和挖掘方法进行优化。该方法可以有效减小Can树的规模,实现频繁项集挖掘在空间效率和时间效率上的优化。实验结果表明,该方法在空间效率和时间效率上好于现有的Can树算法,同时具有较好的稳定性。 How to mine association rule from dynamic data is one of the hottest topics in knowledge acquisition.Can-tree,which is based on CATS tree,is an effective algorithm for incremental mining association rule.It requires that all items should be in specific order before building Can-tree,like lexicographic order or alphabetical order.However,the current used ordering method may cause the size of Can-tree too large,thus decreasing the efficiency of the algorithm.Aiming at this problem,this paper proposes a new Can-tree,which sorts items by data size instead of the current ordering methods.Meanwhile,the tree building and mining methods are optimized based on the proposed Can-tree.This method can effectively minimize the size of Can-tree,and improve the efficiency of mining frequent itemset in space and time.The experimental results show that this method outperforms the existing Can-tree algorithm in space efficiency,time efficiency,and stability.

作者胡军潘皓安 HU Jun;PAN Hao’an(Chongqing Key Laboratory of Computational Intelligence,Chongqing University of Posts and Telecommunications,Chongqing 400065,P.R.China)

机构地区重庆邮电大学计算智能重庆市重点实验室

出处《重庆邮电大学学报（自然科学版）》 CSCD 北大核心 2018年第4期558-563,共6页 Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)

基金国家自然科学基金(61472056 61379114) 教育部人文社科规划项目(15XJA630003) 重庆市教委科学技术研究项目(KJ1500416) 重庆市基础科学与前沿技术研究(cstc2017jcyjAX0406)~~

关键词关联规则增量更新 Can树 association rule incremental update Can-tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1冯玉才,冯剑琳.关联规则的增量式更新算法[J].软件学报,1998,9(4):301-306. 被引量：227
2张步忠,江克勤,张玉州.增量关联规则挖掘研究综述[J].小型微型计算机系统,2016,37(1):18-23. 被引量：12
3安建瑞,王海鹏,张龙波,金超,怀浩.一种基于MapReduce的压缩矩阵关联规则挖掘算法[J].重庆理工大学学报（自然科学）,2016,30(2):95-100. 被引量：5
4邹力鹍,张其善.基于CAN-树的高效关联规则增量挖掘算法[J].计算机工程,2008,34(3):29-31. 被引量：9
5陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4

二级参考文献40

1易彤,徐宝文,吴方君.一种基于FP树的挖掘关联规则的增量更新算法[J].计算机学报,2004,27(5):703-710. 被引量：32
2朱红蕾,李明.一种高效维护关联规则的增量算法[J].计算机应用研究,2004,21(9):107-109. 被引量：9
3张昕,李晓光,王大玲,于戈.数据流中一种快速启发式频繁模式挖掘方法[J].软件学报,2005,16(12):2099-2105. 被引量：14
4冯洁,陶宏才.快速挖掘最大频繁项集[J].微电子学与计算机,2007,24(5):123-126. 被引量：12
5Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Databases[C]//Proc. of ACM SIGMOD Conference on Management of Data. Washington D. C., USA: [s. n.], 1993. 被引量：1
6Han Jiawei, Pei Jian, Yin Yiwen. Mining Frequent Patterns Without Candidate Generation[C]//Proc. of ACM SIGMOD Conference on Management of Data. Dallas, TX, USA: [s. n.], 2000. 被引量：1
7Leung K C, Khan Q I, Hoque T. CanTree: A Tree Structure for Efficient Incremental Mining of Frequent Patterns[C]//Proceedings of the 5th IEEE International Conference on Data Mining. New Orleans, USA:[s. n.], 2005. 被引量：1
8Cheung D,Han J,Ng V. Maintenance of discov-ered association rules in large databases:an incremen-tal updating technique[A].New Orleans,1996.106-114. 被引量：1
9Ayan N F,Tansel A U,Arkun M E. An efficient al-gorithm to update large itemsets with early pruning[A].USA:San Diego,1999.287-291. 被引量：1
10Leung Carson Kai-Sang,Khan Quamrul I,Li Zhan. CanTree:a canonical-order tree for incremental pattern mining[J].Knowledge Information System,2007,(03):287-311. 被引量：1

共引文献243

1徐龙,杨君锐.基于数据库变化的关联规则增量式更新算法[J].重庆科技学院学报（自然科学版）,2007,9(4):67-70. 被引量：1
2简友光,简曙光.空间数据关联规则挖掘研究综述[J].计算机与数字工程,2007,35(7):52-55.
3敬会.关联规则增量式更新算法[J].科技资讯,2007,5(26).
4廖启明.基于数据新增关联规则的更新算法研究[J].光盘技术,2007(6):19-21.
5钱进,孟祥萍,徐冬寅.一种有效的关联规则增量式更新算法[J].长春工程学院学报（自然科学版）,2003,4(3):11-14. 被引量：4
6杨明,孙志挥,宋余庆.快速更新全局频繁项目集[J].软件学报,2004,15(8):1189-1197. 被引量：18
7邓小妮,罗雪山.一种基于事务时间分割的关联规则增量式更新方法[J].计算机工程与应用,2004,40(23):176-179. 被引量：1
8苏占东,游福成,杨炳儒.关联规则的综合评价方法研究与实例验证[J].计算机应用,2004,24(10):17-20. 被引量：27
9朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
10朱红蕾,李明.一种高效维护关联规则的增量算法[J].计算机应用研究,2004,21(9):107-109. 被引量：9

同被引文献34

1胡利平,梁晓龙,何吕龙,张佳强,任宝祥,齐铎.基于情景分析的航空集群决策规则库构建方法[J].航空学报,2020(S01):37-52. 被引量：5
2易彤,徐宝文,吴方君.一种基于FP树的挖掘关联规则的增量更新算法[J].计算机学报,2004,27(5):703-710. 被引量：32
3史忠植,董明楷,蒋运承,张海俊.语义Web的逻辑基础[J].中国科学（E辑）,2004,34(10):1123-1138. 被引量：71
4邹力鹍,张其善.基于CAN-树的高效关联规则增量挖掘算法[J].计算机工程,2008,34(3):29-31. 被引量：9
5常亮,史忠植,邱莉榕,林芬.动态描述逻辑的Tableau判定算法[J].计算机学报,2008,31(6):896-909. 被引量：41
6姜晗,范建淑,贾泂.基于FP-Tree快速挖掘频繁项集[J].计算机应用与软件,2010,27(10):36-37. 被引量：2
7常亮,陈立民.基于动态描述逻辑DDL的动作理论[J].计算机科学,2011,38(7):203-208. 被引量：4
8陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4
9杨月华,杜军平,平源.基于本体的智能信息检索系统[J].软件学报,2015,26(7):1675-1687. 被引量：52
10程广,王晓峰.基于MapReduce的并行关联规则增量更新算法[J].计算机工程,2016,42(2):21-25. 被引量：12

引证文献7

1王星,李佳,陈吉.D-NSWRL:一种语义Web动态扩展的非单调规则语言[J].重庆邮电大学学报（自然科学版）,2020,32(1):154-163.
2刘雯婷,周军.基于缓冲区技术的增量数据关联规则挖掘算法[J].辽宁工业大学学报（自然科学版）,2020,40(2):71-74. 被引量：1
3朱岸青,李帅,唐晓东.Spark平台中的并行化FP_growth关联规则挖掘方法[J].计算机科学,2020,47(12):139-143. 被引量：5
4毛伊敏,邓千虎,陈志刚.基于信息熵与遗传算法的并行关联规则增量挖掘算法[J].通信学报,2021,42(5):122-136. 被引量：21
5洪炎,张磊,严加琪.基于AP-CAN的增量关联挖掘算法研究[J].安庆师范大学学报（自然科学版）,2021,27(2):20-25. 被引量：1
6毛伊敏,邓千虎,邓小鸿,刘蔚.改进的并行关联规则增量挖掘算法[J].计算机应用研究,2021,38(10):2974-2980. 被引量：7
7陈章国,周波,乔治中,胡超.基于机器学习的配电网监控信息智能分析规则库构建方法[J].计算技术与自动化,2022,41(3):148-153. 被引量：4

二级引证文献39

1贾澎涛,温滋.基于RS_Hash频繁项集的卫星载荷关联规则算法[J].国外电子测量技术,2023,42(2):9-15.
2沈慧娟,曹晓丽.基于频集的Apriori关联规则算法的应用研究[J].物联网技术,2020,10(10):57-61. 被引量：13
3杨宇环,张开生.融合FP-Growth和RBM的图书推荐算法研究[J].陕西科技大学学报,2021,39(4):156-160. 被引量：4
4戴宏亮,钟国金,游志铭,戴宏明.基于Spark的舆情情感大数据分析集成方法[J].计算机科学,2021,48(9):118-124. 被引量：12
5孙含笑.Keras神经网络大数据岗位薪酬分类模型[J].计算机时代,2021(9):26-28.
6朱敏.基于人工智能技术的物联网大数据挖掘算法[J].黑龙江工业学院学报（综合版）,2021,21(12):54-59. 被引量：8
7张呈熙,靖青秀,彭建.基于大数据的铜板带成品率预测[J].有色冶金设计与研究,2022,43(2):25-29.
8钟新成,李慧芳.一种高效用模式挖掘算法[J].山西大同大学学报（自然科学版）,2022,38(2):21-23.
9李舶永,刘超慧,金胜凯,陈剑伟,徐亚通.一种改进式的关联规则高效更新算法[J].信息技术与信息化,2022(4):192-195.
10刘龙庚.基于异构网络空管安全监控关联算法研究[J].信息网络安全,2022(4):58-66. 被引量：2

1荀佳仁(摘编).5 Ways to Get Your Cats the Exercise They Need[J].英语画刊（中级）,2018(8):27-27.
2汪兰林,李登峰.具有异质信息的风险投资商与投资企业双边匹配方法研究[J].数学的实践与认识,2018,48(7):43-55. 被引量：8
3肖文,胡娟,周晓峰.PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法[J].计算机工程与科学,2018,40(1):15-23. 被引量：8
4耿俊,周旋.基于EPS地理信息工作站的地形数据连库增量更新技术研究[J].测绘与空间地理信息,2018,41(9):86-88. 被引量：3
5吕静,徐凯恒,李鲁冰,王爱嘉.基于餐饮点评数据的长春市商业中心空间效率研究[J].西部人居环境学刊,2018,33(3):55-60. 被引量：6
6首届中国汽车后市场新技术峰会（CATS）在成都召开[J].汽车维护与修理,2018,0(13):75-76.
7李新华,赵珂,魏芳,马凯惠,张宪党.自研糖化血红蛋白床旁检测分析仪的性能评估[J].检验医学与临床,2018,15(10):1377-1380. 被引量：1
8张润楷,张斌.持久化基数树的设计与实现[J].信息与电脑,2018,30(6):116-118.
9石陆魁,张欣,师胜利.基于Spark的FP_Growth算法的并行与优化[J].计算机工程与应用,2018,54(13):52-58. 被引量：4
10彭健,阳小华.一种逻辑模型树算法在网络舆情中的谣言检测[J].南华大学学报（自然科学版）,2018,32(3):43-48. 被引量：2

重庆邮电大学学报（自然科学版）

2018年第4期

浏览历史

内容加载中请稍等...

基于Can树的关联规则增量更新算法改进被引量：7

参考文献5

二级参考文献40

共引文献243

同被引文献34

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于Can树的关联规则增量更新算法改进 被引量：7

参考文献5

二级参考文献40

共引文献243

同被引文献34

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于Can树的关联规则增量更新算法改进被引量：7