关联规则中FP-tree的最大频繁模式非检验挖掘算法被引量：5

Non-check mining algorithm of maximum frequent patterns in association rules based on FP-tree

下载PDF

导出

摘要基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2～5倍。 The algorithms based on FP-tree,for mining maximal frequent patterns,have high performance but with many drawbacks.For example,they must recursively generate conditional FP-trees,have to do the process of superset checking.In order to overcome these drawbacks of the existing algorithms,an algorithm Non-Check Mining algorithm of Maximum Frequent Pattern（NCMFP）for mining maximal frequent patterns was put forward after the analysis of DMFIA-1 algorithm.In the algorithm,neither constructing conditional frequent pattern tree recursively nor superset checking was needed through modifying the structure of FP-tree.This algorithm reduced the number of mining through early prediction before mining.The application of a method to get the public intersection sets could obtain a complete result.The experiment shows that the efficiency of NCMFP is two to five times as much as that of the similar algorithms in the case of a relatively small support.

作者惠亮钱雪忠

机构地区江南大学信息工程学院

出处《计算机应用》 CSCD 北大核心 2010年第7期1922-1925,共4页 journal of Computer Applications

基金江苏省自然科学基金资助项目(BK20003017)

关键词关联规则数据挖掘频繁模式树最大频繁项集超集检验 association rule data mining Frequent Pattern Tree（FP-tree） maximum frequent itemsets superset checking

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1BAYARDO R.Efficiently mining long patterns from databases[C] // Proceedings of 1998 ACM SIGMOD International Conference on Management of Data.New York:ACM,1998:85-93. 被引量：1
2路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
3宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
4BURDICK D,CALIMLIM M,GEHRKE J.MAFIA:A maximal frequent itemsets algorithm for transactional databases[C] // Proceedings of the 17th International Conference on Data Engineering.Washington,DC:IEEE Computer Society,2001:443-452. 被引量：1
5GOUDA K,ZAKI M J.Efficiently mining maximal frequent itemsets[C] // Proceedings of the IEEE International Conference on Data Mining.Washington,DC:IEEE Computer Society,2001:163-170. 被引量：1
6ZHOU Q H,WESLEY C,LU B J.SmartMiner:A depth 1st algorithm guided by tail information for mining maximal frequent itemsets[C] // Proceedings of the IEEE International Conference on Data Mining.Washington,DC:IEEE Computer Society,2002:570-577. 被引量：1
7GRAHNE G,ZHU J F.High performance mining of maximal frequent itemsets[C] // Proceedings of the 6th SIAM International Workshop on High Performance.New York:HPDM Press,2003:135-143. 被引量：1
8刘乃丽,李玉忱,马磊.一种基于FP-tree的最大频繁项目集挖掘算法[J].计算机应用,2005,25(5):998-1000. 被引量：8
9陈晨,鞠时光.基于改进FP-tree的最大频繁项集挖掘算法[J].计算机工程与设计,2008,29(24):6236-6239. 被引量：14
10王现君,宋晶晶,姜保庆.在单向FP-tree上挖掘频繁闭项集[J].计算机工程与应用,2008,44(10):150-153. 被引量：4

二级参考文献45

1马丽生,邓辉文,齐逸.一种新的最大频繁项目集挖掘算法[J].计算机应用,2006,26(11):2670-2673. 被引量：6
2Han Jia-wei,Kamber M.Data ruing:concepts and techniques[M]. [S.l.]:Morgan Kaufmann Publishers,2001.225-279. 被引量：1
3Agrawal R,Srikant R.Fast algorithms for mining association rules[C]// Proc of 1994 Int'l Conf on Very Large Data Bases.Santiago,Chili: VLDB Endowment, 1994. 487-499. 被引量：1
4Park J S,Chen M S,Yu P S.An effective Hash-based algorithm for mining association rules[C]//Proc of 1995 ACM-SIGMOD Int'l Conf on Management of Datal.San Jose,CA:ACM Press,1995. 175-186. 被引量：1
5Agrawal R,Srikant R.Mining sequential patterns[C]//ICDE'951. Taipei,Taiwan:IEEE Computer Society Press, 1995.3-14. 被引量：1
6Brin S,Motwani R,Silverstein C.Beyond market basket: Generalizing association rules to correlations[C]//SIGMOD'97,1997:265-276. 被引量：1
7Pasquier N,Bastide Y,Taouil R,et al.Discovering frequent closed itemsets for association rules[C]//ICDT'99,1999.398-416. 被引量：1
8Zaki M,Hsiao C.CHARM:an effcient algorithm for closed itemset mining[C]//SDM' 02,2002 . 34-43. 被引量：1
9Burdick D,Calimlim M,Gehrke J.MAFIA:amaximal frequent itemset algorithm for transactional databases[C]//ICDE'01,2001.443-452. 被引量：1
10Pei J,Han J,Mao R.CLOSET:an efficient algorithm for mining frequent closed itemsets[C]//DMKD'00,2000.11-20. 被引量：1

共引文献231

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2
6杨君锐.逆向启发式开采最大频繁项目集[J].计算机工程,2004,30(14):116-118. 被引量：1
7朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
8杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
9张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
10李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3

同被引文献24

1秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
2吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
3Peiyi T,TurKia P.Mining frequent itemsets with partial enu-meration [C] // Florida:Proceedings of the 44th AnnualSoutheast Regional Conference,2006,180-185. 被引量：1
4ZHANG Xueping,ZHU Yanxia,HUA Nan.Mining maximalpatterns based on improved FP-tree and array technique [C] //Jinggangshan:Proceedings of the 2nd International Conferenceon Future:Computer and Communication,2010:660-664. 被引量：1
5王现君,宋晶晶,姜保庆.在单向FP-tree上挖掘频繁闭项集[J].计算机工程与应用,2008,44(10):150-153. 被引量：4
6史旻昱,马辉民,唐述科.基于FS-tree的频繁模式挖掘算法[J].计算机工程与应用,2008,44(30):167-169. 被引量：1
7郑海明.基于FP-tree最大频繁项集的FP-MFI算法研究[J].现代计算机,2008,14(10):37-39. 被引量：1
8陈晨,鞠时光.基于改进FP-tree的最大频繁项集挖掘算法[J].计算机工程与设计,2008,29(24):6236-6239. 被引量：14
9马丽生.快速挖掘频繁项目集算法[J].计算机工程与设计,2009,30(8):1903-1906. 被引量：6
10梅俊,郑刚.一种基于FP-tree的最大频繁项目集挖掘算法[J].现代计算机,2009,15(9):33-36. 被引量：1

引证文献5

1杨青侠,何明祥,邱冬冬,聂宝军.基于FP-Tree的挖掘最大频繁项目集的新算法[J].中国科技信息,2012(14):88-89. 被引量：1
2赵志刚,王芳,万军.基于OWSFP-Tree的最大频繁项目集挖掘算法[J].计算机工程与设计,2013,34(5):1687-1690. 被引量：5
3赵健.基于Fp-Tree频繁模式的挖掘算法[J].电子技术与软件工程,2017(10):163-165.
4王利军,唐立.基于有序FP-tree结构和二维表的最大频繁模式挖掘算法[J].韶关学院学报,2019,40(9):21-25.
5蒋跃军,郑文.基于Flag-Prefix-Tree的频繁模式挖掘改进算法[J].浙江万里学院学报,2024,37(3):76-81.

二级引证文献6

1叶福兰.基于FP_tree的最大频繁模式挖掘算法的改进[J].成都大学学报（自然科学版）,2014,33(2):148-150. 被引量：4
2杨鹏坤,彭慧,周晓锋,孙玉庆.改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J].计算机应用,2015,35(3):775-778. 被引量：16
3李少华,吕志旺,车德勇,周宁.基于有序FP-tree的最大频繁项集挖掘算法[J].东北师大学报（自然科学版）,2016,48(2):65-69. 被引量：5
4尹治华,张大鹏,谭明,王新生.一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法[J].济南大学学报（自然科学版）,2017,31(2):111-117. 被引量：8
5李广璞,黄妙华.频繁项集挖掘的研究进展及主流方法[J].计算机科学,2018,45(B11):1-11. 被引量：14
6王利军.基于质数理论的最大频繁项集挖掘研究[J].廊坊师范学院学报（自然科学版）,2021,21(3):12-16.

1钱雪忠,惠亮.关联规则中改进FP-tree的最大频繁模式挖掘算法[J].计算机工程与设计,2010,31(21):4635-4638. 被引量：3
2钱雪忠,惠亮.关联规则中基于降维的最大频繁模式挖掘算法[J].计算机应用,2011,31(5):1339-1343. 被引量：13
3赵志刚,王芳,万军.基于OWSFP-Tree的最大频繁项目集挖掘算法[J].计算机工程与设计,2013,34(5):1687-1690. 被引量：5
4张志宏,兰静.海量加密军用数据下的频繁项目集挖掘仿真[J].计算机仿真,2015,32(5):10-13.
5王莘,张红旗,汪永伟,侯兴超.一种改进的适于安全审计数据分析的关联算法[J].信息工程大学学报,2007,8(1):22-25. 被引量：1
6龚莎.网页验证码技术综述[J].信息与电脑（理论版）,2014,0(2):143-144. 被引量：4
7王悠.大数据的数据生成条件——蜂花关系[J].新闻传播,2014(12):37-37.
8琚春华,许翀寰.基于有序复合策略的数据流最大频繁项集挖掘[J].情报学报,2010,29(5):864-871.
9苏士俊.怎样动态生成条件字符串完成随机查询[J].电脑开发与应用,1991,4(4):56-57.
10苏士俊.动态生成“条件字符串”完成随机查询[J].中国计算机用户,1991(6):27-28.

计算机应用

2010年第7期

浏览历史

内容加载中请稍等...

关联规则中FP-tree的最大频繁模式非检验挖掘算法被引量：5

参考文献11

二级参考文献45

共引文献231

同被引文献24

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

关联规则中FP-tree的最大频繁模式非检验挖掘算法 被引量：5

参考文献11

二级参考文献45

共引文献231

同被引文献24

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

关联规则中FP-tree的最大频繁模式非检验挖掘算法被引量：5