特定数据最大频繁集挖掘算法被引量：3

Mining Algorithm of Maximal Frequent Itemsets Suitable to Specific Database

下载PDF

导出

摘要针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subsettree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以动态给定最小支持度而不用重新扫描数据库。实验结果表明,该算法在这些特定数据的挖掘中,与FP-growth相比明显提高了挖掘效率。 Aiming at the low mining efficiency problem existing in the mining association rules of FP-growth algorithm on data limited with item counts and transaction length, an improved algorithm（All-subset tree） for mining maximal frequent patterns is proposed, a novel data structure, All-subset tree, which is similar to FP-tree is introduced to store all maximal frequent item sets. The algorithm is in no need of appointed minimum support before scanning the database, and need not rescan the database when assigned minimum support dynamically. Experimental results show that all-subset tree algorithm greatly improves the mining efficiency compared with FP-growth algorithm when mining specific database.

作者王华胡学钢田卫东

机构地区安徽医科大学计算机中心合肥工业大学计算机与信息学院

出处《计算机工程》 CAS CSCD 北大核心 2008年第14期63-65,共3页 Computer Engineering

基金安徽医科大学科学研究基金资助项目(2006kj28)

关键词数据挖掘关联规则频繁模式树最大频繁项目集 data mining association rule Frequent Pattern tree（FP-tree） maximal frequent itemsets

分类号 TP311.12 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Databases[C]//Proceedings of the ACM SIGMOD International Conference on Management of Data. Washington, USA: [s. n.], ACM Press, 1993-05. 被引量：1
2Han Jiawei，Kamber M.数据挖掘:概念与技术[M]．北京:机械工业出版社，2001．被引量：41
3Han Jiawei, Pei Jian, Yun Yiwen. Mining Frequent Patterns Without Candidate Generation[C]//Proc. of 2000 ACM-SIGMOD Int'l Conf. on Management of Data. Dalas, TX, USA, 2000-05: 1-12. 被引量：1
4宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
5陆介平,杨明,孙志挥,鞠时光.快速挖掘全局最大频繁项目集[J].软件学报,2005,16(4):553-560. 被引量：27
6张蓉.Web挖掘技术研究[J].计算机工程,2006,32(15):4-6. 被引量：21

二级参考文献19

1Han J, Kamber M. Data Mining: Concepts and Techniques. Beijing: High Education Press, 2001. 被引量：1
2Agrawal R, ImielinSki T, Swami A. Mining association rules between sets of items in large database. In: Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Vol 2, Washington DC: SIGMOD, 1993. 207-216. 被引量：1
3Agrawal, R Srikant. Fast algorithms for mining association rules. In: Proc. of the 20th Int'l Conf. Very Large Data Bases(VLDB'94). 1994.487-499. 被引量：1
4Han J, Pei J, Yin Y. Mining frequent patterns without candidate generation. In: Proc. of the 2000 ACM-SIGMOD Int'l Conf. on Management of Data. Dallas: ACM Press, 2000. 1-12. 被引量：1
5Bayardo RJ. Efficiently mining long patterns from databases. In: Haas LM, Tiwary A, eds. Proc. of the ACM SIGMOD Int'l Conf.on Management of Data. New York: ACM Press, 1998.85-93. 被引量：1
6Lin D, Kedem ZM. Pincer-Search: A new algorithm for discovering the maximum frequent set. In: Proc. of the 6th European Conf.on Extending Database Technology. Heidelberg: Springer-Verlag, 1998. 105-119. 被引量：1
7Park JS, Chen MS, Yu PS. Efficient parallel data mining for association rules. In: Proc. of the 4th Int'l Conf. on Information and Knowledge Management. 1995. 31-36. 被引量：1
8Agrawal R, Shafer J. Parallel mining of association rules. IEEE Trans. on Knowledge and Data Engineering, 1996,8(6):962-969. 被引量：1
9Cheung DW, Han JW, Ng VT. A fast distributed algorithm for mining association rules. In: Proc. of the IEEE 4th Int'l Conf.Parallel and Distributed Information Systems. Miami Beach: IEEE Press, 1996. 31-44. 被引量：1
10Cheung DW, Lee SD, Xiao YQ. Effect of data skewness and workload balance in parallel data mining. IEEE Trans. on Knowledge and Data Engineering, 2002,14(3):498-514. 被引量：1

共引文献237

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
6杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
7张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
8李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
9吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
10陈天敏,姜丽红.基于预制数据库的FP-tree构造算法[J].计算机工程,2004,30(B12):58-61.

同被引文献31

1刘君强,孙晓莹,王勋,潘云鹤.挖掘最大频繁模式的新方法[J].计算机学报,2004,27(10):1328-1334. 被引量：15
2吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
3秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26
4陆介平,杨明,孙志挥,鞠时光.快速挖掘全局最大频繁项目集[J].软件学报,2005,16(4):553-560. 被引量：27
5王天江,张永俊.一种快速基于约束的医疗图像关联分类算法[J].华中科技大学学报（自然科学版）,2005,33(5):49-51. 被引量：2
6陈耿,朱玉全,宋余庆,陆介平,孙志挥.基于频繁模式树的约束最大频繁项目集挖掘算法研究[J].应用科学学报,2006,24(1):64-69. 被引量：4
7李红,胡学钢.基于CIE-树的关联规则最大频繁项集的求解[J].计算机工程与应用,2006,42(3):180-182. 被引量：3
8王华,胡学钢.基于关联规则的数据挖掘在临床上的应用[J].安徽大学学报（自然科学版）,2006,30(2):21-25. 被引量：36
9张集祥,李桂杰.基于位串数组的最大频繁项目集挖掘算法[J].计算机工程与科学,2006,28(6):90-91. 被引量：1
10马丽生,邓辉文,齐逸.一种新的最大频繁项目集挖掘算法[J].计算机应用,2006,26(11):2670-2673. 被引量：6

引证文献3

1王华,胡学钢.基于Apriori算法的医学分类器研究[J].计算机仿真,2009,26(4):130-134.
2周海岩.关联规则挖掘中的极大频繁项目集[J].计算机与应用化学,2009,26(11):1478-1480.
3尹士闪,马增强,毛晚堆.基于频繁项目集链式存储方法的关联规则算法[J].计算机工程与设计,2012,33(3):1002-1007. 被引量：4

二级引证文献4

1钟雁,马海漫,张春,赵怀昕.改进的FP-tree算法在动车组故障诊断中的应用研究[J].交通运输系统工程与信息,2013,13(6):105-111. 被引量：3
2王华,刘萍.改进的关联规则算法在学生成绩预警中的应用[J].计算机工程与设计,2015,36(3):679-682. 被引量：30
3张春,郭玉霞.一种基于改进FP-Growth算法的动车组故障预测研究[J].铁路计算机应用,2017,26(12):1-4. 被引量：3
4Qiaoyun Song,Qingbei Guo,Kai Wang,Tao Du,Shouning Qu,Yong Zhang.A Scheme for Mining State Association Rules of Process Object Based on Big Data[J].Journal of Computer and Communications,2014,2(14):17-24.

1赵奕,施鹏飞.最大频繁集的数据聚类方法[J].计算机工程与应用,2000,36(11):35-37. 被引量：4
2李景文,刘军锋,闫遂军,邓晓斌.一种改进的最大频繁集发现算法[J].计算机技术与发展,2008,18(10):113-115. 被引量：1
3冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18
4许涛,徐彬.概念格在客户群聚类中的应用[J].现代计算机,2008,14(6):70-73. 被引量：1
5马莉,耿风,韩崇.一种基于位置向量挖掘最大频繁集的算法[J].扬州职业大学学报,2011,15(2):25-28.
6杜垒.改进超集检测策略[J].技术与市场,2011,18(6):27-28.
7宋雨,赵建利,王保义.关联规则挖掘中最大频繁集的双向查找算法[J].华北电力大学学报（自然科学版）,2005,32(2):67-70. 被引量：5
8晏明春,谢辉.基于绩效管理的最大频繁模式挖掘研究[J].计算机工程与应用,2006,42(5):213-216. 被引量：1
9李清峰,周鲜成,王莉,周伟林.最小组合法挖掘最大频繁集[J].计算机应用研究,2008,25(3):702-704. 被引量：4
10侯长满,余彪.关联规则算法FP-growth的研究与分析[J].计算机与网络,2016,42(24):58-61. 被引量：4

计算机工程

2008年第14期

浏览历史

内容加载中请稍等...

特定数据最大频繁集挖掘算法被引量：3

参考文献6

二级参考文献19

共引文献237

同被引文献31

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

特定数据最大频繁集挖掘算法 被引量：3

参考文献6

二级参考文献19

共引文献237

同被引文献31

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

特定数据最大频繁集挖掘算法被引量：3