矩阵与前缀树方法挖掘频繁项集被引量：1

Algorithm of matrix and Prefix-tree for mining frequent itemsets

下载PDF

导出

摘要传统频繁项集挖掘算法的执行效率较低。提出了一种基于矩阵与前缀树的频繁项集挖掘算法MPFI,能快速地挖掘事务数据库中的频繁项集。MPFI算法只需扫描事务数据库一次,构建垂直方向的二进制矩阵,应用二进制位向量表达频繁项集信息,利用前缀树压缩存储频繁项集的相关信息,不产生候选项集。理论分析与实验结果表明,MPFI算法能有效地提高频繁项集挖掘效率。 Traditional algorithm of frequent itemsets mining’s execution efficiency is low. MPFI algorithm based on matrix and Prefix-tree is raised for frequent itemsets mining. It can quickly mining frequent itemsets of transaction database. MPFI algorithm only scan transaction database once, builds vertical binary matrix. Binary vector for frequent itemsets information and Prefix-tree data structure for compression storage of frequent itemsets is applied in the algorithm, without candidate itemsets. According to theoretical analysis and experimental results, MPFI algorithm can effectively improve the efficiency of frequent itemsets mining.

作者丁邦旭黄永青

机构地区铜陵学院数学与计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2015年第22期154-157,171,共5页 Computer Engineering and Applications

基金安徽省高校省级自然科学研究项目(No.KJ2013Z327) 教育部人文社会科学研究青年基金项目(No.11YJC630074) 安徽省自然科学基金项目(No.1208085MG121)

关键词频繁项集矩阵二进制前缀树 frequent itemsets matrix binary Prefix-tree

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献18

1Agrawal R.Database mining: a performance perspective[J]. IEEE Trans on Knowledge and Data Engineering, 1993,5 (6). 被引量：1
2Agrawal R, Imielinski T, Swami A.Mining association rules between sets of items in large databases[C]//Proceedings of the ACM SIGMOD International Conference Manage- ment of Date, Washington, 1993 : 207-216. 被引量：1
3闫珍,皮德常,吴文昊.高维稀疏数据频繁项集挖掘算法的研究[J].计算机科学,2011,38(6):183-186. 被引量：5
4宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
5张毅,杨颖,陆瑞兴.一种新的频繁项集挖掘算法DS-ECLAT[J].广西科学院学报,2010,26(1):19-22. 被引量：2
6Han J, Pei J, Yin Y.Mining Frequent Patterns Without Candiate Generation[C]//Proc of SIGMOD,Dallas,2000, 29(2) : 1-12. 被引量：1
7张忠平,李岩,杨静.基于矩阵的频繁项集挖掘算法[J].计算机工程,2009,35(1):84-86. 被引量：19
8王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18
9Liu Guimei, Lu Hongjun, XuYabo, et al.Ascending frequency ordered prefix tree : Efficient mining of frequent patterns[C]// Prco of 8th Database Systems for Advanced Applications (DASFAA' 03),2003. 被引量：1
10朱光喜,吴伟民,阮幼林,刘干.一种基于前缀树的频繁模式挖掘算法[J].计算机科学,2005,32(4):34-36. 被引量：4

二级参考文献89

1牛小飞,石冰,卢军,吴科.挖掘关联规则的高效ABM算法[J].计算机工程,2004,30(11):118-120. 被引量：16
2皮德常,秦小麟,王宁生.基于动态剪枝的关联规则挖掘算法[J].小型微型计算机系统,2004,25(10):1850-1852. 被引量：16
3陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥.关联规则挖掘中若干关键技术的研究[J].计算机研究与发展,2005,42(10):1785-1789. 被引量：62
4李宏,陈松乔,陈建二,杜剑峰.基于Eclat算法的多种约束关联规则挖掘算法研究[J].计算机测量与控制,2006,14(7):934-936. 被引量：2
5刘以安,刘强,邹晓华,王士同.基于向量内积的关联规则挖掘算法研究[J].计算机工程与应用,2006,42(21):172-174. 被引量：15
6陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
7李超,余昭平.基于矩阵的Apriori算法改进[J].计算机工程,2006,32(23):68-69. 被引量：43
8焦学磊,王新庄.基于矩阵的频繁项集发现算法[J].江汉大学学报（自然科学版）,2007,35(1):43-46. 被引量：6
9Zhu Y Y,Shasha D.StatStream:statistical monitoring of thousands of data streams in real time[C]//Proceedings of the 28th International Conference on Very Large Data Bases.Hong Kong:VLDB Press, 2002: 358-369. 被引量：1
10Manku G S,Motwani R.Approximate frequency counts over data streams[C]//Proceedings of the 28th International Conference on Very Large Data Bases.Hong Kong:VLDB Press,2002:346-357. 被引量：1

共引文献224

1吴磊,何嘉.基于项目集矩阵的AprioriHybral算法研究[J].成都信息工程学院学报,2009(1):43-47.
2谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
3姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
4杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
5王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
6朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
7杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
8张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
9李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
10吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47

同被引文献8

1李海峰,章宁,朱建明,曹怀虎.时间敏感数据流上的频繁项集挖掘算法[J].计算机学报,2012,35(11):2283-2293. 被引量：29
2冯培恩,刘屿,邱清盈,李立新.提高Eclat算法效率的策略[J].浙江大学学报（工学版）,2013,47(2):223-230. 被引量：13
3徐嘉莉,杨洪军,赵茂娟,樊云.一种基于位运算的频繁闭项集挖掘算法[J].计算机应用研究,2013,30(11):3280-3282. 被引量：3
4刘彩苹,毛建频,毛建旭,屈卫兰,蔡玉武.基于格的快速频繁项集挖掘算法[J].湖南大学学报（自然科学版）,2013,40(10):52-57. 被引量：2
5罗丹,李陶深.一种基于压缩矩阵的Apriori算法改进研究[J].计算机科学,2013,40(12):75-80. 被引量：46
6陈凤娟.关联规则的ECLAT算法[J].消费电子,2014(16):149-149. 被引量：3
7王红梅,胡明,赵守峰.基于垂直格式的频繁项集挖掘分段算法[J].吉林大学学报（理学版）,2016,54(3):553-560. 被引量：2
8徐卫,李晓粉,刘端阳.基于命题逻辑的关联规则挖掘算法L-Eclat[J].计算机科学,2017,44(12):211-215. 被引量：3

引证文献1

1崔馨月,孙静宇.改进的Eclat算法研究与应用[J].计算机工程与设计,2018,39(4):1059-1063. 被引量：8

二级引证文献8

1赵艳芹,张恒,童朝娣.瓦斯灾害预警模型的Eclat算法[J].黑龙江科技大学学报,2019,29(4):515-520. 被引量：3
2向春梅,陈超.基于MapReduce的改进Eclat算法[J].成都信息工程大学学报,2019,34(4):369-374. 被引量：5
3尹远,朱璐伟,文凯.基于差异点集的频繁项集挖掘算法[J].计算机工程与设计,2020,41(3):716-720. 被引量：3
4盛魁,马健,曹岩,卞显福.基于遗传模拟退火算法的药品零售大数据关联规则挖掘[J].黑龙江工业学院学报（综合版）,2020,20(6):60-65.
5陈颖聪,李强,黄秋凤,林茂松.面向工业控制的分布式并行聚类关联规则算法研究[J].制造业自动化,2021,43(11):35-40. 被引量：1
6陈生昱,姚有利,周兆海,程超男.煤矿瓦斯监测预警的研究[J].山西化工,2021,41(6):113-116. 被引量：7
7徐鹏,孟宇龙,杨哲,董乃波,邓博伟.一种面向船舶制造的数据关联规则挖掘算法[J].舰船科学技术,2022,44(20):143-148.
8韩忠华,李博,刘松林,李曼,孙亮亮.回溯法与DEclat算法结合的模具组合分配方法[J].计算机应用研究,2023,40(5):1459-1467.

1田宏,董爱杰.基于向量矩阵的频繁项集挖掘算法[J].大连交通大学学报,2008,29(3):74-77. 被引量：2
2刘刚,贾利民.基于二进制可辨矩阵知识约简方法的完备有效性[J].中国铁道科学,2005,26(6):119-125. 被引量：2
3王丽珍,周丽华.生成频繁项目集的一种贪心算法[J].计算机工程与应用,2001,37(13):86-88. 被引量：6
4徐健锋,刘斓,邱桃荣,刘清.基于粒计算的二进制矩阵及在决策树算法的应用[J].广西师范大学学报（自然科学版）,2008,26(3):157-160. 被引量：2
5汪小燕.基于矩阵的决策表属性值分类方法[J].安徽工业大学学报（自然科学版）,2007,24(4):424-426.
6巫红霞,谢强.基于有向图的频繁集挖掘算法[J].湖州师范学院学报,2008,30(1):65-69.
7朱卫卫,杨金民.基于二进制矩阵的RS编码优化算法[J].计算机工程,2011,37(23):57-59. 被引量：4
8陈涛,李正炜,王建立,王斌,郭爽.应用压缩传感理论的单像素相机成像系统[J].光学精密工程,2012,20(11):2523-2530. 被引量：36
9马垣.基于二进制可辨矩阵的知识约简(待续)[J].鞍山师范学院学报,2003,5(2):78-82.
10王彪,唐超颖,沈春林.利用遗传算法进行PID参数寻优的倒立摆控制系统[J].计算机测量与控制,2004,12(12):1171-1174. 被引量：5

计算机工程与应用

2015年第22期

浏览历史

内容加载中请稍等...

矩阵与前缀树方法挖掘频繁项集被引量：1

参考文献18

二级参考文献89

共引文献224

同被引文献8

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

矩阵与前缀树方法挖掘频繁项集 被引量：1

参考文献18

二级参考文献89

共引文献224

同被引文献8

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

矩阵与前缀树方法挖掘频繁项集被引量：1