基于B-list的最大频繁项集挖掘算法被引量：4

Maximal frequent itemset mining algorithm based on B-list

下载PDF

导出

摘要针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁项集,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小搜索空间;最后再结合基于MFI-tree的投影策略实现超集检测来提高算法的效率。实验结果表明,BMFI算法在时间效率与空间效率方面均优于FPMAX与MFIN算法。该算法在稠密数据集与稀疏数据集中进行最大频繁项集挖掘时均有良好的效果。 In order to solve the problems that existing in the maximal frequent itemset mining algorithms,such as the mining time is too long and the memory consumption is too large,this paper presented a maximal frequent itemset mining algorithm BMFI which employed B-list to mining frequent itemsets and employed the whole sequence search tree as the search space.Then,it used the parent equivalence pruning technique to reduce the search space. Finally,which combined with the MFItree-based projection strategy to achieve superset detection to improve the efficiency of the algorithm. The experimental results show that the performance of BMFI algorithm is superior to FPMAX algorithm and MFIN algorithm in terms of time efficiency and spatial efficiency. The proposed algorithm has good performance when mining the maximal frequent itemset in dense data set and sparse data set.

作者张昌文凯郑云俊 Zhang Chang;Wen Kai;Zheng Yunjun(Institute of Applied Communication Technology,School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Chongqing Information Technology Designing Co. Ltd. ,Chongqing 401121,China)

机构地区重庆邮电大学通信与信息工程学院通信新技术应用研究中心重庆信科设计有限公司

出处《计算机应用研究》 CSCD 北大核心 2019年第2期351-354,共4页 Application Research of Computers

关键词最大频繁项集挖掘深度优先搜索剪枝技术超集检测 maximal frequent itemsets mining depth-first search pruning techniques superset detection

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1林晨,顾君忠.基于Nodeset的最大频繁项集挖掘算法[J].计算机工程,2016,42(12):204-207. 被引量：6
2沈戈晖,刘沛东,邓志鸿.NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J].北京大学学报（自然科学版）,2016,52(2):199-209. 被引量：5
3DENG ZhiHong,WANG ZhongHui,JIANG JiaJian.A new algorithm for fast mining frequent itemsets using N-lists[J].Science China(Information Sciences),2012,55(9):2008-2030. 被引量：25

二级参考文献36

1眭俊明,姜远,周志华.基于频繁项集挖掘的贝叶斯分类算法[J].计算机研究与发展,2007,44(8):1293-1300. 被引量：12
2HaHan J W, Pei J, Yin Y W. Mining frequent itemsets without candidate generation. In: The 2000 ACM SIGMOD International Conference on Management of data (SIGMOD’00), New York, 2000. 1-12. 被引量：1
3AgAgrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases. In: The 1993 ACM SIGMOD International Conference on Management of Data (SIGMOD’93), Washington, 1993. 207-216. 被引量：1
4HaHan J, Cheng H, Xin D, et al. Frequent itemset mining: current status and future directions. Data Min Knowl Discov,2007, 15: 55-86. 被引量：1
5BaBaralis E, Cerquitelli T, Chiusano S. IMine: index support for item set mining. IEEE TKDE J, 2009, 21: 493-506. 被引量：1
6ZaZaki M J, Gouda K. Fast vertical mining using diffsets, In: The 9th ACM SIGKDD International Conference on. Knowledge Discovery and Data Mining (SIGKDD’03), Washington, 2003. 326-335. 被引量：1
7DeDeng Z H, Wang Z H. A new fast vertical method for mining frequent itemsets. Int J Comput Intell Syst, 2010, 3:733-744. 被引量：1
8AgAgrawal R, Srikant R. Fast algorithm for mining Association rules. In: The 20th International Conference on Very Large Data Bases (VLDB’94), Santiago de Chile, 1994. 487-499. 被引量：1
9SaSavasere A, Omiecinski E, Navathe S. An efficient algorithm for mining association rules in large databases. In: The21th International Conference on Very Large Data Bases (VLDB’95), Zurich, 1995. 432-443. 被引量：1
10ShShenoy P, Haritsa J R, Sundarshan S, et al. Turbo-charging vertical mining of large databases. In: ACM International Conference on Management of Data and Symposium on Principles of Database Systems (SIGMOD’00), Dallas, 2000.22-33. 被引量：1

共引文献29

1沈戈晖,刘沛东,邓志鸿.NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J].北京大学学报（自然科学版）,2016,52(2):199-209. 被引量：5
2徐永秀,刘旭敏,徐维祥.基于间隔链表改进的频繁项集挖掘算法[J].计算机应用,2016,36(4):997-1001. 被引量：4
3方炜,李万清,俞东进,袁友伟,黄东发.时空大数据的伴随车高效挖掘算法研究[J].工业控制计算机,2016,29(3):18-20. 被引量：1
4吴惠明,杨威,姜芃,高新闻.基于FP-Growth算法的盾构掘进参数与隧道管片渗漏关联性分析[J].隧道建设,2016,36(5):513-517. 被引量：4
5陈奇,张曦煌.基于N-list的并行频繁项集挖掘算法[J].微电子学与计算机,2017,34(5):40-44.
6谭龙,秦琦冰.基于dSFO-Set的可消除项集挖掘算法[J].计算机工程与设计,2017,38(6):1496-1502.
7李校林,杜托,刘彪.基于B-list的快速频繁模式挖掘算法[J].计算机应用,2017,37(8):2357-2361. 被引量：6
8翟悦,王璨,孙建言.一种改进的基于N-List的频繁项集挖掘算法[J].计算机应用与软件,2018,35(9):67-72. 被引量：6
9李校林,杜托,谢勇.基于Hadoop的大数据频繁模式挖掘算法[J].微电子学与计算机,2018,35(9):14-19. 被引量：9
10孙俊,张曦煌.基于节点集Top-k频繁模式挖掘算法[J].计算机工程与应用,2017,53(6):101-105. 被引量：2

同被引文献24

1温蜜,李婧,殷脂.智能电网中数据的可搜索加密机制[J].上海电力学院学报,2013,29(6):513-517. 被引量：2
2李芬田,王红梅,潘超.滑动窗口中FP-Tree的频繁项集挖掘算法的研究[J].小型微型计算机系统,2019,40(1):45-49. 被引量：6
3何青,张小琳,贾梦蕾,于凯,张哲瑜,张宗伟.基于可搜索加密的云计算智慧家居系统研究[J].无线互联科技,2017,14(5):53-54. 被引量：1
4李校林,杜托,刘彪.基于B-list的快速频繁模式挖掘算法[J].计算机应用,2017,37(8):2357-2361. 被引量：6
5李晓蓉,宋子夜,任婧怡,徐磊,许春根.云计算中基于属性的可搜索加密电子病历系统[J].计算机科学,2017,44(B11):342-347. 被引量：10
6张亚玲,王婷,王尚平.增量式隐私保护频繁模式挖掘算法[J].计算机应用,2018,38(1):176-181. 被引量：7
7叶海琴,孟彩霞,王意锋,张爱玲.一种基于MapReduce的频繁模式挖掘算法[J].南京理工大学学报,2018,42(1):62-67. 被引量：4
8张逸凡,赵斌,孙鸿艳,谈超,吉根林.基于时空轨迹的移动对象汇聚模式挖掘算法[J].数据采集与处理,2018,33(3):487-495. 被引量：4
9尹远,张昌,文凯,郑云俊.基于DiffNodeset结构的最大频繁项集挖掘算法[J].计算机应用,2018,38(12):3438-3443. 被引量：5
10王晓雷,陈云杰,王琛,牛犇.基于Q-learning的虚拟网络功能调度方法[J].计算机工程,2019,45(2):64-69. 被引量：35

引证文献4

1文凯,许萌萌,耿小海.基于加权构造链表的频繁加权项集挖掘算法[J].计算机工程与设计,2020,41(7):1920-1925. 被引量：1
2卫朝霞,邹倩影.基于模式增长的嵌入式频繁子树挖掘算法研究[J].计算机仿真,2021,38(3):249-252.
3许爱东,朱静,蒋屹新,张宇南,吴涛,蒋龙生.面向智能电网边缘计算的密文多关键字检索方法[J].计算机应用与软件,2022,39(7):310-314. 被引量：2
4周晓晶,谷钰.基于层次梯度挖掘的数据智能调度算法仿真[J].计算机仿真,2023,40(4):358-361.

二级引证文献3

1周谦,丁中奎,高铭.移动应用安全技术在智能电网中的应用研究[J].光源与照明,2022(10):222-224. 被引量：2
2廖祟阳,余少锋,严鑫,钟建栩,席凌之.基于哈希学习算法的非结构化数据检索方法[J].电气技术与经济,2023(3):95-97.
3郭振华,孙艳青,王中兴.基于并行式频繁项集的党政收费平台[J].电子设计工程,2024,32(5):31-36.

1尹远,张昌,文凯,郑云俊.基于DiffNodeset结构的最大频繁项集挖掘算法[J].计算机应用,2018,38(12):3438-3443. 被引量：5
2徐剑华.“并购高手”沙迪家族和他们的达飞轮船集团[J].珠江水运,2019(3):14-19.
3王楠楠,刘慧婷.频繁模式挖掘系统的设计与开发[J].计算机技术与发展,2018,28(2):150-153. 被引量：2
4黄坤,吴玉佳,李晶.基于差集的高效用项集挖掘方法[J].电子学报,2018,46(8):1804-1814. 被引量：6
5尚弘.一种基于搜索树的轻量级RFID标签防碰撞方案（英文）[J].重庆邮电大学学报（自然科学版）,2018,30(6):789-796. 被引量：1
6张雪芳,沈晓艳.急诊科在抢救急性心肌梗死患者运用绿色通道康复转归分析[J].双足与保健,2018,27(14):64-65. 被引量：2
7赵阳,白凡.基于FP-tree的支持度计数优化策略[J].计算机技术与发展,2017,27(10):30-33. 被引量：1
8兰亭集序[J].教学考试,2018(44):33-33.
9郭世明,高宏.基于滑动窗口挖掘数据流高效用项集的有效算法[J].哈尔滨工程大学学报,2018,39(4):721-729. 被引量：6
10李光明,黄立昌.物联网设备精简Web服务实现框架设计[J].物联网技术,2019,9(2):95-98. 被引量：1

计算机应用研究

2019年第2期

浏览历史

内容加载中请稍等...

基于B-list的最大频繁项集挖掘算法被引量：4

参考文献3

二级参考文献36

共引文献29

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于B-list的最大频繁项集挖掘算法 被引量：4

参考文献3

二级参考文献36

共引文献29

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于B-list的最大频繁项集挖掘算法被引量：4