高效的数据流完全频繁项集挖掘算法被引量：11

Efficient complete frequent itemsets mining algorithm of data stream

下载PDF

导出

摘要针对实时数据流的完全频繁项集挖掘算法计算成本较高的问题,提出一种基于改进FPTree的高效实时数据流完全频繁项集挖掘算法。使用改进的FPTree兼容地表示滑动窗口中的所有事务,建立一个完整的基树;利用事务的字母顺序简单地实现基树的插入与删除操作,无需对基树进行重组操作;利用分组Tree结构对基树进行由上而下的遍历来建立项目树,以较低的计算成本发现完全的频繁项集。仿真结果表明,该方案可有效地发现实时数据流的频繁项集,获得较低的计算成本。 Concerning the problem of high computational cost of complete frequent itemsets mining algorithm of real-time data stream,an improved FPTree based complete frequent itemset mining algorithm of real-time data stream was proposed.Improved FPTree was adopted to represent all transactions in the sliding window compactly,and a complete base tree was constructed.The alphabetical order of transactions was used to realize the insert and delete operations of base tree easily without any reconstruct operation for base tree.Group tree structure was used to construct the project-tree by a top-down tree traverse,and the complete frequent itemsets were discovered with low computational cost.Results of simulation show that the proposed algorithm can discover the frequent itemsets of the real-time data stream efficiently with lower computational cost.

作者茹蓓贺新征

机构地区新乡学院计算机与信息工程学院河南大学计算机与信息工程学院

出处《计算机工程与设计》北大核心 2017年第10期2759-2766,共8页 Computer Engineering and Design

基金河南省科技厅软科学研究计划基金项目(152400410345) 河南省教育厅基金项目(15A520093)

关键词关联规则挖掘频繁项集实时数据流字母顺序项目树遍历数据挖掘 association rule mining frequent itemsets real-time data stream alphabetical o rd e r project tree traverse data mining

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1吴倩,罗健旭.压缩FP-Tree的改进搜索算法[J].计算机工程与设计,2015,36(7):1771-1777. 被引量：8
2李海峰,章宁,朱建明,曹怀虎.时间敏感数据流上的频繁项集挖掘算法[J].计算机学报,2012,35(11):2283-2293. 被引量：29
3曲武,隋海峰,杨炳儒,谢永红.分布式数据流挖掘的研究进展[J].计算机科学,2012,39(1):1-8. 被引量：8
4付冬梅,王志强.基于FP-tree和约束概念格的关联规则挖掘算法及应用研究[J].计算机应用研究,2014,31(4):1013-1015. 被引量：25
5刘芝怡,常睿.基于矩阵的不确定数据频繁项集快速挖掘算法[J].南京理工大学学报,2015,39(4):420-425. 被引量：5
6苏立,南海鹏,余向阳,吴罗长,王瑾.关联规则分类的数据流挖掘方法在水电机组故障诊断的应用[J].西安理工大学学报,2012,28(1):106-110. 被引量：6
7刘浩然,刘方爱,李旭,王记伟.有效的不确定数据概率频繁项集挖掘算法[J].计算机应用,2015,35(6):1757-1761. 被引量：5
8许晓,王诚.基于Topology模型的数据流频繁闭项集挖掘[J].南京邮电大学学报（自然科学版）,2016,36(3):79-84. 被引量：1
9杨鹏坤,彭慧,周晓锋,孙玉庆.改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J].计算机应用,2015,35(3):775-778. 被引量：16

二级参考文献158

1梁吉业,王俊红.基于概念格的规则产生集挖掘算法[J].计算机研究与发展,2004,41(8):1339-1344. 被引量：57
2金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
3吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
4贺跃,郑建军,朱蕾.一种基于熵的连续属性离散化算法[J].计算机应用,2005,25(3):637-638. 被引量：15
5秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26
6赵道利,马薇,梁武科,罗兴锜.水电机组振动故障的信息融合诊断与仿真研究[J].中国电机工程学报,2005,25(20):137-142. 被引量：42
7彭文季,罗兴锜,赵道利.基于频谱法与径向基函数网络的水电机组振动故障诊断[J].中国电机工程学报,2006,26(9):155-158. 被引量：31
8刘学军,徐宏炳,董逸生,钱江波,王永利.基于滑动窗口的数据流闭合频繁模式的挖掘[J].计算机研究与发展,2006,43(10):1738-1743. 被引量：26
9Plale B. Learning run time knowledge about event rates to im- prove memory utilization in wide area stream filtering[C]//Pro- ceedings of the International Symposium on High Performance Distributed Computing (HPDC). 2002~ 171-178. 被引量：1
10Chen L, Reddy K, Agrawal G. GATES: A grid-based middleware for processing distributed data streams[C]//Proeeedings of the International Symposium on High Performance Distributed Computing (HPDC). 2004 : 270-277. 被引量：1

共引文献89

1赵美惠.面向环境监测的无线传感器网络的数据流挖掘研究[J].计算机科学,2012,39(S3):111-113.
2杨欢,张玉清,胡予濮,刘奇旭.基于权限频繁模式挖掘算法的Android恶意应用检测方法[J].通信学报,2013,34(S1):106-115. 被引量：47
3陈伟珂,张铮燕.地铁施工灾害关键警兆监测指标研究[J].中国安全科学学报,2013,23(1):148-154. 被引量：6
4张爱科,符保龙.基于高维聚类的探索性文本挖掘算法[J].计算机应用,2013,33(4):988-990. 被引量：4
5符保龙.基于背景知识和主动学习的文本挖掘技术研究[J].计算机应用与软件,2013,30(5):275-278. 被引量：1
6张东利.决策树分类方法在水轮机组故障诊断的应用研究[J].电网与清洁能源,2013,29(6):92-94. 被引量：3
7张欣伟,陈文献,张锋利.基于DPSO优化支持向量机的水轮机组振动故障诊断[J].西安理工大学学报,2013,29(2):172-175. 被引量：5
8王红梅,胡明.基于散列的频繁项集分组算法[J].计算机应用,2013,33(11):3045-3048. 被引量：1
9杨欢,张玉清,胡予濮,刘奇旭.基于多类特征的Android应用恶意行为检测系统[J].计算机学报,2014,37(1):15-27. 被引量：89
10付达杰,戴红红.一种基于正态分布的数据流挖掘决策树算法[J].计算机应用与软件,2014,31(8):285-287.

同被引文献77

1海燕,张冰波.基于Apriori算法的高校人力资源数据挖掘系统[J].华北水利水电学院学报,2008,29(6):55-57. 被引量：1
2邱勇,兰永杰.高效FP-TREE创建算法[J].计算机科学,2004,31(10):98-100. 被引量：4
3李轶群.加强高校人事管理信息化打造现代师资管理数字平台[J].教育信息化,2005(7):15-17. 被引量：17
4李庆丰.加强青年教师教学能力培养是提高高等教育质量的当务之急--基于1997-2006年间普通高校专任教师队伍结构之量化分析[J].中国高教研究,2008(6):52-55. 被引量：49
5杨春建.数据挖掘在高校师资管理中的应用[J].青海师专学报,2008,28(5):129-131. 被引量：3
6朱慧爽.关联规则在高校科研管理工作中的应用[J].潍坊学院学报,2009,9(4):45-46. 被引量：3
7刘惊雷,刘兆伟,孙雪姣,武栓虎.CP-nets的代数表示及其模型求取算法[J].模式识别与人工智能,2011,24(6):725-732. 被引量：2
8李海峰,章宁,朱建明,曹怀虎.时间敏感数据流上的频繁项集挖掘算法[J].计算机学报,2012,35(11):2283-2293. 被引量：29
9寇香霞,任永功,宋奎勇.一种基于滑动窗口的数据流频繁项集挖掘算法[J].计算机应用与软件,2013,30(1):143-146. 被引量：11
10宋威,刘明渊,李晋宏.基于事务型滑动窗口的数据流中高效用项集挖掘算法[J].南京大学学报（自然科学版）,2014,50(4):494-504. 被引量：4

引证文献11

1张维国.基于数据挖掘的高职师资管理系统的应用与实践[J].计算机时代,2018(1):86-89. 被引量：1
2周鹏.非结构化网络分布式差异数据实时挖掘仿真[J].计算机仿真,2018,35(9):333-337. 被引量：2
3陈欣,于俊洋,赵媛媛.基于CNN和B-LSTM的文本处理模型研究[J].轻工学报,2018,33(5):103-108. 被引量：6
4冯霞,张江,左海超.基于查询聚类的物化视图动态选取策略[J].计算机工程与设计,2019,40(2):591-595. 被引量：2
5郑英姿,张福泉,李立杰.基于强化学习的大数据频繁项集挖掘算法[J].计算机工程与设计,2019,40(8):2270-2277. 被引量：7
6王卫星,刘兆伟,石敬华.基于时间敏感滑动窗口的CP-nets结构学习[J].南京大学学报（自然科学版）,2020,56(2):175-185. 被引量：2
7时兵.复杂网络数据流频繁项集人工智能挖掘仿真[J].计算机仿真,2020,37(4):330-334. 被引量：2
8文凯,耿小海,许萌萌.基于BTA算法的数据流频繁项集挖掘[J].计算机工程与设计,2020,41(8):2226-2230. 被引量：5
9王少峰,韩萌,贾涛,张春砚,孙蕊.数据流高效用模式挖掘综述[J].计算机应用研究,2020,37(9):2571-2578. 被引量：5
10蔡中民.多层实时网络加密数据流频繁项集挖掘方法[J].沈阳工业大学学报,2021,43(3):301-306. 被引量：6

二级引证文献38

1孙洋洋,姚俊萍,李晓军.基于流程视角的物化视图技术研究综述[J].火箭军工程大学学报,2021(3):97-102.
2曹宇,杨军.一种基于深度学习的云平台弹性伸缩算法[J].计算机与现代化,2019(4):17-24.
3郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36. 被引量：378
4周辉,郑飞平,陈蕾,倪相生.基于数据挖掘的高压直流设备故障自动排查方法研究[J].自动化与仪器仪表,2019,0(7):148-150. 被引量：5
5陈镭,张凡龙.Python数据挖掘在高校人才引进中的应用[J].中国教育信息化,2019,25(15):52-54. 被引量：4
6张志锋,崔亚东,崔霄.基于XGBoost的二手房房价预测模型[J].数字技术与应用,2019,37(11):178-180. 被引量：6
7潘立琼,张健.基于优化蚁群算法的网络流量数据精准挖掘仿真[J].佳木斯大学学报（自然科学版）,2020,38(1):53-57. 被引量：3
8张媛,汤学达,桂文军.基于Oracle Logminer的数据同步技术研究[J].网络安全技术与应用,2020(6):75-77. 被引量：1
9Lei Zhang,Chenbo Xu,Yihua Gao,Yi Han,Xiaojiang Du,Zhihong Tian.Improved Dota2 Lineup Recommendation Model Based on a Bidirectional LSTM[J].Tsinghua Science and Technology,2020,25(6):712-720. 被引量：7
10张娅.基于K均值聚类的大数据频繁项集挖掘研究[J].计算机仿真,2020,37(8):457-461. 被引量：7

1魏绒绒,代桃高,李建文.基于GNSS OEM板的数据采集及解码实现[J].大地测量与地球动力学,2017,37(10):1079-1082. 被引量：3
2金泽.邮说首届万国邮政大会的代表[J].上海集邮,2017,0(10):31-34.
3徐桂平.英语单词，想说爱你很容易[J].都市家教（上半月）,2017,0(10):220-220.
4刘金凤,张越,魏巍.不同抗生素治疗下呼吸道感染药物经济学对比分析[J].临床合理用药杂志,2017,10(25):13-14. 被引量：3
5张天伟.《假空缺句和省略》述评[J].外文研究,2017,5(2):92-95.
6任春伟.探索争创新与避风险的平衡之道[J].中国中小企业,2017,0(10):16-16.
7资和周.优先聚类和高斯混合模型树相融合的递增聚类研究[J].现代电子技术,2017,40(19):177-181. 被引量：2
8韩玉国.句法操作在初级汉语语法教学导入环节中的应用[J].国际汉语教学研究,2017(3):62-67. 被引量：1
9孙超利,郭一娜,谭瑛.径向基函数神经网络辅助的微粒群算法[J].太原科技大学学报,2017,38(3):178-184. 被引量：4
10王秀贵,石永安.以教学视角探索《成本会计》中的定额分配[J].中国农业会计,2017(9):10-11. 被引量：1

计算机工程与设计

2017年第10期

浏览历史

内容加载中请稍等...

高效的数据流完全频繁项集挖掘算法被引量：11

参考文献9

二级参考文献158

共引文献89

同被引文献77

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

高效的数据流完全频繁项集挖掘算法 被引量：11

参考文献9

二级参考文献158

共引文献89

同被引文献77

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

高效的数据流完全频繁项集挖掘算法被引量：11