广义遗传算法在Apriori算法改进中的应用

Application of General Genetic Algorithm(GGA) in the Improvement of Apriori Algorithm

下载PDF

导出

摘要 Apriori算法是关联规则挖掘的经典算法。但在面对海量数据集时,由于过多的磁盘读写操作,使算法的效率大大降低。本文提出了一种将数据集根据处理计算机的内存进行分割,使分割后的每一部分数据集能直接放入内存中,用Apriori算法找到局部的关联规则,再在所有找到的局部关联的基础上,使用遗传算法寻找全局关联规则的方法。由于大大减少了磁盘操作,在处理海量数据集时本方法效率优于传统Apriori算法。 Apriori algorithm is the classic algorithm in the mining of associate rule.But faced at large dataset,because of too much disk I/O,the performance of Apriori algorithm drops dramatically.This paper proposes an approach that divides the database to put every parts into RAM directly,then finds the local associate rules according to Apriori algorithm,finally finds the overall associate rules based on all local associate rules using general genetic algorithm(GGA).Because of the much decrease of disk I/O,the performance of this approach is better than the traditional Apriori algorithm when using large dataset.

作者李颖曹长修任江洪叶仲泉

机构地区重庆大学自动化学院

出处《计算机与现代化》 2004年第11期1-3,6,共4页 Computer and Modernization

基金国家教育部博士点基金项目(98061117) 重庆市应用基础研究项目(7369)。

关键词 APRIORI算法磁盘关联规则内存数据集海量数据读写操作局部处理广义 data mining general genetic algorithm associate rule

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] TP333 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献7

1Jiawei Han,Micheline Kamber.数据挖掘-概念与应用(影印版)[M].北京:高等教育出版社,2001. 被引量：1
2TomMMitchell.机器学习[M].北京：机械工业出版社,2003.263-276. 被引量：9
3史忠植著..知识发现[M].北京:清华大学出版社,2002:402.
4R Agrawal,T Imielinski,A Swami. Mining association rules between sets of items in large database[ A ]. In proc. 1993 ACMSIGMOD Int. Conf. Management of Data (SIGMOD' 93) [ C ].Washington: DC, 1993.207-216. 被引量：1
5R Agrawal, R Srikant. Fast algorithms for mining association rules [ A ]. In Proc. 1994 Int. Conf. Very Large Data Bases(VLDB' 94) [C]. Santiago: 1994.487-499. 被引量：1
6许国艳,史宇清.遗传算法在关联规则挖掘中的应用[J].计算机工程,2002,28(7):122-124. 被引量：28
7李鹏,董聪.基于实数编码的广义遗传算法及其在优化问题中的应用[J].控制与决策,2002,17(4):487-490. 被引量：23

二级参考文献5

1董聪,郭晓华,袁曾任.基于广义遗传算法的全局优化方法[J].计算机科学,1999,26(6):7-10. 被引量：17
2孙志挥.知识发现与数据挖掘[M].南京:东南大学,2000,8.. 被引量：2
3周明孙树栋.遗传算法原理与应用[M].北京:国防工业出版社,1999.. 被引量：17
4董聪,郭晓华.广义遗传算法的逻辑结构及全局收敛性的证明[J].计算机科学,1998,25(5):38-42. 被引量：26
5袁慧梅.具有自适应交换率和变异率的遗传算法[J].首都师范大学学报（自然科学版）,2000,21(3):14-20. 被引量：40

共引文献57

1严丽丽,陈鹤年,马杰.基于自适应策略的动态模拟退火遗传挖掘算法[J].软件导刊,2010,9(5):61-62.
2夏江,严平,庄一舟,许向明.基于遗传算法的软土地基沉降预测[J].岩土力学,2004,25(7):1131-1134. 被引量：34
3戴艳丽.基于数据仓库和数据挖掘的评教决策支持系统的研究[J].牡丹江教育学院学报,2012(5):178-180. 被引量：1
4石晓荣,张明廉.一种基于神经网络和遗传算法的拟人智能控制方法[J].系统仿真学报,2004,16(8):1835-1838. 被引量：14
5胡斌,朱莉,曲俊峰,李颜峰,凡华.遗传算法的期货交易决策辅助系统应用方法[J].电脑开发与应用,2005,18(2):44-45.
6武兆慧,张桂娟,刘希玉.基于模拟退火遗传算法的关联规则挖掘[J].计算机应用,2005,25(5):1009-1011. 被引量：19
7郭涛,张浩,陆剑峰.数据挖掘系统开发及Oracle Data Mining应用[J].机械工程与自动化,2005(2):49-51. 被引量：2
8来升强,朱建平.数据挖掘中关联规则算法的发展趋势[J].统计与信息论坛,2005,20(3):16-20. 被引量：3
9邓子建,李弼程.一种有监督学习证据理论分类器[J].计算机工程与应用,2005,41(15):53-56.
10刘建华,王勇,洪月好.遗传算法编码设计及其在数据挖掘中的应用[J].上海电力学院学报,2005,21(3):244-248. 被引量：3

1董聪,郭晓华.广义遗传算法的逻辑结构及全局收敛性的证明[J].计算机科学,1998,25(5):38-42. 被引量：26
2王志春.一种改进的挖掘关联规则Apriori算法[J].电脑知识与技术,2015,0(12):4-5. 被引量：3
3王荣福,余丽娜,魏玲玲.基于划分技术对Apriori算法的改进[J].科技创新导报,2008,5(12):14-15. 被引量：2
4罗可,贺才望.基于Apriori算法改进的关联规则提取算法[J].计算机与数字工程,2006,34(4):48-51. 被引量：22
5李鹏,董聪.基于实数编码的广义遗传算法及其在优化问题中的应用[J].控制与决策,2002,17(4):487-490. 被引量：23
6王代星,张小平,王翰虎.基于置信度与隐含度削减的Apriori算法改进[J].计算机技术与发展,2010,20(11):105-108.
7魏玲,魏永江,高长元.基于Bigtable与MapReduce的Apriori算法改进[J].计算机科学,2015,42(10):208-210. 被引量：22
8杨秋叶.数组在apriori算法改进中的应用[J].科技传播,2013,5(12):227-228. 被引量：1
9于守健,周羿阳.基于前缀项集的Apriori算法改进[J].计算机应用与软件,2017,34(2):290-294. 被引量：12
10邹金萍,高俊.基于关联规则Apriori算法改进[J].信息通信,2015,28(6):34-34.

计算机与现代化

2004年第11期

浏览历史

内容加载中请稍等...

广义遗传算法在Apriori算法改进中的应用

参考文献7

二级参考文献5

共引文献57

相关作者

相关机构

相关主题

浏览历史