-
题名基于压缩FP-树和数组技术的频繁模式挖掘算法
被引量:16
- 1
-
-
作者
秦亮曦
苏永秀
刘永彬
梁碧珍
-
机构
广西大学计算机与电子信息学院
广西气象减灾研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第z1期244-249,共6页
-
基金
广西壮族自治区自然科学基金项目(0728032)
广西大学科研基金项目(X061176)
-
文摘
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine.一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.
-
关键词
数据挖掘
关联规则
频繁模式
压缩fp-树
-
Keywords
data mining
association rules
frequent patterns
compact fp-tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名多时间序列跨事务关联分析研究
被引量:4
- 2
-
-
作者
秦亮曦
史忠植
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院研究生院
广西大学计算机与电子信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第27期10-12,173,共4页
-
基金
国家自然科学基金(编号:90104021
60173017)
-
文摘
论文的研究目的是为了对时间序列的发展趋势进行预测。采用的方法是对多时间序列进行跨事务关联规则分析,利用关联规则中前件和后件的时间差进行预测。提出了跨事务关联规则挖掘ITARM,该算法采用了基于压缩FP-树的、分而治之的挖掘方法。算法在产生了频繁1-项集之后,分别利用1-项集中的项作为约束条件,建立压缩FP-树,挖掘跨事务关联规则。文中给出了算法的主要设计思想和算法的伪代码,并对算法的性能进行了测试。测试结果表明,ITARM算法是一个时间和空间性能都较高的跨事务关联规则挖掘算法。
-
关键词
数据挖掘
时间序列
跨事务关联规则
压缩fp-树
-
Keywords
data mining,time series,inter-transactional association rules,compact fp-tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-