-
题名基于改进FP树的项项正相关关联规则挖掘
被引量:1
- 1
-
-
作者
刘上力
杨清
-
机构
湖南科技大学网络信息中心
-
出处
《计算机工程与科学》
CSCD
北大核心
2011年第7期183-187,共5页
-
基金
湖南省自然科学基金资助项目(06JJ5132)
湖南省教育厅重点科学研究项目(10A028)
湖南省科技计划项目(2009JT3031)
-
文摘
兴趣度量在关联规则挖掘中常用来发现那些潜在的令人感兴趣的模式,基于FP树结构的FP-growth算法是目前较高效的关联规则挖掘算法之一,如果挖掘潜在的有价值的低支持度模式,这种算法效率较低。为此,本文提出一种新的兴趣度量—项项正相关兴趣度量,该量度具有良好的反单调性,所得到的模式中任意一项在事务中的出现均可提升模式中其余项出现的可能性。同时,提出一种改进的FP挖掘算法,该算法采用一种压缩的FP树结构,并利用非递归调用方法来减少挖掘中建立额外条件模式树的开销。更为重要的是,在频繁项集挖掘中引入项项正相关兴趣度量剪枝策略,有效过滤掉非正相关长模式和无效项集,扩大了可挖掘支持度阈值范围。实验结果表明,该算法是有效和可行的。
-
关键词
关联规则
兴趣度
项项正相关
剪枝
-
Keywords
association rules
interestingness measure
between-items positive correlation
pruning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于兴趣度剪枝的Apriori优化算法
被引量:1
- 2
-
-
作者
刘上力
杨清
-
机构
湖南科技大学网络信息中心
-
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2011年第4期68-71,共4页
-
基金
湖南省教育厅重点科学研究项目(10A028)
湖南省科技计划项目(JT3031)
-
文摘
鉴于关联规则挖掘中的Apriori算法在挖掘潜在有价值、低支持度模式时效率较低,因此提出一种优化的Apriori挖掘算法,即在频繁项集挖掘中引入项项正相关兴趣度量剪枝策略,有效过滤掉非正相关长模式和无效项集,从而扩大了可挖掘支持度阈值范围.实验结果表明,该算法是有效和可行的.
-
关键词
APRIORI算法
频繁项集
兴趣度
项项正相关
剪枝
-
Keywords
Apriori algorithm
frequent itemset
interestingness measure
between-items positive correlation
pruning
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-