-
题名一种频繁核心项集的快速挖掘算法
被引量:6
- 1
-
-
作者
田卫东
纪允
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机工程》
CAS
CSCD
2014年第6期120-124,共5页
-
基金
国家自然科学基金资助项目(60603068)
-
文摘
传统的频繁核心项集挖掘需多次生成和反复扫描数据库,导致生成效率低下。为此,提出一种快速生成频繁核心项集算法FMEP。该算法使用Rymon枚举树作为搜索空间,并采用分而治之的策略选择特定的路径进行剪枝。利用频繁核心项集特有的反单调性质,可以快速地判断某一个候选项集是否为频繁核心项集,而无需和所有直接子集的析取支持度进行比较。通过上述方法,可以达到快速挖掘的目的。实验结果证明,该算法能够在挖掘出所有的频繁核心项集精简表示元素的同时,降低消耗时间,与MEP算法相比,在密集型数据集上的时间可缩短2倍以上,在稀疏型数据集上时间至少缩短30%。
-
关键词
数据挖掘
频繁项集
精简表示
频繁核心项集
Rymon枚举树
-
Keywords
data mining
frequent itemsets
concise representation
frequent essential itemsets
Rymon enumeration tree
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-