-
题名频繁闭合项目集的并行挖掘算法研究
被引量:5
- 1
-
-
作者
缪裕青
-
机构
桂林电子工业学院计算机系
-
出处
《计算机科学》
CSCD
北大核心
2004年第5期166-168,共3页
-
文摘
频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特性及并行挖掘的特点,给出了共享存储器模型上(Shared Memory)基于频繁模式树(FP-tree)的挖掘频繁闭合项目集的并行算法(FCIPM)思想,提出了频繁闭合项目集直接判断法,性能分析表明所提技术对算法的性能提高起到了关键作用。
-
关键词
频繁项目集
数据挖掘
并行算法
频繁模式树
频繁闭合项目集
-
Keywords
Data mining,Frequent itemsets,Frequent closed itemsets,FP-tree,Parallel algorithm
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FP-Tree的频繁闭合项目集挖掘算法的研究
被引量:3
- 2
-
-
作者
陈俊杰
崔晓红
-
机构
太原理工大学计算机与软件学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第34期169-171,共3页
-
文摘
目前频繁闭合项目集挖掘算法有很多,例如CLOSET[1]。CLOSET以FP-Growth为基础,采用FP-Tree来表示模式支持集,通过深度优先搜索来挖掘频繁闭合模式。其困难是,递归构造“条件FP-Tree”的CPU开销和存储开销很大。为解决上面的问题,论文提出一种基于FP-Tree和COFI-Tree的频繁闭合项目集挖掘算法,在该算法中引用了COFI-Tree结构,COFI-Tree无需递归地构造“条件FP-Tree”,并且某一时刻只有一个频繁项的COFI-Tree在内存,所以大大减少了内存消耗。通过实验证明:当挖掘大型数据库时,在执行时间方面,该算法比其它算法更有效。
-
关键词
频繁闭合项目集
FP-TREE
COFI-Tree
-
Keywords
frequent closed itemsets
FP-Tree
COFI-Tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名CLOSET^+:基于CLOSET的改进算法
- 3
-
-
作者
杨敏
朱福喜
刘小丽
余永宏
-
机构
武汉大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2006年第11期43-46,共4页
-
基金
国家自然科学基金重大研究计划项目(90104005)
-
文摘
分析了用各种不同的方法挖掘频繁闭合模式的优缺点,以及在什么时候该采取什么样的策略以取得较好的表现。提出了一个CLOSET+算法,该算法不仅综合了其他算法的优点,而且还提出了新的思想和算法。
-
关键词
关联规则
FP-TREE
频繁闭合项目集
-
Keywords
Association Rules
FP-tree
Frequent Closed Itemsets
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名快速更新频繁闭合项目集算法
被引量:1
- 4
-
-
作者
杨萍
李立乡
杨明
-
机构
南京师范大学数学与计算机学院
南京高等职业技术学校
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第36期148-151,共4页
-
基金
国家自然科学基金资助项目(70371015)
江苏省自然科学基金资助项目(BK2005135)
江苏省高校自然科学研究项目基金资助项目(05KJB520066)
-
文摘
频繁闭合项目集集可惟一确定频繁项目集完全集且数量小得多,然而有关频繁闭合项目集的更新还不多见。为此,提出快速更新频繁闭合项目集算法—FUAFCI(Fast Updating Algorithm of Frequent Closed Itemsets),该算法主要考虑最小支持度发生变化时频繁闭合项目集的更新情况。FUAFCI在最坏的情况下仅须扫描各局部数据库一遍,且利用CLOSET+的项目集合并、子项目集修剪以及子集检验等优化策略及已挖掘的结果,可确保对频繁闭合项目集进行高效的更新。验结果表明,FUAFCI算法是有效可行的。
-
关键词
数据挖掘
频繁闭合项目集
更新
-
Keywords
data mining
frequent dosed itemsets
updating
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-