-
题名基于MapReduce的约束频繁项集挖掘算法
被引量:3
- 1
-
-
作者
施亮
钱雪忠
-
机构
江南大学物联网工程学院
-
出处
《计算机工程与设计》
北大核心
2015年第10期2725-2728,2748,共5页
-
基金
国家自然科学基金项目(61103129
61202312)
江苏省科技支撑计划基金项目(BE2009009)
-
文摘
传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约束条件对子任务进行并行挖掘,提高算法的执行效率。实验结果表明,该算法具有较好的实用性和良好的扩展性。
-
关键词
数据挖掘
MapReduce编程模型
约束频繁项集
频繁模式树
关联规则
-
Keywords
data mining
MapReduce programming model
constrained frequent itemsets
frequent pattern tree
association rules
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于约束的序列模式关联规则挖掘算法
被引量:2
- 2
-
-
作者
张钰
刘玉文
-
机构
蚌埠医学院
-
出处
《太原师范学院学报(自然科学版)》
2015年第1期44-48,88,共6页
-
基金
安徽省高等教育省级振兴计划项目(2013zytz037)
安徽省教育厅自然科学研究项目(kj2013z211)
+2 种基金
安徽省教育厅教学研究项目(2013jyxm120)
蚌埠医学院教学研究项目(jyxm1307)
国家级大学生创新创业训练计划项目(201210367022)
-
文摘
约束关联规则是数据挖掘的一个主要方向,可以根据用户给定的约束条件针对性的挖掘.目前大多数的研究都集中在约束频繁项集挖掘方面,很少进行序列模式的约束关联挖掘.本文把序列模式和约束进行结合,提出一种基于约束的序列模式关联规则挖掘算法.它同时处理两类约束:反单调性约束和单调性约束.可以根据约束条件挖掘数据间的因果关联关系.通过实验验证,该算法在运行效率上达到了较好效果.
-
关键词
序列
单调性约束
反单调性约束
约束频繁项集
序列关联规则
-
Keywords
sequence
monotonicity constraint
anti-monotonicity constraints
constrained frequent itemsets
sequential association rules
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种高效的增量更新约束关联规则挖掘算法的研究
被引量:2
- 3
-
-
作者
徐春
李广原
-
机构
广西师范学院计算机与信息工程学院
-
出处
《广西师范学院学报(自然科学版)》
2016年第2期48-54,共7页
-
基金
广西自然科学基金(2014GXNSFAA118388)
广西高校科研项目(YB2014237)
-
文摘
约束关联规则挖掘是根据用户提出的各种约束条件从交易数据库中挖掘出用户感兴趣的关联规则。该文针对目前提出的诸多约束关联挖掘算法只适应于静态数据库的情况,且挖掘出的约束关联规则存在效率低等缺点,提出一种基于倒排索引树的增量更新约束关联规则挖掘算法UPC-IITree,该算法将树型结构与倒排索引相结合,以实现无需扫描原始数据库和不产生候选项集的情况下,解决原始DB新增数据集时能高效地维护满足用户给定约束条件的关联规则。通过实验与其他相关算法进行对比,实验结果表明,UPC-IITree算法减少了算法的执行时间,节约了内存空间,提高了挖掘效率。
-
关键词
增量更新挖掘
倒排索引
约束频繁项集
关联规则
-
Keywords
incremental updating mining
inverted index
frequent item sets
association rules
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于频繁模式树的约束最大频繁项集挖掘算法
被引量:15
- 4
-
-
作者
花红娟
张健
陈少华
-
机构
上海海洋大学信息学院
上海海洋大学图书馆
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第9期78-80,共3页
-
基金
国家"863"计划基金资助重点项目"人工鱼礁生态增殖及海域生态调控技术"(2006AA100303)
-
文摘
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。
-
关键词
数据挖掘
最大频繁项集
约束最大频繁项集
频繁模式树
项约束
-
Keywords
data mining
maximum frequent itemsets
constrained maximum frequent itemsets
Frequent Pattern tree(FP-tree)
item constraint
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-