-
题名快速挖掘全局频繁项目集
被引量:35
- 1
-
-
作者
杨明
孙志挥
吉根林
-
机构
东南大学计算机科学与工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第4期620-626,共7页
-
基金
国家自然科学基金 (79970 0 92 )
-
文摘
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率
-
关键词
数据挖掘
全局频繁项目集
频繁模式树
快速挖掘算法
布尔型关联规则
数据库
APRIORI算法
-
Keywords
data mining
distributed database
global frequent itemsets
frequent pattern tree (FP tree)
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名传感器网络分布式数据流的频繁项集挖掘算法
被引量:4
- 2
-
-
作者
洪月华
-
机构
广西大学计算机与电子信息学院
广西经济管理干部学院计算机系
-
出处
《计算机科学》
CSCD
北大核心
2013年第2期58-60,94,共4页
-
基金
国家自然科学基金项目(61064002)
广西自然科学基金青年项目(2012jjBAG0074)
广西教育厅项目(200103YB195)资助
-
文摘
研究无线传感器网络中数据流频繁项集挖掘问题。针对集中式的静态数据流频繁项集挖掘方法不能在传感器网络中直接使用这一特点,提出基于传感器网络的分布式数据流的频繁项集挖掘算法FIMDS。该算法基于FP-tree快速挖掘出传感器节点上单一数据流的局部频繁项集,然后通过路由将其在无线传感器网络里逐层上传合并,在Sink节点上汇聚后,采用自顶向下的高效剪枝策略挖掘出全局频繁项集。实验结果表明,该算法能有效地大幅度减少候选项集,降低无线传感器网络中的通信量,并有较高的时间和空间效率。
-
关键词
无线传感器网络
分布式数据流
局部频繁项集
全局频繁项集
数据挖掘
-
Keywords
Wireless sensor network, Distributed data streams, Local frequent itemsets, global frequent itemsets, Datamining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FP-tree的快速数据挖掘算法
被引量:3
- 3
-
-
作者
曾庆森
黄贤英
-
机构
重庆理工大学计算机科学与工程学院
-
出处
《重庆工学院学报(自然科学版)》
2009年第10期72-76,共5页
-
基金
重庆市自然科学基金资助项目(CSTC2007BB2405)
-
文摘
针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP-growth算法独立地计算局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.FAMGFI算法采用自顶向下和自底向上策略,能大大降低通信量.理论分析和实验结果表明FAMGFI算法是快速而有效的.
-
关键词
数据挖掘
频繁模式树
全局频繁项集
-
Keywords
data mining
FP-tree
global frequent itemsets
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名分布式数据库的全局频繁项目集高效更新算法
被引量:1
- 4
-
-
作者
宋宝莉
覃征
-
机构
西安交通大学计算机科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第31期157-160,共4页
-
基金
国家自然科学基金资助项目(60542004)
-
文摘
提出了快速更新全局频繁项目集的算法IUAGFI(IncrementalUpdatingAlgorithmforGlobalFrequentItemsets)。该算法主要考虑数据库记录发生变化时全局频繁项目集的更新情况,在最坏的情况下仅需扫描各局部数据库一遍,并利用已建立的各局部改进的频繁模式树和已挖掘的结果,可避免传送某些原全局频繁项目对应的被约束子树,从而降低网络通讯代价。实验结果表明,该算法是有效可行的。
-
关键词
数据挖掘
分布式数据库
全局频繁项目集
约束子树
更新
-
Keywords
data mining
distributed database
global frequent itemsets
constrained sub-tree
updating
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于频繁模式树的分布式关联规则挖掘算法
被引量:11
- 5
-
-
作者
何波
-
机构
重庆理工大学计算机科学与工程学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2012年第4期618-622,共5页
-
基金
教育部人文社会科学研究项目(09yjc870032)
-
文摘
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的.
-
关键词
数据挖掘
频繁模式树
全局频繁项集
关联规则
-
Keywords
data mining
frequent pattern tree
global frequent itemsets: association rules
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种分布式全局频繁闭项目集快速挖掘更新算法
被引量:3
- 6
-
-
作者
陈健美
朱玉全
倪巍伟
宋余庆
宋顺林
桂长青
-
机构
江苏大学计算机科学与通信工程学院
东南大学计算机科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2008年第7期1237-1240,共4页
-
基金
国家自然科学基金项目(60572112)资助
江苏省软件与集成电路基金项目([2005]196)资助
-
文摘
在数据挖掘研究中,频繁闭项目集挖掘成为重要的研究方向.目前已有的频繁闭项目集挖掘算法主要针对单机环境,有关分布式环境下的全局频繁闭项目集挖掘算法的研究尚不多见.针对无共享体系结构数据水平分布的情况,提出了一种分布式快速挖掘全局频繁闭项目集增量式更新算法,算法通过对各节点候选频繁项目集进行预处理,有效地降低网络通信量,提高全局频繁闭项目集挖掘算法的效率,该算法充分利用前次挖掘结果来发现新的全局频繁闭项目集,具有较高的效率.理论分析和实验结果表明算法是有效的.
-
关键词
数据挖掘
分布式数据库
频繁闭项目集
全局频繁闭项目集
增量式更新
-
Keywords
data mining
distributed database
frequent closed itemsets
global frequent closed itemsets
incremental updating
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FP-tree的快速挖掘全局最大频繁项集算法
被引量:2
- 7
-
-
作者
何波
-
机构
重庆理工大学计算机科学与工程学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2011年第7期1547-1552,共6页
-
文摘
挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集,采用自顶向下策略挖掘出所有的全局最大频繁项集。与类Apriori算法相比,该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量。实验结果表明,该算法是快速和高效的。
-
关键词
数据挖掘
频繁模式树
全局最大频繁项集
算法
-
Keywords
data mining
frequent-pattern tree
global maximum frequent itemsets
algorithms
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名快速挖掘分布式数据库全局最大频繁项集
被引量:2
- 8
-
-
作者
何波
-
机构
重庆理工大学计算机科学与工程学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2011年第8期1214-1218,1223,共6页
-
基金
教育部科学研究基金项目((09yjc870032)
-
文摘
提出一种快速挖掘分布式数据库全局最大频繁项集算法(FMMFI).FMMFI算法首先设置了中心节点,并以各个节点构建局部FP-tree,采用挖掘最大频繁项目集算法(DMFIA)快速挖掘局部最大频繁项集;然后与中心节点交互以实现数据汇总;最终获得全局最大频繁项集.FMMFI算法采用自上而下的剪枝策略,能大幅减少候选项集,降低通信量.理论分析和实验结果表明,FMMFI算法是有效的.
-
关键词
数据挖掘
频繁模式树
全局最大频繁项集
分布式数据库
-
Keywords
data mining
FP-tree
global maximum frequent itemsets
distributed database
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名全局频繁闭项目集挖掘算法研究
- 9
-
-
作者
陈健美
朱玉全
宋顺林
桂长青
宋余庆
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机科学》
CSCD
北大核心
2008年第1期193-195,共3页
-
基金
国家自然科学基金(No.60572112)
-
文摘
频繁闭项目集挖掘是数据挖掘研究中的一个重要研究课题。目前已有的频繁闭项目集挖掘算法主要针对单机环境,有关分布式环境下的全局频繁闭项目集挖掘算法的研究尚不多见。为此,本文提出了一种快速挖掘全局频繁闭项目集算法,并对其更新问题进行了研究;提出了一种相应的频繁闭项目集增量式更新算法,该算法将充分利用先前的挖掘结果来节省发现新的全局频繁闭项目集的时间开销。实验结果表明算法是有效的。
-
关键词
数据挖掘
分布式数据库
频繁闭项目集
全局频繁闭项目集
-
Keywords
Data mining, Distributed database, frequent closed itemsets, global frequent closed itemsets
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-