期刊文献+
共找到317篇文章
< 1 2 16 >
每页显示 20 50 100
在FP-树中挖掘频繁模式而不生成条件FP-树 被引量:56
1
作者 范明 李川 《计算机研究与发展》 EI CSCD 北大核心 2003年第8期1216-1222,共7页
FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向... FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向的 ,每个结点只保留指向父结点的指针 ,这大约节省了三分之一的树空间 通过引入被约束子树(可以用 3个很小的数组表示 ) ,算法在挖掘频繁模式时不生成条件FP 树 ,从而大大提高了频繁模式挖掘的时空效率 实验表明 ,与FP growth算法相比 ,算法的挖掘速度提高了 1倍以上 ,而所需的存储空间减少了一半 此外 ,随着数据库规模的增大 ,算法具有很好的可伸缩性 对于稠密数据集 ,算法也具有良好的性能 . 展开更多
关键词 数据挖掘 频繁模式 fp-树
下载PDF
基于极大团和FP-Tree的挖掘关联规则的改进算法 被引量:30
2
作者 陈安龙 唐常杰 +2 位作者 陶宏才 元昌安 谢方军 《软件学报》 EI CSCD 北大核心 2004年第8期1198-1207,共10页
融合了关联规则挖掘的FP-Tree算法和图论的极大团理论的优势,做了以下主要工作:(1) 提出了用邻接矩阵的产生频繁2-项集的改进方法;(2) 提出了极大有序频繁集的概念,证明了Head关系的等价性、划分定理、局部复杂性定理和归并收敛值域定理... 融合了关联规则挖掘的FP-Tree算法和图论的极大团理论的优势,做了以下主要工作:(1) 提出了用邻接矩阵的产生频繁2-项集的改进方法;(2) 提出了极大有序频繁集的概念,证明了Head关系的等价性、划分定理、局部复杂性定理和归并收敛值域定理;(3) 提出并实现了基于极大团划分的MaxCFPTree算法,扫描时间复杂性小于O(n2);(4) 做了相关实验,以验证算法的正确性.新方法缓解了项目数量巨大而内存不足的矛盾,提高了系统效率和伸缩性. 展开更多
关键词 关联规则 fptree 极大团 邻接矩阵 归并收敛
下载PDF
基于Web使用挖掘的用户行为分析 被引量:27
3
作者 张波 巫莉莉 周敏 《计算机科学》 CSCD 北大核心 2006年第8期213-214,239,共3页
Web服务产生了大量的日志数据,这些数据记录了用户的行为信息。如何从海量的日志数据中自动、智能地抽取隐藏于其中的知识,这是本文要研究的问题。基于Web使用挖掘,对点击流数据源进行收集、预处理,并基于FP-tree的关联规则挖掘算法对... Web服务产生了大量的日志数据,这些数据记录了用户的行为信息。如何从海量的日志数据中自动、智能地抽取隐藏于其中的知识,这是本文要研究的问题。基于Web使用挖掘,对点击流数据源进行收集、预处理,并基于FP-tree的关联规则挖掘算法对用户行为进行分析,发现新模式,为优化网站建设提供有价值数据。 展开更多
关键词 WEB使用挖掘 点击流 WEB服务器日志 fp-tree 关联规则
下载PDF
一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 被引量:21
4
作者 宋余庆 朱玉全 +1 位作者 孙志挥 杨鹤标 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期777-783,共7页
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些... 目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FPtree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
5
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fptree
下载PDF
基于FP-Tree的反向频繁项集挖掘 被引量:20
6
作者 郭宇红 童云海 +1 位作者 唐世渭 杨冬青 《软件学报》 EI CSCD 北大核心 2008年第2期338-350,共13页
在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个... 在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集. 展开更多
关键词 反向挖掘 fp 频繁项集 隐私保护 知识隐藏
下载PDF
基于数据挖掘的垃圾E-mail过滤方法 被引量:7
7
作者 李文斌 刘椿年 黄佳进 《北京工业大学学报》 CAS CSCD 北大核心 2003年第2期237-240,共4页
分析了己有的垃圾E-mail过滤规则的算法的本质,给出了将邮件表示成事务的方法。在将垃圾邮件的训练集表示成事务集后,可以用FP-Tree算法从训练集中挖掘出频繁特征集。同时探讨了如何将一个频繁特征集表示成规则及如何使用规则的问题。
关键词 垃圾邮件 邮件过滤 fp-树 规则学习 数据挖掘
下载PDF
基于FP树的全局最大频繁项集挖掘算法 被引量:16
8
作者 王黎明 赵辉 《计算机研究与发展》 EI CSCD 北大核心 2007年第3期445-451,共7页
挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用... 挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用FP-树结构,类似FP-树挖掘方法,一遍就可以挖掘出所有的最大频繁项集,并且超集检测非常简单、快捷.另外MGMF算法采用了分布式PDDM算法播报消息的思想,具有很好的拓展性和并行性.实验证明MGMF算法是有效可行的. 展开更多
关键词 数据挖掘 fp-树 分布式数据库 最大频繁项集 频繁模式树
下载PDF
一种基于邻接表的最大频繁项集挖掘算法 被引量:15
9
作者 殷茗 王文杰 +1 位作者 张煊宇 姜继娇 《电子与信息学报》 EI CSCD 北大核心 2019年第8期2009-2016,共8页
针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次,同时用哈... 针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次,同时用哈希表对邻接表进行辅助存储,减小了遍历的空间规模。理论分析与实验结果表明,该算法时间与空间复杂度较低,提高了最大频繁项集挖掘速率,尤其在处理稠密数据集时具有较好的优越性。 展开更多
关键词 数据挖掘 频繁项集 APRIORI fp-GROWTH fp-tree
下载PDF
最大频繁项集的高效挖掘 被引量:13
10
作者 陈凯 冯全源 《微电子学与计算机》 CSCD 北大核心 2005年第8期22-25,共4页
提出了一种基于布尔矩阵的最大频繁项集挖掘算法MBA(Mining Boolean Array for maximal frequent item-sets),通过将FP-tree映射成布尔矩阵和权值表,运用布尔逻辑运算进行矩阵投影操作得到最大频繁项集,运算效率得到很大提高。
关键词 数据挖掘 关联规则 最大频繁项集 频繁模式树 频繁模式矩阵
下载PDF
基于磁盘表存储FP-TREE的关联规则挖掘算法 被引量:14
11
作者 申彦 宋顺林 朱玉全 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1313-1322,共10页
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据... 随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法. 展开更多
关键词 fp-tree 关联规则 磁盘存储 频繁项目集 DTRfp-GROWTH算法 fp-GROWTH算法 数据挖掘
下载PDF
一种有效的关联规则增量式更新算法 被引量:8
12
作者 朱玉全 孙志挥 《计算机工程与应用》 CSCD 北大核心 2001年第23期28-29,90,共3页
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增... 关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。 展开更多
关键词 数据挖掘 关联规则 增量式更新算法 数据库
下载PDF
利用网格服务的分布式频繁模式挖掘算法 被引量:4
13
作者 张力飞 朱骁峰 何炎祥 《计算机工程与应用》 CSCD 北大核心 2004年第7期179-181,220,共4页
充分利用网格计算平台的各种服务来进行分布式数据挖掘,是近来数据挖掘方面的一个热点。网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利。该文在这些研究的基础上,介绍了一种基于网格平台的分布式... 充分利用网格计算平台的各种服务来进行分布式数据挖掘,是近来数据挖掘方面的一个热点。网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利。该文在这些研究的基础上,介绍了一种基于网格平台的分布式频繁模式挖掘算法。该算法借鉴了FP-growth算法的思想并利用网格平台所提供的分布式计算的各种便利的服务,能在网格计算环境中进行分布式频繁模式的挖掘。 展开更多
关键词 频繁模式树 分布式数据挖掘 网格计算 频繁模式
下载PDF
改进的基于FP-tree的频繁项集挖掘算法 被引量:8
14
作者 郭伟 叶德谦 《计算机工程与应用》 CSCD 北大核心 2007年第19期174-176,共3页
对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。
关键词 数据挖掘 关联规则 频繁项集 fptree
下载PDF
基于FP-树挖掘大数据库的方法及算法PCM 被引量:6
15
作者 郑泉 王建东 《计算机工程与应用》 CSCD 北大核心 2004年第7期182-184,197,共4页
该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构造FP-树并挖掘它,如果子数据库的FP-树不能放进内存,则该方法可递归地用于该子数据库。
关键词 fp-树 fp-增长 频繁模式 频繁项 子数据库
下载PDF
频繁项集快速挖掘算法研究 被引量:11
16
作者 战立强 刘大昕 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第3期266-271,共6页
为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算... 为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算法运用递增构建候选项集模式树的策略缩小搜索空间,运用FP-tree的部分遍历操作简化搜索过程.在多个标准测试数据集上的实验结果表明,该算法的执行时间比同类算法减少了一个数量级,且占用较少的内存空间,因此该算法对于提高频繁项集和频繁闭项集的挖掘效率具有明显的效果. 展开更多
关键词 频繁项集挖掘 频繁闭项集 关联规则 fp-tree
下载PDF
基于FPMAX的最大频繁项目集挖掘改进算法 被引量:9
17
作者 牛新征 佘堃 《计算机科学》 CSCD 北大核心 2013年第12期223-228,共6页
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree... 挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFItree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。 展开更多
关键词 频繁项目集 最大频繁项目集 fp-tree fpMAX fp-GROWTH
下载PDF
关联规则挖掘算法研究 被引量:5
18
作者 周涛 陆惠玲 《齐齐哈尔大学学报(自然科学版)》 2004年第3期58-62,共5页
本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法--Apriori算法,以及在基础上对Apriori算法的各种改进算法。然后对基于非频繁项集的各种关联规则挖掘算法,多维多层次挖掘算法思想进行了讨论。最后指出了关联... 本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法--Apriori算法,以及在基础上对Apriori算法的各种改进算法。然后对基于非频繁项集的各种关联规则挖掘算法,多维多层次挖掘算法思想进行了讨论。最后指出了关联规则挖掘的未来研究方向。 展开更多
关键词 关联规则 APRIORI算法 Hash散列技术 fp-树 数据挖掘 事务压缩
下载PDF
一种多重最小支持度关联规则挖掘算法 被引量:10
19
作者 吴华瑞 张凤霞 赵春江 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第9期1447-1451,共5页
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同... 针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法. 展开更多
关键词 数据挖掘 关联规则 最小支持度 频繁模式树 多重支持度
下载PDF
一种新的基于FP-Tree的关联规则增量式更新算法 被引量:5
20
作者 徐文拴 辛运帏 《计算机工程与设计》 CSCD 北大核心 2006年第18期3430-3432,共3页
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问... 挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论。 展开更多
关键词 数据挖掘 关联规则 增量式更新 频繁模式树
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部