期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于FP-Tree有效挖掘最大频繁项集 被引量:68
1
作者 颜跃进 李舟军 陈火旺 《软件学报》 EI CSCD 北大核心 2005年第2期215-222,共8页
最大频繁项集的挖掘过程中,在最小支持度较小的情况下,超集检测是算法的主要耗时操作.提出了最大频繁项集挖掘算法 FPMFI(frequent pattern tree for maximal frequent item set)使用基于投影进行超集检测的机制,有效地缩减了超集检测... 最大频繁项集的挖掘过程中,在最小支持度较小的情况下,超集检测是算法的主要耗时操作.提出了最大频繁项集挖掘算法 FPMFI(frequent pattern tree for maximal frequent item set)使用基于投影进行超集检测的机制,有效地缩减了超集检测的时间.另外,算法FPMFI通过删除FP子树(conditional frequent pattern tree)的冗余信息,有效地压缩了 FP 子树的规模,减少了遍历的开销.分析表明,算法 FPMFI 具有优越性.实验比较说明,在最小支持度较小时,算法 FPMFI 的性能优于同类算法 1 倍以上. 展开更多
关键词 最大频繁项 频繁模式树 检测 最大频繁项投影
下载PDF
基于改进FP-tree的最大频繁项集挖掘算法 被引量:14
2
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖... 现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。 展开更多
关键词 数据挖掘 关联规则 最大频繁项 检测 频繁模式树
下载PDF
不确定数据流最大频繁项集挖掘算法研究 被引量:9
3
作者 刘慧婷 候明利 +1 位作者 赵鹏 姚晟 《计算机工程与应用》 CSCD 北大核心 2016年第19期72-77,93,共7页
对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研... 对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研究。因此,针对上述不足,提出了一种基于衰减模型的不确定性数据流最大频繁项集挖掘算法TUFSMax。该算法采用标记树结点的方法,使得算法不需要超集检测就可挖掘出所有的最大频繁项集,节约了超集检测时间。实验证明了提出的算法在时间和空间上具有高效性。 展开更多
关键词 不确定性数据流 最大频繁项 检测
下载PDF
基于Nodeset的最大频繁项集挖掘算法 被引量:6
4
作者 林晨 顾君忠 《计算机工程》 CAS CSCD 北大核心 2016年第12期204-207,216,共5页
递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频繁项集挖掘算法——MFIN算法。该算法采用Nodeset数据结构对POC-Tree的节点编码,将集合枚举树作为搜索空... 递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频繁项集挖掘算法——MFIN算法。该算法采用Nodeset数据结构对POC-Tree的节点编码,将集合枚举树作为搜索空间,避免递归遍历和条件FP-Tree构建的时间开销。设计提前停止方法提高求解Nodeset交集的效率,采用父等价剪枝技术和前瞻剪枝技术缩小搜索空间。对基于MFI-Tree的投影策略进行改进,提升超集检测的速度。实验结果表明,MFIN算法在mushroom,pumsb,webdocs数据集上的运行时间及执行效率等总体性能明显优于基于FP-Tree的FP-Max算法。 展开更多
关键词 最大频繁项 关联规则 剪枝技术 前缀树 检测
下载PDF
基于DiffNodeset结构的最大频繁项集挖掘算法 被引量:5
5
作者 尹远 张昌 +1 位作者 文凯 郑云俊 《计算机应用》 CSCD 北大核心 2018年第12期3438-3443,共6页
在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种... 在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果。 展开更多
关键词 最大频繁项挖掘 关联规则 合枚举树 优化剪枝 检测
下载PDF
基于AO算法的数据流频繁项集挖掘 被引量:5
6
作者 文凯 耿小海 +1 位作者 朱璐伟 许萌萌 《计算机工程与科学》 CSCD 北大核心 2020年第12期2259-2264,共6页
针对传统数据流频繁项集挖掘算法在支持度更新、窗口更新方式、频繁k-项集挖掘等方面存在的一系列问题,造成空间和时间效率不高,改进研究了一种高效挖掘数据流频繁项集的AO算法。采用滑动窗口思想,对数据流分块挖掘;在满窗口有新数据流... 针对传统数据流频繁项集挖掘算法在支持度更新、窗口更新方式、频繁k-项集挖掘等方面存在的一系列问题,造成空间和时间效率不高,改进研究了一种高效挖掘数据流频繁项集的AO算法。采用滑动窗口思想,对数据流分块挖掘;在满窗口有新数据流入时,采用取余插入完成数据更新;挖掘频繁k-项集采用And Operation求解支持度,并在挖掘过程结合超集检测,极大地提高了挖掘效率。实验结果表明,该算法在时间和空间效率上均有一定的优越性。 展开更多
关键词 数据流 检测 频繁项 与运算
下载PDF
基于B-list的最大频繁项集挖掘算法 被引量:4
7
作者 张昌 文凯 郑云俊 《计算机应用研究》 CSCD 北大核心 2019年第2期351-354,共4页
针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁项集,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小... 针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁项集,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小搜索空间;最后再结合基于MFI-tree的投影策略实现超集检测来提高算法的效率。实验结果表明,BMFI算法在时间效率与空间效率方面均优于FPMAX与MFIN算法。该算法在稠密数据集与稀疏数据集中进行最大频繁项集挖掘时均有良好的效果。 展开更多
关键词 最大频繁项挖掘 深度优先搜索 剪枝技术 检测
下载PDF
基于FP-tree最大频繁模式超集挖掘算法 被引量:3
8
作者 王君 任永功 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期33-36,41,共5页
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无... 数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间. 展开更多
关键词 数据挖掘 最大频繁项目 条件频繁模式树 检测
下载PDF
改进的最大频繁项集挖掘算法 被引量:2
9
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2010年第18期4009-4011,4032,共4页
为了提高挖掘关联规则的效率,提出基于改进FP-Tree结构的最大频繁项集挖掘算法。介绍并分析了挖掘最大频繁项集的过程和现有算法,指出现有算法中耗时的关键步骤。克服了MMFI算法中需要反复从头表出发沿相同项目结点链搜索右侧结点的缺点... 为了提高挖掘关联规则的效率,提出基于改进FP-Tree结构的最大频繁项集挖掘算法。介绍并分析了挖掘最大频繁项集的过程和现有算法,指出现有算法中耗时的关键步骤。克服了MMFI算法中需要反复从头表出发沿相同项目结点链搜索右侧结点的缺点,提出一种改进的最大频繁项集挖掘算法IMMFI。通过在有序FP-Tree中引入叶子链,用沿叶子链搜索取代沿同层结点链搜索,有效地减少了搜索的次数,提高了算法的效率。实验结果表明了该算法的性能良好。 展开更多
关键词 数据挖掘 关联规则 最大频繁项 检测 频繁模式树
下载PDF
一种改进的最大频繁项集挖掘算法 被引量:2
10
作者 胡德敏 赵瑞可 《计算机应用与软件》 CSCD 北大核心 2012年第12期186-188,共3页
研究基于条件模式基排序的最大频繁项集挖掘算法。通常在基于FP-tree(frequent pattern tree)的最大频繁项集挖掘算法中,影响执行效率的主要是递归和超集检测。因此提出了改进的最大频繁项集挖掘算法S-FP-MFI(sorted frequent pattern t... 研究基于条件模式基排序的最大频繁项集挖掘算法。通常在基于FP-tree(frequent pattern tree)的最大频繁项集挖掘算法中,影响执行效率的主要是递归和超集检测。因此提出了改进的最大频繁项集挖掘算法S-FP-MFI(sorted frequent pattern tree for maximal frequent item set),根据条件模式基含有的项目数对条件模式基进行动态排序,以减少递归次数;另外基于MFI-tree(maximalfrequent item tree)的投影策略减少了超集检测时间。实验表明S-FP-MFI算法在支持度较小的情况下,具有优越性。 展开更多
关键词 递归 最大频繁项 频繁模式树 条件模式基 检测
下载PDF
最大亚频繁模式挖掘算法研究 被引量:1
11
作者 张海清 刘胤田 《计算机工程》 CAS CSCD 北大核心 2011年第14期62-64,共3页
为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MS... 为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MSFP-tree的最大亚频繁模式超集检测和剪枝策略及对MSFP-mining挖掘性能的实验验证。实验结果表明,该算法利用差别频繁度实现核心项集、附加频繁项集、补充频繁项集的阶段性求取和组合,在保证项集频繁度基础上实现最大亚频繁模式挖掘,扩展频繁模式规模。 展开更多
关键词 模式挖掘 最大亚频繁模式 数据 检测 MSFP-tree结构
下载PDF
基于AFOPT-tree的最大频繁项集挖掘
12
作者 周爱武 王浩 温春林 《微型机与应用》 2014年第11期86-88,共3页
在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映... 在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映射至一种压缩的AFOPT-tree结构,该结构结合自顶向下的遍历策略,具有更小的时间开销。 展开更多
关键词 最大频繁项 关联规则 检测 最大频繁项投影
下载PDF
改进超集检测策略
13
作者 杜垒 《技术与市场》 2011年第6期27-28,共2页
一般的超集检测策略都是先进行超集检测,根据检测结果来决定是否将其加入到最大频繁集中,耗时低效,在这里运用索引链表方法来存储已经找到的最大频繁项集。
关键词 最大频繁 检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部