期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
关联规则挖掘中Apriori算法的研究与改进 被引量:94
1
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁 候选
下载PDF
一种基于矩阵的强关联规则生成算法 被引量:17
2
作者 吕桃霞 刘培玉 《计算机应用研究》 CSCD 北大核心 2011年第4期1301-1303,共3页
针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法。该算法通过将事务数据库转换为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少了候选项集的产生,同时实现置信度的高效计... 针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法。该算法通过将事务数据库转换为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少了候选项集的产生,同时实现置信度的高效计算。通过对实例和大数据量数据库的分析表明,该方法是有效的。 展开更多
关键词 关联规则 排序矩阵 候选 频繁 置信度
下载PDF
关联规则增量更新算法研究 被引量:10
3
作者 李宝东 宋瀚涛 《计算机工程与应用》 CSCD 北大核心 2002年第23期6-8,共3页
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进... 该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进行了实验比较,说明了EFUP相对于FUP算法的优点。 展开更多
关键词 关联规则增量更新算法 数据挖掘 关联规则 频繁 支持数 候选 数据库 知识发现
下载PDF
一个有效的分布式并行挖掘关联规则算法 被引量:6
4
作者 葛丽娜 钟诚 《计算机工程与设计》 CSCD 2004年第8期1258-1260,共3页
提出了一个基于分布式结构的快速有效的关联规则挖掘算法,它采用了分布式结构,各节点并行计算,与相关算法相比有效地减少了通信量和候选项集数目,算法可扩展性好,实现简单。
关键词 关联规则算法 关联规则挖掘算法 候选 分布式结构 可扩展性 分布式并行 并行计算 通信量 节点
下载PDF
基于消费行为的Apriori算法研究 被引量:8
5
作者 骆嘉伟 彭蔓蔓 +1 位作者 陈景燕 王思玮 《计算机工程》 CAS CSCD 北大核心 2003年第5期72-73,118,共3页
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集... 介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。 展开更多
关键词 消费行为 APRIORI算法 数据挖掘 关联规则 候选 频繁 数据库
下载PDF
基于时态约束的关联规则挖掘算法 被引量:13
6
作者 张令杰 徐维祥 《计算机工程》 CAS CSCD 2012年第5期50-52,共3页
分析时态约束关联规则挖掘的TCAR算法,针对其在挖掘频繁时态项集时效率较低的问题,提出一种基于时态约束的关联规则挖掘算法。该算法对源数据库进行处理,缩减存储空间,并在更新挖掘最大频繁项集算法基础上,挖掘最大频繁时态项集。实例... 分析时态约束关联规则挖掘的TCAR算法,针对其在挖掘频繁时态项集时效率较低的问题,提出一种基于时态约束的关联规则挖掘算法。该算法对源数据库进行处理,缩减存储空间,并在更新挖掘最大频繁项集算法基础上,挖掘最大频繁时态项集。实例分析结果表明,该算法能提高整体挖掘效率。 展开更多
关键词 时态约束 关联规则 TCAR算法 时间阈值 最大频繁时态 候选
下载PDF
一种优化的Apriori关联规则算法 被引量:11
7
作者 朱奎兵 刘彦戎 《信息技术》 2022年第5期77-81,87,共6页
在数据挖掘中,Apriori算法用于从大型数据库中提取频繁项集,从而获取用于发现知识的关联规则。文中指出了原始的Apriori算法在生成频繁项集的过程中需要大量的时间扫描数据库,由此产生庞大的候选项集,存在算法执行效率低的问题。对于以... 在数据挖掘中,Apriori算法用于从大型数据库中提取频繁项集,从而获取用于发现知识的关联规则。文中指出了原始的Apriori算法在生成频繁项集的过程中需要大量的时间扫描数据库,由此产生庞大的候选项集,存在算法执行效率低的问题。对于以上问题,提出一种优化的Apriori关联规则算法,该算法通过减少扫描部分事务的时间,从而达到减少生成候选项集的方法。文中通过多组实验数据验证表明,优化的Apriori关联规则算法具有较高的执行效率。 展开更多
关键词 计算机应用技术 优化的Apriori算法 频繁 支持度 候选
下载PDF
基于改进Apriori算法的入侵检测系统研究 被引量:12
8
作者 崔贯勋 李梁 +2 位作者 王柯柯 倪伟 苟光磊 《计算机工程与科学》 CSCD 北大核心 2011年第4期40-44,共5页
本文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,改进了在由K阶频繁项集生成K+1阶候选项集时的连接和剪枝策略及对事务数据库的处理方式,它在时间和空间上提高了Apriori算法的效率。根据改... 本文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,改进了在由K阶频繁项集生成K+1阶候选项集时的连接和剪枝策略及对事务数据库的处理方式,它在时间和空间上提高了Apriori算法的效率。根据改进后的算法提出了入侵检测方法,该方法实现了规则库的自动更新,极大地提高了系统的安全性和可靠性。实验结果表明,该方法明显提高了频繁项目集的生成效率,入侵检测系统知识规则库的生成效率也得到改善。 展开更多
关键词 关联规则 APRIORI 频繁 候选 入侵检测
下载PDF
高效用项集挖掘算法 被引量:9
9
作者 祝孔涛 李兴建 王乐 《计算机工程与设计》 CSCD 北大核心 2013年第12期4220-4225,共6页
现有高效用项集挖掘算法主要采用项集枚举和两阶段方法 (或称为候选项集测试方法),后者时空效率的主要瓶颈在于候选项集过多。针对该问题,采用降低候选项集twu值,及利用项最大最小效用值来估计候选项集的效用值等策略,进而进行剪枝,从... 现有高效用项集挖掘算法主要采用项集枚举和两阶段方法 (或称为候选项集测试方法),后者时空效率的主要瓶颈在于候选项集过多。针对该问题,采用降低候选项集twu值,及利用项最大最小效用值来估计候选项集的效用值等策略,进而进行剪枝,从而有效地提高挖掘算法的时间和空间效率。实验采用真实数据集和合成数据集进行算法性能测试,实验结果表明改进后的算法性能得到较大的提高。 展开更多
关键词 效用 高效用 频繁 候选 数据挖掘
下载PDF
频繁项集挖掘的Apriori改进算法研究 被引量:9
10
作者 栗晓聪 滕少华 《江西师范大学学报(自然科学版)》 CAS 北大核心 2011年第5期498-502,共5页
针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"... 针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点. 展开更多
关键词 APRIORI算法 频繁 候选 IApriori算法
下载PDF
改进关联规则算法在高校教学管理中的应用 被引量:9
11
作者 张宗郁 张亚平 +1 位作者 张静远 张晓君 《计算机工程》 CAS CSCD 2012年第2期75-77,81,共4页
在分析基于位向量和无向图Apriori的基础上,提出一种改进的关联规则算法VGApriori。该算法将事务数据库的多次扫描和支持度计算转化为位向量的计算,将频繁项集的挖掘转换为无向图的完全子图挖掘,进一步缩减候选项集,提高频繁项集的发现... 在分析基于位向量和无向图Apriori的基础上,提出一种改进的关联规则算法VGApriori。该算法将事务数据库的多次扫描和支持度计算转化为位向量的计算,将频繁项集的挖掘转换为无向图的完全子图挖掘,进一步缩减候选项集,提高频繁项集的发现效率。该算法在高校教学管理系统应用中取得较好的效果。 展开更多
关键词 关联规则 APRIORI算法 位向量 无向图 候选
下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
12
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 新算法 中节点 递归
下载PDF
基于MapReduce的Apriori算法增量挖掘 被引量:6
13
作者 赵欣灿 朱云 毛伊敏 《计算机应用研究》 CSCD 北大核心 2020年第S02期73-75,79,共4页
针对基于MapReduce框架的Apriori关联规则挖掘算法产生候选项集较长、算法执行效率低等问题,以及大数据环境中数据快速更新造成增量处理等缺陷进行了研究,提出了一种基于项集动态加权的增量挖掘算法WDU-Apriori(weighted dynamic updati... 针对基于MapReduce框架的Apriori关联规则挖掘算法产生候选项集较长、算法执行效率低等问题,以及大数据环境中数据快速更新造成增量处理等缺陷进行了研究,提出了一种基于项集动态加权的增量挖掘算法WDU-Apriori(weighted dynamic updating-Apriori)。首先提出W-DPC(weighted dynamic passes combiner)机制作为其候选项集的结合方式,有效提高算法在大数据环境下的适应能力;其次对于新来的增量数据,设计了WBI(weighted border itemsets)策略,用于生成加权边界项集,以改进对增量数据的挖掘效率;最后构建了CTP(calculate transform probability)方法,用于量化阈值边界项集变为频繁项集的可能性,这对先前的挖掘结果有了更高效的应用,在降低节点负载的同时也解决了原始数据集扫描次数较多的问题。理论分析与实验结果共同表明,WDU-Apriori算法不仅有效提高了挖掘效率,平衡了每一个阶段的工作量,同时也有效降低了算法的时间复杂度。 展开更多
关键词 大数据 数据挖掘 候选 增量数据 阈值边界
下载PDF
基于待与项集的频繁项集挖掘算法的研究 被引量:4
14
作者 傅慧 邹海 《计算机工程与设计》 CSCD 北大核心 2009年第1期129-131,共3页
针对Apriori算法存在的问题,提出了一种基于待与项集的频繁项集挖掘算法,从两方面考虑对算法效率进行改进:通过对项编码来减少扫描数据库次数;提出了一个新的概念—待与项集,通过从待与项集中删除项来减少候选项集的数量。实例分析表明... 针对Apriori算法存在的问题,提出了一种基于待与项集的频繁项集挖掘算法,从两方面考虑对算法效率进行改进:通过对项编码来减少扫描数据库次数;提出了一个新的概念—待与项集,通过从待与项集中删除项来减少候选项集的数量。实例分析表明,该方法仅需扫描一次数据库,而且具有搜索速度快、节省内存空间等优点。该算法同样适用于处理超大型事务数据库。 展开更多
关键词 APRIORI算法 频繁 待与 裁减 候选
下载PDF
一种聚类矩阵和剪枝策略结合的关联规则算法 被引量:1
15
作者 许珂乐 《现代计算机》 2023年第24期46-50,60,共6页
在医学领域,Apriori关联规则算法在慢性病等方面有广泛应用。然而,该算法存在一些问题,比如需要多次扫描病例数据库、产生大量数据集和冗余规则。针对出现的相关问题,提出一种结合聚类矩阵和剪枝策略的关联规则数据挖掘算法。通过添加... 在医学领域,Apriori关联规则算法在慢性病等方面有广泛应用。然而,该算法存在一些问题,比如需要多次扫描病例数据库、产生大量数据集和冗余规则。针对出现的相关问题,提出一种结合聚类矩阵和剪枝策略的关联规则数据挖掘算法。通过添加约束条件,并采用聚类矩阵方法来压缩存储事务数据库。同时,引入前剪枝和后剪枝策略优化算法。实验证明,这种优化算法显著减少了数据库的扫描次数,降低了候选项目集的数量,缩短了算法的执行时间,大大提高了运行效率。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 候选 聚簇矩阵 剪枝策略
下载PDF
挖掘最大频繁项集的事务集迭代算法 被引量:3
16
作者 陈波 王乐 董鹏 《计算机工程与应用》 CSCD 北大核心 2009年第6期141-144,共4页
发现最大频繁项目集是数据挖掘应用中的关键问题;提出一种新的基于事务集迭代的求最大频繁项集算法,该算法在每次迭代时,通过对输入事务集的两次扫描,生成所有阶数的候选项集和频繁项集;每次迭代后又生成新的事务集作为下一次迭代的输入... 发现最大频繁项目集是数据挖掘应用中的关键问题;提出一种新的基于事务集迭代的求最大频繁项集算法,该算法在每次迭代时,通过对输入事务集的两次扫描,生成所有阶数的候选项集和频繁项集;每次迭代后又生成新的事务集作为下一次迭代的输入,而候选最大频繁项集集合则随着迭代不断地趋于完整。该算法不需要生成K-1阶候选项集或频繁树,有别于已有的经典算法;同时由于用于迭代的事务集的数据量会快速缩减,从而也可有效降低算法的时间复杂度。实验表明在大数据量和小最小支持度时该算法更为有利。 展开更多
关键词 最大频繁 候选 事务 迭代
下载PDF
单调和反单调约束条件下关联规则的挖掘算法分析 被引量:3
17
作者 杜剑峰 李宏 +1 位作者 陈松乔 陈建二 《计算机科学》 CSCD 北大核心 2005年第6期142-144,166,共4页
本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法... 本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法,在发现频繁项集的同时进行约束条件的检验。数据库的扫描次数较少,无需对候选项集进行剪枝,占用内存较小。实验证明:该算法的执行效率比已有算法有显著提高。 展开更多
关键词 约束条件 算法分析 单调 调和 关联规则挖掘算法 划分方法 充分利用 数据分布 搜索方法 自底向上 频繁 扫描次数 候选 实验证明 等价类 概念格 A算法 数据库 效率比 内存
下载PDF
基于迭代事务集与交集剪枝的最大频繁项集挖掘算法 被引量:3
18
作者 刘黎明 王水 王乐 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期97-102,共6页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成-检验方法,则候选项目集生成的代价通常很高。为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成-检验方法,则候选项目集生成的代价通常很高。为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行。 展开更多
关键词 数据挖掘 最大频繁 候选 剪枝 迭代
下载PDF
一种改进的Apriori算法
19
作者 吴文妹 陈国龙 《福建电脑》 2005年第4期17-17,14,共2页
本文利用频繁项集的一个性质,对Apriori算法中的生成候选项集这一步进行改进,大大减少不必要的计算,从而加快候选项集生成的速度。
关键词 APRIORI算法 候选 数据挖掘 关联规则 频繁
下载PDF
基于排序索引矩阵的频繁项集挖掘算法 被引量:3
20
作者 荀娇 徐连诚 杨仁华 《计算机工程》 CAS CSCD 2012年第19期41-44,48,共5页
针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法。将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集。从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨... 针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法。将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集。从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨越式搜索和连接。整个过程只需扫描一次数据库,不会产生候选项集。实验结果表明,该算法能提高频繁项集的挖掘效率。 展开更多
关键词 关联规则 排序索引矩阵 候选 频繁 跨越式搜索 数据挖掘
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部