期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Apriori挖掘频繁项目集算法的改进 被引量:30
1
作者 柴华昕 王勇 《计算机工程与应用》 CSCD 北大核心 2007年第24期158-161,171,共5页
针对Apriori算法的不足,提出了一种新的优化算法Napriori。算法从优化产生2-项目集、事务压缩、项目压缩、优化连接等几个方面对Apriori算法进行优化,将散列技术应用于产生1-项目集和2-项目集,将压缩优化和连接优化应用于k-项目集。实... 针对Apriori算法的不足,提出了一种新的优化算法Napriori。算法从优化产生2-项目集、事务压缩、项目压缩、优化连接等几个方面对Apriori算法进行优化,将散列技术应用于产生1-项目集和2-项目集,将压缩优化和连接优化应用于k-项目集。实验结果表明,Napriori算法运行速度比Apriori算法有了明显的提高。 展开更多
关键词 关联规则Apriori算法事务压缩散列结构
下载PDF
大数据量下的Apriori改进算法及在weka平台的实现 被引量:4
2
作者 范多锋 徐俊刚 《电子技术(上海)》 2012年第7期1-4,共4页
文章在分析关联规则和Apriori算法原理的基础上,针对Apriori算法扫描数据库时由于事务数过大,导致系统的I/O负载和CPU运算压力过大等弊端,提出一种主要针对大数据量情况下Apriori算法性能提升的改进算法。主要思想是通过抽样和事务压缩... 文章在分析关联规则和Apriori算法原理的基础上,针对Apriori算法扫描数据库时由于事务数过大,导致系统的I/O负载和CPU运算压力过大等弊端,提出一种主要针对大数据量情况下Apriori算法性能提升的改进算法。主要思想是通过抽样和事务压缩来减少算法需要扫描的事务数,进而提升算法的效率。同时,基于主流的weka开源数据挖掘工具实现了改进算法。实验结果表明了算法的有效性。 展开更多
关键词 数据挖掘 关联规则 APRIORI 事务压缩 抽样 WEKA
原文传递
基于候选项集剪枝的Apriori算法的研究 被引量:4
3
作者 韩天鹏 白玲玲 王浩 《阜阳师范学院学报(自然科学版)》 2014年第4期79-83,共5页
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1... 在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。 展开更多
关键词 事务压缩 候选集剪枝 关联规则 APRIORI算法
下载PDF
基于矩阵的Apriori算法的优化 被引量:1
4
作者 梅成 周兴斌 《计算机与现代化》 2008年第12期5-7,共3页
在数据挖掘中关联规则挖掘是很重要的一个方面,而Apriori算法是进行关联规则挖掘的经典算法。本文首先分析了经典Apriori算法,然后利用矩阵的思想对其改进,并利用事务压缩的思想对矩阵进行压缩。改进后的算法明显提高了Apriori算法的效率。
关键词 关联规则 APRIORI算法 事务压缩 矩阵
下载PDF
AprioriTid挖掘频繁项集算法的改进 被引量:3
5
作者 兰聪花 刘洋 唐占红 《计算机应用与软件》 CSCD 2010年第3期234-236,共3页
针对AprioriTid算法的不足,提出一种新的优化算法IaprioriTid。该算法从事务压缩、项目压缩和散列技术等方面对AprioriTid算法进行优化,提高了算法的效率。对AprioriTid算法中引入的C′k进行事务压缩和项目压缩,减少C′k中的数据量,提... 针对AprioriTid算法的不足,提出一种新的优化算法IaprioriTid。该算法从事务压缩、项目压缩和散列技术等方面对AprioriTid算法进行优化,提高了算法的效率。对AprioriTid算法中引入的C′k进行事务压缩和项目压缩,减少C′k中的数据量,提高扫描效率,应用散列技术优化产生频繁-2项集。最后实验证明了该算法的有效性。 展开更多
关键词 频繁项集 APRIORITID算法 事务压缩 项目压缩 散列结构
下载PDF
数据挖掘方法的应用——对移动通讯用户消费水平的分析
6
作者 刘云霞 《统计教育》 2003年第2期10-12,共3页
本文将数据挖掘中事务数据库压缩的方法应用于对某县的移动通讯用户从2001年的9月到2002年的3月的消费水平的分析,并对消费情况进行了进一步的剖析,取得了良好的效果。
关键词 数据挖掘 事务数据库 移动通讯用户 消费水平 事务项压缩 粗造集理论
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部