期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大数据环境下基于前缀树的频繁项集挖掘 被引量:1
1
作者 黄彩娟 刘卓华 +1 位作者 所辉 杨滨 《控制工程》 CSCD 北大核心 2019年第11期2136-2140,共5页
针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修... 针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显著地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。 展开更多
关键词 频繁项集挖掘 MAPREDUCE 前缀序列树 模糊支持度 大数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部