摘要
传统频繁项集挖掘算法的执行效率较低。提出了一种基于矩阵与前缀树的频繁项集挖掘算法MPFI,能快速地挖掘事务数据库中的频繁项集。MPFI算法只需扫描事务数据库一次,构建垂直方向的二进制矩阵,应用二进制位向量表达频繁项集信息,利用前缀树压缩存储频繁项集的相关信息,不产生候选项集。理论分析与实验结果表明,MPFI算法能有效地提高频繁项集挖掘效率。
Traditional algorithm of frequent itemsets mining’s execution efficiency is low. MPFI algorithm based on matrix and Prefix-tree is raised for frequent itemsets mining. It can quickly mining frequent itemsets of transaction database. MPFI algorithm only scan transaction database once, builds vertical binary matrix. Binary vector for frequent itemsets information and Prefix-tree data structure for compression storage of frequent itemsets is applied in the algorithm, without candidate itemsets. According to theoretical analysis and experimental results, MPFI algorithm can effectively improve the efficiency of frequent itemsets mining.
出处
《计算机工程与应用》
CSCD
北大核心
2015年第22期154-157,171,共5页
Computer Engineering and Applications
基金
安徽省高校省级自然科学研究项目(No.KJ2013Z327)
教育部人文社会科学研究青年基金项目(No.11YJC630074)
安徽省自然科学基金项目(No.1208085MG121)
关键词
频繁项集
矩阵
二进制
前缀树
frequent itemsets
matrix
binary
Prefix-tree