期刊文献+

基于投影位置的序列模式挖掘算法

Projection position-based sequential pattern mining algorithm
原文传递
导出
摘要 针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性. 针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.
出处 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第S1期104-107,共4页 Journal of Huazhong University of Science and Technology(Natural Science Edition)
基金 国家自然科学基金资助项目(60973074)
关键词 数据挖掘 序列模式 PREFIXSPAN 投影位置 投影数据库 data mining sequential pattern PrefixSpan project position project database
  • 相关文献

参考文献10

二级参考文献35

  • 1Agrawal R, Srikant R. Mining Sequential Pattems[C]//Proc. of the 11th Int'l Conf. on Data Engineering. Taipei, China: [s. n.], 1995: 3-L4. 被引量:1
  • 2Srikant R, Agrawal R. Mining Sequential Patterns: Generalizations and Performance Improvements[C]//Proc. of the 5th Int'l Conf. on Extending Database Technology. Avignon, France: [s. n.], 1996: 3-17. 被引量:1
  • 3Zaki M J. SPADE: An Efficient Algorithm for Mining Frequent Sequences[J]. Machine Learning Journal, Special Issue on Unsupervised Learning, 2001, 42(1/2): 31-60. 被引量:1
  • 4Pei Jian,- Han Jiawei, Mortazavi B, et al. FreeSpan: Frequent Pattern-projected Sequential Pattern Mining[C]//Proe. of the 6th Int'l Conf. on Knowledge Discovery and Data Mining. New York, USA: [s. n.], 2000: 355-359. 被引量:1
  • 5Pei Jian, Han Jiawei, Mortazavi-Asl B, et al. Mining Sequential Patterns by Pattern-growth: The PrefixSpan Approach[J]. IEEE Trans. on Knowledge and Data Engineering, 2004, 16(11): 1424-1440. 被引量:1
  • 6Han J, Pei J, Mortazavi-Asl B,et al. Freespan: frequent pattern-projected sequential pattern mining[A]. In: Proceedings of the International Conference on Knowledge Discovery and Data Mining ACM [C]. Montreal, Canada, 2000. 355-359. 被引量:1
  • 7Pei J, Han J, Mortazavi-Asl B, et al. PrefixSpan: mining sequence patterns efficiently by prefix-projected pattern growth[A]. In: 17th the International Conference on Data Engineering[C]. Hidelberg, 2001.215-224. 被引量:1
  • 8Agrawal C C, Yu P S.Online generation of association rules[A]. In: Proceedings of the 14th International Conference on Data Engineering [C]. Orlando,Florida,USA,1998.402-411. 被引量:1
  • 9Hidber C. Online association rule mining[R]. Barkeley:Technical Report UCB/CSD-98-1004, UC, 1998. 被引量:1
  • 10Nag B, Deshpande P M, DeWitt D J. Using a knowledge cache for interactive discovery of association rules[A]. In: Proceedings of the 1999 SIGKDD Conference[C]. San Diego, California, 1999.244-253. 被引量:1

共引文献35

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部