基于预聚类技术的并行序贯模式挖掘算法被引量：2

Pre-Clustered Sequential Pattern Mining

下载PDF

导出

摘要本文讨论了在并行序贯模式数据挖掘方面采用“预聚类并行序贯模式挖掘”的策略,对数据序列聚类后按不同的类分布到不同的并行节点上,以减少甚至消除不必要的通讯开销,以便能够提高并行序贯模式挖掘在集群式高性能计算机上的执行效率。 In this article, we present the Pre-Clustered Sequential Pattern Mining Algorithm in the parallel sequential pattern mining field. The method clusters the data sequences according to different classes and distribute the them into different parallel computing nodes. Thus it greatly reduces the unnecessary communications overhead and improves the execution efficiency of parallel sequential pattern mining on clustered high-performance computers.

作者金沈杰吴绍春吴耿锋严胜祥

机构地区上海大学计算机工程与科学学院

出处《计算机工程与科学》 CSCD 2004年第10期66-68,90,共4页 Computer Engineering & Science

基金上海市科委"基于高性能计算的数据挖掘和知识发现"项目(01JC14002) 上海市教委"第四期重点学科"项目(205153)

关键词模式挖掘并行聚类技术高性能计算机数据挖掘算法执行效率序贯开销集群 data mining parallel computing sequential pattern clustering data distribution

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] TN911.7 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献5

1杨学兵,陆勤,蔡庆生.一种高效的挖掘序贯模式的算法[J].小型微型计算机系统,2001,22(2):201-203. 被引量：1
2Takahiko Shintani, Masaru Kitsuregawa. Mining Algorithms for Sequential Patterns in Parallel: Hash Based Approach[A]. PacificAsia Corf on Knowledge Discovery and Data Mining[C]. 1998.283 - 294. 被引量：1
3Ramakrishnan Srikant, Rakesh Agrawal. Mining Sequential Patterns: Generalizations and Performance Improvements [A]. Proc 5th Int'l Conf Extending Database Technology[C]. 1996, 1057:3- 17. 被引量：1
4Rekesh Agrawal, Ramakrishnan Srikant. Mining Sequential Patterns [A] .Eleventh Int'l Conf on Data Engineering[C]. 1995. 被引量：1
5欧阳为民,蔡庆生.在数据库中自动发现广义序贯模式[J].软件学报,1997,8(11):864-870. 被引量：12

二级参考文献4

1Han J，Proc 21th VLDB Conf Zurich，1995年被引量：1
2欧阳为民,蔡庆生.发现广义序贯模式的增量式更新技术[J].软件学报,1998,9(10):777-780. 被引量：12
3欧阳为民,蔡庆生.在大型数据库中多层序贯模式的发现[J].计算机研究与发展,1998,35(10):916-920. 被引量：7
4欧阳为民,蔡庆生.基于版本空间的并行概念学习[J].计算机研究与发展,1998,35(10):951-959. 被引量：10

共引文献11

1李炜,郑华,邱剑锋,朱丽进,蒋阿芳.基于时间序列相似性匹配算法的地震预测研究[J].四川地震,2010(2):10-16. 被引量：2
2欧阳为民,蔡庆生.大型数据库中多层关联规则的元模式制导发现[J].软件学报,1997,8(12):920-927. 被引量：7
3欧阳为民,蔡庆生.发现序贯模式的增量式更新技术[J].小型微型计算机系统,1998,19(11):12-17. 被引量：1
4欧阳为民,蔡庆生.发现广义序贯模式的增量式更新技术[J].软件学报,1998,9(10):777-780. 被引量：12
5郑华,李炜,邱剑锋,林晨,蒋阿芳.基于时间序列相似性匹配算法的地震预测研究[J].皖西学院学报,2010(2):22-26. 被引量：2
6郑华,李炜,邱剑锋,林晨,蒋阿芳.基于时间序列相似性匹配算法的研究[J].井冈山大学学报（自然科学版）,2010,31(3):73-77. 被引量：3
7杨学兵,刘胜军,蔡庆生.一种实时过程控制中的数据挖掘算法研究[J].计算机应用,1999,19(9):8-10. 被引量：3
8李铭,蔡庆生.一个高效的关联规则增量式更新算法[J].计算机工程与应用,2000,36(5):47-49. 被引量：12
9杨炳儒,江亚东.基于大型数据库的KDD系统及应用研究[J].世界科技研究与发展,2001,23(1):49-56. 被引量：3
10钟晓,马少平,张钹,俞瑞钊.数据挖掘综述[J].模式识别与人工智能,2001,14(1):48-55. 被引量：91

同被引文献4

1曾敏,张洪伟.SCM数据挖掘的混合遗传算法模型[J].计算机应用,2004,24(11):84-87. 被引量：2
2邹翔,张巍,刘洋,蔡庆生.分布式序列模式发现算法的研究[J].软件学报,2005,16(7):1262-1269. 被引量：19
3闫冀楠,张维.上海股市EMH实证检验[J].系统工程学报,1997,12(3):49-56. 被引量：24
4柳炳祥,徐远纯.数据挖掘在企业危机管理中的应用[J].科学学与科学技术管理,2002,23(6):78-80. 被引量：9

引证文献2

1魏雄.决策树算法在股票分析与预测中的应用[J].电脑知识与技术,2007(5):764-765. 被引量：3
2吴楠.通过增量聚类预处理分区的一种序列模式挖掘方法[J].宿州学院学报,2008,23(2):102-103.

二级引证文献3

1邓淑玲,石良武.决策树型现代数据挖掘技术商业应用[J].财会通讯（理财版）,2008(4):43-44.
2杨秀杰,陈平.均线形态组合在股票分析中的应用[J].中国科技纵横,2011(5):229-230.
3王领,胡扬.基于C4.5决策树的股票数据挖掘[J].计算机与现代化,2015(10):21-24. 被引量：6

1欧阳为民,蔡庆生.发现序贯模式的增量式更新技术[J].小型微型计算机系统,1998,19(11):12-17. 被引量：1
2何振峰,杭小树,熊范纶.一种基于时间窗口的数据预处理算法[J].小型微型计算机系统,2004,25(1):89-92. 被引量：1
3王振宇,杭小树,边历峰.一种基于时间窗口的关系数据库中挖掘序贯模式的算法[J].模式识别与人工智能,2001,14(3):336-341. 被引量：4
4杨学兵,陆勤,蔡庆生.一种高效的挖掘序贯模式的算法[J].小型微型计算机系统,2001,22(2):201-203. 被引量：1
5张文燕,欧阳为民.水平划分数据的私密保持序贯模式挖掘[J].计算机工程,2007,33(19):170-172. 被引量：1
6欧阳为民,蔡庆生.在大型数据库中多层序贯模式的发现[J].计算机研究与发展,1998,35(10):916-920. 被引量：7
7杨学兵,蔡庆生.序贯模式的一种高效挖掘算法[J].计算机应用与软件,2000,17(7):23-27.
8毛宇,王广奇.用数据挖掘的方法构建可扩展的入侵检测系统[J].华中科技大学学报（自然科学版）,2003,31(S1):144-146.
9蔚赵春,吴绍春,王炜.一种改进的序贯模式算法在地震学中的应用[J].计算机应用研究,2005,22(8):150-152. 被引量：1
10王剑春,邓华,程勇.IBM集群式高性能计算机体系结构及气象应用[J].电子测试,2013,24(7S):256-257. 被引量：1

计算机工程与科学

2004年第10期

浏览历史

内容加载中请稍等...

基于预聚类技术的并行序贯模式挖掘算法被引量：2

参考文献5

二级参考文献4

共引文献11

同被引文献4

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于预聚类技术的并行序贯模式挖掘算法 被引量：2

参考文献5

二级参考文献4

共引文献11

同被引文献4

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于预聚类技术的并行序贯模式挖掘算法被引量：2