基于离散区间的频繁嵌入式子树挖掘算法

Frequent embedded subtree mining algorithm based on discrete interval

下载PDF

导出

摘要针对频繁嵌入式子树挖掘,利用离散区间来构造投影库,给出一种基于离散区间的频繁嵌入式子树挖掘算法。该算法通过离散区间消除冗余投影,有效地压缩投影库的规模,提高了子树节点计数效率,减低了算法的时空复杂性。实验结果表明该算法具有较高的挖掘效率。 A frequent embedded subtree mining algorithm based on discrete interval, called DIFTM algorithm, was presented by using discrete interval to construct project database. The algorithm eliminates effectively redundant projection in the process of constructing project database by computing discrete interval so that the size of the project database was reduced, searching and counting efficiency of the subtree nodes was improved, and its time-space complexity was reduced. The experimental results show that the DIFI？M algorithm is efficient and effective.

作者孔鹏程张继福

机构地区太原科技大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2009年第4期1120-1123,共4页 journal of Computer Applications

基金山西省自然科学基金资助项目(2006011041)

关键词数据挖掘频繁嵌入式子树离散区间投影库冗余投影 data mining frequent embedded subtree discrete interval project database redundant projection

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1ZAKI M J. Efficiently mining frequent trees in a forest[ C]// Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2002:71 -80. 被引量：1
2ASAI T, ABE K, KAWASOE S, et al. Efficient substructure discovery from large semi-structured data[ J]. IEICE Transactions on Information and Systems, 2004, E87-D(12) : 2754 -2763. 被引量：1
3潘瑾严勇王晨等.Chopper:一个高效的有序标号树频繁结构的挖掘算法.计算机科学,2003,30(10):303-308. 被引量：1
4朱永泰,王晨,洪铭胜,汪卫,施伯乐.ESPM——频繁子树挖掘算法[J].计算机研究与发展,2004,41(10):1720-1727. 被引量：18
5杨沛,郑启伦,彭宏,李颖基.PFTM:一种基于投影的频繁子树挖掘算法[J].计算机科学,2005,32(2):206-209. 被引量：5
6赵传申,孙志挥,张净.基于投影分支的快速频繁子树挖掘算法[J].计算机研究与发展,2006,43(3):456-462. 被引量：14
7王晨..结构数据挖掘与处理的若干问题的研究[D].复旦大学,2005:
8ZAKI M J. Data mining template library[ EB/OL]. [ 2008 - 08 - 11 ]. http://www, cs. rpi. edu/- zaki/software/. 被引量：1

二级参考文献43

1朱永泰,王晨,洪铭胜,汪卫,施伯乐.ESPM——频繁子树挖掘算法[J].计算机研究与发展,2004,41(10):1720-1727. 被引量：18
2Cook D, Holder L. Substructure discovery using minimal description length and background knowledge. Journal of Arti_cial Intelligence Research, 1994,1: 231～ 255. 被引量：1
3Yoshida K, Motoda H. CLIP: Concept learning from inference patterns. Artificial Intelligence, 1995,75 (1):63～ 92. 被引量：1
4Asai T,Abe K,Kawasoe S,Arimura H,Satamoto H,Arikawa S.Effecient substructure discovery from large semi-structured data.In:2nd SIAM Int'l. Conf. on Data Mining,April 2002. 被引量：1
5Zaki M J. Efficiently mining frequent trees in a forest. In SIGKDD'2002 Edmonton, Alberta, Canada. 被引量：1
6Cooley R,Mobasher B, Srivastava J. Web Mining: Information and Pattern Discovery on the World Wide Web. In: 8th IEEE Intl. Conf. on Tools with AI,1997.?A?A?A?A 被引量：1
7Li Q,Moon B. Indexing and querying XML data for regular path expressions. In: 27th Int'l. Conf. on Very Large Data Bases,2001. 被引量：1
8Shapiro B,Zhang K. Comparing multiple RNA secondary strutures using tree comparisons. Computer Applications in Biosciences,1990,6(4) :309～318. 被引量：1
9Inokuchi A,Washio T,Motoda H. An apriori-based algorithm for mining frequent substructures from graph data. In: 4th European Conf. on Principles of Knowledge Discovery and Data Mining,Sep. 2000. 被引量：1
10Kuramochi M,Karypis G. Frequent subgraph discovery. In: 1st IEEE Int'l Conf. on Data Mining,Nov. 2001. 被引量：1

共引文献23

1陈子军,李伟,李霞,王鑫昱.基于投影编码的频繁子树挖掘算法[J].计算机研究与发展,2006,43(z3):389-394. 被引量：2
2胡枫.频繁序列模式挖掘算法Apriori的分析及改进[J].青海师范大学学报（自然科学版）,2009,25(3):35-38. 被引量：1
3赵文文,吴坚,陈波.数据挖掘中的频繁模式发现[J].萍乡高等专科学校学报,2005,22(4):84-85.
4赵传申,孙志挥,张净.基于投影分支的快速频繁子树挖掘算法[J].计算机研究与发展,2006,43(3):456-462. 被引量：14
5国新出版物发行数据调查中心修改《出版物发行数据核查指引》(报刊部分)[J].中国报业,2006(12):17-17.
6朱颖雯,吉根林.一种高效的最大频繁Embedded子树挖掘算法[J].计算机科学,2007,34(12):175-179. 被引量：1
7杨沛,谭琦.极大频繁子树挖掘及其应用[J].计算机科学,2008,35(2):150-153. 被引量：4
8王涛.一种基于频繁子树的数据库索引方法[J].华中科技大学学报（自然科学版）,2008,36(3):103-106.
9周军,姜元春,林文龙.基于有向带权图的Web用户浏览行为模型[J].情报理论与实践,2008,31(5):795-798. 被引量：1
10李海波,王元珍,左琼.混合型频繁无序树挖掘算法[J].华中科技大学学报（自然科学版）,2009,37(5):61-63.

1刘征宇,毛维杰.离散区间2-D系统的二次稳定性分析[J].科技通报,2005,21(4):427-433.
2郭修燕,毛维杰.离散区间2-D时滞系统的二次稳定与镇定[J].电机与控制学报,2006,10(4):398-401.
3李慧,闫德勤,韩丽.一种基于粗糙集理论的连续属性离散化新算法[J].计算机应用研究,2010,27(1):77-78. 被引量：7
4高建国,崔业勤.基于信息熵理论的连续属性离散化方法[J].微电子学与计算机,2011,28(7):187-189. 被引量：9
5韩清龙,俞金寿.滞后时变离散区间系统的稳定性[J].华东理工大学学报（自然科学版）,1996,22(2):176-182.
6凌方,王建东.一种连续属性离散化的新方法[J].数据采集与处理,2002,17(2):179-182. 被引量：5
7刘丽华,魏秀琨,刘志东.离散区间系统鲁棒容错控制器的设计[J].控制工程,2003,10(z2):61-62.
8郑咸义,段雄林.产生式系统的一种新匹配算法[J].华南理工大学学报（自然科学版）,1995,23(5):71-74.
9曾建武,张建明,王树青.基于人工鱼群算法的离散化方法[J].模式识别与人工智能,2006,19(5):611-616. 被引量：7
10李学明,刘勇国,廖晓峰,吴开贵,张伟.树-投影关联规则挖掘方法的水平优化与搜索策略研究[J].计算机研究与发展,2004,41(6):946-955.

计算机应用

2009年第4期

浏览历史

内容加载中请稍等...

基于离散区间的频繁嵌入式子树挖掘算法

参考文献8

二级参考文献43

共引文献23

相关作者

相关机构

相关主题

浏览历史