-
题名基于模式增长的嵌入式频繁子树挖掘算法研究
- 1
-
-
作者
卫朝霞
邹倩影
-
机构
四川大学锦城学院
电子科技大学成都学院
-
出处
《计算机仿真》
北大核心
2021年第3期249-252,263,共5页
-
基金
成都市科学技术局2018年成都市技术创新研发项目(2018-YFYF-00191-SN)。
-
文摘
针对传统挖掘算法会输出大规模频繁子树且其中包含较多冗余信息,使事物表达不够清晰完整,降低后续操作效率的问题,提出基于模式增长的嵌入式频繁子树挖掘算法。定义标签树,并分析挖掘任务,根据模式增长的基本性质,扫描森林数据库,建立与频繁子树模式对应的投影库,确定模式增长过程,设立增长框架。提出融合压缩思想,采用深度优化方式遍历所有子树的节点,构建融合压缩树,实现数据清理。基于数据清理结果组建拓扑序列,制定树与森林的拓扑编码,输入数据库与最小支持度数值,结合覆盖定理对频繁子树队列进行裁剪,完成挖掘。仿真结果表明,上述方法挖掘的数据信息更加丰富完整,挖掘效率更高。
-
关键词
模式增长
嵌入式
频繁子树挖掘
融合压缩
覆盖定理
-
Keywords
Pattern growth
Embedded
frequent sub-tree mining
Fusion compression
Covering theorem
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-