-
题名基于层次频繁模式树的数据自动挖掘算法
被引量:2
- 1
-
-
作者
王景兰
方晓
-
机构
亳州职业技术学院信息工程系
-
出处
《上海电机学院学报》
2022年第4期239-242,248,共5页
-
基金
安徽省职业教育创新发展试验区资助项目(WJ-ZYPX-003)
安徽省级质量工程资助项目(2020jxtd173)
+1 种基金
2020年安徽省高校人文科学研究资助项目(SK2020A0778)
2020亳州职业技术学院人文科学研究资助项目(BYK2029)。
-
文摘
在大规模数据中包含过多的冗余信息,当前算法表达事物不够清晰,导致数据信息不能够完全被挖掘,操作效率过低。为此,提出了基于层次频繁模式树设计数据的自动挖掘算法。基于层次频繁模式树定义挖掘任务,以候选集剪枝思想建立数据自动连接矩阵,利用最小支持度裁剪队列自动挖掘数据,完成基于层次频繁模式树的数据自动挖掘算法设计。实验结果表明:动车组的运维数据作为测试样本,分别对不同总量的数据进行挖掘,研究算法能够在规定时间内将数据表达完全,以200万条数据为例本文算法比传统算法的挖掘数量,分别超出了10万条和8万条,提高了其工作效率。
-
关键词
层次频繁模式树
数据自动挖掘
相关规则
数据源
连接矩阵
-
Keywords
hierarchical frequent pattern tree
automatic data mining
relevant rules
data source
connection matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于层次频繁模式树的关联分类规则数据挖掘算法
- 2
-
-
作者
杜永生
-
机构
济宁学院计算机科学系
-
出处
《济宁学院学报》
2011年第6期76-78,共3页
-
文摘
针对CMAR算法存在的不足,提出了层次频繁模式树的概念,并在此基础上实现了关联分类数据挖掘算法.实验数据表明,该方法比CMAR算法具有更高的效率与数据库覆盖面.
-
关键词
数据挖掘
关联分类规则
层次频繁模式树
-
Keywords
data mining
association classification roles
hierarchical frequent pattern tree
-
分类号
TP301.5
[自动化与计算机技术—计算机系统结构]
-
-
题名一种新型快速建立频繁模式树的方法
被引量:2
- 3
-
-
作者
王静红
刘教民
郭盛
孙亚非
-
机构
河北工业大学智能电器研究所
石家庄学院外语学院
河北师范大学信息技术学院
-
出处
《计算机应用》
CSCD
北大核心
2008年第3期735-737,共3页
-
基金
国家自然科学基金资助项目(60675014)
河北省科技厅项目(042135126)
河北省教育厅自然基金资助项目(2007474)
-
文摘
频繁模式树(FP_tree)是产生频繁相集的有效方法,现在的算法一般都是基于频繁模式树,但是创建FP_tree需要花费很长时间。为了提高创建树的效率,提出了一种新型快速的方法——改进的层次频繁模式树(IHFP_tree)。首先,扫描一遍数据库,产生每个项的等价类;其次,去掉不频繁项后,对等价类进行重新改写,然后创建FP_tree。提出只需扫描一遍数据库,而且不需要筛选和重组事务记录的方法,有效提高了算法的时空效率。实验表明,IHFP_tree的挖掘速度比FP_tree方法要快得多。
-
关键词
频繁模式树
改进的层次频繁模式树
频繁模式
等价类
-
Keywords
FP_tree
Inprove Hierarchy FP_tree (IHFP_tree)
frequent pattern
equivalence class
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-