-
题名多谓词约束下基于模式增长的频繁项集挖掘算法
被引量:1
- 1
-
-
作者
马青霞
李广水
郑滔
-
机构
金陵科技学院信息技术学院
江苏省信息分析工程实验室
南京大学软件学院
-
出处
《计算机技术与发展》
2011年第10期116-120,124,共6页
-
基金
国家863项目(863/2007AA01Z448)
江苏省现代教育技术研究重点立项课题(2010-T-15267)
金陵科技学院博士启动基金(JIT-B-01)
-
文摘
针对多维关联规则中挖掘事务数据库的所有频繁项集这一问题,提出了基于维约束进行求解的构想。采用模式增长的挖掘方法并根据谓词约束特征,设计了两种频繁项集挖掘算法,其中MCMFI1算法在指定约束下构建模式树并进行频繁项集挖掘,而节点向量约束的算法MCMFI2在预先挖掘出无约束频繁项集的情况下,依据给定约束对已有频繁集及模式树进行更新搜索,因此需要开销更多的主存,但在更新过程中有更高的效率。理论分析和实验结果都表明了MCM-FI算法的完备性和有效性。
-
关键词
频繁项集
约束模式挖掘
多维关联规则
频繁模式树
-
Keywords
frequent itemsets
constraint-based pattern mining
multidimensional association rule
FP-tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向不确定数据模式指标的通用界值估算方法
- 2
-
-
作者
王菊
刘付显
靳春杰
-
机构
空军工程大学防空反导学院
[
-
出处
《计算机应用》
CSCD
北大核心
2018年第1期165-170,共6页
-
文摘
针对约束模式挖掘中模式指标的界值估算问题,提出了一种面向不确定数据模式指标的通用界值估算方法。根据带有权值的不确定型事务数据库的特点,首先设计了面向常用模式指标的通用界值估算框架,其次给出了在该框架下对模式指标上界值的快速估算方法,最后估计了两种典型模式指标的上界值以说明其可行性。实验中对比了PHUI-UP算法分别结合事务加权效用值、所提方法估算所得的上界值和实际上界值后的运行时间和内存占用情况,实验结果表明所提方法可以通过占用较小内存和运行时间来实现模式效用上界值的估算。
-
关键词
不确定数据库
模式指标
界值估算
约束模式挖掘
通用估算框架
-
Keywords
uncertain dataset
pattern measure
bound estimation
constraint-based pattern mining
general estimationframework
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—计算机科学与技术]
-