-
题名一种实时挖掘数据流近似频繁项的算法
被引量:2
- 1
-
-
作者
高宏宾
张小彬
杨海振
-
机构
五邑大学信息学院
-
出处
《计算机应用》
CSCD
北大核心
2008年第S2期219-222,共4页
-
文摘
数据流的无限性和流动性使得传统的频繁项挖掘算法难以适用。针对数据流的特点,提出了一种实时的挖掘数据流近似频繁项的算法。在允许的偏差范围内,新算法只需扫描一次数据项,使用的存储空间远远小于数据流的规模,能动态地挖掘数据流中的所有频繁项。将数据项存储到一种新的数据结构中,利用该数据结构可以快速地删除非频繁项。最后,理论分析和实验表明这种方法的有效性。
-
关键词
数据流
数据挖掘
频繁项
非频繁项
ε-近似
-
Keywords
data stream
data mining
frequent item
non-frequent item
ε-approximate
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种实时有效的AECFP数据流频繁项挖掘算法
被引量:1
- 2
-
-
作者
谢玉忠
朱国魂
吴春
-
机构
桂林电子科技大学计算机与控制学院
-
出处
《桂林电子科技大学学报》
2009年第6期480-482,共3页
-
文摘
由于数据流的高速产生性、强流动性及变化不稳定性的需求,数据流算法应在有限存储空间里实时准确分析数据,提取有用知识。在允许的误差范围内,提出一种有效的数据流频繁项挖掘算法AECFP,通过一种基于频繁项样本的数据结构记录抵达的项目集合,进行快速的保存样本,并在样本空间满时快速删除出现次数最小且最旧的非频繁项,保留相同支持数的其它频繁项。当用户查询频繁项时,快速实时准确挖掘数据流中的频繁项,适应数据波动变化。经过实验证明,该算法在挖掘频繁项时,具有快速的处理能力,满足空间消耗的低存储要求,并能保证数据频繁项的挖掘准确度。
-
关键词
数据流
数据挖掘
频繁项
ε-近似
非频繁项
-
Keywords
data streams
data mining
frequent item
ε-approximate
non-frequent item
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-