-
题名SCTree:一种互异情节模式挖掘算法
被引量:1
- 1
-
-
作者
黄鹏
王鹏
汪卫
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第3期177-181,共5页
-
文摘
现有的事件序列情节模式挖掘算法多是基于滑动窗口和非重叠出现的。目前没有有效算法挖掘基于互异出现的互异情节模式。为此,提出带状态计数的前缀树结构(SCTree)来生成互异情节模式候选集,进行互异计数和裁剪。为减少数据库扫描次数,提出SCTree的主动扩展技术。实验表明了算法的有效性和高效性。
-
关键词
数据挖掘
频繁情节模式
互异出现
带状态计数的前缀树
-
Keywords
Data mining Frequent episodes Distinct occurrences State-counted prefix-tree
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名面向事件流的频繁片断计数算法
被引量:1
- 2
-
-
作者
黄鹏
王鹏
汪卫
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机科学与探索》
CSCD
2010年第10期909-917,共9页
-
基金
国家教育部博士点基金No.20090071120092~~
-
文摘
在事件流上挖掘频繁片断已经成为近来研究的热点,在很多应用中起到重要作用。以往的研究提出了一些挖掘算法,包括基于滑动窗口和基于非重叠出现的方法。然而,这些算法在处理基于片断互异出现的支持度计数时,效率很低甚至无效。为此,提出了一种包含状态计数的有限状态自动机模型,并使用该模型给出了一种高效挖掘算法。从理论上对算法的效率和有效性进行了分析;实验结果证明了算法是有效且高效的。
-
关键词
事件流
频繁片断挖掘
互异出现计数
数据挖掘
-
Keywords
event stream; frequent episodes discovery; distinct occurrences; data mining;
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-