-
题名基于同步频繁树的时间序列关联规则分析
被引量:6
- 1
-
-
作者
李海林
龙芳菊
-
机构
华侨大学信息管理系
华侨大学现代应用统计与大数据研究中心
-
出处
《智能系统学报》
CSCD
北大核心
2021年第3期502-510,共9页
-
基金
国家自然科学基金项目(71771094,61300139)
福建省自然科学基金项目(2019J01067)
福建省社会科学规划一般项目(FJ2020B088).
-
文摘
针对经典算法Apriori和频繁模式增长算法(frequent pattern growth, FP-growth)不能直接对时间序列数据进行关联规则挖掘的问题,提出一种同步频繁树算法(synchronize frequent tree, SFT)。利用时间序列的时间属性具有一维性的特点,定义趋势项-位置表示法表示时间序列数据,将首条时间序列构建成一棵基础树,通过计算树叶子节点与列表项的信息交集,可判断其是否与该树枝中的所有节点构成频繁K项集。在SFT算法中,用趋势项-位置表示的数据内存占用情况要优于原始数据,并且在挖掘过程中不会产生候选频繁项集,使得算法在整个挖掘过程中表现出较好的时间性能。基于商品数据和股票数据的数值实验表明,SFT算法所得结果不仅与其他5种对比算法的结果一致,在各量级的数据和不同的支持度计数中,其时间复杂度都要优于对比算法。
-
关键词
时间序列
线性分段
趋势项-位置
事务集表示
频繁项集
同步频繁树
关联规则
时间效率
-
Keywords
time series
linear segmentation
trend item-location
transactionset representation
frequent itemsets
synchronize frequent trees
association rules
time efficiency
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-