-
题名基于最佳u-shapelets的时间序列聚类算法
被引量:6
- 1
-
-
作者
余思琴
闫秋艳
闫欣鸣
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2017年第8期2349-2356,共8页
-
基金
国家自然科学基金资助项目(51674255)
江苏省自然科学基金资助项目(BK20140192)~~
-
文摘
针对基于u-shapelets的时间序列聚类中u-shapelets集合质量较低的问题,提出一种基于最佳u-shapelets的时间序列聚类算法Div Ushap Cluster。首先,探讨不同子序列质量评估方法对基于u-shapelets的时间序列聚类结果的影响;然后,选用最佳的子序列质量评估方法对u-shapelet候选集进行质量评估;其次,引入多元top-k查询技术对u-shapelet候选集进行去除冗余操作,搜索出最佳的u-shapelets集合;最后,利用最佳u-shapelets集合对原始数据集进行转化,达到提高时间序列聚类准确率的目的。实验结果表明,Div Ushap Cluster算法在聚类准确度上不仅优于经典的时间序列聚类算法,而且与Brute Force算法和SUSh算法相比,Div Ushap Cluster算法在22个数据集上的平均聚类准确度分别提高了18.80%和19.38%。所提算法能够在保证整体效率的情况下有效提高时间序列的聚类准确度。
-
关键词
时间序列
聚类
u-shapelets
内部聚类评价指标
多元化top-k查询
-
Keywords
time series
clustering
u-shapelets
internal clustering evaluation measurement
diversified top-k query
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于趋势特征表示的shapelet分类方法
被引量:5
- 2
-
-
作者
闫欣鸣
孟凡荣
闫秋艳
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2017年第8期2343-2348,2356,共7页
-
基金
国家重点研发计划项目(2016YFC060908)
国家自然科学基金资助项目(61402482
+2 种基金
61572505
52674255)
江苏省自然科学基金资助项目(BK20140192)~~
-
文摘
Shapelet是一种具有辨识性的时间序列子序列,通过识别局部特征达到对时间序列准确分类的目的。原始shapelet发现算法效率较低,大量工作关注于提高shapelet发现的效率。然而,对于带有趋势变化的时间序列,采用典型的时间序列表示方法进行shapelet发现,容易造成序列中趋势信息的丢失。为了解决时间序列趋势信息丢失的问题,提出一种基于趋势特征的多样化top-k shapelet分类方法:首先采用趋势特征符号化方法对时间序列的趋势信息进行表示;然后针对序列的趋势特征符号获取shapelet候选集合;最后通过引入多样化top-k查询算法从候选集中选取k个最具代表性的shapelets。在时间序列的分类实验中,与传统分类算法相比,所提方法在11个数据集上的分类准确率均有提升;与Fast Shapelet算法相比,提升了运行效率,缩短了算法的运行时间,并在趋势信息明显的数据上效果显著。结果表明,所提方法能有效提高时间序列的分类准确率,提升算法运行效率。
-
关键词
shapelet
趋势特征
符号化
多样化top-k查询
时间序列分类
-
Keywords
shapelet
trend feature
symbolization
diversified top-k query
time series classification
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-