期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于云模型的时间序列分段聚合近似方法 被引量:34
1
作者 李海林 郭崇慧 《控制与决策》 EI CSCD 北大核心 2011年第10期1525-1529,共5页
针对时间序列数据的高维特性,提出一种基于云模型的时间序列分段聚合近似方法.利用云模型的熵评判分段聚合后各子序列的数据稳定性,选取稳定性最弱的子序列再分段聚合,最终得到云模型序列,同时给出了云模型序列的相似性度量.该方法对时... 针对时间序列数据的高维特性,提出一种基于云模型的时间序列分段聚合近似方法.利用云模型的熵评判分段聚合后各子序列的数据稳定性,选取稳定性最弱的子序列再分段聚合,最终得到云模型序列,同时给出了云模型序列的相似性度量.该方法对时间序列能够有效降维,并能够自适应地识别和描述其基本特征.实验结果表明,数据压缩较大时,所提出方法能够较好地保证近似的准确性,并提高时间序列数据挖掘的效率. 展开更多
关键词 时间序列 云模型 相似性 分段聚合近似
原文传递
基于分段聚合时间弯曲距离的时间序列挖掘 被引量:11
2
作者 李海林 郭崇慧 杨丽彬 《山东大学学报(工学版)》 CAS 北大核心 2011年第5期57-62,共6页
针对时间序列的相似性度量问题,提出基于分段聚合时间弯曲距离的时间序列挖掘方法。首先运用经典分段聚合近似方法来对时间序列进行数据变换,实现时间序列的特征提取和数据降维,然后利用动态时间弯曲距离进行距离计算,最后将其应用于时... 针对时间序列的相似性度量问题,提出基于分段聚合时间弯曲距离的时间序列挖掘方法。首先运用经典分段聚合近似方法来对时间序列进行数据变换,实现时间序列的特征提取和数据降维,然后利用动态时间弯曲距离进行距离计算,最后将其应用于时间序列聚类和分类的数值实验中。新方法不仅过程简单、易于实现,而且实验结果表明其平均分类错误率与传统分段时间弯曲相比,几乎降低了50%。同时,新方法在运行时间和聚类挖掘结果上都具有一定的优势。 展开更多
关键词 时间序列 分段聚合近似 动态时间弯曲 数据降维
原文传递
基于时间序列的数据挖掘技术在城市内涝灾害中的应用研究 被引量:9
3
作者 胡文红 孙欣欣 《科技通报》 北大核心 2016年第6期229-231,244,共4页
水利信息化的建设积累了大量历史水情数据,对这些数据进行挖掘,找到与给定时间段相似的水文过程,为城市防汛提供指导。针对水文数据维度高、周期性强、短期波动频繁等特点,采用分段聚合近似方法进行有效压缩,把握水文时间序列模式的变... 水利信息化的建设积累了大量历史水情数据,对这些数据进行挖掘,找到与给定时间段相似的水文过程,为城市防汛提供指导。针对水文数据维度高、周期性强、短期波动频繁等特点,采用分段聚合近似方法进行有效压缩,把握水文时间序列模式的变化特征,在此基础上采用最大特征点优先匹配的动态时间弯曲距离算法比较两个水文时间序列的相似性,并以杭州市水位监测站采集到的历史水位和降雨量信息为样本进行了验证,结果有效。 展开更多
关键词 城市内涝 水文时间序列 聚合近似 最大特征点 相似度算法
下载PDF
基于SO-PAA-GAF和AdaBoost集成学习的高压断路器故障诊断 被引量:3
4
作者 司江宽 吐松江·卡日 +2 位作者 范想 高文胜 朱炜 《电力系统保护与控制》 EI CSCD 北大核心 2024年第3期152-160,共9页
针对在小样本和复杂工况下高压断路器故障诊断识别精度不高的问题,提出一种基于振动信号处理和Ada Boost集成学习的高压断路器故障诊断方法。首先,搭建高压断路器实验平台并采集8种工况下的分闸振动信号。其次,对振动信号进行绝对值处理... 针对在小样本和复杂工况下高压断路器故障诊断识别精度不高的问题,提出一种基于振动信号处理和Ada Boost集成学习的高压断路器故障诊断方法。首先,搭建高压断路器实验平台并采集8种工况下的分闸振动信号。其次,对振动信号进行绝对值处理后,使用分段聚合近似(piecewise aggregate approximation,PAA)进行分段平均,将输出的新序列采用格拉姆角场(Gramian angular field,GAF)转换成图片,并使用Relief F方法对提取的高维图片特征进行重要度排序。最后,将保留的重要特征输入到Ada Boost集成学习模型进行故障诊断,并用蛇优化算法确定最优PAA分段步长和输入分类器特征数量,以进一步提高故障诊断精度。通过分析多种信号处理方式及分类模型可知,图片信号和Ada Boost集成学习模型能够有效处理振动信号并准确判断故障类型,为准确、可靠地诊断高压断路器故障提供了新途径。 展开更多
关键词 高压断路器 振动信号处理 分段聚合近似 格拉姆角场 故障诊断
下载PDF
基于PAA的时间序列早期分类 被引量:9
5
作者 马超红 翁小清 《计算机科学》 CSCD 北大核心 2018年第2期291-296,317,共7页
在时间序列数据挖掘领域,时间序列的早期分类越来越受到人们的重视,由于时间序列的长度(也称为维数)较大,在早期分类的实际应用中选择合适的维数约简方法非常重要,因此提出一种基于分段聚合近似(PAA)的时间序列早期分类方法。首先运用PA... 在时间序列数据挖掘领域,时间序列的早期分类越来越受到人们的重视,由于时间序列的长度(也称为维数)较大,在早期分类的实际应用中选择合适的维数约简方法非常重要,因此提出一种基于分段聚合近似(PAA)的时间序列早期分类方法。首先运用PAA对时间序列样本进行维数约简,然后在低维空间对样本进行早期分类,在43个时间序列数据集上的实验结果表明,所提方法在准确率、早期性、可靠性等方面优于已有方法。 展开更多
关键词 时间序列 早期分类 维数约简 分段聚合近似
下载PDF
基于SLIDE+SVM的雷达辐射源信号识别 被引量:6
6
作者 黄颖坤 金炜东 《系统仿真学报》 CAS CSCD 北大核心 2017年第9期1944-1949,共6页
针对依靠经验提取辐射源信号特征方法的不足,提出了一种基于自主特征学习的雷达辐射源信号识别模型。该模型由2个部分组成:(1)将雷达信号变换到频域,利用改进的分段聚集近似表示(Piecewise Aggregate Approximation,PAA)算法对信号降维;... 针对依靠经验提取辐射源信号特征方法的不足,提出了一种基于自主特征学习的雷达辐射源信号识别模型。该模型由2个部分组成:(1)将雷达信号变换到频域,利用改进的分段聚集近似表示(Piecewise Aggregate Approximation,PAA)算法对信号降维;(2)构造多层线性降噪器(Linear Denoiser,LIDE)进行特征学习,模型采用无监督训练方法,构建一个SVM进行识别。通过仿真5种不同的辐射源信号验证了模型的有效性,结果表明该模型在低信噪比下能获得较好的识别正确率。 展开更多
关键词 雷达辐射源信号识别 分段聚集近似表示 线性降噪器 支持向量机
下载PDF
面向非平稳时间序列的因果关系发现算法
7
作者 周嘉颖 周跃进 《长春师范大学学报》 2024年第2期50-58,共9页
针对传统因果关系算法不能分析非平稳时间序列和可变时滞时间序列数据因果关系的问题,本文提出一种基于分段聚合近似可变时滞转移熵(PAAVL-TE)的因果关系算法。利用分段聚合近似法对时间序列进行转换,提取时间序列的特征信息,运用动态... 针对传统因果关系算法不能分析非平稳时间序列和可变时滞时间序列数据因果关系的问题,本文提出一种基于分段聚合近似可变时滞转移熵(PAAVL-TE)的因果关系算法。利用分段聚合近似法对时间序列进行转换,提取时间序列的特征信息,运用动态时间弯曲距离寻找相似程度最高的时间序列计算可变时滞时间序列的转移熵,实现了非平稳时间序列的因果分析。通过计算机仿真模拟实验将提出的算法与存在的算法相比较,证实算法有效性。将该算法用于北京市昌平区PM 2.5浓度和气象数据分析,表明本文算法具有广泛的应用性。 展开更多
关键词 非平稳时间序列 分段聚合近似 转移熵 可变时滞 因果关系
下载PDF
分段聚合近似和数值导数的动态时间弯曲方法 被引量:5
8
作者 李海林 梁叶 《智能系统学报》 CSCD 北大核心 2016年第2期249-256,共8页
针对动态弯曲方法对时间序列数据相似性度量的质量和效率的局限性,本文提出一种基于分段聚合近似和数值导数的动态时间弯曲方法。该方法通过分段聚合近似将时间序列数据进行有效地降维,再结合数值导数对降维后的特征序列构建新特征序列... 针对动态弯曲方法对时间序列数据相似性度量的质量和效率的局限性,本文提出一种基于分段聚合近似和数值导数的动态时间弯曲方法。该方法通过分段聚合近似将时间序列数据进行有效地降维,再结合数值导数对降维后的特征序列构建新特征序列,并且设计符合该特征序列相似性度量方法。实验结果分析表明,与传统动态弯曲方法相比,新方法具有较好的度量质量,能在时间序列数据挖掘中得到较好的分类效果,且在低维空间具有较高的分类效率,具有一定的优越性。 展开更多
关键词 动态时间弯曲 时间序列 分段聚合近似 数值导数 相似性度量 分类 数据降维 特征表示
下载PDF
基于分段分区聚合近似和模糊聚类的风电出力特性分析 被引量:4
9
作者 蔺红 徐邦恩 《水力发电》 北大核心 2018年第12期95-99,共5页
风电出力特性与负荷需求的形状(负荷需求具有双峰性的典型形状)不一样,难以直观得到风电出力特性曲线的大概轮廓。因此,提出改进的自适应模糊聚类算法,采用表征多时空尺度的风电波动性、同时率评价指标对风电出力数据归一化处理,分段聚... 风电出力特性与负荷需求的形状(负荷需求具有双峰性的典型形状)不一样,难以直观得到风电出力特性曲线的大概轮廓。因此,提出改进的自适应模糊聚类算法,采用表征多时空尺度的风电波动性、同时率评价指标对风电出力数据归一化处理,分段聚合降低维度,计算自适应函数α(c),确定各时段最佳聚类数c,对风电出力类型分类;引入变异离散度系数βi,剔除风电出力畸变数据;提出分区加权中位值法,辨识并提取风电出力特性概率区间带。针对新疆区域电网2015年1月份的风电出力数据,仿真计算分析风电出力特性曲线及概率区间带,验证了所提方法的有效性和稳定性。 展开更多
关键词 分段聚合近似 模糊聚类 分区加权中位值法 风电出力特性
下载PDF
基于离群值检测的铅酸电池故障诊断方法
10
作者 冯雪松 舒勇 +1 位作者 张军 向勇 《电测与仪表》 北大核心 2023年第7期39-46,共8页
单体电池故障是导致铅酸电池组在运行过程中突发失效的主要原因,传统的识别方法需要依靠高精度的测试设备和复杂的电池机理模型,部署成本高、使用范围有限。考虑到故障电池和正常电池之间的等效电阻、等效电容等内部参数的差异,会由于... 单体电池故障是导致铅酸电池组在运行过程中突发失效的主要原因,传统的识别方法需要依靠高精度的测试设备和复杂的电池机理模型,部署成本高、使用范围有限。考虑到故障电池和正常电池之间的等效电阻、等效电容等内部参数的差异,会由于浮充电流在时间尺度上通过电压凸显出来,文中设计了一种基于离群值检测的故障诊断方法,该方法采用时间序列聚类分析技术,对各个单体电池运行过程中产生的电压时间序列进行相似性分析,通过判断相异度较高离群值对故障电池进行定位。为了减小长跨度的时间序列造成的计算爆炸风险,采用分段聚合近似表示方法对时间序列进行降维处理,加快了计算速度。该方法可直接应用于微控制器,有较强的实用性。 展开更多
关键词 电池故障 时间序列聚类 分段聚合近似
下载PDF
基于Spark的高维数据相似性连接
11
作者 成小海 《计算机技术与发展》 2018年第8期43-47,共5页
高维数据相似性连接(HDSJ)是指在给定的空间数据库中,频繁执行连接和距离计算操作找出向量空间满足给定条件的数据对。但是随着数据量和维数的增加,HDSJ的计算成本将呈指数增加。针对HDSJ在处理海量数据时效率不佳的问题,利用Spark集群... 高维数据相似性连接(HDSJ)是指在给定的空间数据库中,频繁执行连接和距离计算操作找出向量空间满足给定条件的数据对。但是随着数据量和维数的增加,HDSJ的计算成本将呈指数增加。针对HDSJ在处理海量数据时效率不佳的问题,利用Spark集群分布式和基于内存并行计算特性,提出了基于Spark框架的HDSJ改进方法。该方法主要借助Spark中高效的RDD算子,使用分段聚合近似(PAA)表示原始的高维向量,用符号聚合近似(SAX)将表示后的向量重新组织成组,这样可以避免大量不必要的计算。PAA和SAX都是已有的降维技术,将二者结合使用可以很好地过滤掉大部分的干扰数据。实验结果证明,该方法在保证实验结果准确率的前提下提高了运算速率,比现有方法有更好的性能优势。 展开更多
关键词 高维数据 相似性连接 SPARK 分段聚合近似 符号聚合近似
下载PDF
基于滑动窗口分段的动态时间弯曲下界算法 被引量:1
12
作者 孙宏伟 王会青 张建辉 《小型微型计算机系统》 CSCD 北大核心 2016年第4期768-772,共5页
下界算法可以简化时间序列相似性查询的计算过程.现有的基于点对累积近似表示法的下界算法,相似度计算的时间代价较小,但当时间序列振幅波动较大时,往往不能紧致地拟合时间序列.针对这一问题,在下界算法中引入滑动窗口分段表示法,提出... 下界算法可以简化时间序列相似性查询的计算过程.现有的基于点对累积近似表示法的下界算法,相似度计算的时间代价较小,但当时间序列振幅波动较大时,往往不能紧致地拟合时间序列.针对这一问题,在下界算法中引入滑动窗口分段表示法,提出一种基于滑动窗口分段的动态时间弯曲下界算法,构建拟合度更高的上下边界曲线,对时间序列进行过滤,筛除相似性较差的时间序列.实验结果表明,该算法能够有效地简化时间序列相似度的计算过程,降低时间复杂度,提高相似性查询效率,且当时间序列的振幅波动较大时,相似度计算的紧致度和修剪率更高. 展开更多
关键词 动态时间弯曲距离 下界距离 点对累积近似 滑动窗口分段
下载PDF
QPAAS:一种在线多数据流自适应分段算法
13
作者 张彬 陈琼 彭勇 《衡阳师范学院学报》 2010年第3期80-83,共4页
数据流分段是数据流处理技术的基本任务,然而,它在多数据流环境下并不是一个小问题。该文提出了一个高效算法(即QPAAS算法),它能实时处理多个数据流分段。该算法利用了PAA技术中的增量计算特性,能快速处理单个数据流分段。为了处理多个... 数据流分段是数据流处理技术的基本任务,然而,它在多数据流环境下并不是一个小问题。该文提出了一个高效算法(即QPAAS算法),它能实时处理多个数据流分段。该算法利用了PAA技术中的增量计算特性,能快速处理单个数据流分段。为了处理多个数据流,它索引所有数据流的当前分段到一颗B+树中,这样算法即可实时分段多个数据流。在真实的数据流上的多个实验表明,QPAAS算法有效而高效,仅具有线性时间和空间复杂度。而且,它比传统的PAA分段算法快几个数量级。 展开更多
关键词 算法 数据流 分段 点对累积近似 增量计算
下载PDF
采用自适应分段聚合近似的典型负荷曲线形态聚类算法 被引量:56
14
作者 王潇笛 刘俊勇 +3 位作者 刘友波 许立雄 马铁丰 胥威汀 《电力系统自动化》 EI CSCD 北大核心 2019年第1期110-118,共9页
对海量负荷数据进行降维聚类处理是提取负荷关键信息,深度挖掘其内在规律的前提。根据负荷曲线的形态特征,文中提出了一种基于可变时间分辨率自适应分段聚合近似方法的曲线形态聚类算法。首先,根据负荷爬坡事件及基于斜率提取的边缘点... 对海量负荷数据进行降维聚类处理是提取负荷关键信息,深度挖掘其内在规律的前提。根据负荷曲线的形态特征,文中提出了一种基于可变时间分辨率自适应分段聚合近似方法的曲线形态聚类算法。首先,根据负荷爬坡事件及基于斜率提取的边缘点来衡量负荷曲线的形态特征及其变化趋势,采用自适应分段聚合近似算法对用户日负荷数据集进行可变时间分辨率重构,进一步采用一种基于负荷曲线形态聚类的k-shape算法进行聚类处理,该聚类算法以一种基于曲线形态相似性的距离量度方式作为相似性判据,并依据斯坦纳树优化方法进行聚类中心计算。利用模拟数据、实测数据算例分析验证了所提算法在数据降维、负荷聚类中的实用性和有效性。 展开更多
关键词 电力负荷 曲线聚类 k-shape算法 自适应分段聚合近似
下载PDF
基于电压曲线形态特征聚类的低压台区相位辨识 被引量:3
15
作者 廖志伟 谢汛恺 +2 位作者 郑广昱 王博文 刘烨 《电力系统自动化》 EI CSCD 北大核心 2023年第7期142-149,共8页
针对电压曲线分布集中导致低压台区用户相位难以准确辨识的问题,提出基于电压曲线形态特征聚类的低压台区相位辨识方法。首先,采用分段聚合近似(PAA)对配电变压器低压侧三相以及低压用户的电压曲线进行分段,提取反映整体分布的主要特征... 针对电压曲线分布集中导致低压台区用户相位难以准确辨识的问题,提出基于电压曲线形态特征聚类的低压台区相位辨识方法。首先,采用分段聚合近似(PAA)对配电变压器低压侧三相以及低压用户的电压曲线进行分段,提取反映整体分布的主要特征信息,减少冗余噪声的干扰。引入一阶导数与动态时间弯曲(DTW)增加对每个分段序列局部趋势变化的分析,并将其集成到PAA距离度量中,既弥补了均值特征缺乏对电压曲线趋势变化信息的考量,又能降低DTW的时间复杂度。然后,通过该距离度量综合判定电压特征序列的相似度,并以此改进传统k-means聚类的相似性度量,构建低压台区相位辨识模型。最后,通过实际台区算例分析验证了所提方法的有效性。 展开更多
关键词 低压台区 相位辨识 分段聚合近似 动态时间弯曲 形态特征 K-MEANS聚类
下载PDF
基于动态时间规整的语音样例快速检索算法 被引量:7
16
作者 张连海 冯志远 +1 位作者 陈琦 李勃昊 《计算机应用研究》 CSCD 北大核心 2014年第6期1688-1692,共5页
为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动... 为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动态规整得分的分段累积近似下界估计,最后采用K-最近邻算法与动态时间规整算法搜索与语音样例相似度最高的区域。实验结果表明,此算法的检索速度比直接运用DTW算法快6.32倍,而对其检索精度无任何影响。 展开更多
关键词 语音样例检索 音素后验概率 分段累积近似下界估计 动态时间规整 内积距离
下载PDF
城市用水量曲线聚类算法的研究与实现
17
作者 刘春柳 张征 《中国科技论文在线精品论文》 2020年第2期212-220,共9页
准确预测城市用水量可以对智慧水务调度、报警提供支持,预测前对所有用水量曲线进行聚类可以提高预测的精度.为满足实时性和运行效率的要求,提出基于形态特征的分段聚合近似(shape-based piecewise aggregate approximation,SPAA)表示方... 准确预测城市用水量可以对智慧水务调度、报警提供支持,预测前对所有用水量曲线进行聚类可以提高预测的精度.为满足实时性和运行效率的要求,提出基于形态特征的分段聚合近似(shape-based piecewise aggregate approximation,SPAA)表示方法,同时为解决传统基于欧氏距离的聚类算法无法包含曲线的形状特征的问题,提出自适应聚类数的基于序列形态相似性的k-shape聚类算法.另外,采用一种基于质心的聚类中心计算方式,提取每类用水量曲线形态.最后,对某水务公司的用水量数据实例进行聚类分析.结果表明,本文所提的SPAA-k-shape算法可以有效降维,减少聚类计算时间,比传统仅考虑欧氏距离的算法更准确. 展开更多
关键词 市政工程 模式识别与智能系统 曲线聚类 k-shape算法 基于形态特征的分段聚合近似
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部