期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
高维类别属性数据流离群点快速检测算法 被引量:21
1
作者 周晓云 孙志挥 +1 位作者 张柏礼 杨宜东 《软件学报》 EI CSCD 北大核心 2007年第4期933-942,共10页
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric... 提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性. 展开更多
关键词 数据流 离群点检测 频繁模式 高维 概念转移
下载PDF
时间序列异常检测 被引量:21
2
作者 周大镯 刘月芬 马文秀 《计算机工程与应用》 CSCD 北大核心 2008年第35期145-147,共3页
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例压缩;其次利用局部异常检测方法检测出时间序列中的异常模式。通... 在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例压缩;其次利用局部异常检测方法检测出时间序列中的异常模式。通过心电图(ECG)数据实验验证了算法的有效性和合理性。 展开更多
关键词 时间序列 异常模式 局部异常因子 序列重要点
下载PDF
时间序列异常模式的k-均距异常因子检测 被引量:12
3
作者 詹艳艳 徐荣聪 《计算机工程与应用》 CSCD 北大核心 2009年第9期141-145,共5页
提出了一种基于k-均距异常因子检测时间序列异常模式的算法(K-MDOF)。该算法首先利用边缘权重因子提取时间序列模式表示的边缘点,然后通过提取每一段子模式的四个特征值:模式长度、模式高度、模式均值和标准差将时间序列映射到特征空间... 提出了一种基于k-均距异常因子检测时间序列异常模式的算法(K-MDOF)。该算法首先利用边缘权重因子提取时间序列模式表示的边缘点,然后通过提取每一段子模式的四个特征值:模式长度、模式高度、模式均值和标准差将时间序列映射到特征空间,最后利用k-均距异常因子在该特征空间中检测时间序列的异常模式。从模式的角度检测时间序列的异常行为弥补了点异常检测的个体行为局限性,提高了异常检测的效率和准确性,在仿真数据集和真实数据集上的实验结果都证明了在时间序列异常检测中模式异常定义的合理性以及算法的有效性。 展开更多
关键词 时间序列 异常模式 k-均距异常因子 边缘权重因子
下载PDF
时间序列多尺度异常检测方法 被引量:9
4
作者 陈波 刘厚泉 赵志凯 《计算机工程与应用》 CSCD 北大核心 2018年第20期122-127,共6页
针对时间序列异常模式检测大多采用线性模式分割方式的局限性,研究了在Haar小波变换多尺度特征的基础上,结合时间序列模式分割技术,提出一种时间序列多尺度异常检测方法。该方法首先通过小波变换压缩时间序列,把时间序列分解在不同的尺... 针对时间序列异常模式检测大多采用线性模式分割方式的局限性,研究了在Haar小波变换多尺度特征的基础上,结合时间序列模式分割技术,提出一种时间序列多尺度异常检测方法。该方法首先通过小波变换压缩时间序列,把时间序列分解在不同的尺度上;再利用二次回归模型将分解后的时间序列分割成可变长度的模式序列,计算模式异常值;最后重构原时间序列,检测原时间序列中的异常模式。实验结果表明,该方法可以有效地检测异常,而且可以从不同分解级数的压缩时间序列中检测多尺度异常模式。 展开更多
关键词 时间序列 小波变换 二次回归模型 多尺度 异常模式
下载PDF
快速挖掘数据流中离群点 被引量:5
5
作者 唐向红 李国徽 杨观赐 《小型微型计算机系统》 CSCD 北大核心 2011年第1期9-16,共8页
离群点检测是数据挖掘领域的一个重要分支,当前数据流的离群点检测研究越来越受到关注.为了快速准确地检测出数据流中离群点,提出一种在线数据流离群点检测算法ODDS(outlier detection in online data stream s).它利用数据与频繁模式... 离群点检测是数据挖掘领域的一个重要分支,当前数据流的离群点检测研究越来越受到关注.为了快速准确地检测出数据流中离群点,提出一种在线数据流离群点检测算法ODDS(outlier detection in online data stream s).它利用数据与频繁模式的相异程度来度量数据的离群程度,通过构建ODDS-Tree树,能动态地更新数据流中候选离群点的离群信息.实验结果验证了该算法与其他同类算法相比具有较高的效率与优良的可扩展性能. 展开更多
关键词 数据流 离群点检测 频繁模式 离群因子
下载PDF
基于监控数据的MySQL异常检测算法 被引量:6
6
作者 凌骏 尹博学 +1 位作者 李晟 王鑫 《计算机工程》 CAS CSCD 北大核心 2015年第11期41-46,共6页
随着互联网数据规模的增长,服务器集群的规模快速扩大,对大规模的集群进行监控和分析成为互联网行业运维的难点。为此,根据监控统计数据剧烈波动的特点,提出一种My SQL异常检测分析算法,采用基于模式的异常检测方法,无须设置阈值,分段... 随着互联网数据规模的增长,服务器集群的规模快速扩大,对大规模的集群进行监控和分析成为互联网行业运维的难点。为此,根据监控统计数据剧烈波动的特点,提出一种My SQL异常检测分析算法,采用基于模式的异常检测方法,无须设置阈值,分段取模式特征值,计算异常点、异常区间和异常程度。实验结果表明,该算法对于抖动剧烈监控数据的时序序列可以较好地提取数据特征,与基于均值方差的异常检测算法相比,具有更高的精准度,对监测数据的适用性较强。 展开更多
关键词 异常检测 监控数据 统计 模式 时间序列
下载PDF
多变量时间序列例外模式的识别 被引量:2
7
作者 翁小清 沈钧毅 《模式识别与人工智能》 EI CSCD 北大核心 2007年第3期336-342,共7页
多变量时间序列(MTS)在金融、医学、科学、工程等领域是非常普遍的.本文提出一种在 MTS 中识别异常模式的方法.采用自底向上的分割算法将 MTS 分割成互不重叠的子序列,使用扩展的 Frobenius 范数来计算2个MTS 子序列之间的相似性,通过 K... 多变量时间序列(MTS)在金融、医学、科学、工程等领域是非常普遍的.本文提出一种在 MTS 中识别异常模式的方法.采用自底向上的分割算法将 MTS 分割成互不重叠的子序列,使用扩展的 Frobenius 范数来计算2个MTS 子序列之间的相似性,通过 K-均值聚类将 MTS 子序列分为若干个类.根据异常模式的定义,从这若干个类中识别出异常模式.在2个实际数据集上进行实验,实验结果验证算法的有效性. 展开更多
关键词 多变量时间序列(MTS) 白底向上的分割算法 扩展的Frobenius范数 例外模式
原文传递
基于距离的样本选择方法及其在实时野点检测中的应用 被引量:2
8
作者 肖健华 《计算机科学》 CSCD 北大核心 2003年第4期159-161,173,共4页
The paper introduces the approach of outher detection based on kernel,and points out the approach is hard to be realized with the increase of sample number. In order to reduce the size of optimization,the sample selec... The paper introduces the approach of outher detection based on kernel,and points out the approach is hard to be realized with the increase of sample number. In order to reduce the size of optimization,the sample selection method based on distance is proposed Through selecting samples,the computation workload and the demand of EMS memory can be decreased greatly. In the end,the real-time demand can be met. 展开更多
关键词 数据库 知识发现 支持向量机 实时野点检测 样本选择方法 数据点 数据处理
下载PDF
一种水文时间序列异常模式检测方法研究 被引量:2
9
作者 李云霞 姚建国 +1 位作者 万定生 赵群 《计算机技术与发展》 2019年第7期159-163,共5页
时间序列数据是一类常见的多维复杂类型数据,它客观记录了观测系统随时间次序而变化的、在各观测时刻点的重要信息。时间序列数据具有海量性、高维性、复杂性等特点,直接对原始水文时间序列进行异常检测需要花费大量的时间,因此提出一... 时间序列数据是一类常见的多维复杂类型数据,它客观记录了观测系统随时间次序而变化的、在各观测时刻点的重要信息。时间序列数据具有海量性、高维性、复杂性等特点,直接对原始水文时间序列进行异常检测需要花费大量的时间,因此提出一种基于两阶段的水文时间序列异常检测方法。该方法通过分段线性表示方法对原始时间序列进行表示,提取子序列的斜率,极值差和均值三个特征值来表示原始时间序列。第一阶段在每个子序列为一个三元组的基础上用层次聚类算法对数据进行聚类,得到聚类结果。第二阶段基于聚类结果计算每一类的异常因子,根据异常因子判定异常模式。为验证该方法的有效性,采用龙门站的实测数据和人工合成数据进行实验检测,取得了较好的效果。 展开更多
关键词 时间序列 分段线性表示 层次聚类 异常因子 异常模式
下载PDF
时空轨迹大数据模式挖掘研究进展 被引量:40
10
作者 吉根林 赵斌 《数据采集与处理》 CSCD 北大核心 2015年第1期47-58,共12页
时空轨迹挖掘是数据挖掘领域的前沿研究课题,通过研究和开发时空轨迹挖掘技术,来发现隐藏在轨迹大数据中有价值的规律和知识以供决策支持。本文介绍了时空轨迹大数据模式挖掘与知识发现领域的研究进展;然后对时空轨迹模式挖掘技术产生... 时空轨迹挖掘是数据挖掘领域的前沿研究课题,通过研究和开发时空轨迹挖掘技术,来发现隐藏在轨迹大数据中有价值的规律和知识以供决策支持。本文介绍了时空轨迹大数据模式挖掘与知识发现领域的研究进展;然后对时空轨迹模式挖掘技术产生的背景、应用领域和研究现状作了简介,并探讨了面向时空轨迹大数据模式挖掘的研究内容、系统架构以及关键技术,最后对时空轨迹频繁模式、伴随模式、聚集模式和异常模式的挖掘算法思想进行了阐述。 展开更多
关键词 时空轨迹模式挖掘 时空轨迹大数据 轨迹频繁模式 轨迹伴随模式 轨迹聚集模式 轨迹异常模式
下载PDF
基于空间密度聚类和异常数据域的负荷异常值识别方法 被引量:36
11
作者 赵天辉 张耀 王建学 《电力系统自动化》 EI CSCD 北大核心 2021年第10期97-105,共9页
针对海量电力负荷数据,提出一种基于空间密度聚类和异常数据域的负荷异常值识别方法。首先,基于空间密度聚类方法将负荷曲线按照正常和异常用电模式进行分类,并对正常用电模式中的负荷曲线进行负荷水平分类。然后,在不同负荷水平下,利... 针对海量电力负荷数据,提出一种基于空间密度聚类和异常数据域的负荷异常值识别方法。首先,基于空间密度聚类方法将负荷曲线按照正常和异常用电模式进行分类,并对正常用电模式中的负荷曲线进行负荷水平分类。然后,在不同负荷水平下,利用负荷期望值的置信区间和负荷样本与样本均值之间偏差的四分位差,构建异常数据域。考虑非典型用电行为的偶然性,引入用电时刻偏移量,对形成的异常数据域进行修正,并构建面向异常用电模式的异常数据域。在算例中,采用居民和工业用户的负荷数据集对所提方法进行检验,相比于传统方法,文中所提方法的识别精确率平均提高了10%以上,综合评价指标平均提高了4%以上。 展开更多
关键词 负荷异常值 不良数据辨识 负荷聚类 用电模式 负荷水平 四分位差 用电时刻偏移
下载PDF
基于聚类的出租车异常轨迹检测 被引量:11
12
作者 朱燕 李宏伟 +2 位作者 樊超 许栋浩 施方林 《计算机工程》 CAS CSCD 北大核心 2017年第2期16-20,共5页
出租车全球定位系统数据中蕴含城市交通和移动对象行为的宏观信息,从中可以挖掘出有价值的异常轨迹模式。将位置和几何形状、行驶时间分别作为出租车轨迹的空间与时间特征,根据特征偏离情况划分时间、空间和时空异常轨迹。从轨迹数据中... 出租车全球定位系统数据中蕴含城市交通和移动对象行为的宏观信息,从中可以挖掘出有价值的异常轨迹模式。将位置和几何形状、行驶时间分别作为出租车轨迹的空间与时间特征,根据特征偏离情况划分时间、空间和时空异常轨迹。从轨迹数据中提取相同起终点的轨迹集,将轨迹划分成轨迹片段,计算轨迹间的相似度并进行基于距离和密度的聚类,在空间特征上初步分离出频繁和稀疏轨迹,根据数据异常判定的kσ准则确定时间特征异常的分离阈值,对时间特征进行再次划分,最终实现出租车异常轨迹检测。实验结果表明,该方法能从异常轨迹中挖掘出个性化路线、异常停留位置和交通路段,为智能交通、物流高效规划和执行等提供参考信息。 展开更多
关键词 异常轨迹检测 全球定位系统数据 轨迹聚类 时空特征 轨迹模式
下载PDF
时间序列增量异常模式检测算法 被引量:3
13
作者 周大镯 刘雷 《计算机工程》 CAS CSCD 北大核心 2009年第16期45-47,共3页
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出一种高效率的时间序列增量异常模式检测算法。将时间序列按序列重要点进行数据分割,利用局部异常检测方法检测出时间序列的异常模式。当插入一些新数据时,邻近分割模式发... 在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出一种高效率的时间序列增量异常模式检测算法。将时间序列按序列重要点进行数据分割,利用局部异常检测方法检测出时间序列的异常模式。当插入一些新数据时,邻近分割模式发生变化,增量异常检测算法更新相应的最近邻模式。通过该算法可以高效率地发现时间序列的异常模式。 展开更多
关键词 时间序列 增量异常模式 局部异常因子
下载PDF
基于时空立方体的蒙古高原草原火高频区时空演变特征 被引量:1
14
作者 昙娜 阿拉腾图娅 +2 位作者 包玉龙 高彦哲 敖日格乐 《草业科学》 CAS CSCD 北大核心 2023年第11期2763-2774,共12页
蒙古高原东部草原火频繁发生,波及面广,对畜牧业发展威胁很大。本研究以蒙古高原草原火高频区2001-2020年的MCD64A1遥感火烧迹地数据为基础,利用时空立方体模型挖掘草原火的时空演变模式。结果表明:整体上,草原火从西南向东北逐渐增多,... 蒙古高原东部草原火频繁发生,波及面广,对畜牧业发展威胁很大。本研究以蒙古高原草原火高频区2001-2020年的MCD64A1遥感火烧迹地数据为基础,利用时空立方体模型挖掘草原火的时空演变模式。结果表明:整体上,草原火从西南向东北逐渐增多,以国境线为界的火发生面积差异明显,主要分布在蒙古国境内,并存在明显的年际变化,每隔3~4年出现一次草原火发生的高峰。草原火高频集聚立方体的空间和时间自相关关系比较复杂,火事件的规律性差,不具有连续性,对防火防灾带来困难。草原火发生频率显著高或低的个别点主要分布在人口聚集的镇所在地;呼伦贝尔市东部、西部国境线附近,肯特省北部,东方省西南角、东北部、东南部以及与新巴尔虎左旗交界处草原火虽不连续发生,但近期发生频率较高,需要高度警惕。利用时空立方体挖掘蒙古高原草原火高频区时空演变模式,可为准确、快速识别草原火多发点位及其时空演变特性,网格化管理草原火,管护员巡查调度、草原火预测、降低火灾发生频率等提供辅助决策。 展开更多
关键词 草原火 时空立方体 局部异常值分析 时空热点分析 网格化管理 时空演变模式 蒙古高原
下载PDF
基于无指导离群点检测的网络入侵检测技术 被引量:4
15
作者 黄俊 韩玲莉 陈光平 《小型微型计算机系统》 CSCD 北大核心 2007年第11期2007-2009,共3页
讨论了基于无指导离群点检测的网络入侵检测技术及实现框架.技术方法首先在网络数据包上通过改进的随机森林算法建立了网络服务模型,然后通过确定网络服务模型上的离群点实现网络入侵检测.还通过在KDD'99数据集上对所提出的技术实... 讨论了基于无指导离群点检测的网络入侵检测技术及实现框架.技术方法首先在网络数据包上通过改进的随机森林算法建立了网络服务模型,然后通过确定网络服务模型上的离群点实现网络入侵检测.还通过在KDD'99数据集上对所提出的技术实现入侵检测的实验及结果进行了讨论并与其他无指导异常检测方法进行了比较. 展开更多
关键词 网络入侵检测 随机森林算法 无指导离群点检测 网络服务模型
下载PDF
基于分形理论的股票时序数据离群模式挖掘研究 被引量:4
16
作者 孙金花 冯英浚 胡健 《运筹与管理》 CSCD 2008年第5期135-140,共6页
针对股票时间序列的特点,从离群点对股票时序数据有序性的影响角度出发,在界定分形离群点含义的基础上,利用分形理论将离群模式挖掘理解为一个优化分割问题。采用推广G-P(Grassberger-Procaccia)算法计算股票时间序列数据集的多重分形... 针对股票时间序列的特点,从离群点对股票时序数据有序性的影响角度出发,在界定分形离群点含义的基础上,利用分形理论将离群模式挖掘理解为一个优化分割问题。采用推广G-P(Grassberger-Procaccia)算法计算股票时间序列数据集的多重分形广义维数,并利用贪婪算法的思想设计了FT-Greedy算法来求解基于分形理论的时间序列离群模式挖掘优化问题的解集。实验证明,该方法能有效地解决股票时间序列离群模式挖掘问题。 展开更多
关键词 数据挖掘 离群模式挖掘 分型理论 股票时序数据
下载PDF
An Efficient Outlier Detection Approach on Weighted Data Stream Based on Minimal Rare Pattern Mining 被引量:1
17
作者 Saihua Cai Ruizhi Sun +2 位作者 Shangbo Hao Sicong Li Gang Yuan 《China Communications》 SCIE CSCD 2019年第10期83-99,共17页
The distance-based outlier detection method detects the implied outliers by calculating the distance of the points in the dataset, but the computational complexity is particularly high when processing multidimensional... The distance-based outlier detection method detects the implied outliers by calculating the distance of the points in the dataset, but the computational complexity is particularly high when processing multidimensional datasets. In addition, the traditional outlier detection method does not consider the frequency of subsets occurrence, thus, the detected outliers do not fit the definition of outliers (i.e., rarely appearing). The pattern mining-based outlier detection approaches have solved this problem, but the importance of each pattern is not taken into account in outlier detection process, so the detected outliers cannot truly reflect some actual situation. Aimed at these problems, a two-phase minimal weighted rare pattern mining-based outlier detection approach, called MWRPM-Outlier, is proposed to effectively detect outliers on the weight data stream. In particular, a method called MWRPM is proposed in the pattern mining phase to fast mine the minimal weighted rare patterns, and then two deviation factors are defined in outlier detection phase to measure the abnormal degree of each transaction on the weight data stream. Experimental results show that the proposed MWRPM-Outlier approach has excellent performance in outlier detection and MWRPM approach outperforms in weighted rare pattern mining. 展开更多
关键词 outlier detection WEIGHTED data STREAM MINIMAL WEIGHTED RARE pattern MINING deviation factors
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部