期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于k均值分区的数据流离群点检测算法 被引量:20
1
作者 倪巍伟 陆介平 +1 位作者 陈耿 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2006年第9期1639-1643,共5页
离群知识发现是数据挖掘研究的一个重要方面,数据流离群点挖掘更因其挖掘对象具有动态性、不可复读性、数据量大等特点而成为离群知识发现研究的一个难点.提出一种基于k均值分区的流数据离群点发现算法,先对数据流进行分区做k均值聚类... 离群知识发现是数据挖掘研究的一个重要方面,数据流离群点挖掘更因其挖掘对象具有动态性、不可复读性、数据量大等特点而成为离群知识发现研究的一个难点.提出一种基于k均值分区的流数据离群点发现算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后在这些均值参考点中,根据离群点的定义找出可能存在的离群点.理论分析和实验结果表明,算法可以有效解决数据流离群点检测问题,算法是有效可行的. 展开更多
关键词 数据挖掘 离群点检测 均值参考点 聚合
下载PDF
基于k均值分区的流数据高效密度聚类算法 被引量:8
2
作者 倪巍伟 陆介平 +1 位作者 陈耿 孙志挥 《小型微型计算机系统》 CSCD 北大核心 2007年第1期83-87,共5页
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区... 数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的. 展开更多
关键词 数据流聚类 均值参考点 密度聚类
下载PDF
基于改进K-均值聚类算法的背景提取方法 被引量:7
3
作者 查成东 王长松 +1 位作者 巩宪锋 周家新 《计算机工程与设计》 CSCD 北大核心 2007年第21期5141-5143,共3页
背景提取是运动目标检测中重要而基础的一个环节。分析了一般静态背景提取算法的原理和缺陷,提出了一种新颖的基于改进K-均值聚类算法的背景提取方法,给出了动态三元组(DTDG)的概念,并且对每个像素用3个动态三元组进行建模,实现了原始... 背景提取是运动目标检测中重要而基础的一个环节。分析了一般静态背景提取算法的原理和缺陷,提出了一种新颖的基于改进K-均值聚类算法的背景提取方法,给出了动态三元组(DTDG)的概念,并且对每个像素用3个动态三元组进行建模,实现了原始背景的提取。实验验证了所提方案的有效性。 展开更多
关键词 背景模型 背景提取 K-均值 均值参考点 计算机视觉
下载PDF
基于聚类和拟合的QAR数据离群点检测算法 被引量:8
4
作者 杨慧 王丽婧 《计算机工程与设计》 北大核心 2015年第1期174-177,共4页
为解决从飞机快速存取记录器(QAR)数据中发现异常数据并预测飞机潜在故障的问题,考虑QAR数据量大、飞行参数数据值相对较为稳定的特点,提出一种适用于QAR数据的离群点检测算法。第一阶段采用K均值聚类对QAR数据流分区进行聚类生成均值... 为解决从飞机快速存取记录器(QAR)数据中发现异常数据并预测飞机潜在故障的问题,考虑QAR数据量大、飞行参数数据值相对较为稳定的特点,提出一种适用于QAR数据的离群点检测算法。第一阶段采用K均值聚类对QAR数据流分区进行聚类生成均值参考点;第二阶段采用最小二乘法对生成的均值参考点进行拟合,通过计算均值参考点到拟合飞机参数曲线的距离来判断并找出可能的离群点。实验结果表明,该算法可以准确发现飞机中的故障数据,有效解决部分飞机故障的离群点检测问题。 展开更多
关键词 飞机时序数据 K均值聚类 均值参考点 最小二乘法 离群点检测
下载PDF
一种有效的数据流二次聚类算法 被引量:2
5
作者 胡学钢 曹永照 吴共庆 《西南交通大学学报》 EI CSCD 北大核心 2009年第4期490-494,共5页
为提高数据分布不规则和含有噪音时的数据流聚类质量,提出了一种有效的数据流二次聚类算法TCLUSA.该算法基于分区思想,采用DBSCAN方法对每块分区进行聚类,以得到的簇的均值点作为其代表点,再用k-m eans对所获得的代表点进行聚类,算法采... 为提高数据分布不规则和含有噪音时的数据流聚类质量,提出了一种有效的数据流二次聚类算法TCLUSA.该算法基于分区思想,采用DBSCAN方法对每块分区进行聚类,以得到的簇的均值点作为其代表点,再用k-m eans对所获得的代表点进行聚类,算法采用分层结构保存每次聚类获得的簇参考点,直至获得最终结果.理论分析和实验结果表明,TCLUSA算法能有效提高数据流的聚类质量. 展开更多
关键词 数据流聚类 密度簇参考点 k-均值参考点
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部