-
题名基于k均值分区的数据流离群点检测算法
被引量:20
- 1
-
-
作者
倪巍伟
陆介平
陈耿
孙志挥
-
机构
东南大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第9期1639-1643,共5页
-
基金
国家自然科学基金项目(70371015)
教育部高等学校博士学科点专项科研基金项目(20040286009)
江苏省自然科学基金项目(BK2006095)
-
文摘
离群知识发现是数据挖掘研究的一个重要方面,数据流离群点挖掘更因其挖掘对象具有动态性、不可复读性、数据量大等特点而成为离群知识发现研究的一个难点.提出一种基于k均值分区的流数据离群点发现算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后在这些均值参考点中,根据离群点的定义找出可能存在的离群点.理论分析和实验结果表明,算法可以有效解决数据流离群点检测问题,算法是有效可行的.
-
关键词
数据挖掘
离群点检测
均值参考点
聚合
-
Keywords
data mining
outliers detection
mean reference point
clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于k均值分区的流数据高效密度聚类算法
被引量:8
- 2
-
-
作者
倪巍伟
陆介平
陈耿
孙志挥
-
机构
东南大学计算机科学与工程系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第1期83-87,共5页
-
基金
国家自然科学基金项目(70371015)资助
教育部高等学校博士学科点专项科研基金项目(20040286009)资助.
-
文摘
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.
-
关键词
数据流聚类
均值参考点
密度聚类
-
Keywords
data stream clustering
mean reference point
density based clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进K-均值聚类算法的背景提取方法
被引量:7
- 3
-
-
作者
查成东
王长松
巩宪锋
周家新
-
机构
北京科技大学机械工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第21期5141-5143,共3页
-
文摘
背景提取是运动目标检测中重要而基础的一个环节。分析了一般静态背景提取算法的原理和缺陷,提出了一种新颖的基于改进K-均值聚类算法的背景提取方法,给出了动态三元组(DTDG)的概念,并且对每个像素用3个动态三元组进行建模,实现了原始背景的提取。实验验证了所提方案的有效性。
-
关键词
背景模型
背景提取
K-均值
均值参考点
计算机视觉
-
Keywords
background model
background generation
K-means clustering
mean reference point
computer vision
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于聚类和拟合的QAR数据离群点检测算法
被引量:8
- 4
-
-
作者
杨慧
王丽婧
-
机构
中国民航大学计算机科学与技术学院
-
出处
《计算机工程与设计》
北大核心
2015年第1期174-177,共4页
-
基金
国家自然科学基金与中国民航联合基金项目(61179063)
国家自然科学基金项目(61301245)
-
文摘
为解决从飞机快速存取记录器(QAR)数据中发现异常数据并预测飞机潜在故障的问题,考虑QAR数据量大、飞行参数数据值相对较为稳定的特点,提出一种适用于QAR数据的离群点检测算法。第一阶段采用K均值聚类对QAR数据流分区进行聚类生成均值参考点;第二阶段采用最小二乘法对生成的均值参考点进行拟合,通过计算均值参考点到拟合飞机参数曲线的距离来判断并找出可能的离群点。实验结果表明,该算法可以准确发现飞机中的故障数据,有效解决部分飞机故障的离群点检测问题。
-
关键词
飞机时序数据
K均值聚类
均值参考点
最小二乘法
离群点检测
-
Keywords
aircraft timing data
K-means clustering
mean reference point
least squares method
outlier detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种有效的数据流二次聚类算法
被引量:2
- 5
-
-
作者
胡学钢
曹永照
吴共庆
-
机构
合肥工业大学计算机与信息学院
-
出处
《西南交通大学学报》
EI
CSCD
北大核心
2009年第4期490-494,共5页
-
基金
安徽省自然科学基金资助项目(050420207)
安徽省高校青年教师科研资助计划(2005jq1012)
-
文摘
为提高数据分布不规则和含有噪音时的数据流聚类质量,提出了一种有效的数据流二次聚类算法TCLUSA.该算法基于分区思想,采用DBSCAN方法对每块分区进行聚类,以得到的簇的均值点作为其代表点,再用k-m eans对所获得的代表点进行聚类,算法采用分层结构保存每次聚类获得的簇参考点,直至获得最终结果.理论分析和实验结果表明,TCLUSA算法能有效提高数据流的聚类质量.
-
关键词
数据流聚类
密度簇参考点
k-均值参考点
-
Keywords
data stream clustering
reference point of density cluster
k-means reference point
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-