期刊文献+

基于核密度估计的离群数据挖掘 被引量:3

Outlier Mining Method Based on Kernel Density Estimation
下载PDF
导出
摘要 数据集存在多样性,导致样本点的密度难以有效度量且效率低下,多数基于密度的异常检测方法局限于局部密度的计算,使其无法适应复杂数据库的发展需求,因此提出一种基于核密度估计的离群数据挖掘方法OMDE。首先,为估计并度量样本点的密度,提出一种特定核函数,该函数更适合于估计样本的局部密度;然后提出了一种基于均值的邻域密度估计方法来度量样本点邻域的密度,同传统的邻域密度估计方法相比,它对邻域大小具有更强的鲁棒性。在此基础上,提出一种基于离群因子估计的离群数据挖掘算法,结合多尺度邻域的信息,对样本的异常因子进行局部和全局的细化,实现了复杂数据集上的离群检测。最后,采用人工合成数据集分析验证了参数对算法性能的影响,并通过3组不同的真实数据集,将OMDE与相关算法进行了比较,实验结果显示,OMDE算法在效率和准确性两个方面具有较大的优势。 The diversity of data sets makes the density of sample points difficult to measure and inefficient.Most local density-based anomaly detection methods cannot meet the needs of the development of complex database because of the limitation of local density calculation.So an outlier data mining method OMDE is proposed based on kernel density estimation.First,to estimate and measure the local density of sample points,a specific kernel function is proposed.Second,a neighborhood density estimation method to measure the density of the neighborhood of the sample points is given.Compared with other existing methods,this method is more robust to neighborhood size parameters.Third,an outlier data mining algorithm is proposed,which combines the information of multi-scale neighborhood and realizes outlier detection on complex data sets.Finally,the influence of parameters on the performance of the algorithm is analyzed by using the synthetic data set;and OMDE is also compared with state-of-art algorithms.Experimental results show that the OMDE algorithm has great advantages in efficiency and accuracy.
作者 马洋 赵旭俊 苏建花 席婷婷 MA Yang;ZHAO Xu-jun;SU Jian-hua;XI Ting-ting(School of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024,China)
出处 《太原科技大学学报》 2020年第6期456-462,469,共8页 Journal of Taiyuan University of Science and Technology
基金 国家自然科学基金(61572343) 山西省青年基金(201901D211303) 山西省面上自然基金(201901D111257)。
关键词 密度 邻域 离群检测 核函数 density neighborhood outlier detection kernel function
  • 相关文献

参考文献3

二级参考文献7

共引文献18

同被引文献22

引证文献3

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部