-
题名一种基于基尼指标的高维数据离群挖掘算法
被引量:3
- 1
-
-
作者
石岩
刘爱琴
张继福
-
机构
太原科技大学计算机科学与技术学院
-
出处
《太原科技大学学报》
2013年第3期161-165,共5页
-
基金
山西省自然科学基金(2010011021-2)
-
文摘
针对高维数据集中的离群点挖掘任务,给出了一种基于基尼指标和属性相关性分析的高维数据离群点挖掘算法。该算法首先采用属性相关性分析方法,删除高维数据集中的冗余属性,缩减了数据集的大小;其次采用基尼指标作为离群度量因子,从缩减后的数据集中,挖掘出不同离群程度的数据点;最后,实验采用天体光谱数据作为实验数据集,经实验验证,该算法对高维数据集中离群点的挖掘算法是有效的和可行的,其效率得到了明显的提高。
-
关键词
离群数据
高维数据
属性相关性分析
基尼指标
-
Keywords
outlier data, high-dimensional data set, attribute relevance analysis, gini index
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于基尼指标加权的离群子空间与离群数据挖掘方法
被引量:1
- 2
-
-
作者
孙伟伟
-
机构
太原科技大学计算机科学与技术学院
-
出处
《电脑开发与应用》
2012年第10期35-37,共3页
-
文摘
针对大多数离群数据检测方法依赖于用户确定参数以及维灾现象,给出了一种基于基尼指标加权的离群子空间与离群数据挖掘方法。该方法通过计算各个维上去一划分的基尼指标值来生成数据对象的离群子空间及属性权向量,在子空间中采用基于统计离群数据挖掘的思想来挖掘离群数据;不需输入参数,结果更具客观性,并且能够适应高维离群数据挖掘;最后采用恒星光谱数据集,验证了可行性和有效性。
-
关键词
离群数据
基尼指标
属性权向量
离群子空间
-
Keywords
outlier
gini index
attribute weighted vectors
outlier subspace
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-