-
题名一种基于多属性权重的分类数据子空间聚类算法
被引量:19
- 1
-
-
作者
庞宁
张继福
秦啸
-
机构
太原科技大学计算机科学与技术学院
奥本大学计算机科学与软件工程学院
-
出处
《自动化学报》
EI
CSCD
北大核心
2018年第3期517-532,共16页
-
基金
国家自然科学基金(61572343)资助~~
-
文摘
采用多属性频率权重以及多目标簇集质量聚类准则,提出一种分类数据子空间聚类算法.该算法利用粗糙集理论中的等价类,定义了一种多属性权重计算方法,有效地提高了属性的聚类区分能力;在多目标簇集质量函数的基础上,采用层次凝聚策略,迭代合并子簇,有效地度量了各类尺度的聚类簇;利用区间离散度,解决了使用阈值删除噪音点所带来的参数问题;利用属性对簇的依附程度,确定了聚类簇的属性相关子空间,提高了聚类簇的可理解性.最后,采用人工合成、UCI和恒星光谱数据集,实验验证了该聚类算法的可行性和有效性.
-
关键词
分类数据聚类
多属性频率
多目标簇集质量
属性相关子空间
区间离散度
-
Keywords
Categorical data clustering, multiple attribute frequency, multi-objective cluster quality, attributes relatedsubspace, interval dispersion degree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-