-
题名复杂分布数据的半监督阶段聚类
被引量:1
- 1
-
-
作者
张俊溪
吴晓军
蒋江红
-
机构
西安航空学院车辆工程学院
西北工业大学自动化学院
陕西师范大学计算机科学学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2016年第7期1003-1009,共7页
-
基金
陕西省自然科学基金 No.2014JM8353~~
-
文摘
半监督聚类是一种用先验信息完善聚类过程的机器学习方法。通过将元胞自动机(cellular automata,CA)距离变换算法引入到半监督聚类过程中,采用平面距离变换算法将数据集划分为若干子类,获得聚类数和约束信息,并作为下一阶段聚类的先验信息。利用半监督K-means聚类算法对第一阶段的聚类结果做进一步划分,可以获得完整的聚类中心和聚类数,并由此提出CA-K-means二阶段聚类算法。采用3组人工数据集和3组标准UCI数据集进行对比仿真实验,将CA-K-means二阶段聚类算法与半监督K-means聚类算法、遗传Kmeans聚类算法和单纯的CA层次聚类算法进行对比,结果显示,该算法对复杂分布数据的聚类准确率较高,聚类性能更加优良。
-
关键词
元胞自动机
半监督聚类
k-means聚类算法
ca-k-means二阶段聚类
复杂分布
-
Keywords
cellular automata
semi-supervised clustering algorithm
k-means clustering algorithm
ca-k-means two phases clustering algorithm
complex distribution
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-