提出了一种多标签符号型属性值划分的聚类方法(clustering method for multi-label symbolic value partition, CMSVP)。首先,利用标签排序和K-means算法,对原始标签信息进行聚类。然后,为每一个属性构建一个无向加权图。图中的每一个...提出了一种多标签符号型属性值划分的聚类方法(clustering method for multi-label symbolic value partition, CMSVP)。首先,利用标签排序和K-means算法,对原始标签信息进行聚类。然后,为每一个属性构建一个无向加权图。图中的每一个节点代表一个属性值,边的权重则表示节点之间的相似度。最后,对所有的无向加权图进行随机游走,得到属性值的聚类方案。实验在6个多标签数据集上进行。结果表明,CMSVP算法在对数据有效地进行压缩的同时,也能在一定程度上提高数据的分类性能。展开更多
文摘提出了一种多标签符号型属性值划分的聚类方法(clustering method for multi-label symbolic value partition, CMSVP)。首先,利用标签排序和K-means算法,对原始标签信息进行聚类。然后,为每一个属性构建一个无向加权图。图中的每一个节点代表一个属性值,边的权重则表示节点之间的相似度。最后,对所有的无向加权图进行随机游走,得到属性值的聚类方案。实验在6个多标签数据集上进行。结果表明,CMSVP算法在对数据有效地进行压缩的同时,也能在一定程度上提高数据的分类性能。