对于聚类而言确定聚类数目一直是一个具有挑战性的难题。尽管在经典与深度聚类中,非参数方法的好处是众所周知的,但大多数方法都是参数的,即需要预定义的固定数量的聚类,用k表示。一旦给定的k不准确,那么聚类结果的准确度将会十分低下,...对于聚类而言确定聚类数目一直是一个具有挑战性的难题。尽管在经典与深度聚类中,非参数方法的好处是众所周知的,但大多数方法都是参数的,即需要预定义的固定数量的聚类,用k表示。一旦给定的k不准确,那么聚类结果的准确度将会十分低下,尤其是对于高维数据和多种类数据而言。本文提出了一种非参数深度自聚类方法——基于蒙特卡洛方法(Monte Carlo method)的聚类数目确定方法。它是一种可以对多种类数据自动判断聚类数目的方法,并且得到的嵌入具有很好的解释性,可以用于其他任务。本模型采用自编码器作为主体,使用蒙特卡洛方法综合确定聚类数目。在对多种类数据进行的试验中,效果相对于本文选取的先进对照方法有了明显的提升。展开更多
文摘对于聚类而言确定聚类数目一直是一个具有挑战性的难题。尽管在经典与深度聚类中,非参数方法的好处是众所周知的,但大多数方法都是参数的,即需要预定义的固定数量的聚类,用k表示。一旦给定的k不准确,那么聚类结果的准确度将会十分低下,尤其是对于高维数据和多种类数据而言。本文提出了一种非参数深度自聚类方法——基于蒙特卡洛方法(Monte Carlo method)的聚类数目确定方法。它是一种可以对多种类数据自动判断聚类数目的方法,并且得到的嵌入具有很好的解释性,可以用于其他任务。本模型采用自编码器作为主体,使用蒙特卡洛方法综合确定聚类数目。在对多种类数据进行的试验中,效果相对于本文选取的先进对照方法有了明显的提升。