-
题名基于分治法的高维大数据集模糊聚类算法
被引量:5
- 1
-
-
作者
王宝文
阎俊梅
刘文远
石岩
-
机构
燕山大学信息学院
日本九州东海大学工程学院信息系统工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第24期60-62,共3页
-
基金
国家科技部高新技术计划资金资助项目(2005EJ000017)
河北省科技研究与发展计划基金资助项目(02547015D)
河北省普通高等学校博士科研资金资助项目(B2002118)
-
文摘
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度。
-
关键词
模糊聚类
分治法
遗传算法
模糊非相似矩阵
大数据集
高维
-
Keywords
fuzzy clustering
distributed method
genetic algorithm
fuzzy dissimilar matrix
large data sets
high dimension
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于遗传算法的高维数据模糊聚类
被引量:2
- 2
-
-
作者
王宝文
阎俊梅
刘文远
石岩
-
机构
燕山大学信息学院
日本九州东海大学工程学院信息系统工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第16期191-192,221,共3页
-
基金
国家科技部高新技术计划项目(No.2005EJ000017)
河北省科技研究与发展计划(02547015D)
河北省普通高等学校博士科研资助基金(No.2002B2002118)
-
文摘
提出了一种基于遗传算法的高维数据模糊聚类方法。引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本初始化到二维平面。利用遗传算法进行迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近,使高维样本映射到二维平面。最后将得到的最优的二维样本利用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明利用该方法有较好的聚类效果,且比用FCM算法直接聚类收敛速度快。
-
关键词
模糊聚类
模糊非相似矩阵
遗传算法
高维数据
-
Keywords
fuzzy clustering
fuzzy dissimilar matrix
genetic algorithm
high dimensional datas
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种分布式的模糊聚类方法
- 3
-
-
作者
阎俊梅
-
机构
山西大同大学数学与计算机科学学院
-
出处
《山西大同大学学报(自然科学版)》
2011年第1期3-4,11,共3页
-
基金
国家科技部高新技术计划资助项目[2005EJ000017]
河北省科技研究与发展计划资助项目[02547015D]
河北省普通高等学校博士科研资助基金[B2002118]
-
文摘
由于FCM算法中的初始值需要随机的设定,这种随机性不能保证每次都能达到全局最优,也就是说如果初始聚类中心的设置具有全局的特点,那么聚类的结果才能达到全局最优。因此主要针对模糊c-均值(FCM)聚类算法对初始值很敏感,而且容易陷入局部最优解的这一特点,提出了一种分布式的模糊聚类方法。首先用分治法得到模糊聚类的全局的聚类中心值,然后再用FCM进行聚类,从而克服FCM算法对初始值敏感和容易陷入局部最优解的缺陷,达到全局最优。经仿真实验证明结果是很理想的。
-
关键词
聚类分析
分治方法
大数据集
-
Keywords
clustering analysis
distributed method
large data set
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于遗传算法的分布式的模糊聚类算法
- 4
-
-
作者
阎俊梅
-
机构
山西大同大学数计学院
-
出处
《电脑开发与应用》
2010年第10期1-2,共2页
-
基金
国家科技部高新技术计划项目(2005EJ000017)
河北省科技研究与发展计划(02547015D)
河北省普通高等学校博士科研基金资助2002(B2002118)
-
文摘
模糊聚类是一种非监督的聚类算法,但不能保证找到全局最小值,因为是从一个给定的点开始通过迭代的方法找到一个目标函数的最小值。为了克服这个缺点,在模糊聚类算法中结合遗传算法从一个多点的概念去产生多个数据空间。直接将遗传算法应用到模糊聚类中是不合适的,因为数据集通常是巨大的,在这种情况下,染色体的长度会很长。鉴于此,提出了一种基于遗传算法的分布式的模糊聚类算法,将大的进化环境分成若干个小的进化环境。通过理论证明是可行的,且该算法能极大地提高聚类的速度。
-
关键词
分布方法
模糊聚类
遗传算法
-
Keywords
distributed approach, fuzzy clustering, genetic algorithm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-