期刊文献+
共找到216篇文章
< 1 2 11 >
每页显示 20 50 100
K-Means聚类算法研究综述 被引量:277
1
作者 杨俊闯 赵超 《计算机工程与应用》 CSCD 北大核心 2019年第23期7-14,63,共9页
K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如... K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如何选取,离群点的检测与去除,距离和相似性度量等。从多个方面对K-Means算法的改进措施进行概括,并和传统K-Means算法进行比较,分析了改进算法的优缺点,指出了其中存在的问题。对K-Means算法的发展方向和趋势进行了展望。 展开更多
关键词 K-MEANS 聚类算法 聚类中心 离群点
下载PDF
一种进化聚类学习新方法 被引量:41
2
作者 杨欣斌 孙京诰 黄道 《计算机工程与应用》 CSCD 北大核心 2003年第15期60-62,共3页
根据人类进行聚类判断所遵循的原则,模拟蚂蚁寻找食物源的行为,该文提出了一种基于蚁群的聚类学习新方法。该方法可以最终获得全局最优解,并且具有本质并行性、计算效率高、聚类学习能力强等优点。
关键词 聚类分析 蚁群算法 聚类中心
下载PDF
一种基于簇中心点自动选择策略的密度峰值聚类算法 被引量:47
3
作者 马春来 单洪 马涛 《计算机科学》 CSCD 北大核心 2016年第7期255-258,280,共5页
针对基于密度峰值的聚类算法(CFSFDP)无法自行选择簇中心点的问题,提出了CFSFDP改进算法。该算法采用簇中心点自动选择策略,根据簇中心权值的变化趋势搜索"拐点",并以"拐点"之前的一组点作为各簇中心,这一策略有效... 针对基于密度峰值的聚类算法(CFSFDP)无法自行选择簇中心点的问题,提出了CFSFDP改进算法。该算法采用簇中心点自动选择策略,根据簇中心权值的变化趋势搜索"拐点",并以"拐点"之前的一组点作为各簇中心,这一策略有效避免了通过决策图判决簇中心的方法所带来的误差。仿真实验采用5类数据集,并与DBSCAN及CFSFDP算法进行了对比,结果表明,CFSFDP改进算法具有较高的准确度及较强的鲁棒性,适用于较低维度的数据的聚类分析。 展开更多
关键词 聚类 DBSCAN 密度峰值 簇中心点
下载PDF
一种采用聚类技术改进的KNN文本分类方法 被引量:33
4
作者 张孝飞 黄河燕 《模式识别与人工智能》 EI CSCD 北大核心 2009年第6期936-940,共5页
KNN算法稳定性好、准确率高,但由于其时间复杂度与样本数量成正比,导致其分类速度慢,难以在大规模海量信息处理中得到有效应用.文中提出一种改进的KNN文本分类方法.其基本思路是,通过文本聚类将样本中的若干相似文档合并成一个中心文档... KNN算法稳定性好、准确率高,但由于其时间复杂度与样本数量成正比,导致其分类速度慢,难以在大规模海量信息处理中得到有效应用.文中提出一种改进的KNN文本分类方法.其基本思路是,通过文本聚类将样本中的若干相似文档合并成一个中心文档,并用这些中心文档代替原始样本建立分类模型,这样就减少了需要进行相似计算的文档数,从而达到提高分类速度的目的.实验表明,以分类准确率、召回率和F-score为评价指标,文中方法在与经典KNN算法相当的情况下,分类速度得到较大提高. 展开更多
关键词 k-最近邻(KNN) 文本分类 文本聚类 聚类中心 自然语言处理
原文传递
基于聚合距离参数的改进K-means算法 被引量:26
5
作者 王巧玲 乔非 蒋友好 《计算机应用》 CSCD 北大核心 2019年第9期2586-2590,共5页
针对传统K均值聚类(K-means)算法随机选择初始中心及K值导致的聚类结果不确定且精度不高问题,提出了一种基于聚合距离的改进K-means算法。首先,基于聚合距离参数筛选出优质的初始聚类中心,并将其作用于K-means算法。然后,引入戴维森堡... 针对传统K均值聚类(K-means)算法随机选择初始中心及K值导致的聚类结果不确定且精度不高问题,提出了一种基于聚合距离的改进K-means算法。首先,基于聚合距离参数筛选出优质的初始聚类中心,并将其作用于K-means算法。然后,引入戴维森堡丁指数(DBI)作为算法的准则函数,循环更新聚类直到准则函数收敛,最后完成聚类。改进算法提供了优质的初始聚类中心及K值,避免了聚类结果的随机性。二维数值型仿真数据的聚类结果表明,改进算法在数据样本数达到10 000时仍能保持较好的聚类效果。针对Iris和Seg这两个UCI标准数据集的调整兰德系数,改进算法比传统算法性能分别提高了83.7%和71.0%,最终验证了改进算法比传统算法聚类结果的准确性更高。 展开更多
关键词 聚合距离参数 聚类中心 聚类评判指标 戴维森堡丁指数(DBI) 数据聚类
下载PDF
基于改进K-modes聚类的KNN分类算法 被引量:23
6
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 K-modes算法 KNN算法 分类 簇中心 K-modes-KNN算法 字符串核函数
下载PDF
基于LDA的改进K-means算法在文本聚类中的应用 被引量:21
7
作者 王春龙 张敬旭 《计算机应用》 CSCD 北大核心 2014年第1期249-254,共6页
针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含狄利克雷分布(LDA)主题概率模型的初始聚类中心选择算法。该算法选择蕴含在文本集中影响程度最大的前m个... 针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含狄利克雷分布(LDA)主题概率模型的初始聚类中心选择算法。该算法选择蕴含在文本集中影响程度最大的前m个主题,并在这m个主题所在的维度上对文本集进行初步聚类,从而找到聚类中心,然后以这些聚类中心为初始聚类中心对文本集进行所有维度上的聚类,理论上保证了选择的初始聚类中心是基于概率可确定的。实验结果表明改进后算法聚类迭代次数明显减少,聚类结果更准确。 展开更多
关键词 主题模型 K-MEANS 聚类中心 文本聚类 隐含狄利克雷分布
下载PDF
基于K近邻和优化分配策略的密度峰值聚类算法 被引量:18
8
作者 孙林 秦小营 +1 位作者 徐久成 薛占熬 《软件学报》 EI CSCD 北大核心 2022年第4期1390-1411,共22页
密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一... 密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一种基于K近邻(K-nearest neighbors,KNN)和优化分配策略的密度峰值聚类算法.首先,基于KNN、点的局部密度和边界点确定候选簇中心;定义路径距离以反映候选簇中心之间的相似度,基于路径距离提出密度因子和距离因子来量化候选簇中心作为簇中心的可能性,确定簇中心.然后,为了提升点的分配的准确性,依据共享近邻、高密度最近邻、密度差值和KNN之间距离构建相似度,并给出邻域、相似集和相似域等概念,以协助点的分配;根据相似域和边界点确定初始聚类结果,并基于簇中心获得中间聚类结果.最后,依据中间聚类结果和相似集,从簇中心到簇边界将簇划分为多层,分别设计点的分配策略;对于具体层次中的点,基于相似域和积极域提出积极值以确定点的分配顺序,将点分配给其积极域中占主导地位的簇,获得最终聚类结果.在11个合成数据集和27个真实数据集上进行仿真实验,与最新的基于密度峰值的聚类算法作对比,结果表明:所提算法在纯度、F度量、准确度、兰德系数、调整兰德系数和标准互信息上均表现出良好的聚类性能. 展开更多
关键词 密度峰值聚类 K近邻 簇中心 积极值 分配策略
下载PDF
基于SAAFSA优化加权模糊聚类算法的变压器故障诊断 被引量:16
9
作者 史丽萍 宋朝鹏 +2 位作者 李明泽 陈苏黔 李加欣 《电测与仪表》 北大核心 2018年第11期12-18,共7页
针对加权模糊聚类算法(WFCM)应用于变压器DGA分析时存在收敛速度慢、对初始值敏感的问题,提出了一种改进人工鱼群优化加权模糊聚类算法(SAAFSA-WFCM)的变压器故障诊断方法。该方法利用模拟退火算法(SA)来改进人工鱼群算法(AFSA)以求取... 针对加权模糊聚类算法(WFCM)应用于变压器DGA分析时存在收敛速度慢、对初始值敏感的问题,提出了一种改进人工鱼群优化加权模糊聚类算法(SAAFSA-WFCM)的变压器故障诊断方法。该方法利用模拟退火算法(SA)来改进人工鱼群算法(AFSA)以求取最佳初始聚类中心,在发挥AFSA优异的全局寻优能力的同时,利用SA的概率性突跳搜索机制对AFSA实施局部优化,提高了AFSA的搜索精度。WFCM算法以得到的最佳初始聚类中心为初值进行迭代运算,最终求得更接近实际位置的聚类中心,克服了WFCM易受初值影响的缺陷,加快了收敛速度。仿真与实例分析表明,该方法可有效应用于变压器的故障诊断,并有着较高的诊断正确率和诊断效率。 展开更多
关键词 加权模糊聚类 模拟退火 人工鱼群算法 聚类中心 故障诊断
下载PDF
基于模糊聚类分析的数据检索的应用 被引量:11
10
作者 潘玉奇 周劲 +1 位作者 杨秀丽 袁宁 《微电子学与计算机》 CSCD 北大核心 2005年第6期167-169,172,共4页
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类... 为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类中心和查询数据的相似程度来进行聚类检索。 展开更多
关键词 模糊聚类分析 相似度 聚类中心 聚类检索
下载PDF
云制造环境下基于本体和模糊QoS的供应商匹配方法 被引量:15
11
作者 孙晓琳 金淳 +1 位作者 马琳 王文波 《中国管理科学》 CSSCI CSCD 北大核心 2018年第1期128-138,共11页
云制造环境下的服务匹配具有资源数量大、语义信息不对称、QoS多样化和模糊化的特点,同时企业有自主选择匹配结果的需求。为此,提出基于本体和模糊QoS聚类的三阶段供应商匹配模型。首先构建本体模型和供应商服务描述模型,运用语义本体... 云制造环境下的服务匹配具有资源数量大、语义信息不对称、QoS多样化和模糊化的特点,同时企业有自主选择匹配结果的需求。为此,提出基于本体和模糊QoS聚类的三阶段供应商匹配模型。首先构建本体模型和供应商服务描述模型,运用语义本体既消除了信息的不对称性,又增加了语义信息的完整性。此外,对QoS的多属性信息进行三角模糊化处理,结合模糊偏好和优化的模糊C均值聚类(FCM)算法按需聚类,提高了收敛速度和精度,得出基于匹配度排序的结果集合。实例验证结果表明:本文匹配方法较传统方法有更高的适应性和查准率。 展开更多
关键词 服务匹配 供应商服务本体 模糊QoS 模糊C均值聚类算法 聚类中心
原文传递
结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究 被引量:13
12
作者 张亚迪 孙悦 +1 位作者 刘锋 朱二周 《计算机科学》 CSCD 北大核心 2022年第1期121-132,共12页
聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点... 聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点。然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地处理非凸型分布和有离群值的数据集等问题。文中提出了一种基于密度参数和中心替换的改进K-means算法DC-Kmeans。该算法采用数据对象的密度参数来逐步确定初始类簇中心,使用中心替换方法更新偏离实际位置的初始中心,因而比传统聚的类算法更加精确。为了获得最佳聚类效果,文中同时提出了一个能够对聚类结果进行有效评价的新聚类有效性指标SCVI和一个能够快速获得目标数据集最佳类簇数的新算法OCNS。实验结果表明,所提聚类方法对各种类型的数据集都是有效的。 展开更多
关键词 聚类算法 聚类有效性指标 最佳类簇数 类簇中心 数据挖掘
下载PDF
基于核密度估计的K-CFSFDP聚类算法 被引量:13
13
作者 董晓君 程春玲 《计算机科学》 CSCD 北大核心 2018年第11期244-248,共5页
快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依... 快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的KCFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。 展开更多
关键词 聚类 核密度估计 密度峰值 聚类中心
下载PDF
基于残差分析的混合属性数据聚类算法 被引量:13
14
作者 邱保志 张瑞霖 李向丽 《自动化学报》 EI CSCD 北大核心 2020年第7期1420-1432,共13页
针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的... 针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的相似性,以提出的基于KNN和Parzen窗的局部密度计算方法计算每个对象的密度,通过线性回归和残差分析进行聚类中心预选取,然后以提出的聚类中心目标优化模型确定真正的聚类中心,最后将其他数据对象按照距离高密度对象的最小距离划分到相应的簇中,形成最终聚类.在合成数据集和UCI数据集上的实验结果验证了算法的有效性.与同类算法相比,RA-Clust具有较高的聚类精度. 展开更多
关键词 聚类 残差分析 线性回归 混合属性数据集 聚类中心
下载PDF
K均值优化算法综述 被引量:12
15
作者 邓滨玥 《软件》 2020年第2期188-192,共5页
k-means算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。在数据挖掘技术中常常使用聚类方法,而k-means算法作为最典型、最常见、实用度最广的一种聚类算法,具有简单易操作等优点。但此算... k-means算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。在数据挖掘技术中常常使用聚类方法,而k-means算法作为最典型、最常见、实用度最广的一种聚类算法,具有简单易操作等优点。但此算法需要人工设定聚类中心的数量,初始聚类中心,容易陷入局部最优,使得算法的时间复杂度变得较大,得到的聚类结果易受到k值与设定的初始聚类中心的影响,针对这些问题,本文介绍了k-means算法的改进方法,分析其优缺点并提出了优化算法的下一步研究方向。 展开更多
关键词 K-MEANS算法 聚类算法 聚类中心 误差平方和 无监督学习
下载PDF
引入改进飞蛾扑火的K均值交叉迭代聚类算法 被引量:11
16
作者 黄鹤 李昕芮 +3 位作者 吴琨 郭璐 王会峰 茹锋 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第9期32-39,共8页
针对现有K均值聚类(KMC)算法在选取初始聚类中心时随机性较大、全局搜索能力差、聚类精度低等问题,提出了一种引入改进飞蛾扑火的K均值交叉迭代聚类(IMFO-KMC)算法。利用最大最小距离积法初始化聚类中心,避免了KMC算法对随机初始聚类中... 针对现有K均值聚类(KMC)算法在选取初始聚类中心时随机性较大、全局搜索能力差、聚类精度低等问题,提出了一种引入改进飞蛾扑火的K均值交叉迭代聚类(IMFO-KMC)算法。利用最大最小距离积法初始化聚类中心,避免了KMC算法对随机初始聚类中心较为敏感的问题;利用样条插值预测的思想改进飞蛾扑火算法,提高了算法的收敛速度及寻优精度;以类内平均距离为适应度函数,引导插值扑火算法优化KMC迭代过程中的聚类中心,提高了聚类精度。将IMFOKMC与KMC、K-means++算法、模糊c均值聚类算法在国际标准数据集Iris、Wine和Seeds上进行了实验对比,结果表明:IMFO-KMC算法在Iris数据集上的性能提升最为明显,相比其他算法准确率提高了0.67%~4.18%,标准化互信息提高了1.5%~4.01%。 展开更多
关键词 飞蛾扑火算法 聚类中心 K均值聚类 类内平均距离 最大最小距离积法
下载PDF
基于混沌理论和KPCM聚类的变压器绕组松动状态监测 被引量:10
17
作者 黄春梅 马宏忠 +2 位作者 付明星 许洪华 李勇 《高压电器》 CAS CSCD 北大核心 2019年第1期95-102,共8页
运行中的变压器会产生持续振动,通过振动的变化可以判断变压器内部运行状态。变压器振动信号中包含了大量状态信息,难以从中提取有效特征来监测绕组松动状态。为此,提出了基于混沌理论和核可能性聚类算法KPCM的变压器绕组松动状态监测... 运行中的变压器会产生持续振动,通过振动的变化可以判断变压器内部运行状态。变压器振动信号中包含了大量状态信息,难以从中提取有效特征来监测绕组松动状态。为此,提出了基于混沌理论和核可能性聚类算法KPCM的变压器绕组松动状态监测方法。首先,从振动信号的混沌动力学特性出发,通过选择最佳嵌入维数和时间延迟,对实测变压器振动信号进行相空间重构。然后,针对重构信号的高维空间分布,使用KPCM聚类方法对分布模式进行识别,据此对绕组松动状态进行监测。现场实测数据的计算结果表明,使用Wolf法计算得到的最大李雅普诺夫指数为正,证实了变压器振动信号的混沌特性,基于KPCM聚类分析得到的聚类中心位移矢量的变化能够有效识别出绕组松动的机械故障隐患。研究结果为从混沌动力学角度监测变压器绕组的松动状态提供了理论依据。 展开更多
关键词 相空间重构 混沌特性 KPCM 变压器绕组 振动信号 松动状态 聚类中心
下载PDF
改进模糊C均值聚类法的车辆实际行驶工况构建 被引量:10
18
作者 高建平 高小杰 《河南科技大学学报(自然科学版)》 CAS 北大核心 2017年第6期21-27,共7页
针对模糊C均值(FCM)聚类法的性能依赖于初始聚类中心、迭代容易陷入局部极值、不能确保FCM收敛于一个最优解的问题,利用多岛遗传算法(MIGA)与序列二次规划法(SQP)组合优化,对FCM聚类的初始聚类中心进行优化,从而使聚类结果更加接近最优... 针对模糊C均值(FCM)聚类法的性能依赖于初始聚类中心、迭代容易陷入局部极值、不能确保FCM收敛于一个最优解的问题,利用多岛遗传算法(MIGA)与序列二次规划法(SQP)组合优化,对FCM聚类的初始聚类中心进行优化,从而使聚类结果更加接近最优聚类。采用主成分分析和改进的FCM聚类分析,将运动学片段的特征值进行降维和分类处理,构建出基于大样本、符合郑州市交通特征的行驶工况。与试验数据对比表明:所构建的乘用车行驶工况与试验数据特征参数平均相对误差仅为2.097%,速度-加速度联合分布差异(SAFD_(diff))仅为1.74%,行驶工况拟合精度较高,更能综合反映郑州市交通真实状况。 展开更多
关键词 FCM聚类 聚类中心 主成分分析 行驶工况
下载PDF
多源信息数据的并行优化抽样聚类K-means算法 被引量:10
19
作者 杨晓梅 《计算机仿真》 北大核心 2020年第7期305-308,332,共5页
为了解决K-means算法在面对多源信息数据时,无法对数据集合准确聚类,且处理效率较低等问题,以多源信息数据的特点和传统算法为依据,研究得到一种多源信息数据的并行优化抽样聚类K-means算法。算法利用特征函数和模糊分类中理想的划分函... 为了解决K-means算法在面对多源信息数据时,无法对数据集合准确聚类,且处理效率较低等问题,以多源信息数据的特点和传统算法为依据,研究得到一种多源信息数据的并行优化抽样聚类K-means算法。算法利用特征函数和模糊分类中理想的划分函数,对多源信息数据合理化预处理,同时基于Map Reduce模型和Canopy算法定义,获得相同数据并分类到相同子集内,然后采用BK-means算法对Canopy子集达成聚类分析,通过抽样策略令数据空间形成同宽的窗格,根据其范围内点数与最小点数的比较及间距值的确定,对数据点实施去除,通过最大最小距离方法对新的聚类中心和模式进行选择,最后令并行优化抽样聚类K-means算法得到有效的实现。经过仿真,上述算法不仅并行性较好,聚类精准度较高,并且具备极佳的鲁棒性和收敛性,处理时长有明显的缩短。 展开更多
关键词 多源信息数据 收敛性 聚类中心 欧几里得度量
下载PDF
两阶段模糊c-均值聚类算法及其应用 被引量:9
20
作者 同小军 曾山 +1 位作者 欧军 万波 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第11期71-75,共5页
针对模糊c-均值算法对初始值敏感、收敛结果易陷入局部极小值的缺点,提出了两阶段模糊c-均值聚类算法.首先通过恰当的贴近度(满足相似相近性)估计分类数,选取初始聚类中心;然后通过模糊c-均值算法进行聚类,最后对所得的聚类中心采用逻... 针对模糊c-均值算法对初始值敏感、收敛结果易陷入局部极小值的缺点,提出了两阶段模糊c-均值聚类算法.首先通过恰当的贴近度(满足相似相近性)估计分类数,选取初始聚类中心;然后通过模糊c-均值算法进行聚类,最后对所得的聚类中心采用逻辑斯谛型的灰色模型进行预测.由于聚类中心具有统计特征,因此较好地克服了样本间的随机误差,灰色逻辑斯谛模型较好地克服了每个样本内误差.采用上述方法对全国30个省市农村居民年收入进行了分析和比较,得出了具有参考价值的结果. 展开更多
关键词 模糊C-均值聚类 聚类中心 灰色逻辑斯谛预测模型 随机误差 区域经济分析
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部