期刊文献+
共找到2,415篇文章
< 1 2 121 >
每页显示 20 50 100
K-MEANS算法中的K值优化问题研究 被引量:189
1
作者 杨善林 李永森 +1 位作者 胡笑旋 潘若愚 《系统工程理论与实践》 EI CSCD 北大核心 2006年第2期97-101,共5页
在空间聚类中,最佳聚类数K求解的关键是构造合适的聚类有效性函数.典型K-平均算法中的聚类数K必须是事先给定的确定值,然而,实际中K很难被精确地确定,使得该算法对一些实际问题无效.文章提出距离代价函数作为最佳聚类数的有效性检验函数... 在空间聚类中,最佳聚类数K求解的关键是构造合适的聚类有效性函数.典型K-平均算法中的聚类数K必须是事先给定的确定值,然而,实际中K很难被精确地确定,使得该算法对一些实际问题无效.文章提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此设计了一种新的K值优化算法.同时,给出了K值最优解KOPT及其上界KMAX的条件,在理论上证明了经验规则KMAX≤N的合理性,实例结果进一步验证了新方法的有效性. 展开更多
关键词 空间聚类 k-平均算法 距离代价函数 k值优化
原文传递
初始聚类中心优化的k-means算法 被引量:152
2
作者 袁方 周志勇 宋鑫 《计算机工程》 CAS CSCD 北大核心 2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表... 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。 展开更多
关键词 数据挖掘 聚类 k-means算法 聚类中心
下载PDF
基于粒子群的K均值聚类算法 被引量:122
3
作者 刘靖明 韩丽川 侯立文 《系统工程理论与实践》 EI CSCD 北大核心 2005年第6期54-58,共5页
 针对K均值聚类算法存在的缺点,提出了一种新的聚类算法———基于粒子群的K均值聚类算法,并将此算法与现有的基于遗传算法的K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效地克服传统的K均值算...  针对K均值聚类算法存在的缺点,提出了一种新的聚类算法———基于粒子群的K均值聚类算法,并将此算法与现有的基于遗传算法的K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效地克服传统的K均值算法易陷入局部极小值的缺点,而且全局收敛能力优于基于遗传算法的K均值聚类算法. 展开更多
关键词 粒子群算法 聚类分析 全局优化 k均值算法 遗传算法
原文传递
一种优化初始中心点的K-means算法 被引量:139
4
作者 汪中 刘贵全 陈恩红 《模式识别与人工智能》 EI CSCD 北大核心 2009年第2期299-304,共6页
针对K-means算法所存在的问题,提出一种优化初始中心点的算法.采用密度敏感的相似性度量来计算对象的密度,启发式地生成样本初始中心.然后设计一种评价函数——均衡化函数,并以均衡化函数为准则自动生成聚类数目.与传统算法相比,本文算... 针对K-means算法所存在的问题,提出一种优化初始中心点的算法.采用密度敏感的相似性度量来计算对象的密度,启发式地生成样本初始中心.然后设计一种评价函数——均衡化函数,并以均衡化函数为准则自动生成聚类数目.与传统算法相比,本文算法可得到较高质量的初始中心和较稳定的聚类结果.实验结果表明该算法的有效性和可行性. 展开更多
关键词 k-means算法 密度 初始中心点 均衡化函数
原文传递
基于改进k-means算法的海量智能用电数据分析 被引量:126
5
作者 赵莉 候兴哲 +2 位作者 胡君 傅宏 孙洪亮 《电网技术》 EI CSCD 北大核心 2014年第10期2715-2720,共6页
针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究。以家庭用户为例,建立了家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数... 针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究。以家庭用户为例,建立了家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数等的数据维度模型,利用k-means算法简单、收敛速度快的优势,克服其容易陷入局部最优解的缺陷,综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准,将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,对k-means算法进行改进;为提高数据处理效率,进行Map-Reduce处理模型下的海量家庭用户用电数据的并行挖掘。通过在Hadoop集群上进行实验,结果证明提出的算法运行稳定、高效、可行,且具有良好的加速比。 展开更多
关键词 智能用电 云计算 Map-Reduce处理模型 k-means算法 并行挖掘
下载PDF
基于轮廓系数的聚类有效性分析 被引量:117
6
作者 朱连江 马炳先 赵学泉 《计算机应用》 CSCD 北大核心 2010年第12期139-141,198,共4页
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果... 针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。 展开更多
关键词 聚类 k均值算法 轮廓系数 有效性分析 无监督
下载PDF
改进的K-means聚类k值选择算法 被引量:106
7
作者 王建仁 马鑫 段刚龙 《计算机工程与应用》 CSCD 北大核心 2019年第8期27-33,共7页
空间聚类算法中,聚类的效果在很大程度上受制于最佳k值的选择。典型的K-均值算法中,聚类数k需要事先确定,但在实际情况中k的取值很难确定。针对手肘法在确定k值的过程中存在的"肘点"位置不明确问题,基于指数函数性质、权重调... 空间聚类算法中,聚类的效果在很大程度上受制于最佳k值的选择。典型的K-均值算法中,聚类数k需要事先确定,但在实际情况中k的取值很难确定。针对手肘法在确定k值的过程中存在的"肘点"位置不明确问题,基于指数函数性质、权重调节、偏执项和手肘法基本思想,提出了一种改进的k值选择算法ET-SSE算法。通过多个UCI数据集和K-means聚类算法对该算法进行实验,结果表明,使用该k值选择算法相比于手肘法能更加快速且准确地确定k值。 展开更多
关键词 k-均值算法 k值选择 ET-SSE 算法
下载PDF
基于K-means算法的温室移动机器人导航路径识别 被引量:106
8
作者 高国琴 李明 《农业工程学报》 EI CAS CSCD 北大核心 2014年第7期25-33,共9页
针对温室移动机器人机器视觉导航路径识别实时性差、受光照干扰影响严重等问题,首先,将HSI颜色空间3个分量进行分离,选取与光照信息无关且可以有效抑制噪声影响的色调分量H进行后续图像处理,以削弱光照对机器人视觉导航的不良影响;针对... 针对温室移动机器人机器视觉导航路径识别实时性差、受光照干扰影响严重等问题,首先,将HSI颜色空间3个分量进行分离,选取与光照信息无关且可以有效抑制噪声影响的色调分量H进行后续图像处理,以削弱光照对机器人视觉导航的不良影响;针对温室环境图像特有的颜色特征信息,引入K-means算法对图像进行聚类分割,将垄间道路信息与绿色作物信息各自聚类,再通过形态学腐蚀方法去除聚类后图像中存在的冗余、干扰信息,以获得完整的道路信息,与常用阈值分割方法相比,可降低因分割信息不明确而导致后续Hough变换进行直线拟合时需占据大量内存且计算量较大的问题,进而提高移动机器人路径识别的快速性,并适应温室作业机器人自主导航的高实时性要求。试验结果表明,该文方法在复杂背景与变光照条件下的温室作业环境中可大幅降低光照对机器人导航的影响,对于光照不均具有良好的鲁棒性,道路信息提取率可达95%。同时,其平均单幅图像处理时耗降低53.26%,可显著提高路径识别速度。该研究可为解决温室移动机器人机器视觉导航路径识别的鲁棒性及实时性问题提供参考。 展开更多
关键词 温室 机器人 机器视觉 图像分割 路径识别 HSI颜色空间 k-means算法
下载PDF
一种改进的K-means算法 被引量:72
9
作者 张玉芳 毛嘉莉 熊忠阳 《计算机应用》 CSCD 北大核心 2003年第8期31-33,60,共4页
聚类分析在科研和商业应用中都有着非常重要的应用,K means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K means算法的局限性日益突出。基于取样的划分思想,提出了一种改进的K means算法,在一定程度上避免了聚类结果陷入局... 聚类分析在科研和商业应用中都有着非常重要的应用,K means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K means算法的局限性日益突出。基于取样的划分思想,提出了一种改进的K means算法,在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况,仿真实验结果表明:改进后的K means算法优于原始算法,并且稳定性更好。 展开更多
关键词 聚类 k-means算法 误差平方和准则函数
下载PDF
一种改进的k-means初始聚类中心选取算法 被引量:92
10
作者 韩凌波 王强 +1 位作者 蒋正锋 郝志强 《计算机工程与应用》 CSCD 北大核心 2010年第17期150-152,共3页
在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别... 在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别数给定的情况下,通过用标准的UCI数据库进行实验比较,发现采用改进后方法选取的初始类中心的k-means算法比随机选取初始聚类中心算法有相对较高的准确率和稳定性。 展开更多
关键词 k-means算法 聚类中心 密度参数
下载PDF
基于k-means聚类算法的研究 被引量:87
11
作者 黄韬 刘胜辉 谭艳娜 《计算机技术与发展》 2011年第7期54-57,62,共5页
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法。通过将对数据集的多次采样,选取最终较优的初始聚类中心,使... 分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法。通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高。通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义。 展开更多
关键词 数据挖掘 聚类算法 k-means算法
下载PDF
一种有效的K-means聚类中心初始化方法 被引量:86
12
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 k-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
下载PDF
最小方差优化初始聚类中心的K-means算法 被引量:84
13
作者 谢娟英 王艳娥 《计算机工程》 CAS CSCD 2014年第8期205-211,223,共8页
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该... 传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。 展开更多
关键词 聚类 k-means算法 方差 紧密度 初始聚类中心
下载PDF
一种改进的粒子群和K均值混合聚类算法 被引量:79
14
作者 陶新民 徐晶 +1 位作者 杨立标 刘玉 《电子与信息学报》 EI CSCD 北大核心 2010年第1期92-97,共6页
该文针对K均值聚类算法存在的缺点,提出一种改进的粒子群优化(PSO)和K均值混合聚类算法。该算法在运行过程中通过引入小概率随机变异操作增强种群的多样性,提高了混合聚类算法全局搜索能力,并根据群体适应度方差来确定K均值算法操作时机... 该文针对K均值聚类算法存在的缺点,提出一种改进的粒子群优化(PSO)和K均值混合聚类算法。该算法在运行过程中通过引入小概率随机变异操作增强种群的多样性,提高了混合聚类算法全局搜索能力,并根据群体适应度方差来确定K均值算法操作时机,增强算法局部精确搜索能力的同时缩短了收敛时间。将此算法与K均值聚类算法、基于PSO聚类算法和基于传统的粒子群K均值聚类算法进行比较,数据实验证明,该算法有较好的全局收敛性,不仅能有效地克服其他算法易陷入局部极小值的缺点,而且全局收敛能力和收敛速度都有显著提高。 展开更多
关键词 k均值算法 粒子群优化算法 随机变异 适应度方差
下载PDF
基于遗传算法的K均值聚类分析 被引量:70
15
作者 赖玉霞 刘建平 杨国兴 《计算机工程》 CAS CSCD 北大核心 2008年第20期200-202,共3页
传统K均值算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优值。针对上述问题,该文提出一种基于遗传算法的K均值聚类算法,将K均值算法的局部寻优能力与遗传算法的全局寻优能力相结合,在自适应交叉概率和变异概... 传统K均值算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优值。针对上述问题,该文提出一种基于遗传算法的K均值聚类算法,将K均值算法的局部寻优能力与遗传算法的全局寻优能力相结合,在自适应交叉概率和变异概率的遗传算法中引入K均值操作,以克服传统K均值算法的局部性和对初始中心的敏感性,实验证明,该算法有较好的全局收敛性,聚类效果更好。 展开更多
关键词 k均值算法 聚类中心 遗传算法
下载PDF
K-means算法的初始聚类中心的优化 被引量:74
16
作者 赖玉霞 刘建平 《计算机工程与应用》 CSCD 北大核心 2008年第10期147-149,共3页
传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点... 传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点作为初始聚类中心,理论分析与实验结果表明,改进的算法能取得更好的聚类结果。 展开更多
关键词 聚类 k-means算法 密度 聚类中心 高密度区域
下载PDF
最优聚类个数和初始聚类中心点选取算法研究 被引量:80
17
作者 张素洁 赵怀慈 《计算机应用研究》 CSCD 北大核心 2017年第6期1617-1620,共4页
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取... 传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取原则来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。实验证明,该算法能选取最优的k值,通过用标准的UCI数据库进行实验,采用的算法能选择出唯一的初始中心点,聚类准确率较高、误差平方和较小。 展开更多
关键词 k-means算法 聚类中心 准确率 误差平方和
下载PDF
基于遗传算法的聚类分析 被引量:49
18
作者 傅景广 许刚 王裕国 《计算机工程》 CAS CSCD 北大核心 2004年第4期122-124,共3页
给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到使聚类划分效果最好的聚... 给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到使聚类划分效果最好的聚类中心。实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法。 展开更多
关键词 遗传算法 聚类 k-均值算法 二进制编码
下载PDF
基于密度的改进K均值算法及实现 被引量:76
19
作者 傅德胜 周辰 《计算机应用》 CSCD 北大核心 2011年第2期432-434,共3页
传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消... 传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。 展开更多
关键词 聚类 k-均值算法 初始聚类中心 高密度区域
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
20
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 kmeans聚类算法 初始聚类中心 优化
下载PDF
上一页 1 2 121 下一页 到第
使用帮助 返回顶部