期刊文献+
共找到163篇文章
< 1 2 9 >
每页显示 20 50 100
结合最大最小距离和加权密度的K-means聚类算法 被引量:21
1
作者 马克勤 杨延娇 +2 位作者 秦红武 耿琳 王丕栋 《计算机工程与应用》 CSCD 北大核心 2020年第16期50-54,共5页
随机选取初始聚类中心和根据经验设置K值对K-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的K-means聚类算法,称为KWDM算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影... 随机选取初始聚类中心和根据经验设置K值对K-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的K-means聚类算法,称为KWDM算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定K值,防止了根据经验来设置K值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。 展开更多
关键词 K-MEANS 初始中心 离群点 密度法 最大最小距离
下载PDF
面向稀疏高维大数据的扩展增量模糊聚类算法 被引量:19
2
作者 钱雪忠 姚琳燕 《计算机工程》 CAS CSCD 北大核心 2019年第6期75-81,88,共8页
模糊C均值(FCM)聚类算法对初始中心点敏感,不考虑类别间中心点的相互影响,且仅能处理低维数据。为此,设计一种改进的初始中心点选择方法,并基于条件模糊聚类思想,将传统FCM算法中的欧氏距离替换为余弦距离后提出wHFCLM算法。将该算法与... 模糊C均值(FCM)聚类算法对初始中心点敏感,不考虑类别间中心点的相互影响,且仅能处理低维数据。为此,设计一种改进的初始中心点选择方法,并基于条件模糊聚类思想,将传统FCM算法中的欧氏距离替换为余弦距离后提出wHFCLM算法。将该算法与扩展增量聚类算法spFCM、oFCM和rseFCM相结合,得到对应的扩展增量模糊聚类算法spHF(c+l)M、oHF(c+l)M以及rseHF(c+l)M。实验结果表明,与spFCM算法、oFCM算法和rseFCM算法相比,扩展增量模糊聚类算法对初始中心点的选择敏感性较低,能较好地处理大规模稀疏高维数据集,且在合适的分块大小下具有更优的聚类性能。 展开更多
关键词 扩展聚类算法 条件聚类 稀疏高维大数据 模糊聚类 初始中心点
下载PDF
一种优化初始中心点的K-Means文本聚类算法 被引量:13
3
作者 朱颢东 钟勇 赵向辉 《郑州大学学报(理学版)》 CAS 北大核心 2009年第2期29-32,共4页
为解决传统K-Means算法以及它的变种会产生较大波动的聚类结果的问题,使用改进的模拟退火算法来优化初始中心,得到一种适合对文本数据聚类分析的算法.把改进的模拟退火算法和K-Means算法结合在一起,从而达到既能发挥模拟退火算法的全局... 为解决传统K-Means算法以及它的变种会产生较大波动的聚类结果的问题,使用改进的模拟退火算法来优化初始中心,得到一种适合对文本数据聚类分析的算法.把改进的模拟退火算法和K-Means算法结合在一起,从而达到既能发挥模拟退火算法的全局寻优能力,又可以兼顾K-Means的局部寻优能力,较好地克服了K-Means对初始化敏感、容易陷入局部最优的缺点.实验证明,该算法可以生成质量较高而且聚类质量波动性较小的结果. 展开更多
关键词 K-MEANS算法 模拟退火算法 初始中心
下载PDF
一种优化初始中心的K-means粗糙聚类算法 被引量:14
4
作者 姚跃华 史秀岭 《计算机工程与应用》 CSCD 北大核心 2010年第34期126-128,共3页
针对K-means算法的不足,提出了一种优化初始中心的聚类算法。首先,采用密度敏感的相似性度量来计算对象的密度,基于对象之间的距离和对象的邻域,选择相互距离尽可能远的数据点作为初始聚类中心。然后,采用基于粗糙集的K-means聚类算法... 针对K-means算法的不足,提出了一种优化初始中心的聚类算法。首先,采用密度敏感的相似性度量来计算对象的密度,基于对象之间的距离和对象的邻域,选择相互距离尽可能远的数据点作为初始聚类中心。然后,采用基于粗糙集的K-means聚类算法处理边界对象,同时利用均衡化函数自动生成聚类数目。实验表明,算法具有较好的聚类效果和综合性能。 展开更多
关键词 聚类 K-MEANS算法 初始中心 密度 粗糙集
下载PDF
基于稠密区域的K-medoids聚类算法 被引量:6
5
作者 赵湘民 陈曦 潘楚 《计算机工程与应用》 CSCD 北大核心 2016年第16期85-89,99,共6页
针对传统K-medoids聚类算法对初始中心点敏感,以及迭代次数较高等缺点,提出一种可行的初始化方法和中心点搜索更新策略。新算法首先利用密度可达思想为数据集中每个对象建立一个稠密区域,遴选出K个密度大且距离较远的稠密区域,把对应的... 针对传统K-medoids聚类算法对初始中心点敏感,以及迭代次数较高等缺点,提出一种可行的初始化方法和中心点搜索更新策略。新算法首先利用密度可达思想为数据集中每个对象建立一个稠密区域,遴选出K个密度大且距离较远的稠密区域,把对应的稠密区域的核心对象作为聚类算法的K个初始中心点;其次,把K个中心点搜索更新范围锁定在所选的K个有效稠密区域里。新算法在Iris、Wine、PId标准数据集中测试,获取了理想中心点和稠密区域,并且在较少的迭代次数内收敛到最优解或近似最优解。 展开更多
关键词 K-medoids聚类算法 稠密区域 初始中心点 中心点搜索更新
下载PDF
关于优化K-medoids聚类算法搜索策略研究 被引量:4
6
作者 朱纯 吴建华 潘毅 《计算机仿真》 CSCD 北大核心 2016年第10期244-248,277,共6页
由于传统K-medoids聚类算法对初始中心点敏感,计算迭代次数较高,存在聚类准确率不够高等缺点。为了解决中心点敏感问题,首先利用密度思想为数据集中每个对象建立一个ε0-领域,利用最大最小距离法遴选出K个密度大且距离较远的ε0-领域,... 由于传统K-medoids聚类算法对初始中心点敏感,计算迭代次数较高,存在聚类准确率不够高等缺点。为了解决中心点敏感问题,首先利用密度思想为数据集中每个对象建立一个ε0-领域,利用最大最小距离法遴选出K个密度大且距离较远的ε0-领域,把对应的ε0-领域的核心对象作为聚类算法的K个初始中心点;然后,为了解决传统K-medoids聚类算法的迭代次数较高、全局搜索的盲目性,在获取有效初始中心点的前提下,提出了以初始中心点为核心进行ε0-领域搜索更新策略,用来减少聚类算法的中心点更新迭代次数;同时,为了解决传统K-medoids聚类算法聚类准确率较低等缺点,提出了赋予簇内距离和簇间距离不同权重的准则函数,增强聚类算法的评价标准。改进后的算法在Iris和Wine数据集上进行测试,实验结果表明,初始中心点分别位于不同的簇中,降低了算法的迭代次数,提高了聚类准确率。 展开更多
关键词 聚类算法 局部密度区域 初始中心点 领域搜索策略 加权准则函数
下载PDF
非独立同分布下的K-Modes算法
7
作者 周慧鑫 姜合 王艳梅 《计算机工程与设计》 北大核心 2023年第1期182-187,共6页
传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分... 传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分布的。针对这两方面问题,通过基于层次聚类进行预聚类的方法改进选取初始中心的方法,引入非独立同分布思想计算相异度量,进行实验验证。实验结果表明,通过改进初始中心的选取方法和相异度量的计算方法很好改进了K-Modes算法,提高了算法的聚类精度。 展开更多
关键词 K-Modes算法 初始中心 独立同分布 非独立同分布 耦合关系 层次聚类 相异度度量
下载PDF
基于Hub的高维数据初始聚类中心的选择策略 被引量:3
8
作者 张巧达 何振峰 《计算机系统应用》 2015年第4期171-175,共5页
针对基于Hub的聚类算法K-hubs算法存在对初始聚类中心敏感的问题,提出一种基于Hub的初始中心选择策略.该策略充分利用高维数据普遍存在的Hubness现象,选择相距最远的K个Hub点作为初始的聚类中心.实验表明采用该策略的K-hubs算法与原来... 针对基于Hub的聚类算法K-hubs算法存在对初始聚类中心敏感的问题,提出一种基于Hub的初始中心选择策略.该策略充分利用高维数据普遍存在的Hubness现象,选择相距最远的K个Hub点作为初始的聚类中心.实验表明采用该策略的K-hubs算法与原来采用随机初始中心的K-hubs算法相比,前者拥有较好的初始中心分布,能够提高聚类准确率,而且初始中心所在的位置倾向于接近最终簇中心,有利于加快算法收敛. 展开更多
关键词 Hubness 初始中心 最大最小距离方法 高维数据 聚类
下载PDF
改进的初始中心与隶属度函数的模糊C-均值算法 被引量:2
9
作者 万龙 《重庆科技学院学报(自然科学版)》 CAS 2011年第1期178-180,共3页
针对模糊C-均值(FCM)算法对初始中心敏感的缺点,通过选取离均值最远的点作为初始聚类中心的方法,提出了一种基于均值距离的初始中心选取算法,同时由于远离各类聚类中心的野值样本会影响迭代结果,通过改变隶属度函数来克服这种缺陷。然... 针对模糊C-均值(FCM)算法对初始中心敏感的缺点,通过选取离均值最远的点作为初始聚类中心的方法,提出了一种基于均值距离的初始中心选取算法,同时由于远离各类聚类中心的野值样本会影响迭代结果,通过改变隶属度函数来克服这种缺陷。然后选取有代表性的样本作为实验数据集进行实验,通过实验得出,与传统的FCM算法比较,改进的FCM算法可以得到更高的准确率,实验证明了改进算法的有效性和优越性。 展开更多
关键词 模糊C-均值 初始中心 隶属度函数 聚类中心
下载PDF
基于网格密度距离的K-means优化算法 被引量:1
10
作者 张佳 杨呈永 +1 位作者 崔建明 智春 《桂林理工大学学报》 CAS 北大核心 2022年第2期502-506,共5页
针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高... 针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高密度网格并进行降序排序;再在高密度网格中引入K-means++思想,选取k个距离较远的网格点;最后进行K-means算法聚类的k个初始中心点将确定在上述网格点中。仿真实验结果表明,GDD-K-means算法减少了聚类中心选取的随机性,改善了聚类的效果。 展开更多
关键词 K-MEANS聚类 网格 密度 初始中心
下载PDF
聚类初始中心点选取研究 被引量:2
11
作者 杨天霞 王治和 +1 位作者 王华 王凌云 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期161-165,共5页
研究了利用已发现的频繁序列模式对序列数据库进行再聚类再发现的问题,针对已有的K-均值聚类算法随机选取初始中心点而导致聚类结果不稳定性的缺点,提出了一种基于Huffman思想的初始中心点选取算法——K-SPAM(K-means algorithm of sequ... 研究了利用已发现的频繁序列模式对序列数据库进行再聚类再发现的问题,针对已有的K-均值聚类算法随机选取初始中心点而导致聚类结果不稳定性的缺点,提出了一种基于Huffman思想的初始中心点选取算法——K-SPAM(K-means algorithm of sequence pattern mining based on the Huffman Method)算法.该算法能够在一定程度上减少陷入局部最优的可能,而且对序列间相似度的计算采用一种高效的"与"、"或"运算,可极大提高算法的执行效率. 展开更多
关键词 K-均值 序列模式 HUFFMAN树 聚类 初始中心
下载PDF
旅游客户细分K-means算法的初始中心优化
12
作者 王丹竹 杨昌勇 《科技通报》 北大核心 2016年第7期130-133,共4页
以标准K-means算法在旅游客户细分的应用中存在的聚类效果不佳等缺陷为着眼点,本文设计了一种以初始化中心优化K-means算法为基础的旅游客户细分模型,首先优化该算法中相似度的计算中的距离度量,之后再以K-means算法聚类效果对初始质心... 以标准K-means算法在旅游客户细分的应用中存在的聚类效果不佳等缺陷为着眼点,本文设计了一种以初始化中心优化K-means算法为基础的旅游客户细分模型,首先优化该算法中相似度的计算中的距离度量,之后再以K-means算法聚类效果对初始质心严重依赖和对数据输入顺序敏感等缺点为着眼点,提出寻找较为准确的K个聚类中心的方法。结果表明,通过改进K-means算法得到的客户划分,类别明确,类别之间的界限清晰,说明通过对客户的划分定义明确,划分效果较好。 展开更多
关键词 K-MEANS聚类 旅游企业 客户细分 初始中心 质心优化
下载PDF
基于点概率的K-means算法的改进
13
作者 邵晶晶 蒋林利 《柳州师专学报》 2015年第6期108-110,共3页
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择... K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好. 展开更多
关键词 K-MEANS算法 初始中心 几何概率
下载PDF
一种改进的RBF神经网络DOA估计方法
14
作者 巫军卫 张旻 钟子发 《计算机工程》 CAS CSCD 北大核心 2011年第17期155-157,共3页
提出一种优化径向基函数神经网络来波方位(DOA)估计模型结构和参数的方法。利用误差准则函数的收敛性,合理确定模型的隐层神经元数目,根据阵列信号相位差特征的空间分布特点,选择具有代表性的隐层神经元的中心,构建的RBF神经网络更能反... 提出一种优化径向基函数神经网络来波方位(DOA)估计模型结构和参数的方法。利用误差准则函数的收敛性,合理确定模型的隐层神经元数目,根据阵列信号相位差特征的空间分布特点,选择具有代表性的隐层神经元的中心,构建的RBF神经网络更能反映阵列的测向能力。相比于目前的径向基函数神经网络测向模型的构建方法,改进的DOA估计模型具有更好的泛化性能,能够提高测向精度。实验结果验证了该方法的有效性。 展开更多
关键词 来波方位 径向基函数神经网络 误差准则函数 隐层神经元 初始中心
下载PDF
一种优化初始中心点的K-means算法 被引量:139
15
作者 汪中 刘贵全 陈恩红 《模式识别与人工智能》 EI CSCD 北大核心 2009年第2期299-304,共6页
针对K-means算法所存在的问题,提出一种优化初始中心点的算法.采用密度敏感的相似性度量来计算对象的密度,启发式地生成样本初始中心.然后设计一种评价函数——均衡化函数,并以均衡化函数为准则自动生成聚类数目.与传统算法相比,本文算... 针对K-means算法所存在的问题,提出一种优化初始中心点的算法.采用密度敏感的相似性度量来计算对象的密度,启发式地生成样本初始中心.然后设计一种评价函数——均衡化函数,并以均衡化函数为准则自动生成聚类数目.与传统算法相比,本文算法可得到较高质量的初始中心和较稳定的聚类结果.实验结果表明该算法的有效性和可行性. 展开更多
关键词 K-MEANS算法 密度 初始中心点 均衡化函数
原文传递
基于免疫离群数据和敏感初始中心的K-means算法的风电场机群划分 被引量:27
16
作者 林俐 潘险险 +1 位作者 张凌云 赵双 《中国电机工程学报》 EI CSCD 北大核心 2016年第20期5461-5468,5722,共8页
风电机组在实际运行时,受尾流效应和迟滞效应等因素的影响,场内机组运行状态并不相同,风电场采用传统的单机表征模型可能会产生较大误差。该文基于风电场实测运行数据,以风电机组具有相近运行点为机群划分原则,提出一种基于免疫离群数... 风电机组在实际运行时,受尾流效应和迟滞效应等因素的影响,场内机组运行状态并不相同,风电场采用传统的单机表征模型可能会产生较大误差。该文基于风电场实测运行数据,以风电机组具有相近运行点为机群划分原则,提出一种基于免疫离群数据和敏感初始中心的K-means算法的风电场机群划分方法。首先,针对风电场实测运行数据含有离群数据的问题,基于实测样本分布密度分析,对实测数据进行离群数据处理,免疫离群数据的干扰。其次,传统K-means算法对初始聚类中心的选取是随机的,划分结果容易陷入局部最优,基于改进的最大最小距离法对初始机群中心进行优化选择,免疫机群划分结果对初始机群中心随机选取的敏感性。最后,通过对某实际风电场的仿真分析,验证了所提机群划分方法的有效性,所建立的风电场等值模型能够较准确地反映风电场并网点的动态特性,模型的精确性有了较大的提高。 展开更多
关键词 风电场 机群划分 K-MEANS算法 离群数据 敏感初始中心 实测数据
下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
17
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 聚类分析 K⁃means聚类算法 聚类中心选取 K⁃means算法改进 初始中心点
下载PDF
K均值聚类算法初始质心选择的改进 被引量:15
18
作者 孙可 刘杰 王学颖 《沈阳师范大学学报(自然科学版)》 CAS 2009年第4期448-450,共3页
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的... 聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。 展开更多
关键词 聚类 K均值聚类算法 初始质心 密度 最近邻相似度
下载PDF
优化加权核K-means聚类初始中心点的SLIC算法 被引量:11
19
作者 杨艳 许道云 《计算机科学与探索》 CSCD 北大核心 2018年第3期494-501,共8页
超像素是近年来快速发展的一种图像预处理技术,被广泛应用于计算机视觉领域。简单线性迭代聚类(simple linear iterative clustering,SLIC)算法是其中的一种图像预处理技术框架,该算法根据像素的颜色和距离特征进行聚类来实现良好的分... 超像素是近年来快速发展的一种图像预处理技术,被广泛应用于计算机视觉领域。简单线性迭代聚类(simple linear iterative clustering,SLIC)算法是其中的一种图像预处理技术框架,该算法根据像素的颜色和距离特征进行聚类来实现良好的分割结果。然而,SLIC算法尚存在一些问题。基于优化加权核K-means聚类初始中心点,提出一种新的SLIC算法(WKK-SLIC算法)。算法基于图像像素之间的颜色相似性和空间相似性度量,采用超像素分割的归一化割公式,使用核函数来近似相似性度量。算法将像素值和坐标映射到高维特征空间中,通过对该特征空间中的每个点赋予适当的权重,使加权K均值和归一化割的目标函数的优化在数学上等价。从而通过在所提出的特征空间中迭代地应用简单的K-means聚类来优化归一化割的目标函数。在WKK-SLIC算法中,采用密度敏感的相似性度量计算空间像素点的密度,启发式地生成K-means聚类的初始中心以达到稳定的聚类结果。实验结果表明,WKK-SLIC算法在评估超像素分割的几个标准上优于SLIC算法。 展开更多
关键词 超像素 超像素分割 加权核K-means 密度 初始中心点
下载PDF
基于均衡化函数的k均值优化算法 被引量:7
20
作者 钱雪忠 施培蓓 +1 位作者 张明阳 汪中 《计算机工程》 CAS CSCD 北大核心 2008年第14期60-62,共3页
传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择... 传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择算法,自动生成聚类数目,实验结果表明了改进算法的有效性。 展开更多
关键词 K-均值算法 密度 初始中心点 均衡化函数
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部