期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种改进的K-Modes聚类算法 被引量:7
1
作者 贾彬 梁毅 苏航 《软件导刊》 2019年第6期60-64,69,共6页
为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法... 为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法,并采用一种基于预聚类的初始中心选取方法。使用UCI数据集进行实验,结果表明,MAV-K-Modes算法相比于传统K-Modes算法,其正确率、类精度和召回率都有明显提升,且MAV-K-Modes算法适合于并行化改造。 展开更多
关键词 聚类算法 相异度度量 初始中心点 多属性值Modes K-Modes
下载PDF
一种改进的K-Prototypes聚类算法 被引量:4
2
作者 孙志冉 苏航 梁毅 《计算机工程与应用》 CSCD 北大核心 2020年第21期54-59,共6页
针对K-Prototypes聚类算法中人为指定初始聚类中心和聚类数目导致算法准确度和稳定性低下的问题,提出了基于密度优化的K-Prototypes聚类算法,该算法根据数据对象的密度分布,自适应地优化聚类数目和初始聚类中心的设置,并通过区分每个属... 针对K-Prototypes聚类算法中人为指定初始聚类中心和聚类数目导致算法准确度和稳定性低下的问题,提出了基于密度优化的K-Prototypes聚类算法,该算法根据数据对象的密度分布,自适应地优化聚类数目和初始聚类中心的设置,并通过区分每个属性对聚类结果的不同影响权重,改进相异度计算公式,提升聚类的准确度。在合成数据集和UCI数据集上实验结果表明,该算法与K-Prototypes算法、DPCM算法和Fuzzy K-Prototypes算法相比,平均准确率分别提高了8.52%、4.28%和8.33%,达到了相对较好的聚类结果。 展开更多
关键词 聚类算法 初始中心点 密度 混合属性
下载PDF
一种改进的混合属性数据聚类算法
3
作者 陈丹 王振华 《电脑知识与技术(过刊)》 2010年第13期2713-2716,共4页
K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受"噪声"干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点... K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受"噪声"干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。 展开更多
关键词 聚类分析 初始中心点 K-原型算法 聚类算法 混合属性数据
全文增补中
K均值聚类算法初始质心选择的改进 被引量:15
4
作者 孙可 刘杰 王学颖 《沈阳师范大学学报(自然科学版)》 CAS 2009年第4期448-450,共3页
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的... 聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。 展开更多
关键词 聚类 K均值聚类算法 初始质心 密度 最近邻相似度
下载PDF
优化加权核K-means聚类初始中心点的SLIC算法 被引量:11
5
作者 杨艳 许道云 《计算机科学与探索》 CSCD 北大核心 2018年第3期494-501,共8页
超像素是近年来快速发展的一种图像预处理技术,被广泛应用于计算机视觉领域。简单线性迭代聚类(simple linear iterative clustering,SLIC)算法是其中的一种图像预处理技术框架,该算法根据像素的颜色和距离特征进行聚类来实现良好的分... 超像素是近年来快速发展的一种图像预处理技术,被广泛应用于计算机视觉领域。简单线性迭代聚类(simple linear iterative clustering,SLIC)算法是其中的一种图像预处理技术框架,该算法根据像素的颜色和距离特征进行聚类来实现良好的分割结果。然而,SLIC算法尚存在一些问题。基于优化加权核K-means聚类初始中心点,提出一种新的SLIC算法(WKK-SLIC算法)。算法基于图像像素之间的颜色相似性和空间相似性度量,采用超像素分割的归一化割公式,使用核函数来近似相似性度量。算法将像素值和坐标映射到高维特征空间中,通过对该特征空间中的每个点赋予适当的权重,使加权K均值和归一化割的目标函数的优化在数学上等价。从而通过在所提出的特征空间中迭代地应用简单的K-means聚类来优化归一化割的目标函数。在WKK-SLIC算法中,采用密度敏感的相似性度量计算空间像素点的密度,启发式地生成K-means聚类的初始中心以达到稳定的聚类结果。实验结果表明,WKK-SLIC算法在评估超像素分割的几个标准上优于SLIC算法。 展开更多
关键词 超像素 超像素分割 加权核K-means 密度 初始中心点
下载PDF
基于均衡化函数的k均值优化算法 被引量:7
6
作者 钱雪忠 施培蓓 +1 位作者 张明阳 汪中 《计算机工程》 CAS CSCD 北大核心 2008年第14期60-62,共3页
传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择... 传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优聚类数目也不理想。针对这些问题,该文提出一种新的评价函数——均衡化函数,采用基于密度的初始化中心点选择算法,自动生成聚类数目,实验结果表明了改进算法的有效性。 展开更多
关键词 K-均值算法 密度 初始中心点 均衡化函数
下载PDF
SVD优化初始簇中心的K-means中文文本聚类算法 被引量:9
7
作者 戴月明 王明慧 +1 位作者 张明 王艳 《系统仿真学报》 CAS CSCD 北大核心 2018年第10期3835-3842,共8页
为了改善传统K-means算法在聚类过程中,聚类数目K难以准确预设,聚类结果受初始中心影响,对噪声点敏感,不稳定等缺点,同时针对文本聚类中文本向量化后数据维数较高,空间分布稀疏,存在潜在语义结构等问题,提出了一种利用奇异值分解(Singul... 为了改善传统K-means算法在聚类过程中,聚类数目K难以准确预设,聚类结果受初始中心影响,对噪声点敏感,不稳定等缺点,同时针对文本聚类中文本向量化后数据维数较高,空间分布稀疏,存在潜在语义结构等问题,提出了一种利用奇异值分解(Singular Value Decomposition, SVD)的物理意义进行粗糙分类,再结合K-means算法的中文文本聚类优化算法(SVD-Kmeans)。新算法利用SVD分解的数学意义对文本数据进行了平滑处理,同时利用SVD分解的物理意义对文本数据进行粗糙分类,将分类的结果作为K-means算法的初始聚类中心点。实验结果表明,相比其他K-means及其改进算法,SVD-Kmeans算法的聚类质量F-Measure值有明显提升。 展开更多
关键词 SVD 文本聚类 K-MEANS 初始中心点
下载PDF
改进CK-means+算法及并行实现 被引量:2
8
作者 邵金鑫 行艳妮 +3 位作者 南方哲 赵鑫 马廷淮 钱育蓉 《计算机工程与设计》 北大核心 2022年第5期1240-1248,共9页
为降低K值的不确定性和初始聚类中心的随机性对聚类结果的影响,提出一种基于优化Canopy算法和均值计算法的改进K-means算法——CK-means+。优化Canopy算法,降低距离阈值T不确定性对最终输出K值的影响,通过Canopy算法和均值计算法得到K... 为降低K值的不确定性和初始聚类中心的随机性对聚类结果的影响,提出一种基于优化Canopy算法和均值计算法的改进K-means算法——CK-means+。优化Canopy算法,降低距离阈值T不确定性对最终输出K值的影响,通过Canopy算法和均值计算法得到K值和初始中心点。在UCI数据集上,结合Spark框架并行化,实验结果表明,相较其它算法,CK-means+算法效率更高,可以更好适应大规模数据应用场景。 展开更多
关键词 Canopy算法 K-MEANS算法 初始值K 初始中心点 并行化
下载PDF
基于K-means聚类算法的智能照明系统设计与开发 被引量:1
9
作者 高杰 魏强 《中国照明电器》 2022年第3期28-35,共8页
本文提出了一种基于K-means聚类算法的智能照明系统。系统采用MQTT(消息队列遥测传输)通信协议传输控制信号和采集用户行为习惯数据,选取用户的日常用灯时间和用灯时长作为两个特征值。为了使算法适应不同的用户数据,提出了一种确定K-me... 本文提出了一种基于K-means聚类算法的智能照明系统。系统采用MQTT(消息队列遥测传输)通信协议传输控制信号和采集用户行为习惯数据,选取用户的日常用灯时间和用灯时长作为两个特征值。为了使算法适应不同的用户数据,提出了一种确定K-means聚类算法的聚类数搜索范围上下界的方法,并通过选择有效性指标,以及基于用户行为习惯数据设定初始中心点,确定最佳聚类数。实验利用ESP8266模块、MQTT服务器和手机端测试界面测试灯的控制和数据采集,借助PyCharm软件对传统K-means算法和改进后的K-means算法在用户用灯行为习惯数据上进行聚类数搜索范围的确定、有效性指标和聚类效果比较。实验结果表明,采用MQTT通信协议能够控制灯的状态,平均响应时间为105 ms,改进的K-means聚类算法能够很好地对用户用灯行为习惯数据进行聚类,自动为用户提供正确的开灯时间和开灯持续时间。 展开更多
关键词 机器学习 K-MEANS 初始中心点 用户行为习惯 最佳聚类数
原文传递
基于初始中心点K均值聚类算法的改进方法研究 被引量:2
10
作者 卜天然 《通化师范学院学报》 2017年第2期60-63,共4页
传统聚类算法随机选取初始中心不能有效处理不规则数据集的边缘数据.该文主要叙述了K均值聚类算法基本思想和流程,详细分析了其算法的优点及存在的问题,提出对现有基于初始中心点K均值聚类算法的改进方法.
关键词 初始中心点 K均值聚类算法 改进方法
下载PDF
改进的K-means算法 被引量:1
11
作者 王芳妮 贺兴时 +1 位作者 谌路 杨敏 《纺织高校基础科学学报》 CAS 2012年第3期370-373,共4页
针对传统K-means聚类算法对初始点敏感性问题,根据数据样本分布,采用启发式的方法选取初始聚类中心点,设计了一种均衡化评价函数,由此函数为准则自动生成聚类数目.通过实验验证了该算法的收敛性.
关键词 K-MEANS算法 数据分布 初始中心点 均衡化函数
下载PDF
基于概念格的K-Means算法研究
12
作者 李艳霞 史一民 李冠宇 《计算机工程与设计》 CSCD 北大核心 2011年第2期656-658,662,共4页
针对现有的K-Means算法K值需要人工赋值、随机选取初始中心点、文本表示维度高且缺乏语义的缺陷,提出了一种基于概念格的K-Means算法——K-MeansBCC(K-means algorithm based on concept lattice)。将文本集经预处理转化为形式背景,在... 针对现有的K-Means算法K值需要人工赋值、随机选取初始中心点、文本表示维度高且缺乏语义的缺陷,提出了一种基于概念格的K-Means算法——K-MeansBCC(K-means algorithm based on concept lattice)。将文本集经预处理转化为形式背景,在此基础上生成概念格;利用概念格中的概念表示文本,根据文本中概念的权重确定K值、选取初始中心点。最后设计了文本间的概念相似度计算公式,并由K-Means算法产生聚类结果。实验结果表明,该算法提高了聚类的效率和准确性。 展开更多
关键词 K-MEANS算法 概念格 聚类 概念相似度 初始中心点
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部