期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种K-means改进算法的并行化实现与应用 被引量:50
1
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行kmeans 文本聚类
下载PDF
一种基于Hadoop云计算平台的聚类算法优化的研究 被引量:29
2
作者 张石磊 武装 《计算机科学》 CSCD 北大核心 2012年第S2期115-118,共4页
随着信息技术的飞速发展,需要处理的数据量急剧增长,聚类算法的研究面临着海量数据分析和处理的挑战。对K-means聚类算法的优化进行了深入的研究,提出了首先选定初始聚类中心的并行K-means聚类算法。对不同大小的数据集进行测试实验,证... 随着信息技术的飞速发展,需要处理的数据量急剧增长,聚类算法的研究面临着海量数据分析和处理的挑战。对K-means聚类算法的优化进行了深入的研究,提出了首先选定初始聚类中心的并行K-means聚类算法。对不同大小的数据集进行测试实验,证明该优化算法具有更好的时间性、正确性和稳定性,适合于海量数据的分析和处理。 展开更多
关键词 云计算 HADOOP平台 并行k-means MapReudce 初始化聚类中心
下载PDF
基于约束信息的并行k-means算法 被引量:8
3
作者 於跃成 王建东 +1 位作者 郑关胜 陈斌 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期505-508,共4页
为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束... 为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束信息以chunklet的形式引入到分布式聚类过程,从而引导算法执行有偏搜索.约束并行k-means算法在理论上保证无约束样本簇内距离最小的同时能够确保chunklet约束中的样本与对应的簇中心之间的平均距离最小.实验结果表明,约束并行k-means算法能够有效改善并行k-means的聚类精度,同时在分布式环境下能够得到与已有约束聚类算法在集中式数据集上相等价的聚类结果. 展开更多
关键词 k-means 并行k-means 约束聚类 约束并行k-means
下载PDF
基于Hash改进的k-means算法并行化设计 被引量:5
4
作者 张波 徐蔚鸿 +1 位作者 陈沅涛 朱玲 《计算机工程与科学》 CSCD 北大核心 2016年第10期1980-1985,共6页
为了解决k-means算法在Hadoop平台下处理海量高维数据时聚类效果差,以及已有的改进算法不利于并行化等问题,提出了一种基于Hash改进的并行化方案。将海量高维的数据映射到一个压缩的标识空间,进而挖掘其聚类关系,选取初始聚类中心,避免... 为了解决k-means算法在Hadoop平台下处理海量高维数据时聚类效果差,以及已有的改进算法不利于并行化等问题,提出了一种基于Hash改进的并行化方案。将海量高维的数据映射到一个压缩的标识空间,进而挖掘其聚类关系,选取初始聚类中心,避免了传统k-means算法对随机选取初始聚类中心的敏感性,减少了k-means算法的迭代次数。又结合MapReduce框架将算法整体并行化,并通过Partition、Combine等机制加强了并行化程度和执行效率。实验表明,该算法不仅提高了聚类的准确率和稳定性,同时具有良好的处理速度。 展开更多
关键词 海量数据 HADOOP HASH 并行k-means聚类 中心选取
下载PDF
基于并行k-means聚类的配电网台区无功补偿模块化控制方法
5
作者 凡远柱 《微型电脑应用》 2024年第10期208-212,共5页
配电网台区无功补偿过程中受到配电线损谐波影响,出现电流、电压不平衡而无法抑制无功电流、电压的问题。为了实现配电网台区无功补偿,结合并行k-means聚类算法提出配电网台区无功补偿模块化控制方法。构建模块化多电平换流器稳定无功... 配电网台区无功补偿过程中受到配电线损谐波影响,出现电流、电压不平衡而无法抑制无功电流、电压的问题。为了实现配电网台区无功补偿,结合并行k-means聚类算法提出配电网台区无功补偿模块化控制方法。构建模块化多电平换流器稳定无功补偿控制结构,结合k-means聚类算法归一化计算配电网线损率,避免无功补偿谐波增大而导致电压不平衡,有助于保持无功补偿控制稳定性。采用k-means聚类算法对多个样本分类处理,并将中心样本数据作为聚类中心。结合配电网运行状态,计算电流平衡度,筛选出最佳状态下智能电流控制开关分布状态,改变电流输入和输出的选相,控制无功补偿电流值,保持配电网内部的电流平衡。构建电压正、负序分量变换矩阵,控制目标有功、无功电压。通过引入非闭环控制结构,对实际运行过程中出现的扰动及时纠正,使电压在额定电压调节范围内稳定波动,保持配电网内部电压平衡。由实验结果可知,该方法补偿后无功电流、电压为0,配电网台区主要为有功电流、电压,说明使用该方法能够瞬时抑制无功电流,达到理想补偿效果。 展开更多
关键词 并行k-means聚类 无功补偿 多电平换流器 电流平衡度
下载PDF
一种并行的加速k-均值聚类方法 被引量:2
6
作者 王秀华 《电脑知识与技术》 2013年第6X期4299-4302,共4页
针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作... 针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作集,并在每个工作集上并行进行传统k-均值聚类,并得到相应的聚类中心和半径,通过衡量不同子集聚类结果的关系,对每个工作集中聚类得到的子类进行合并,并对特殊数据进行二次归并以校正聚类结果,从而有效处理海量数据的聚类问题。实验结果表明,Pk_means方法在大规模数据集上在保持聚类效果的同时大幅度提高了聚类效率。 展开更多
关键词 k-均值聚类 并行计算 并行k-均值聚类 工作集 效率
下载PDF
并行K均值聚类和贪婪算法融合的软硬件划分
7
作者 杜敏 王培东 《信息技术》 2008年第4期134-137,共4页
提出了一种并行K均值聚类和贪婪算法融合的软硬件划分算法。算法首先将有相似属性的任务节点通过并行K均值聚类算法组成一个大的任务节点,而后使用贪婪算法划分由大的任务节点组成的系统。实验结果表明,这种软硬件划分的方法具有高效率... 提出了一种并行K均值聚类和贪婪算法融合的软硬件划分算法。算法首先将有相似属性的任务节点通过并行K均值聚类算法组成一个大的任务节点,而后使用贪婪算法划分由大的任务节点组成的系统。实验结果表明,这种软硬件划分的方法具有高效率及高面积利用率的特点,尤其对多节点的复杂任务算法的求解时间远小于贪婪算法。 展开更多
关键词 软硬件协同设计 软硬件划分 贪婪算法 并行k均值聚类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部