基于K-means聚类算法的研究被引量：22

Research of clustering algorithm based on K-means

下载PDF

导出

摘要原始的k-means算法[4]是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度. Original k-means clustering algorithm is the means that selects K centers randomly from the data sample cluster .This selection is blind and random, and to a certain extent the validity of algorithm lies on the selection. In order to avoid the blindness of selection, we should make full use of the information of existing data sample dot. We make pre-treatment of the data to choose the initial center. The experiment improves not only the calculation efficiency of algorithm, but also the precision of ultimate clustering.

作者步媛媛关忠仁

机构地区成都信息工程学院计算机系成都信息工程学院网络中心

出处《西南民族大学学报（自然科学版）》 CAS 2009年第1期198-200,共3页 Journal of Southwest Minzu University(Natural Science Edition)

关键词数据挖掘聚类 K-MEANS算法聚类中心 data mining clustering K-means clustering center

分类号 TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
2连凤娜,吴锦林,唐琦.一种改进的K-means聚类算法[J].电脑与信息技术,2008,16(1):38-40. 被引量：23
3徐义峰,陈春明,徐云青.一种改进的k-均值聚类算法[J].计算机应用与软件,2008,25(3):275-277. 被引量：41
4JIAWEI HAN, MICHELINE KAMBER.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2007. 被引量：4
5袁玉波等著..数据挖掘与最优化技术及其应用[M].北京:科学出版社,2007:206.

二级参考文献14

1陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量：44
2袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
3Han J W Kamber M 范明孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版杜,2001.147-158. 被引量：113
4MacQueen J.Some Methods for Classification and Analysis of Multivariate Observations[C]//Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability,1967. 被引量：1
5Wang Wei,Yang Jiong,Muntz R.STING:A Statistical Information Grid Approach to Spatial Data Mining[C]//Proc.of the 23rd International Conference on Very Large Data Bases,1997. 被引量：1
6Agrawal R,Gehrke J,Gunopulcs D.Automatic Subspace Clustering of High Dimensional Data for Data Mining Application[C]//Proc.of ACM SIGMOD Intconfon Management on Data,Seattle,WA,1998:94-205. 被引量：1
7Guha S,Rastogi R,Shim K.Cure:An Efficient Clustering Algorithm for Large Database[C]//Proc.of ACM-SIGMOND Int.Conf.Management on Data,Seattle,Washington,1998:73-84. 被引量：1
8Kaufan L, Rousseeuw Pj. Finding Groups in Data: an Introduction to Cluster Analysis[M]. New York: John Wiley & Sons, 1990. 被引量：1
9Guha S, Rastogi R, Shim K. CURE: an efficient clustering algorithm for large databased[C]. In Haas LM, Tiwary A eds. Proceedings of the ACM SIGMOD International Conference on Management of Data, Sesttle: ACM Press, 1998:73-84. 被引量：1
10Kurniawan A, Benech N, Tao Yufei. Towards High-dimensional Clustering [ J ]. COMP, November 1999 : 1-2. 被引量：1

共引文献205

1赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：4
2段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
3张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
4王秀芳,王岩.优化K均值随机初始中点的改进算法[J].化工自动化及仪表,2012,39(10):1302-1304. 被引量：4
5鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.欧氏距离的加权处理对K-means法聚类效果的改进[J].中国医院统计,2008,15(1):9-12. 被引量：1
6高燕飞,陈俊杰,强彦.自适应数据库中基于特征向量的聚类算法的研究与改进[J].电脑开发与应用,2008,21(7):57-58.
7强彦,陈俊杰,高燕飞.自适应数据库中基于特征向量的聚类算法[J].计算机工程与应用,2008,44(27):162-164. 被引量：2
8花海洋,赵怀慈.聚类算法在银行客户细分中的应用[J].计算机工程,2008,34(24):37-39. 被引量：5
9刘文远,杨丹丹,王宝文.IRP中基于聚类分析的主题数据库划分研究[J].情报杂志,2009,28(1):17-18. 被引量：2
10陈森平,陈启买.基于熵的K均值算法的改进[J].广东技术师范学院学报,2008,29(9):27-29. 被引量：2

同被引文献141

1符保龙,黄崇争.基于免疫遗传退火算法的Web关联规则挖掘方法[J].计算机应用研究,2009,26(2):478-480. 被引量：3
2朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
3徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
4张雪,李隆云,陈大霞,王钰.川续断种子质量分级标准的研究[J].中国中药杂志,2012,37(1):37-40. 被引量：23
5张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
6张万军,樊甫华,谭营.聚类方法在雷达信号分选中的应用[J].雷达科学与技术,2004,2(4):219-223. 被引量：36
7赵立江,何钦铭.一种个性化Web推荐系统的研究与实现[J].武汉理工大学学报（交通科学与工程版）,2004,28(5):681-684. 被引量：14
8陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量：44
9袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
10姜园,张朝阳,仇佩亮,周东方.用于数据挖掘的聚类算法[J].电子与信息学报,2005,27(4):655-662. 被引量：67

引证文献22

1周文鹏.基于数据挖掘的个性化网页推送服务模式研究[J].计算机与数字工程,2010,38(8):58-61. 被引量：4
2黄美璇.一种基于Kmax的K-means改进算法[J].佛山科学技术学院学报（自然科学版）,2010,28(2):49-52. 被引量：1
3周爱武,于亚飞.K-Means聚类算法的研究[J].计算机技术与发展,2011,21(2):62-65. 被引量：134
4周锐,胡学钢.基于聚类的决策树连续属性离散化改进算法[J].微计算机信息,2011,27(6):183-184. 被引量：1
5肖强,钱晓东.基于K-means算法的Web访问用户关联规则挖掘算法[J].图书情报工作,2011,55(16):136-139. 被引量：1
6李卓君.一种改进的K-means算法[J].科技创业月刊,2012,25(1):134-135. 被引量：3
7赵立子,张婕,魏建和,隋春,金钺,杨成民,褚庆龙.柴胡种子质量分级标准[J].中国农学通报,2012,28(7):207-211. 被引量：12
8陈英,何中市,黄敏.一种优化的K-means聚类中心算法研究[J].制造业自动化,2012,34(8):19-22. 被引量：5
9马宝秋,连翠玲,赵旭.基于距离的K-Means划分式聚类算法及其编程实现[J].河北省科学院学报,2013,30(4):17-21.
10关欣,孙祥威,曹昕莹.改进的K-Means算法在特征关联中的应用[J].雷达科学与技术,2014,12(1):81-85. 被引量：5

二级引证文献190

1赵翠翠,尹春华.K-means和SOM在商品评论中的情感词聚类对比[J].北京信息科技大学学报（自然科学版）,2020,35(1):23-26. 被引量：6
2李杨,杨建宇,范竹雯,郑绍明,柳越冬,祝庆明,严雪梅,陆锦锐,张朝杰,张德鸿,祝之友(指导).中国道地药材研究近况系列(11)道地药材黄芩的研究近况[J].光明中医,2020(7):1106-1109. 被引量：4
3符丁,尹卓英.关联规则挖掘发现问题的协同式需求获取方法[J].计算机与数字工程,2011,39(4):63-66. 被引量：4
4申彦,宋顺林,朱玉全.一种基于半监督的大规模数据集聚类算法[J].南京大学学报（自然科学版）,2011,47(4):372-382. 被引量：1
5吴家鑫,张国栋,刘晓洁,齐鹏,郑应华,何继红,宋敏,葛辛玫,王华丽,曹芹.聚类分析在黄霉素发酵过程中的应用[J].微生物学通报,2012,39(6):865-871. 被引量：12
6孙平安.基于维分量簇中心为初始中心的多维k-means聚类算法[J].曲阜师范大学学报（自然科学版）,2012,38(4):65-69.
7张力,陈健,潘琳,胡益芳.面向“功能受限”通讯终端的DL信息服务技术[J].图书馆理论与实践,2013(1):86-88.
8缪凯.基于K-MEANS算法的山东省金融IC卡城市推广规划[J].科技信息,2013(1):461-461.
9张磊,张公让,张金广.一种网格化聚类算法的MapReduce并行化研究[J].计算机技术与发展,2013,23(2):60-64. 被引量：3
10兰远东,刘宇芳,徐涛.分批处理的K-means算法并行实现[J].计算机工程,2012,38(13):145-147. 被引量：2

1袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
2P.J.Denning,张晓东.设计智能系统的盲目性[J].世界科学,1989,11(11):9-10.
3马翩翩,苏一丹,覃华,王晓帅.一种基于D^2权重的核k-means聚类算法[J].微电子学与计算机,2012,29(7):85-89. 被引量：1
4谢会娟,佘为,钟声.基于ASP.NET实现随机选取考题的研究[J].信息技术,2010,34(9):66-68. 被引量：1
5曹文平.一种有效k-均值聚类中心的选取方法[J].计算机与现代化,2008(3):95-97. 被引量：9
6张凤蛟.快速曲线拟合的方法[J].延边大学学报（自然科学版）,2006,32(3):208-211. 被引量：4
7乔涵丽,马昌凤.确定NMF基个数的能量提取法[J].桂林电子科技大学学报,2012,32(6):487-489. 被引量：2
8崔新维,孙棒,胡成明.优化方法——围法[J].机械研究与应用,2010,23(2):38-40.
9王娟.一种高效的K-means聚类算法[J].科技信息,2012(25):168-168. 被引量：1
10孙平安.基于维分量簇中心为初始中心的多维k-means聚类算法[J].曲阜师范大学学报（自然科学版）,2012,38(4):65-69.

西南民族大学学报（自然科学版）

2009年第1期

浏览历史

内容加载中请稍等...

基于K-means聚类算法的研究被引量：22

参考文献5

二级参考文献14

共引文献205

同被引文献141

引证文献22

二级引证文献190

相关作者

相关机构

相关主题

浏览历史

基于K-means聚类算法的研究 被引量：22

参考文献5

二级参考文献14

共引文献205

同被引文献141

引证文献22

二级引证文献190

相关作者

相关机构

相关主题

浏览历史

基于K-means聚类算法的研究被引量：22