基于K-Means的搜索结果聚类方法被引量：3

A Search Results Clustering Method Based on K-Means

下载PDF

导出

摘要 K-Means算法是一种常用的聚类算法。通过分析传统K-Means聚类算法可知,该算法随机选取聚类中心并需要手动设定聚类个数,因此容易出现局部最优、稳定性差,适用范围窄的问题。为了改善聚类结果,对K-Means算法进行了改进,根据文本距离确定初始聚类中心,并在初始聚类完成后,对聚类进行合并,形成最终的聚类结果。实验结果表明,改进后的K-Means算法提高了聚类的查准率和查全率。 K-Means algorithm is one of common clustering algorithms.Through the analysis of the traditional K-Means algorithm,the algorithm selects the cluster center randomly and set the number of clusters manually,so it has deficiencies of local optimum,poor stability and narrow application range.In order to improve the clustering results,this paper improves K-Means clustering algorithm.The initial clustering centers are determined according to the text distance and the clusters are merged after the initial clustering is completed to form the final clustering results.

作者刘宇征邵家玉

机构地区东南大学自动化学院

出处《工业控制计算机》 2018年第3期65-66,69,共3页 Industrial Control Computer

关键词搜索结果聚类 K-MEANS 聚类中心合并聚类 search results clustering K-Means clustering center merging clustering

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1刘华斌..Web搜索引擎的搜索结果聚类研究[D].南昌大学,2008:
2张丽平..一种面向标签质量的检索结果聚类方法[D].华南理工大学,2011:
3谢红伟..基于Nutch的聚类搜索引擎的研究与实现[D].华南理工大学,2013:
4党秋月..基于语义的搜索结果聚类方法研究[D].北京邮电大学,2013:
5柏晗,成颖,柯青.网络检索结果聚类研究综述[J].情报理论与实践,2015,38(10):138-144. 被引量：2
6谢娟英,王艳娥.最小方差优化初始聚类中心的K-means算法[J].计算机工程,2014,40(8):205-211. 被引量：87
7孙珊珊..基于网页聚类的搜索引擎结果排序[D].中国石油大学(华东),2010:
8陈菊红..搜索引擎返回结果聚类技术的研究与实现[D].西南交通大学,2009:

二级参考文献76

1张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61
2钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
3夏斌,徐彬.基于超链接信息的搜索引擎检索结果聚类方法研究[J].电脑开发与应用,2007,20(5):16-17. 被引量：1
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
5盛骤,谢式千,潘承毅.概率论与数理统计[M].2版.北京:高等教育出版社,1997:18-28. 被引量：1
6Han Jiawei,Kamber M.Data Mining:Concepts and Techniques[M].2nd ed.Beijing,China:China Machine Press,2011. 被引量：1
7Pena J M,Lozano J A,Larranaga P.An Empirical Comparison of Four Initialization Methods for the K Means Algorithm[J].Pattern Recognition Letters,1999,20(10):1027-1040. 被引量：1
8Vance F.Clustering and the Continuous K-Means Algorithm[J].Los Alamos Science,1994,22:138-134. 被引量：1
9Jain A K,Murty M N,Flynn P J.Data Clustering:A Review[J].ACM Computing Survey,1999,31 (3):264-323. 被引量：1
10Kaufman L,Rousseeuw P J.Finding Groups in Data:An Introduction to Cluster Analysis[M].New York,USA:John Wiley & Sons,Inc.,1990. 被引量：1

共引文献87

1张晓倩,曲福恒,杨勇,才华,梁鲜.一种高效的基于初始聚类中心优化的K-means算法[J].长春理工大学学报（自然科学版）,2015,38(4):154-158. 被引量：6
2张小川,严杰,朱常鹏.聚类算法在市政绩效评估中的应用[J].软件导刊,2015,14(11):48-51. 被引量：2
3罗亚松,许江湖,胡洪宁,贺静波,陈占伟.正交频分复用传输速率最大化自适应水声通信算法研究[J].电子与信息学报,2015,37(12):2872-2876. 被引量：6
4蔡宇浩,梁永全,樊建聪,李璇,刘文华.加权局部方差优化初始簇中心的K-means算法[J].计算机科学与探索,2016,10(5):732-741. 被引量：11
5傅城州,汤庸,贺超波,王津凌,袁成哲.基于标签相似度计算的学术圈构建方法[J].计算机科学,2016,43(9):52-56. 被引量：5
6朱纯,吴建华,潘毅.关于优化K-medoids聚类算法搜索策略研究[J].计算机仿真,2016,33(10):244-248. 被引量：4
7张明微,吴海涛.一种优化初始聚类中心的k-means算法[J].上海师范大学学报（自然科学版）,2016,45(5):599-603. 被引量：2
8吕琳,尉永清,任敏,潘晓.基于蚁群优化算法的凝聚型层次聚类[J].计算机应用研究,2017,34(1):114-117. 被引量：16
9刘萍,龚雪飞,简家文,张帆,陈志芸.k-means-RBF集成神经网络在工业尾气检测中的应用[J].宁波大学学报（理工版）,2017,30(1):116-120. 被引量：1
10陈蕾,赵霞,贾嫣,魏霖静.关于人的语音声调准确识别仿真[J].计算机仿真,2017,34(3):161-164. 被引量：2

同被引文献39

1曹洪其,余岚,孙志挥.基于网格聚类技术的离群点挖掘算法[J].计算机工程,2006,32(11):119-121. 被引量：15
2孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079
3孟子健,马江洪.一种可选初始聚类中心的改进k均值算法[J].统计与决策,2014,30(12):12-14. 被引量：18
4姚长青,杜永萍.降维技术在专利文本聚类中的应用研究[J].情报学报,2014,33(5):491-497. 被引量：12
5侯荣涛,路郁,王琴,周彬.基于精细簇的K-Means文本聚类[J].计算机工程与设计,2015,36(7):1794-1799. 被引量：2
6张素洁,赵怀慈.最优聚类个数和初始聚类中心点选取算法研究[J].计算机应用研究,2017,34(6):1617-1620. 被引量：82
7王海燕,桑晓斐,赵可云.基于大数据的大学生网络行为分析研究[J].中国教育信息化,2017,23(13):6-10. 被引量：6
8刘先花.基于群体协同智能聚类的大数据存储系统设计[J].现代电子技术,2017,40(23):130-133. 被引量：7
9廖礼.K-means算法及其改进算法[J].科教导刊（电子版）,2017,0(30):268-268. 被引量：1
10游香薷,王业,杨抒,王斌.基于聚类算法的学生消费行为分析研究和应用[J].自动化技术与应用,2017,36(12):32-35. 被引量：6

引证文献3

1张海华,李楠楠.基于大数据K-means聚类算法的在线学习行为路径的研究[J].电子设计工程,2020,28(12):17-20. 被引量：13
2王荻智,李建宏,施运梅.基于K-means的政府公文聚类方法[J].软件导刊,2020,19(6):201-204. 被引量：3
3李鑫伟,刘瑞哲.大数据聚类算法在成品油输油管道泄漏检测中的应用[J].石油库与加油站,2022,31(1):1-5. 被引量：1

二级引证文献17

1吴安迪,蒋文明.基于数据挖掘的《景岳全书·血证》用药规律分析[J].中药药理与临床,2022,38(1):201-206. 被引量：3
2尚珍宇(译),程可欣,简钰清,王志芳,王颖(译),周佳怡(译).社交媒体文本数据分析方法对比与适用性研究:以北京市城市公园感知为例[J].景观设计学（中英文）,2023,11(5):8-29. 被引量：1
3徐送宁,孙树滋.N^+注入Ag薄膜晶体生长机制的研究[J].沈阳工业学院学报,2000,19(1):8-11.
4王婷,翟翼.基于K-means聚类算法在线学习行为路径的研究[J].通讯世界,2020,27(8):109-110.
5宋龙虎.基于大数据技术的网络资源管理系统设计[J].信息工程大学学报,2020,21(6):747-751. 被引量：5
6刘传波.基于情报大数据的目标活动规律分析[J].舰船电子工程,2021,41(3):37-41. 被引量：1
7刘易,陈芳芳,解海翔,盖佳郇,徐天奇.基于弹性冲击波技术的输电杆塔螺栓快速检测及定位诊断[J].电子设计工程,2021,29(13):87-90. 被引量：1
8佘春燕.混合教学模式下高职学生在线课程学习行为有效性研究[J].无线互联科技,2022,19(2):145-146. 被引量：1
9王婷.大数据背景下基于K-means聚类算法的在线学习行为路径分析与研究[J].网络安全技术与应用,2022(5):43-45. 被引量：3
10郑冬花,叶丽珠,隋栋,黄锦涛.云计算环境中面向大数据的改进密度峰值聚类算法[J].济南大学学报（自然科学版）,2022,36(5):592-596. 被引量：5

1李俊.基于改进的密度层次的K-均值算法研究[J].福建电脑,2018,34(1):114-115.
2丁霞,张晓飞,易鸣.组织特异性蛋白质复合体的识别[J].数学杂志,2017,37(5):1093-1100.
3侯美玲.毒素[J].山西老年,2018,0(3):53-53.
4李彦明.基于改进RPCL的K-means聚类算法[J].甘肃科技,2018,34(4):59-62. 被引量：1
5贾瑞玉,李玉功.类簇数目和初始中心点自确定的K-means算法[J].计算机工程与应用,2018,54(7):152-158. 被引量：50
6王伟峰,钮亮,刘颖,余允涛,麻吕斌.基于Getis-Ord G_i~*统计的地区用电量多元空间聚类方法研究[J].内蒙古电力技术,2018,36(1):15-20. 被引量：4
7王晨曦.基于聚类算法k-means的异常检测系统[J].电子技术与软件工程,2018(6):188-188. 被引量：3
8胡明娣,孔波.基于改进的颜色和形状特征融合的图像检索[J].西安文理学院学报（自然科学版）,2018,21(2):28-33. 被引量：6
9韩浩月.虚拟城市真实人生[J].现代交际,2002,0(10):48-48.
10张伟鹏,李振军,李荣华,刘宇鸿,毛睿,乔少杰.基于MapReduce的图结构聚类算法[J].软件学报,2018,29(3):627-641. 被引量：4

工业控制计算机

2018年第3期

浏览历史

内容加载中请稍等...

基于K-Means的搜索结果聚类方法被引量：3

参考文献8

二级参考文献76

共引文献87

同被引文献39

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于K-Means的搜索结果聚类方法 被引量：3

参考文献8

二级参考文献76

共引文献87

同被引文献39

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于K-Means的搜索结果聚类方法被引量：3