空间投影在K-means算法中的研究与应用被引量：7

Research and Application of Spatial Projection in K-means Algorithm

下载PDF

导出

摘要为了加快K-means计算速度和寻找最优聚类子空间,使用特定的变换矩阵对数据进行投影,将特征空间划分为聚类空间和噪声空间,前者包含全部空间结构信息,后者不包含任何信息。将噪声空间舍弃,在聚类空间下进行K-means每一次迭代。算法不同于PCA K-means先降维再聚类,而是在迭代过程中达到筛选维度的效果,并将保留的维度反馈给下一次迭代,同时聚类空间的维度信息是自动发现的,没有引入额外的参数。实验证明AC Kmeans算法相较于已有同类型算法在准确度和计算时间方面都得到了大幅提升。 In order to speed up K-means computation and find the optimal clustered subspace, the data are projected using a specific transformation matrix, and the feature space is divided into clustered space and noise space. The former contains all spatial structure information, while the latter does not contain any information. The noise space is discarded and K-means is performed in the clustering space. The algorithm is different from PCA K-means in that it first reduces dimension and then clusters, but achieves the effect of dimension selection in the iteration process, and feeds the retained dimension back to the next iteration. At the same time, the dimension information of clustered space is automatically found without introducing additional parameters. Experiments show that the accuracy and computation time of the AC K-means algorithm are greatly improved compared with the existing similar algorithms.

作者王义武杨余旺 WANG Yiwu;YANG Yuwang(College of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China)

机构地区南京理工大学计算机科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2020年第7期200-204,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61640020) 江苏省农业自主创新项目(No.CX(13)3054,No.CX(16)1006) 江苏省重点研发计划项目(No.BE2016368-1) 江苏省科技重点及面上项目(No.SBE2018310371)。

关键词 K-MEANS算法空间投影最优子空间加速降维 K-means algorithm spatial projection optimal subspace acceleration dimensionality reduction

分类号 TP301.06 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1高亮,谢健,曹天泽.基于Kd树改进的高效K-means聚类算法[J].计算技术与自动化,2015,34(4):69-74. 被引量：7
2林玉娥,顾国昌,刘海波.2维不相关鉴别矢量集算法[J].中国图象图形学报,2009,14(5):944-949. 被引量：1
3何云斌,刘雪娇,王知强,万静,李松.基于全局中心的高密度不唯一的K-means算法研究[J].计算机工程与应用,2016,52(1):48-54. 被引量：10
4叶学义,王大安,宦天枢,夏经文,顾亚风.基于张量的2D-PCA人脸识别算法[J].计算机工程与应用,2017,53(6):1-6. 被引量：7
5万静,张义,何云斌,李松.基于KD-树和K-means动态聚类方法研究[J].计算机应用研究,2015,32(12):3590-3595. 被引量：16
6薛印玺,许鸿文,李羚.基于样本密度的全局优化K均值聚类算法[J].计算机工程与应用,2018,54(14):143-147. 被引量：14
7张顺龙,库涛,周浩.针对多聚类中心大数据集的加速K-means聚类算法[J].计算机应用研究,2016,33(2):413-416. 被引量：28

二级参考文献84

1陈绵书,陈贺新,刘伟.一种新的求解无相关鉴别矢量集方法[J].计算机学报,2004,27(7):913-917. 被引量：10
2陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
3吴小俊,杨静宇,王士同,Josef Kittler.广义统计不相关最优鉴别矢量集的一个理论结果[J].电子学报,2004,32(10):1720-1722. 被引量：4
4吴小俊,杨静宇,王士同,Josef Kittler,陆介平.改进的统计不相关最优鉴别矢量集[J].电子与信息学报,2005,27(1):47-50. 被引量：8
5刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
6Belhumeur P N, Hespanha J P, Kriegman D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection [ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997,19(7) :711-720. 被引量：1
7Foloy D H, Sammon J W. An optimal set of vecors[J].IEEE Transactions on Computers, 1975,24 ( 3 ) :281-289. 被引量：1
8Yang Jian, Zhang David, Xa Yong, et al. Two-dimensional diseriminant transform for face recognition [ J ]. Pattern Recognition,2005,38 ( 7 ) : 1125-1129. 被引量：1
9Kirby M, Sirovich L. Application of the Karhunen-Loeve procedure for the charaterizatian of human faces [ J ] . IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990,12 ( 1 ) : 103-108. 被引量：1
10Yang Jian, Zhang David, Frangi Alejandro, et al. Two-dimensional PCA a new approach to appearance-based face representation and recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence ,2004,26 ( 1 ) : 131 - 137. 被引量：1

共引文献76

1周润,滕奇志.基于改进DBSCAN算法的金相图像晶粒聚集检测方法[J].智能计算机与应用,2021,11(4):44-48. 被引量：1
2周文振,陈国良,杜珊珊,李飞.一种聚类改进的迭代最近点配准算法[J].激光与光电子学进展,2016,53(5):196-202. 被引量：11
3叶李.传感器网络时间序列数据的事件分类研究[J].重庆邮电大学学报（自然科学版）,2016,28(3):421-425. 被引量：1
4刘宝龙,苏金.双MapReduce改进的Canopy-Kmeans算法[J].西安工业大学学报,2016,36(9):730-737. 被引量：6
5刘岩,王存睿.基于抽样融合改进的大数据聚类方法[J].微电子学与计算机,2017,34(4):17-21. 被引量：12
6徐爱萍,王波,徐武平.HBase中基于时空特征的监测视频大数据关联查询研究[J].计算机应用研究,2017,34(5):1423-1427. 被引量：4
7杨宗宪,邬春学,高丽萍,朱思征,王山山.支持三级缓存的移动小组域实时协同模型研究[J].小型微型计算机系统,2017,38(5):972-976. 被引量：1
8李淋淋,倪建成,曹博,于苹苹,姚彬修.基于Spark框架的并行聚类算法[J].计算机技术与发展,2017,27(5):97-101. 被引量：6
9郁启麟.K-means算法初始聚类中心选择的优化[J].计算机系统应用,2017,26(5):170-174. 被引量：25
10罗嗣卿,刘璐.改进K-means算法对大兴安岭蓝莓干销售预测的应用[J].黑龙江大学自然科学学报,2017,34(2):139-144. 被引量：2

同被引文献78

1杜佳颖,段隆振,段文影,卜秋瑾.基于Spark的改进K-means算法的并行实现[J].计算机应用研究,2020,37(2):434-436. 被引量：13
2代才,石晓琪.基于新的适应度函数和多搜索策略的高维多目标进化算法[J].计算机应用研究,2020,37(1):85-88. 被引量：11
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
5孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079
6赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
7熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：86
8王骏,王士同,邓赵红.特征加权距离与软子空间学习相结合的文本聚类新方法[J].计算机学报,2012,35(8):1655-1665. 被引量：22
9张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
10毕凯,王晓丹,邢雅琼.基于模糊测度和证据理论的模糊聚类集成方法[J].控制与决策,2015,30(5):823-830. 被引量：17

引证文献7

1马克勤,杨延娇,秦红武,耿琳,王丕栋.结合最大最小距离和加权密度的K-means聚类算法[J].计算机工程与应用,2020,56(16):50-54. 被引量：21
2王子龙,李进,宋亚飞.基于距离和权重改进的K-means算法[J].计算机工程与应用,2020,56(23):87-94. 被引量：36
3相益萱,姜合,潘品臣,孙聪慧.二次幂耦合的K-means聚类算法研究[J].计算机工程与应用,2021,57(14):95-102. 被引量：6
4郭晓军,王云峰,朱亮.基于时序特征提取的用户群体划分模型[J].中国电子科学研究院学报,2021,16(6):592-598. 被引量：1
5孙林,刘梦含,徐久成.基于优化初始聚类中心和轮廓系数的K-means聚类算法[J].模糊系统与数学,2022,36(1):47-65. 被引量：45
6韩煜,王青,刘丽娜.K-means聚类算法的优化研究[J].软件,2023,44(10):58-61. 被引量：4
7衣天龙,邵琦,李秋元.基于优化覆盖算法的异构多模态信息检索方法[J].计算机仿真,2024,41(10):493-496.

二级引证文献109

1滑江,孙钰,周彦斌,蔡曙日,龚尚文.基于K-means方法的气象数据分区在公路养护的应用[J].公路交通科技,2022,39(S01):19-23. 被引量：1
2郭宗祥.基于属性相似度与聚类的知识服务匹配研究[J].组合机床与自动化加工技术,2020(9):171-174. 被引量：2
3孙鹏,杨杉.基于K-means算法的亚洲足球聚类研究[J].电子技术与软件工程,2020(21):162-163. 被引量：1
4曾如明,李云飞.K-means聚类算法的一种改进方法研究[J].邵阳学院学报（自然科学版）,2021,18(2):8-14. 被引量：7
5张军,宣铁锋,吴磊.基于电网运行数据集的有功网损评估优化[J].现代计算机,2021,27(7):20-23.
6赵国伟,蔡江辉,杨海峰,荀亚玲.一种基于属性加权的快速聚类算法[J].计算机与数字工程,2021,49(5):930-935. 被引量：2
7赵学武,吴宁,王军,阮利,李玲玲,徐涛.航空大数据研究综述[J].计算机科学与探索,2021,15(6):999-1025. 被引量：14
8余姚果,梅亚东,王现勋,朱迪,吴贞晖,张祥.基于改进SBR的风电出力典型场景提取与分析[J].武汉大学学报（工学版）,2021,54(4):346-353. 被引量：4
9曾鸣,姜慧玲.网络群体性事件微博舆情主题演化研究[J].信息与管理研究,2021,6(2):28-40. 被引量：2
10郑芯瑜,刘必林,孔祥洪,王雪辉.基于K-means动态聚类的鸢乌贼角质颚模式识别[J].渔业科学进展,2021,42(4):64-72. 被引量：1

1仵博,何国坤,陈锐浩.深度融入教育教学全过程的教育信息化体系构建和实践[J].世界教育信息,2019,32(23):71-74. 被引量：3
2李日扬.基于Logistics的中小微企业信用评价研究[J].市场周刊,2019,0(11):133-134.
3谌力.Dynatrace推动云环境之下的智能化运维与开发管理[J].新金融世界,2019,0(11):57-57.
4范学田,李生彬,折伟强,柴芙蓉,陈钊.天祝县中心城区区域噪声分析与防治对策研究[J].科技与创新,2020,0(3):8-9. 被引量：3
5李建勋,唐子豪,张永进,王小江.基于Kriging方法和Pettitt检验的数据冲突判别[J].计算机工程与应用,2020,56(3):86-93. 被引量：4
6孙宏斌,黄天恩,郭庆来,张伯明,郭文鑫,刘文涛,徐泰山,许涛.面向调度决策的智能机器调度员研制与应用[J].电网技术,2020,44(1):1-8. 被引量：43
7向红艳,徐莲怡.基于分数阶拓展算子GM(1,1)模型的高速公路养护成本预测[J].中外公路,2020,40(1):278-282. 被引量：6
8黄永鑫,唐雪飞.基于近邻传播聚类和TANE算法的高校数据中函数依赖的发现[J].计算机应用,2020,40(1):90-95. 被引量：3
9温粉莲.一种混合模型的时序数据异常检测方法[J].数字通信世界,2020(1):15-16. 被引量：3
10郑鑫江,许枫,杨娟.一种改进的水下小目标跟踪算法仿真[J].计算机仿真,2020,37(1):244-248.

计算机工程与应用

2020年第7期

浏览历史

内容加载中请稍等...

空间投影在K-means算法中的研究与应用被引量：7

参考文献7

二级参考文献84

共引文献76

同被引文献78

引证文献7

二级引证文献109

相关作者

相关机构

相关主题

浏览历史

空间投影在K-means算法中的研究与应用 被引量：7

参考文献7

二级参考文献84

共引文献76

同被引文献78

引证文献7

二级引证文献109

相关作者

相关机构

相关主题

浏览历史

空间投影在K-means算法中的研究与应用被引量：7