海量数据信息中的迭代聚类过程的改进研究被引量：4

Iterative Clustering Process Improvement Research in Huge Amounts of Data Information

下载PDF

导出

摘要对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。 Iterative clustering of huge amounts of data information can provide accurate basis for data mining, has important application value. Traditional algorithm for the selection of initial parameters is too sensitive, which reduces the iterative clustering accuracy. Put forward based on information and belongs to the huge amounts of data clustering of iterative clustering method. Adopting the membership degree deviation is the calculation of data clustering center, determine the clustering center of the data and information; Use class as the distance between and clustering discriminant standard, used to determine the data information characteristic and the clustering center distance; Characteristics of huge amounts of data information and classifies the calculation result of clustering center, processing, until all the clustering center of the data information and return to the end of the iterative clustering to obtain accurate results. The simulation experimental results show that the improved algorithm can improve the huge amounts of data information of iterative clustering results, the effect is satisfactory.

作者穆肇南

机构地区贵州商学院

出处《科技通报》北大核心 2016年第4期152-155,共4页 Bulletin of Science and Technology

关键词海量数据信息迭代聚类并归 huge amounts of data information iterative clustering and return

分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1陈克寒,韩盼盼,吴健.基于用户聚类的异构社交网络推荐算法[J].计算机学报,2013,36(2):349-359. 被引量：125
2胡伟.改进的层次K均值聚类算法[J].计算机工程与应用,2013,49(2):157-159. 被引量：63
3陈科尹,邹湘军,熊俊涛,彭红星,郭艾侠,陈丽娟.基于视觉显著性改进的水果图像模糊聚类分割算法[J].农业工程学报,2013,29(6):157-165. 被引量：53
4曾接贤,王军婷,符祥.K均值聚类分割的多特征图像检索方法[J].计算机工程与应用,2013,49(2):226-230. 被引量：25
5周婷,张君瑛,罗成.基于Hadoop的K-means聚类算法的实现[J].计算机技术与发展,2013,23(7):18-21. 被引量：24
6王超,徐肖豪,王飞.基于航迹聚类的终端区进场程序管制适用性分析[J].南京航空航天大学学报,2013,45(1):130-139. 被引量：40
7马志刚.基于小波分析的车辆噪声特征提取方法研究[J].电子设计工程,2010,18(1):1-2. 被引量：8

二级参考文献106

1李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
2司永胜,刘刚,高瑞.基于K-均值聚类的绿色苹果识别技术[J].农业机械学报,2009,40(S1):100-104. 被引量：50
3孙君顶,武学东,周利华.基于颜色和形状的图像检索[J].计算机科学,2004,31(5):180-183. 被引量：11
4孙君顶,崔江涛,毋小省,周利华.基于颜色和形状特征的彩色图像检索方法[J].中国图象图形学报（A辑）,2004,9(7):820-827. 被引量：30
5叶秀清,顾伟康,肖强.快速模糊分割算法[J].模式识别与人工智能,1996,9(1):66-70. 被引量：27
6李在庭,高德勇,何遵文.直升机声信号特征提取和识别技术[J].兵工学报,1996,17(1):55-59. 被引量：19
7贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
8杨新湦,丁松滨,赵磊,冯学伟.宁波栎社机场进离场程序的优化[J].中国民航大学学报,2007,25(3):8-12. 被引量：5
9欧阳军林,夏利民.基于二值信息的颜色和形状特征的图像检索[J].小型微型计算机系统,2007,28(7):1262-1266. 被引量：10
10谢崇宝,袁宏源,郭元裕.最优分类的模糊划分聚类改进方法[J].系统工程,1997,15(1):58-63. 被引量：12

共引文献329

1陈西江,安庆,班亚,王德欣,李坤,刘海鹏.融合高斯核及指数函数聚类的点云目标物提取[J].应用科学学报,2022,40(3):411-422.
2谭儒婷,曾丁丁,武艳雯,徐淑云,温芝元.树上椪柑的最优色差分量机器识别的方法研究[J].湖南农业科学,2013(12):120-122. 被引量：2
3唐勇,刘海波,张铁壁.基于小波技术的疲劳驾驶行为识别研究[J].仪表技术与传感器,2011(1):49-51. 被引量：4
4穆建晔,田碧洁.影响经济发展的文化因素及其扬弃[J].学术交流,2000(3):36-38.
5李童玉,王伟刚.PLC实现定量给料机的集中分解控制[J].水泥科技,2000(T00):27-29.
6刘满芝,高晓峰,屈传智,周梅华,殷馨.中国煤炭需求波动规律研究[J].资源科学,2013,35(4):681-689. 被引量：16
7蔡志华.基于K均值聚类的彩色图像快速分割方法[J].计算机与数字工程,2013,41(8):1328-1330. 被引量：6
8谢璐,金志刚,王颖.基于视频稳像和视角变换的公交客流计数方法[J].计算机应用,2013,33(10):2926-2930. 被引量：6
9郭杰,陈健生,向守兵,雷刚.基于机器视觉的精密铸铁平板刮研质量检测[J].四川师范大学学报（自然科学版）,2013,36(5):787-791. 被引量：1
10项荣,应义斌,蒋焕煜.田间环境下果蔬采摘快速识别与定位方法研究进展[J].农业机械学报,2013,44(11):208-223. 被引量：76

同被引文献49

1刘立拓,刘建国,赵南京,鲁翠萍,陈东,石焕,王春龙,张玉钧,刘文清.激光诱导击穿光谱数据特征自动提取方法研究[J].光谱学与光谱分析,2011,31(12):3285-3288. 被引量：5
2魏雪峰,刘晓.基于2维最大熵最佳阈值算法的图像分割研究[J].激光技术,2013,37(4):519-522. 被引量：11
3陈凯,张达,张元生.采空区三维激光扫描点云数据处理方法[J].光学学报,2013,33(8):117-122. 被引量：40
4范士俊,张爱武,胡少兴,孙卫东.基于随机森林的机载激光全波形点云数据分类方法[J].中国激光,2013,40(9):216-222. 被引量：29
5曹忆南,王新伟,周燕.距离选通激光成像空间定位模糊C均值聚类分割法[J].红外与激光工程,2013,42(10):2682-2686. 被引量：7
6刘希亮,陈桂明,李方溪,张倩.采用聚类分析的冲突证据判定及合成方法[J].红外与激光工程,2013,42(10):2853-2857. 被引量：5
7熊平,朱天清,顾霄.基于信息增益比例约束的数据匿名方法及其评估机制[J].计算机应用研究,2014,31(3):819-824. 被引量：2
8史丽燕,谷保平,姚学礼.基于改进K-匿名算法的个人信息隐私保护应用[J].计算机仿真,2014,31(3):217-220. 被引量：3
9王建仁,魏龙,段刚龙,黄梯云.自适应学习的多特征元素协同表示分类算法[J].计算机应用,2014,34(4):1094-1098. 被引量：3
10周景才,张沪寅,查文亮,陈毅波.云计算环境下基于用户行为特征的资源分配策略[J].计算机研究与发展,2014,51(5):1108-1119. 被引量：35

引证文献4

1胡闽.云平台海量数据中提取用户信息数学建模仿真[J].计算机仿真,2017,34(4):311-314. 被引量：2
2丁慧洁.不可信任环境下敏感数据自动匿名方法仿真[J].计算机仿真,2017,34(5):257-260.
3平金珍,王茜,师硕.激光传感中冗余数据的挖掘方法设计[J].激光杂志,2018,39(5):138-141.
4梁燕红.属性受限状态下低维冗余聚类数据快速挖掘方法[J].科学技术与工程,2018,18(9):107-111. 被引量：1

二级引证文献3

1韦存存.激光数据存储结构稳定性分布模型设计[J].激光杂志,2018,39(10):111-114. 被引量：1
2崔彦青.动态分块网页主题信息准确自动提取仿真[J].计算机仿真,2019,36(10):349-352. 被引量：2
3韩高峰.智能网络系统低匹配度数据深度挖掘算法研究[J].宁夏师范学院学报,2020,41(4):82-88. 被引量：1

1冯波,郝文宁,陈刚,占栋辉.K-means算法初始聚类中心选择的优化[J].计算机工程与应用,2013,49(14):182-185. 被引量：49
2曹洪武,王振磊,姚娜,姚江河.基于SLIC和多尺度显著性的红枣图像分割算法[J].江苏农业科学,2016,44(3):455-457.
3孙巍,郭敏.基于SLIC与条件随机场的图像分割算法[J].计算机应用研究,2015,32(12):3817-3820. 被引量：14
4何跃,杨磊,徐玖平.一种新的聚类判别分析框架及其实证研究[J].计算机应用研究,2007,24(12):32-36. 被引量：7
5赵伟,林楠,韩英,张洪涛.一种改进的K-means聚类的协同过滤算法[J].安徽大学学报（自然科学版）,2016,40(2):32-36. 被引量：14
6赵军,徐晓燕.基于GraphX的分布式幂迭代聚类[J].计算机应用,2016,36(10):2710-2714. 被引量：3
7曹洪武,周保平,姚江河.基于PSO和视觉显著性的棉花图像分割算法[J].江苏农业科学,2016,44(2):430-433. 被引量：2
8邵辰琳,杨卫平,张志龙.基于简单线性迭代聚类超像素的meanshift跟踪[J].应用光学,2017,38(2):193-199. 被引量：5
9蔡强,刘亚奇,曹健,毛典辉,李海生.基于SLIC与Delaunay图割的交互式图像分割算法[J].计算机科学与探索,2015,9(4):482-490. 被引量：1
10刘思思.边坡影响因素的自组织神经网络归类处理[J].企业技术开发,2005,24(11):35-36.

科技通报

2016年第4期

浏览历史

内容加载中请稍等...

海量数据信息中的迭代聚类过程的改进研究被引量：4

参考文献7

二级参考文献106

共引文献329

同被引文献49

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

海量数据信息中的迭代聚类过程的改进研究 被引量：4

参考文献7

二级参考文献106

共引文献329

同被引文献49

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

海量数据信息中的迭代聚类过程的改进研究被引量：4