面向大规模信息网络的高效自适应聚类算法被引量：3

Efficient Adaptive Clustering Algorithm for Large Scale Information Network

下载PDF

导出

摘要为解决传统聚类算法在处理大规模信息网络中时间开销过大的问题,基于大规模信息网络的统计学特性,提出了一种将信息网络拓扑结构进行"分而治之"的思想,有效地减少了聚类问题规模和时间开销,并保持了相当的聚类效果。主要贡献包括:提出按照聚类影响力排名来对整个信息网络进行分层切割,然后分别聚类的思想;按照特定信息网络统计学意义上的结构特性,如信息网络的富人集团特性和分层社区结构特性,设计了一套将信息网络进行层次划分的粗略方案,并通过实验证明了其具有一定的合理性;提出了迭代的层级间聚类融合算法,可以实现不同层次聚类的融合。实验表明,该算法在兼具较好聚类效果的同时,非常明显地减少了运算开销。 The time cost of traditional clustering algorithm is too high when using it to large scale information net-work. To solve this issue, based on the statistical characteristic of information network, this paper proposes a novel“divide and conquer”strategy on information network, which reduces the clustering size and time cost heavily without efficiency loss. The main contribution of this paper is three folds：（1） It proposes the idea that clustering in different layers separately after dividing the whole information network into several layers according to the clustering contribution rank;（2） Based on the rich-club phenomenon and hierarchical community feature which exists in information network, it designs the blueprint of layer dividing method of clustering algorithm;（3） It presents an iteration procedure to merge clusters in different layers. The experimental results show that the proposed algorithm has good clustering effect and can reduce time cost.

作者吴诗极李川唐常杰李洋涛曾卫杨尚乾杨宁

机构地区四川大学计算机学院国家空管自动化系统技术重点实验室武汉大学软件工程国家重点实验室

出处《计算机科学与探索》 CSCD 2014年第4期406-416,共11页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金Grant No.61103043 国家"十二五"科技支撑计划项目Grant No.2012BAG04B02 武汉大学软件工程国家重点实验室开放基金项目Grant No.SKLSE2012-09-26~~

关键词信息网络自适应聚类信息层 ADAPTIVE CLUSTERING (AC) information network information layer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1解(亻刍),汪小帆.复杂网络中的社团结构分析算法研究综述[J].复杂系统与复杂性科学,2005,2(3):1-12. 被引量：86
2罗家德著..社会网分析讲义[M].北京:社会科学文献出版社,2005:228.

二级参考文献33

1[1]Gibson D,Kleinberg J,Raghavan P.Inferring web communities from link topology[A].Proceedings of the 9th ACM Conference on Hypertext and Hypermedia[C].1998.225-234. 被引量：1
2[2]Flake G W,Lawrence S R,Giles C L,et al.Self-organization and identification of web communities[J].IEEE Computer,2002,35 (3):66-71. 被引量：1
3[3]Adamic A L,Adar E.Friends and neighbors on the web[J].Social Networks,2003,25 (3):211-130. 被引量：1
4[4]Shen-Orr S,Milo R,Mangan S,et al.Network motifs in the transcriptional regulation network of Escherichia coli[J].Nature Genetics,2002,31 (1):64-68. 被引量：1
5[5]Milo R,Shen-Orr S,Itzkovitz S,et al.Network motifs:simple building blocks of complex networks[J].Science,2002,298 (5594):824-827. 被引量：1
6[6]Holme P,Huss M,Jeong H.Subnetwork hierarchies of biochemical pathways[J].Bioinformatics,2003,19 (4):532-538. 被引量：1
7[7]Girvan M,Newman M E J.Community structure in social and biological networks[J].Proc Natl Acad Sci,2001,99 (12):7 821-7 826. 被引量：1
8[8]Gleiser P,Danon L.Community structure in jazz[J].Advances in Complex Systems,2003,6 (4):565-573. 被引量：1
9[9]Garey M R,Johnson D S.Computers and Intractability:A Guide to the Theory of NP-Completeness[M].San Francisco:W.H.Freeman Publishers,1979. 被引量：1
10[10]Scott J.Social Network Analysis:A Handbook[M].2nd ed.London:Sage Publications,2002. 被引量：1

共引文献85

1王丹,刘发升.复杂网络的社区发现算法研究[J].计算机时代,2009(3):57-59. 被引量：5
2俞桂杰,彭语冰,褚衍昌.复杂网络理论及其在航空网络中的应用[J].复杂系统与复杂性科学,2006,3(1):79-84. 被引量：26
3袁韶谦,赵海,张昕,李超.Internet拓扑的社团结构分析[J].复杂系统与复杂性科学,2007,4(3):17-27. 被引量：1
4赫南,李德毅,淦文燕,朱熙.复杂网络中重要性节点发掘综述[J].计算机科学,2007,34(12):1-5. 被引量：135
5方锦清,汪小帆,郑志刚,李翔,狄增如,毕桥.一门崭新的交叉科学:网络科学(下篇)[J].物理学进展,2007,27(4):361-448. 被引量：65
6范彦静,王化雨,蔡媛媛.社会合作网络中社团结构的搜索算法研究[J].信息技术与信息化,2008(2):13-15. 被引量：1
7蔡媛媛,王红,范彦静.复杂网络理论及其在城市公交网络中的应用[J].信息技术与信息化,2008(2):18-19. 被引量：6
8杨建新,周献中,葛银茂.基于拉普拉斯图谱和K均值的多社团发现方法[J].计算机工程,2008,34(12):178-180. 被引量：9
9徐兴兴,常文军,翟羽佳,林丽萍,刘小康,马立业,张宏伟,曹广文.PPP4R1基因与肿瘤相关性的生物信息学预测及在胃癌组织中的初步验证[J].第二军医大学学报,2009,30(3):275-278. 被引量：1
10邢雪,马杰良,安莉莉.一种基于四元加权消减的复杂网络社团划分算法[J].延边大学学报（自然科学版）,2009,35(1):68-71.

同被引文献20

1李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：111
2徐森,卢志茂,顾国昌.结合K均值和非负矩阵分解集成文本聚类算法[J].吉林大学学报（工学版）,2011,41(4):1077-1082. 被引量：12
3曹泽文,周姚.基于MapReduce的JP算法设计与实现[J].计算机工程,2012,38(24):14-16. 被引量：6
4杨慧中,董陶,陶洪峰.基于改进K-means聚类算法的组合模型建模[J].控制工程,2013,20(2):201-203. 被引量：18
5杨燕,王全根,黄波.蚁群聚类算法的并行化设计与实现[J].控制工程,2013,20(3):411-414. 被引量：8
6罗明伟,姚宏亮,李俊照,王浩.一种基于节点相异度的社团层次划分算法[J].计算机工程,2014,40(1):275-279. 被引量：10
7任重鲁,李金明.非负矩阵分解在微阵列数据分类和聚类发现中的应用[J].计算机工程与科学,2014,36(7):1389-1397. 被引量：5
8张新萍,张孝远,刘杰.基于差分进化算法的模糊核聚类算法及其在故障诊断中的应用[J].电力系统保护与控制,2014,42(17):102-106. 被引量：4
9申国伟,杨武,王巍,于淼,董国忠.基于非负矩阵分解的大规模异构数据联合聚类[J].计算机研究与发展,2016,53(2):459-466. 被引量：6
10李欢,刘锋,朱二周.基于改进K-means算法的海量数据分析技术研究[J].微电子学与计算机,2016,33(5):52-57. 被引量：9

引证文献3

1赵艳萍,徐胜超.基于云计算与非负矩阵分解的数据分级聚类[J].现代电子技术,2018,41(5):56-60. 被引量：9
2冯新扬,沈建京.一种基于Yarn云计算平台与NMF的大数据聚类算法[J].信息网络安全,2018(8):43-49. 被引量：4
3邓斌涛,徐胜超.基于动态双子种群的差分进化K中心点聚类算法[J].计算机与现代化,2021(7):54-59. 被引量：2

二级引证文献15

1张建盛,牟健君.基于云原生的东西向流量攻击检测方案研究[J].信息网络安全,2020(S01):115-118.
2冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
3陈建煊.利益相关者管理[J].经济管理,2000,26(4):58-58. 被引量：3
4林宁.云数据处理技术在特种设备监督管理平台运用[J].设备管理与维修,2018(15):11-12. 被引量：1
5田春岐,李静,王伟,张礼庆.一种基于机器学习的Spark容器集群性能提升方法[J].信息网络安全,2019(4):11-19. 被引量：2
6吕国,肖瑞雪,白振荣,孟凡兴.大数据挖掘中的MapReduce并行聚类优化算法研究[J].现代电子技术,2019,42(11):161-164. 被引量：21
7甘井中,黄恒杰.非负矩阵分解在数据优化中的研究[J].电脑知识与技术,2019,15(6Z):12-13.
8申燕萍,顾苏杭,郑丽霞.基于云计算平台的仿生优化聚类数据挖掘算法[J].计算机科学,2019,46(11):247-250. 被引量：25
9李凯军,李兆宇.钢铁企业云计算平台研究及应用[J].电脑知识与技术,2019,15(10X):76-77. 被引量：1
10许琴,金晶,邱燕,朱涛.基于云存储技术的手术室数据管理系统[J].自动化与仪器仪表,2020,0(2):97-100. 被引量：4

1南光耀.基于特征数据的房地产企业高管微博营销效果分析[J].重庆电子工程职业学院学报,2015,24(3):40-44.
2唐燕雯.一种基于K-means的自适应聚类算法的研究[J].科技致富向导,2012(2):143-143. 被引量：1
3王羽婷,徐维祥,张翼,李华华.一种新的Web日志聚类算法的研究与实现[J].现代电子技术,2007,30(24):139-142. 被引量：2
4肖红光,陈颖慧,巫小蓉.基于结构树的高维数据流子空间自适应聚类算法[J].小型微型计算机系统,2016,37(10):2206-2211. 被引量：4
5张光卫,康建初,夏传良,李鹤松.复杂网络集团特征研究综述[J].计算机科学,2006,33(10):1-4. 被引量：12
6李丽娟,李少东.自适应聚类算法在DDoS攻击检测中的应用[J].计算机工程与应用,2012,48(2):86-89. 被引量：4
7成卫青,卢艳红.一种基于最大最小距离和SSE的自适应聚类算法[J].南京邮电大学学报（自然科学版）,2015,35(2):102-107. 被引量：44
8田勇,朱云鹏,冯权.遗传算法在神经网络中的研究与应用[J].电气传动自动化,2000,22(6):35-38. 被引量：7
9黄宇,张琳艳.挖掘微博网络中的优质源[J].计算机光盘软件与应用,2013,16(1):75-76.
10王小妮.具有资源约束的自适应聚类算法[J].计算机工程与设计,2015,36(1):246-249.

计算机科学与探索

2014年第4期

浏览历史

内容加载中请稍等...

面向大规模信息网络的高效自适应聚类算法被引量：3

参考文献2

二级参考文献33

共引文献85

同被引文献20

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向大规模信息网络的高效自适应聚类算法 被引量：3

参考文献2

二级参考文献33

共引文献85

同被引文献20

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向大规模信息网络的高效自适应聚类算法被引量：3