基于Hadoop框架下的Fast-Newman算法改进

Improvement of Fast-Newman Algorithm Based on Hadoop Framework

下载PDF

导出

摘要 Fast-Newman算法的复杂程度高,尤其是在计算模块度(Modularity)时,在边数较多的情况下,随着结点数提高,极大的影响着计算速度。为此,本文提出了一种基于Hadoop框架下的改进策略。该策略通过结点-边信息的划分,完成一定程度的分布化,在利用大量mappers的基础上,降低每次迭代时间,从而最终提升计算速度。通过对Zachary网络与随机ego-Facebook部分集的实验对比可以发现,算法加速比与并行序列数量有关。 To cut down the complexity of the fast-newman algorithm, especially the computation of 'modularity',which raises rapidly with the larger edges, a distributed fast-newman based on Hadoop framework has been proposed in this paper. It reduces the computing cost by degrading the number of pairs of edge and nodes to realize the computing parallel with matched count of mappers(computers). By recording the experiments of Zachary-net and the part of ego-Facebook, the relationship of speed-up ratio and numbers of mappers has been found.

作者喻金平赖柄州

机构地区江西理工大学工程研究院江西理工大学信息工程学院

出处《科技广场》 2016年第11期9-12,共4页 Science Mosaic

关键词 HADOOP Fast-newman 分布式社区发现 Hadoop Fast-newman Distributed Community Discovery

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1周小平,梁循,张海燕.基于R-C模型的微博用户社区发现[J].软件学报,2014,25(12):2808-2823. 被引量：25
2黄发良,张师超,朱晓峰.基于多目标优化的网络社区发现方法[J].软件学报,2013,24(9):2062-2077. 被引量：30
3索勃,李战怀,陈群,王忠.基于信息流动分析的动态社区发现方法[J].软件学报,2014,25(3):547-559. 被引量：16
4康颖,古晓艳,于博,林政,王伟平,孟丹.一种面向大规模社会信息网络的多层社区发现算法[J].计算机学报,2016,39(1):169-182. 被引量：8
5赵彦荣,王伟平,孟丹,张书彬,李均.基于Hadoop的高效连接查询处理算法CHMJ[J].软件学报,2012,23(8):2032-2041. 被引量：36
6崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
7张少敏,李晓强,王保义.基于Hadoop的智能电网数据安全存储设计[J].电力系统保护与控制,2013,41(14):136-140. 被引量：44
8陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学,2013,35(10):25-35. 被引量：117

二级参考文献100

1Ghemawat S, Gobioff H, Leung ST. The Google file system. In: Proc. of the SOSP 2003. 2003.20-43. [doi: 10.1145/1165389. 945450]. 被引量：1
2Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters. In: Proc. of the OSDI 2004. 2004. 137-150. [doi: 10.1145/1327452.1327492]. 被引量：1
3Yang HC, Dasdan A, Hsiao RL, Parker DS. Map-Reduce-Merge: Simplified relational data processing on large cluster. In: Proc. of the SIGMOD 2007. 2007. 1029-1040. [doi: 10.1145/1247480.1247602]. 被引量：1
4Lammel R. Google's MapReduce programming model Revisited. Science Computer Program, 2008,70(1):1-30. [doi: 10.1016/ j .scico .2007.07.001 ]. 被引量：1
5Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Anthony S, Liu H, Wyckoff P, Murthy R. Hi:ce: A warehousing solution over a map-reduce framework. Proc. of the VLDB Endowment, 2009,2(2): 1626-1627. 被引量：1
6Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Zhang N, Antony S, Liu H, Murthy R. Hive--A petabyte scale data warehouse using Hadoop data engineering. In: Proc. of the ICDE. 2010. 996-1005. [doi: 10.1109/ICDE.2010.5447738]. 被引量：1
7Olston C, Reed B, Sirvastava U, Kumar R, Tomkins A. Pig Latin: A not-so-foreign language for data processing. In: Proc. of the SIGMOD. 2008. 1099-1110. [doi: 10.1145/1376616.1376726]. 被引量：1
8White T. Hadoop: The Definitive Guide. O'Reilly, 2009. 被引量：1
9Apache Hadoop. http://hadoop.apache.org/. 被引量：1
10Murty J. Programming Amazon Web Services: S3, EC2, SQS, FPS, and SimpleDB. O'Reilly, 2008. 被引量：1

共引文献399

1陈豫,曾铮,王三梅.科技信息工作中大数据技术的应用和发展[J].情报学进展,2014(1):81-122. 被引量：2
2陈宁,陈孝文,冯世杰,吕志鹏,陈习,张娜,王岩.基于Hadoop的电力客户用电地址存储与结构化管理系统设计[J].微型电脑应用,2020,36(2):97-101. 被引量：4
3李威耀,范国梅,马俊才.基于微生物分类的信息推荐模型[J].计算机应用研究,2020,37(S01):211-212.
4左学刚,邹滨,胡晨霞,李沈鑫,贺晨骋.自然资源大数据助力的城市可持续发展评估[J].测绘科学,2023,48(1):189-200. 被引量：3
5丁冠军,兰海滨,樊邦奎,龙腾,刘岩,王晶.智能电网应用中的PLC技术[J].电工技术学报,2013,28(S2):378-382. 被引量：23
6樊邦奎,丁冠军,兰海滨,龙腾,王晶,陈志勇.智能电网应用中的PLC最短路径及多径传输统计模型[J].电工技术学报,2013,28(S2):387-390. 被引量：3
7常青,严小文,陶晓峰,付峰.基于大数据技术的智能电表运行状态分析系统研究[J].自动化与仪器仪表,2015(12):4-6. 被引量：19
8李莉华,冯志强,冉兵,赵春玲,张春来,盘强文,邬丽莎.缺血预处理减轻兔肾缺血再灌流损伤的研究[J].中国病理生理杂志,2000,16(5):461-461. 被引量：2
9董贺,徐凌宇.基于云平台的软件服务流体系结构[J].上海大学学报（自然科学版）,2013,19(1):14-20. 被引量：7
10张岩,郭松,赵国海.基于Hadoop的云计算试验平台搭建研究[J].沈阳师范大学学报（自然科学版）,2013,31(1):85-89. 被引量：14

1赵雅端,卢罡,赵英,山岚.基于GPU的复杂网络社区挖掘算法并行计算[J].计算机应用研究,2013,30(8):2426-2428. 被引量：2
2马力,张娟.基于社团结构的文本聚类算法研究[J].西安邮电学院学报,2013,18(2):111-115. 被引量：1
3Quasar.新贵NEWMAN K豹鼠标[J].电脑自做,2006(6):7-7.
4李程,邵峰晶,隋毅.基于复杂网络的遥感图像检测研究[J].科技视界,2015(17):290-291.
5李程,邵峰晶,隋毅.基于复杂网络的遥感图像检测研究[J].科技视界,2015(12):314-315.
6佘春东,范植华,孙世新,胡四泉,车著明.一种基于投影树的并行序列挖掘算法[J].计算机工程与应用,2004,40(14):4-5.
7牛建伟,戴彬,童超,彭井.GFN:基于“群”思想对Fast-Newman算法改进的复杂网络聚类算法[J].高技术通讯,2013,23(10):1016-1023.
8Newman鼠标键盘套装[J].电脑自做,2002(9):18-18.
9王小雨,宋苗苗.一种基于节点相似度的社团探测算法[J].信息安全与技术,2012,3(8):99-102.
10向宇,郭云龙,徐潇,曾维刚,李莉.多策略中文微博实体词消歧及实体链接[J].计算机应用与软件,2016,33(8):12-17. 被引量：4

科技广场

2016年第11期

浏览历史

内容加载中请稍等...

基于Hadoop框架下的Fast-Newman算法改进

参考文献8

二级参考文献100

共引文献399

相关作者

相关机构

相关主题

浏览历史