Hadoop负载均衡的诊断与处理

Diagnosis and Treatment of Load Balancing in Hadoop

下载PDF

导出

摘要 Hadoop集群作为流行的分布式大数据处理系统框架,得到了广泛应用。但若不能较好地解决其负载均衡问题,将无法充分发挥其高可靠性、高效性和高扩展性等特点。鉴于此,本文针对Hadoop体系的两大核心HDFS和MapReduce以及常用的组件Hive与HBase,从产生数据倾斜的原理进行分析,提出了有效的解决方案,以保障集群的负载均衡和保证集群的高效性。 Hadoop cluster is a popular distributed big data processing system framework.In the case of load balancing,it has high reliability,high efficiency and high scalability.For HDFS and MapReduce in Hadoop system,as well as hive and HBase,this paper analyzes the principle of data skew,and puts forward an effective solution.

作者黄河清林峰 HUANG Heqing;LIN Feng(Department of Information Technology Engineering,Fuzhou Polytechnic,Fuzhou,China,350108)

机构地区福州职业技术学院信息技术工程系

出处《福建电脑》 2021年第7期36-39,共4页 Journal of Fujian Computer

基金福州职业技术学院校级科研项目(No.FZYKJJJB201901)资助。

关键词 HADOOP 数据倾斜负载均衡 MAPREDUCE Hadoop Data Skew Load Balancing MapReduce

分类号 TP319 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1吴瑶瑶,杨庚.云环境下分布式文件系统负载均衡研究[J].计算机工程与应用,2019,55(10):67-72. 被引量：13
2张海..基于HDFS分布式存储技术研究与优化[D].河北工业大学,2013:
3周家帅,王琦,高军.一种基于动态划分的MapReduce负载均衡方法[J].计算机研究与发展,2013,50(S1):369-377. 被引量：11
4翟红敏,刘国华,赵威,刘源源,翟红坤.MapReduce中连接负载均衡优化研究[J].计算机工程与科学,2014,36(10):1860-1865. 被引量：4
5黄伟建,宋园园.HBase负载均衡分析及优化策略[J].微电子学与计算机,2016,33(4):125-128. 被引量：4
6邵芳,王勇.基于HBase的大数据平台负载均衡算法分析与优化[J].软件导刊,2019,18(1):104-107. 被引量：7
7李翀,张彤彤,杜伟静,刘学敏.基于Hive的高可用双引擎数据仓库[J].计算机系统应用,2019,28(9):65-71. 被引量：10

二级参考文献44

1Dean J,Ghemawat S.MapReduce:Simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113. 被引量：1
2Blanas S,Patel J M,Ercegovac V,et al.A comparison of join algorithms for log processing in MapReduce[C]∥Proc of the 2010ACM SIGMOD International Conference on Management of Data,2010:975-986. 被引量：1
3Afrati F N,Ullman J D.Optimizing multiway joins in a MapReduce environment[J].IEEE Transactions on Knowledge and Data Engineering,2011,23(9):1282-1298. 被引量：1
4Gufler B,Augsten N,Reiser A,et al.Load balancing in MapReduce based on scalable cardinality estimates[C]∥Proc of the International Conference on Data Engineering,2012:522-533. 被引量：1
5Gufler B,Augsten N,Reiser A,et al.Handling data skew in MapReduce[C]∥Proc of the 1st International Conference on Cloud Computing and Services Science,2011:574-583. 被引量：1
6Yang H,Dasdan A,Hsiao R L,et al.Map-reduce-merge:Simplified relational data processing on large clusters[C]∥Proc of the 2007ACM SIGMOD International Conference on Management of Data,2007:1029-1040. 被引量：1
7Wang H,Qin X,Zhang Y,et al.LinearDB:A relational approach to make data warehouse scale like MapReduce[C]∥Proc of DASFAA’11,2011:306-320. 被引量：1
8Dittrich J,Quiané-Ruiz J A,Jindal A,et al.Hadoop++:Making ayellow elephant run like a cheetah(without it even noticing)[J].Proceedings of the VLDB Endowment,2010,3(1-2):515-529. 被引量：1
9Eltabakh M Y,Tian Y,zcan F,et al.CoHadoop:flexible data placement and its exploitation in Hadoop[J].Proceedings of the VLDB Endowment,2011,4(9):575-585. 被引量：1
10Okcan A,Riedewald M.Processing theta-joins using MapReduce[C]∥Proc of the 2011ACM SIGMOD International Conference on Management of Data,2011:949-960. 被引量：1

共引文献42

1赵星源,赵丹,杜战朝,李壮.民用建筑“四节一环保”大数据平台建设与应用[J].建筑科学,2020,36(S02):409-417. 被引量：1
2闫博文,周兆国,文宏武.军事物流数据仓库建设研究[J].军事交通学报,2022(10):22-26.
3李冬.试论国有企业制度创新的几个问题[J].金山企业管理,2000(1):1619-1619. 被引量：1
4刘寒梅,韩宏莹.基于反馈调度的MapReduce负载均衡分区算法研究[J].信息通信,2015,28(10):41-42. 被引量：1
5王卓,陈群,李战怀,潘巍,尤立.基于增量式分区策略的MapReduce数据均衡方法[J].计算机学报,2016,39(1):19-35. 被引量：24
6胡忠奎,屈波,黄斌,黎文阳.一种基于虚拟处理区间划分的负载均衡等值连接算法[J].现代计算机,2016,0(2):3-7.
7王刚,李盛恩.MapReduce中数据倾斜解决方法的研究[J].计算机技术与发展,2016,26(9):201-204. 被引量：3
8梁俊杰,何利民.基于MapReduce的数据倾斜连接算法[J].计算机科学,2016,43(9):27-31. 被引量：6
9熊倩,张,郭明,徐婕.MapReduce Shuffle性能改进[J].计算机应用,2017,37(A01):58-62. 被引量：5
10杨朝辉,康磊.Hadoop平台中的MapReduce模型及优化[J].信息技术与信息化,2017(12):82-85. 被引量：2

1谭智慧.非洲猪瘟临床诊断与处理措施[J].畜牧兽医科学（电子版）,2021(10):132-133.
2周吉华,王俊怡,段斌修.高炉TRT透平发电机组振动故障诊断与处理[J].冶金设备管理与维修,2021,39(3):12-15.
3高明,康晓凤,孙典,张一凡,丁乾,张百川.基于树莓派的人脸识别门禁系统[J].软件工程,2021,24(7):49-51. 被引量：4
4董少杰,杨敬巍,程宇.中国云计算自主可控发展趋势探讨[J].通信世界,2021(12):36-37. 被引量：4
5齐灿,张铁军,史丽萍,胡岩,邢民者,刘朋,柴红超,贾鹏宇,高靖达,褚登伟,郭付臣.TWIST评分在小儿阴囊急症中的应用[J].中华男科学杂志,2021,27(4):377-379. 被引量：7
6马文艺,徐文欣.微服务架构Saa S多租户校园管理平台[J].电子世界,2021(10):150-151. 被引量：2

福建电脑

2021年第7期

浏览历史

内容加载中请稍等...

Hadoop负载均衡的诊断与处理

参考文献7

二级参考文献44

共引文献42

相关作者

相关机构

相关主题

浏览历史