一种引入内存平衡的Hadoop平台作业调度算法被引量：4

A Job Scheduling Algorithm for Hadoop Based on Memory Balancing

下载PDF

导出

摘要通过实验对FIFO、CAP和FAIR三种调度算法的特点与性能进行了对比分析,得出了它们各自优点和存在的问题.针对公平调度算法Fair Scheduler不适用于内存密集型作业调度的缺点,提出一种基于内存平衡的公平调度算法FMScheduler,在整个调度的过程中考虑作业的内存使用和计算节点的内存情况,通过加入内存比较机制、调整作业公平权重计算方法以及引入作业预留机制,对原有Hadoop公平调度算法进行改进与优化.最后,通过仿真实验对FMScheduler进行测试分析,实验结果表明,FMScheduler在高内存作业调度环境下的独立响应时间和作业整体的平均响应时间都比Fair Scheduler有所减少;并且在多用户多作业且包含内存密集型作业的环境中,FMScheduler与Hadoop原有的三种调度算法相比,在处理数据密集型作业和内存密集型作业的混合场景时,能够更合理公平地调度作业. Abstract： The characteristics and performance of three Hadoop scheduling algorithms, i. e. FIFO, CAP and FAIR, are compared and analyzed through experiment, and both their pros and cons are educed too. Targeting on solving the issue that Fair Scheduler is not suitable for memory-intensive jobs, a novel FMScheduleris proposed on the basis of memory balance. Taking into account the memory usage and the memory of TaskTrackers,FMSchedulerintents to improve and optimize the original Hadoop scheduUng algorithms by mixing memory comparison mechanism, adjusting the calculation method offair weight and introducing job reservation mechanism. Finally,the experimental results demonstrate that compared with existing scheduling algorithms in Hadoop FMScheduler is most suitable and optimal for scheduling in the scene with multi-user, multi-job and containing memory-intensive jobs, because FMScheduler gains the least independent and total average response time of jobs,improves the resource utilization and ensures the memory-intensive jobs more fair execution opportunities.

作者杨倩茹黄梦醒万兵

机构地区海南大学信息科学技术学院

出处《小型微型计算机系统》 CSCD 北大核心 2014年第12期2708-2712,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(71161007)资助海南省国际科技合作专项项目(KJHZ2014-16)资助海南省重点科技计划项目(ZDXM20130078)资助

关键词云计算作业调度 HADOOP 公平调度 Cloud Computing Job Scheduling Hadoop Fair Scheduler

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1陈全,邓倩妮.异构环境下自适应的Map-Reduce调度[J].计算机工程与科学,2009,31(A01):168-171. 被引量：21
2张密密..MapReduce模型在Hadoop实现中的性能分析及改进优化[D].电子科技大学,2010:
3高瞻,罗四维.基于资源-预留图的动态网格资源预留机制[J].软件学报,2011,22(10):2497-2508. 被引量：6

二级参考文献12

1胡春明,怀进鹏,沃天宇,雷磊.一种支持端到端QoS的服务网格体系结构[J].软件学报,2006,17(6):1448-1458. 被引量：19
2胡春明,怀进鹏,沃天宇.一种基于松弛时间的服务网格资源能力预留机制[J].计算机研究与发展,2007,44(1):20-28. 被引量：20
3Vaquero L M, Rodero-Merino L, Caceres J, et al. A Break in the Clouds: Towards a Cloud DefinitionD]. ACM SIGCOMM Computer Communication Review, 2009, 39 ( 1 ) : 50- 55. 被引量：1
4Bryant R E. Data-Intensive Supercomputing: the Case for DISC[R]. CMU Technical Report CMU-CS-07-128, Department of Computer Science, Carnegie Mellon University, 2007. 被引量：1
5Dean J, Ghemawat S. MapReduce: Simplied Data Processing on Large Clusters[C]//Proc of OSDI '04,2004 : 137-150. 被引量：1
6Colbyranger, Raghuraman R, Penmetsa A. Evaluating MapReduce for Multi-Core and Multiprocessor Systems[C]//Proc of the IEEE 13th Int'l Syrup on High Performance Computer Architecture, 2007 : 13-24. 被引量：1
7Kruijf M D, Sankaralingam K. MapReduce for the Cell B. E. Architecture[-R]. Technical Report CS-TR-2007-1625, University of Wisconsin Computer Sciences University of Wisconsin, 2007. 被引量：1
8He B S, Fang W B, Luo Q, et al. Mars: A MapReduce Framework on Graphics Processors[C]//Proc of the 17th Int'l Conf on Parallel Architectures and Compilation Techniques, 2008 : 260-269. 被引量：1
9Apache Hadoop. Hadoop [EB/OL]. [2009-03-06]. http://hadoop, apache, org/. 被引量：1
10Yahoo. Yahoo! Hadoop Tutorial [EB/OL]. [2009-02-27]. http:// public, yahoo, com/gogate/hadoop-tutorial/start-tutorial, html. 被引量：1

共引文献25

1刘希伟,叶蕾,于明远,梁荣华,黄庆藏.面向异构集群的作业调度与资源分配研究[J].华中科技大学学报（自然科学版）,2012,40(S1):175-178.
2顾宇,周良,丁秋林.基于优先级的Three-Queue调度算法研究[J].计算机科学,2011,38(B10):253-256. 被引量：4
3李丽英,唐卓,李仁发.基于LATE的Hadoop数据局部性改进调度算法[J].计算机科学,2011,38(11):67-70. 被引量：17
4李鑫,张鹏.Hadoop集群公平调度算法的改进与实现[J].电脑知识与技术,2012,8(1):166-168. 被引量：6
5吴黎兵,党平,聂雷,李飞,邱鑫.面向分布式计算环境的接纳控制机制研究[J].计算机工程与科学,2012,34(10):58-63.
6邹世军,赵红武.基于Hadoop集群的加权循环算法的研究[J].工业控制计算机,2012,25(10):65-66.
7杨立身,余丽萍.异构环境下增强的自适应MapReduce调度算法[J].计算机工程与应用,2013,49(19):39-43. 被引量：5
8陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学,2013,35(10):25-35. 被引量：117
9何翔,李仁发,唐卓.一种异构环境下的基于MapReduce任务调度改进机制[J].计算机应用研究,2013,30(11):3370-3373. 被引量：8
10王笑宇,程良伦.云计算环境下动态资源碎片管理机制[J].计算机应用,2014,34(4):999-1004. 被引量：8

同被引文献34

1李千目,张晟骁,陆路,戚湧,张宏.一种Hadoop平台下的调度算法及混合调度策略[J].计算机研究与发展,2013,50(S1):361-368. 被引量：12
2杨海军.云计算环境下人工蜂群作业调度算法设计[J].数学的实践与认识,2012,24(10):115-120. 被引量：5
3金伟健,王春枝.基于匹配规则的MapReduce任务调度模型[J].计算机应用,2014,34(4):1010-1013. 被引量：7
4周景才,张沪寅,查文亮,陈毅波.云计算环境下基于用户行为特征的资源分配策略[J].计算机研究与发展,2014,51(5):1108-1119. 被引量：35
5王静蕾.Hadoop云计算框架中的分布式数据库HBase研究[J].商丘职业技术学院学报,2014,13(2):18-20. 被引量：1
6郭其标,吕春峰.基于云计算Hadoop异构集群的并行作业调度算法[J].计算机测量与控制,2014,22(6):1846-1849. 被引量：3
7马莉,唐善成,王静,赵安新.云计算环境下的动态反馈作业调度算法[J].西安交通大学学报,2014,48(7):77-82. 被引量：15
8朱洁,赵红,李雯睿.基于Hadoop的三队列作业调度算法[J].计算机应用,2014,34(11):3227-3230. 被引量：3
9孙彦超,王兴芬.基于Hadoop框架的MapReduce计算模式的优化设计[J].计算机科学,2014,41(B11):333-336. 被引量：12
10朱永华,沈熠,刘玲.Linux内核完全公平调度器改进的研究[J].计算机工程与应用,2014,50(21):59-62. 被引量：3

引证文献4

1王钟斐,王钟磊.一种改进的延时调度算法[J].电子设计工程,2018,26(15):23-26.
2郑羽,胡积宝.Hadoop集群中给定候选任务集的最大利润问题[J].计算机技术与发展,2018,28(12):194-199.
3郑羽,胡积宝.基于遗传算法的Hadoop作业调度模型性能评价[J].池州学院学报,2021,35(3):24-28.
4王春娟.基于Hadoop云平台的集群作业调度算法的研究[J].科技通报,2018,0(9):158-163. 被引量：1

二级引证文献1

1吴岳.改进的Hadoop公平调度算法[J].电脑与信息技术,2022,30(6):39-41. 被引量：1

1陈玉云,柳先辉,赵晓东.基于Hadoop平台资源调度策略的研究[J].电脑知识与技术,2012,8(7):4687-4690. 被引量：3
2李鑫,张鹏.Hadoop集群公平调度算法的改进与实现[J].电脑知识与技术,2012,8(1):166-168. 被引量：6
3廖有清,许学东.路由器多端口公平调度算法与实现[J].微计算机信息,2006(12X):228-230. 被引量：3
4黄辰,戴彬,王芙蓉,张波.无线Mesh网中基于网络编码感知的分组公平调度机制[J].电子学报,2010,38(1):25-31.
5张敏,邱恭安,张士兵.基于优先公平调度的网络链路状态测量方法[J].数字技术与应用,2016,34(12):52-53.
6付超,肖明,孙超平.考虑公平权重的云服务供应商选择[J].计算机集成制造系统,2015,21(8):2240-2248. 被引量：8
7黎卫红,刘羽,芦奉良.面向多核的时间帧加权公平调度算法[J].桂林理工大学学报,2012,35(1):121-125. 被引量：1
8谢健聪,肖侬,褚瑞.一种分布式磁盘缓存的设计与实现[J].微电子学与计算机,2007,24(9):169-170. 被引量：3
9牛帅.并不陌生的内存计算[J].信息方略,2011(23):37-37.
10王刚,崔炳谋.Oracle8调度作业方法[J].兰州交通大学学报,2001,22(6):28-30. 被引量：1

小型微型计算机系统

2014年第12期

浏览历史

内容加载中请稍等...

一种引入内存平衡的Hadoop平台作业调度算法被引量：4

参考文献3

二级参考文献12

共引文献25

同被引文献34

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种引入内存平衡的Hadoop平台作业调度算法 被引量：4

参考文献3

二级参考文献12

共引文献25

同被引文献34

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种引入内存平衡的Hadoop平台作业调度算法被引量：4