基于调度历史数据在线预测作业执行时间被引量：3

On-line prediction of application runtime using schedule historical data

下载PDF

导出

摘要传统基于用户预估的执行时间通常准确性较差。结合分类和基于实例的学习方法,综合使用模板相似和数值相似方法,在历史调度数据中获取当前作业的相似作业,并使用其历史信息预测当前作业执行时间。使用调度历史中的用户名、分组名、队列名、应用名、用户请求处理器数、用户请求(预估)执行时间和用户请求内存量等属性进行训练和预测,算法中涉及的参数使用遗传算法确定。数值实验表明,相较于已有文献,本方法在使用更少参数的前提下得到了与文献结果中相近的低估率,并获得了更低的平均绝对误差。在HPC2N04和HPC2N05日志数据集上,平均绝对误差分别降低了43%和77%。研究了使用在线预测替换用户估计对作业调度的影响,对结果进行了初步分析并指出了今后的改进方向。 Traditional runtimes based on user estimating is usually less accurate.This paper combined the categorization with the instance-based learning method,used the template similarity and numerical similarity method to find the similar jobs of the current jobs in historical data,and used historical scheduling data to predict the runtimes of the current jobs.This paper only took seven job attributes into account,which included user name,group name,queue name,application name,requested number of processors,requested runtime,requested memory.It applied genetic algorithm to train the best parameters,and used similar jobs attributes to predict runtimes.Compared with the existing method,experimental results show that the proposed prediction method achieves a similar underestimate rate on the premise of using fewer parameters,and gets a lower mean absolute error.Moreover,on the HPC2N04 and HPC2N05 datasets,the mean absolute errors reduce 43%and 77%respectively.This paper studied the effect of using online prediction to replace user estimation on job scheduling,analyzed the results and pointed out the future improvement directions.

作者许伦凡熊敏肖永浩 Xu Lunfan;Xiong Min;Xiao Yonghao(Institute of Computer Application,China Academy of Engineering Physics,Mianyang Sichuan 621900,China)

机构地区中国工程物理研究院计算机应用研究所

出处《计算机应用研究》 CSCD 北大核心 2020年第3期763-767,共5页 Application Research of Computers

基金国家重点研发计划资助项目(2016YFB0201504)。

关键词执行时间预测作业调度遗传算法 K近邻 application runtimes prediction job scheduling genetic algorithm K-nearest neighbor

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1蒋炎华.网格环境下任务的执行时间预测技术研究[J].计算机工程与设计,2011,32(10):3428-3430. 被引量：4
2余莹,李肯立,徐雨明.计算集群中一种基于任务运行时间的组合预测方案[J].计算机应用,2015,35(8):2153-2157. 被引量：2

二级参考文献31

1李爱国,覃征.滑动窗口二次自回归模型预测非线性时间序列[J].计算机学报,2004,27(7):1004-1008. 被引量：12
2EI-Ghazawi T, Gaj K,Alexandridis N,et al.A performance study of job management systems[J].Concurrency and Computation: P racti c e & Experience, John Wiley & Son, 2004,16( 13): 1229-1246. 被引量：1
3Zhou D,Lo V.Wave scheduler:Scheduling for faster turnaround time in peer-based desktop grid systems[C].Boston,MA,USA: Proc of 11th Workshop on Job Scheduling Strategies for Parallel Processing, Lecture Notes in Computer Science 3834. Berlin: Springer,2005. 被引量：1
4Kondo D,Chien A,Casanova H.Resource management for rapid application turnaround on enterprise desktop grids [C].Proc of Super Computing Conference,2004. 被引量：1
5Kondo D,Chien A,Casanova H.Scheduling task parallel applica- tions for rapid application turnaround on enterprise desktop grids [J].Journal of Grid Computing,2007,5(4):379-405. 被引量：1
6R脚本编程软件[OL],http://www.r-yser.org/.2010. 被引量：1
7Che X,Hu L,Guo D,et al.Information service prototype system for run-time prediction of grid applications,pervasive computing and applications[C].2nd International Conference on Pervasive Computing and Applications,2007:530-535. 被引量：1
8Li W, Delugach H. Software metrics and application domain complexity[C].Hong Kong:IEEE Proc of Asia Pacific Software Engineering Conference & International Computer Science Conference, 1997:513-514. 被引量：1
9Casanova H.Simgrid:a toolkit for the simulation of application scheduling [C]. Brisbane, Australia: IEEE International Sympo- sium on Cluster Computing and the Grid,2001. 被引量：1
10Casanova H, Legrand A, Marchal L. Scheduling distributed ap- plications:the simgrid simulation framework[C].3rd IEEE Int'l Symposium on Cluster Computing and the Grid,2003. 被引量：1

共引文献4

1张霄宏,海林鹏,贾宗璞,沈记全,赵文涛.同构Hadoop环境作业执行时间计算方法[J].计算机工程与应用,2014,50(10):249-252. 被引量：1
2吴桂宝,沈瑜,张文帅,廖莎莎,王琦琦,李京.面向回填优化的作业时长预测[J].小型微型计算机系统,2019,40(1):6-12. 被引量：5
3余莹,李肯立,徐雨明.计算集群中一种基于任务运行时间的组合预测方案[J].计算机应用,2015,35(8):2153-2157. 被引量：2
4聂德雷,赵博,王崇,汪欣,燕昺昊.拟态多执行体架构下的超时阈值计算方法[J].网络与信息安全学报,2018,4(10):68-76. 被引量：1

同被引文献7

1伍章俊,刘晓,倪志伟.基于混沌时间序列的云工作流活动运行时间预测模型[J].计算机集成制造系统,2013,19(8):1920-1927. 被引量：2
2郑顾平,王秋萍.基于参数变化的云应用程序执行时间预估方法[J].计算机工程与应用,2017,53(11):95-99. 被引量：3
3夏元清,闫策,王笑京,宋向辉.智能交通信息物理融合云控制系统[J].自动化学报,2019,45(1):132-142. 被引量：43
4郑婷婷,陈洁璇,许洋,余阳,潘茂林.业务流程中一种个性化的任务完成时间预测方法[J].计算机集成制造系统,2019,25(4):993-1000. 被引量：8
5李帅标,赵海燕,陈庆奎,曹健.基于Stacking策略的过程剩余执行时间预测[J].小型微型计算机系统,2019,40(12):2481-2486. 被引量：5
6赵文迪,陈德旺,卓永强,黄允浒.深度神经模糊系统算法及其回归应用[J].自动化学报,2020,46(11):2350-2358. 被引量：8
7范苍宁,刘鹏,肖婷,赵巍,唐降龙.深度域适应综述:一般情况与复杂情况[J].自动化学报,2021,47(3):515-548. 被引量：34

引证文献3

1陈龙,杜江,伍仕红,宋弦,姚刚.基于指令执行时间预测的优化调度指挥网络交互系统[J].电工技术,2020,0(7):150-151.
2李慧芳,黄姜杭,徐光浩,夏元清.基于多维度特征融合的云工作流任务执行时间预测方法[J].自动化学报,2023,49(1):67-78. 被引量：3
3张丹丹,孔旭博,吉青,郑宇.基于特征相似的作业执行时间和内存预测算法[J].计算机仿真,2024,41(3):366-371.

二级引证文献3

1王晓勇,胡胜利.基于改进SMOTE算法和Ensemble模型的学习结果预测方法[J].中北大学学报（自然科学版）,2024,45(3):257-264. 被引量：1
2刘鲲鹏,宫立华,汪莉.基于多任务特征融合算法的电力大数据增量式自组织映射方法[J].微型电脑应用,2024,40(6):101-104.
3唐诗咏,索鸿飞,杨健伟,陆海,赵轲.云计算环境中基于改进粒子群优化的任务调度算法[J].电子设计工程,2024,32(20):6-10.

1李帅标,赵海燕,陈庆奎,曹健.基于Stacking策略的过程剩余执行时间预测[J].小型微型计算机系统,2019,40(12):2481-2486. 被引量：5
2陈博,李雅君,刘连志.基于电力通信网的电力调度数据网安全传输[J].通信电源技术,2020,37(5):197-198. 被引量：2
3韩文君.铁路信号微机联锁在铁路运输自动化中的作用分析[J].科学技术创新,2020(8):71-72.
4徐超,吴波,姜丽丽,金熠波,张胜.云—边缘系统中跨域大数据作业调度技术研究[J].计算机应用研究,2020,37(3):754-758. 被引量：10
5张靓,凌伟.大数据资源调度下船舶网络信息加密传输系统设计[J].舰船科学技术,2019,41(22):64-66. 被引量：5
6张舜,刘彩艳,谭桂春,张雯雯,曲芃芃.以PIK3CA突变及突变相关的基因构建子宫内膜样腺癌的预后预测模型[J].现代妇产科进展,2020,29(5):329-334. 被引量：3
7程瑞琪,朱思宇,邓卉,裴志勇,吴卫国.极限强度模型试验非线性相似方法研究[J].武汉理工大学学报（交通科学与工程版）,2020,44(1):195-200. 被引量：4
8周卓炜,林巍,尹海卿.悬浮隧道整体结构行为机理试验研究2:详细设计[J].中国港湾建设,2020,40(2):15-20. 被引量：2
9唐志琼,莫莉晖.规范监控信息优化,提升告警信息有效性[J].企业管理,2018,0(S01):330-331.
10岳东峻.昭通供电局电力调度数据网第二平面建设研究[J].数字通信世界,2020,0(4):276-276.

计算机应用研究

2020年第3期

浏览历史

内容加载中请稍等...

基于调度历史数据在线预测作业执行时间被引量：3

参考文献2

二级参考文献31

共引文献4

同被引文献7

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于调度历史数据在线预测作业执行时间 被引量：3

参考文献2

二级参考文献31

共引文献4

同被引文献7

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于调度历史数据在线预测作业执行时间被引量：3