期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
大数据流式计算框架Heron环境下的流分类任务调度策略 被引量:9
1
作者 张译天 于炯 +1 位作者 鲁亮 李梓杨 《计算机应用》 CSCD 北大核心 2019年第4期1106-1116,共11页
新型大数据流式计算框架Apache Heron默认使用轮询调度算法进行任务调度,忽略了拓扑运行时状态以及任务实例间不同通信方式对系统性能的影响。针对这个问题,提出Heron环境下流分类任务调度策略(DSC-Heron),包括流分类算法、流簇分配算... 新型大数据流式计算框架Apache Heron默认使用轮询调度算法进行任务调度,忽略了拓扑运行时状态以及任务实例间不同通信方式对系统性能的影响。针对这个问题,提出Heron环境下流分类任务调度策略(DSC-Heron),包括流分类算法、流簇分配算法和流分类调度算法。首先通过建立Heron作业模型明确任务实例间不同通信方式的通信开销差异;其次基于流分类模型,根据任务实例间实时数据流大小对数据流进行分类;最后将相互关联的高频数据流整体作为基本调度单元构建任务分配计划,在满足资源约束条件的同时尽可能多地将节点间通信转化为节点内通信以最小化系统通信开销。在包含9个节点的Heron集群环境下分别运行SentenceWordCount、WordCount和FileWordCount拓扑,结果表明DSC-Heron相对于Heron默认调度策略,在系统完成时延、节点间通信开销和系统吞吐量上分别平均优化了8.35%、7.07%和6.83%;在负载均衡性方面,工作节点的CPU占用率和内存占用率标准差分别平均下降了41.44%和41.23%。实验结果表明,DSC-Heron对测试拓扑的运行性能有一定的优化作用,其中对接近真实应用场景的FileWordCount拓扑优化效果最为显著。 展开更多
关键词 大数据 流式计算 apache heron 任务调度 数据流分类 通信开销
下载PDF
基于Heron平台的自适应重传策略 被引量:1
2
作者 夏毅 于炯 +2 位作者 鲁亮 张译天 李梓杨 《东北师大学报(自然科学版)》 CAS 北大核心 2020年第1期55-62,共8页
针对Heron容错机制中拓扑使用固定超时阈值未考虑数据源与组件内部逻辑的差异对元组往返时间影响的问题,提出了Heron环境下自适应重传策略,包括元组标记算法和最优参数估计算法.首先通过元组标记算法监控拓扑中元组,然后根据数据流的处... 针对Heron容错机制中拓扑使用固定超时阈值未考虑数据源与组件内部逻辑的差异对元组往返时间影响的问题,提出了Heron环境下自适应重传策略,包括元组标记算法和最优参数估计算法.首先通过元组标记算法监控拓扑中元组,然后根据数据流的处理时延计算最优超时阈值并更新到拓扑中,从而适应当前集群的实际负载,提升集群性能.实验结果表明,自适应重传策略与默认重传策略相比,集群的元组失败率和CPU占用率在不同情况下平均降低了16%和0.6 GHz,集群吞吐量平均提高了13%. 展开更多
关键词 apache heron 流式计算 容错 大数据
下载PDF
Heron环境下基于实例重分配的传输负载优化策略
3
作者 刘宇 于炯 +2 位作者 蒲勇霖 李梓杨 张译天 《计算机应用研究》 CSCD 北大核心 2021年第1期198-203,共6页
作为新一代大数据流式计算框架,Heron忽略了任务实例之间不同通信方式的差异以及节点资源利用率不均衡的问题导致系统性能下降。针对这一问题,设计了节点资源限制模型、通信开销优化模型和实例数据流关系模型,并在此基础上提出了Heron... 作为新一代大数据流式计算框架,Heron忽略了任务实例之间不同通信方式的差异以及节点资源利用率不均衡的问题导致系统性能下降。针对这一问题,设计了节点资源限制模型、通信开销优化模型和实例数据流关系模型,并在此基础上提出了Heron环境下基于实例重分配的传输负载优化策略(transmission load optimization strategy based on instance reallocation in Heron,TLIR-Heron)。该策略包括节点资源限制算法和实例重分配算法,通过判定实例重分配条件并执行重分配算法将节点间数据流转换为节点内数据流,从而降低通信开销。实验结果表明,在三组拓扑测试下,TLIR-Heron相较于Heron默认调度策略能够降低节点间通信开销和系统的计算延迟,并提升了计算节点资源利用的均衡性。 展开更多
关键词 大数据 流式计算 apache heron 资源限制 通信开销
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部