神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,...神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,但是由于其基于C++实现,与神威太湖之光上的异构众核处理器SW26010的编译器不兼容,因此无法直接在该架构上有效运行。基于SW26010的主核/从核的体系架构移植了OpenFOAM的核心计算代码,并采用混合语言编程实现的方式来解决编译不兼容的问题。此外,通过寄存器通信、向量化和双缓冲等优化手段,单核组的性能较优化后的主核代码提高了8.03倍,较Intel(R)Xeon(R)CPU E5-2695v3的串行执行性能提高了1.18倍。同时,将单核组的实现扩展到了神威太湖之光的大规模集群上,并进行了强可扩展性测试,256个核组上实现了184.9倍的加速。采用的移植方式和优化手段也可以为其他复杂C++程序在神威太湖之光上的应用提供借鉴。展开更多
为了提高异构多核处理器平台的计算性能,从任务调度的角度出发,提出了一种使用黄金正弦和莱维飞行机制改进的麻雀搜索算法(Fusion of Golden Sinusoidal and Levy Flight in Sparrow Search Algorithm,GSLF-SSA)来优化异构多核处理器的...为了提高异构多核处理器平台的计算性能,从任务调度的角度出发,提出了一种使用黄金正弦和莱维飞行机制改进的麻雀搜索算法(Fusion of Golden Sinusoidal and Levy Flight in Sparrow Search Algorithm,GSLF-SSA)来优化异构多核处理器的任务调度。通过对异构任务调度的分析,将异构任务建模为DAG(Directed Acyclic Graph)任务模型,通过对其优先级进行随机编码分配,实现了GSLF-SSA算法求解域从连续到离散的映射,使该算法更能适用于异构多核任务调度之中。将DAG任务的最优调度长度作为算法的适应度值进行迭代寻优,通过与目前应用广泛的麻雀搜索算法(SSA)、混合式任务调度算法(IHSSA)、人工蜂群算法(ABC)等多种启发式算法在异构任务调度环境下的实验对比表明,GSLF-SSA能获得更优的调度长度与更短的调度执行时间。展开更多
随着网页内容和功能的丰富以及用户体验需求的提升,移动Web浏览中的计算能耗与日俱增.DVFS(Dynamic Voltage and Frequency Scaling)技术在同构多核架构中取得较好的节能效果,但在异构多核架构中,由于系统默认的调度策略没有充分利用低...随着网页内容和功能的丰富以及用户体验需求的提升,移动Web浏览中的计算能耗与日俱增.DVFS(Dynamic Voltage and Frequency Scaling)技术在同构多核架构中取得较好的节能效果,但在异构多核架构中,由于系统默认的调度策略没有充分利用低功耗核心,导致高性能核心的工作频率和时间往往高于实际需求,浪费大量电能.而面向异构平台的Linux HMP(Heterogeneous Multi-Processing)技术也没有充分利用异构平台的特性,无法对能效进行有效的提升.针对上述问题,该文面向移动异构平台,提出了一种基于支持向量机的CPU配置预测模型.首先选取500个热门网站主页,分析其主页面的架构(HTML)及样式(CSS)信息,进行特征选择;遍历不同CPU配置渲染网页,记录获得最优加载时间、能耗及EDP对应CPU配置;最后在线下利用支持向量机自主挖掘网页特征同最优配置的内在关系,以此构建移动异构平台的CPU资源调度预测模型.该模型通过分析网页特征,根据不同的优化目标,为渲染引擎分配合适的处理器资源.实验结果显示,同目前最先进的一种线性回归预测模型相比,该文提出的CPU资源调度模型在加载时间、能耗和EDP上的性能得到显著提升.展开更多
文摘神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,但是由于其基于C++实现,与神威太湖之光上的异构众核处理器SW26010的编译器不兼容,因此无法直接在该架构上有效运行。基于SW26010的主核/从核的体系架构移植了OpenFOAM的核心计算代码,并采用混合语言编程实现的方式来解决编译不兼容的问题。此外,通过寄存器通信、向量化和双缓冲等优化手段,单核组的性能较优化后的主核代码提高了8.03倍,较Intel(R)Xeon(R)CPU E5-2695v3的串行执行性能提高了1.18倍。同时,将单核组的实现扩展到了神威太湖之光的大规模集群上,并进行了强可扩展性测试,256个核组上实现了184.9倍的加速。采用的移植方式和优化手段也可以为其他复杂C++程序在神威太湖之光上的应用提供借鉴。
文摘为了提高异构多核处理器平台的计算性能,从任务调度的角度出发,提出了一种使用黄金正弦和莱维飞行机制改进的麻雀搜索算法(Fusion of Golden Sinusoidal and Levy Flight in Sparrow Search Algorithm,GSLF-SSA)来优化异构多核处理器的任务调度。通过对异构任务调度的分析,将异构任务建模为DAG(Directed Acyclic Graph)任务模型,通过对其优先级进行随机编码分配,实现了GSLF-SSA算法求解域从连续到离散的映射,使该算法更能适用于异构多核任务调度之中。将DAG任务的最优调度长度作为算法的适应度值进行迭代寻优,通过与目前应用广泛的麻雀搜索算法(SSA)、混合式任务调度算法(IHSSA)、人工蜂群算法(ABC)等多种启发式算法在异构任务调度环境下的实验对比表明,GSLF-SSA能获得更优的调度长度与更短的调度执行时间。
文摘随着网页内容和功能的丰富以及用户体验需求的提升,移动Web浏览中的计算能耗与日俱增.DVFS(Dynamic Voltage and Frequency Scaling)技术在同构多核架构中取得较好的节能效果,但在异构多核架构中,由于系统默认的调度策略没有充分利用低功耗核心,导致高性能核心的工作频率和时间往往高于实际需求,浪费大量电能.而面向异构平台的Linux HMP(Heterogeneous Multi-Processing)技术也没有充分利用异构平台的特性,无法对能效进行有效的提升.针对上述问题,该文面向移动异构平台,提出了一种基于支持向量机的CPU配置预测模型.首先选取500个热门网站主页,分析其主页面的架构(HTML)及样式(CSS)信息,进行特征选择;遍历不同CPU配置渲染网页,记录获得最优加载时间、能耗及EDP对应CPU配置;最后在线下利用支持向量机自主挖掘网页特征同最优配置的内在关系,以此构建移动异构平台的CPU资源调度预测模型.该模型通过分析网页特征,根据不同的优化目标,为渲染引擎分配合适的处理器资源.实验结果显示,同目前最先进的一种线性回归预测模型相比,该文提出的CPU资源调度模型在加载时间、能耗和EDP上的性能得到显著提升.