期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
科学计算应用程序单核指令级优化研究 被引量:4
1
作者 罗红兵 张晓霞 +1 位作者 王伟 武林平 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1263-1269,共7页
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面... 尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进. 展开更多
关键词 性能分析 性能优化 XEON 指令优化 科学计算程序
下载PDF
计算流体力学程序单核指令级优化方法
2
作者 刘闯 何峰 +2 位作者 肖兮 董小社 张兴军 《西安交通大学学报》 EI CAS CSCD 北大核心 2018年第12期77-83,共7页
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程... 针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程序的存储结构和访存顺序进行调整,以优化空间开销和访存性能;对CPU的流水机制进行分析,在循环和分支中消除指令的控制相关和数据相关从而达到减少流水中断率的目的;分析编译器对高级语言的处理特点并结合系统中的运行时栈在指令级作出分析,优化指令结构从而减少指令冗余和降低指令复杂度。实验结果表明,在TIANHE-1A超级计算机系统上进行测试,与优化前程序相比,优化后的程序执行时间约减少68.34%,空间消耗约减少55.43%。通过对程序性能各项指标进行分析的结果表明,程序在流水中断率、缓存命中率及机器指令数等性能指标上均有大幅地提升,该方法优化覆盖范围多于目前其他优化方法,有较好的优化效果,在计算流体力学程序优化研究中具有一定的借鉴价值。 展开更多
关键词 流体力学程序 指令优化 访存优化 流水优化
下载PDF
国产Unicore架构的Android系统绘图操作指令级加速优化
3
作者 凌明 武建平 王猛猛 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第7期1065-1071,共7页
针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数据的高效性,改变内存填充操作,采用汇编技术批量填充内存,优化内存填充效率;利用单指令多数据(SIMD)协处... 针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数据的高效性,改变内存填充操作,采用汇编技术批量填充内存,优化内存填充效率;利用单指令多数据(SIMD)协处理器的运算并发性加速改进alpha混合操作,使SK130平台能够并行完成多个像素的alpha混合,提升alpha混合效率.实验结果表明:采用汇编优化后,Android系统Canvas填充效率平均提升17%,最高达44%.采用SIMD加速技术与汇编优化相结合后,Android系统位图渲染效率平均提升34%. 展开更多
关键词 指令优化 ANDROID系统 Unicore架构 图形系统 Skia库
下载PDF
基于机群的并行匹配算法 被引量:1
4
作者 张春玲 邱振戈 《测绘科学》 CSCD 北大核心 2006年第6期127-128,136,共3页
随着卫星遥感技术的发展,需要快速地将卫星遥感图像数据转化为用户需要的信息,并行图像处理技术是解决“快速”的重要途径。并行程序的性能与计算机体系结构密切相关,不但取决于CPU,还与系统架构、指令结构、存储部件的存取速度等因素... 随着卫星遥感技术的发展,需要快速地将卫星遥感图像数据转化为用户需要的信息,并行图像处理技术是解决“快速”的重要途径。并行程序的性能与计算机体系结构密切相关,不但取决于CPU,还与系统架构、指令结构、存储部件的存取速度等因素有关。一般意义上,提高并行程序的性能采用粗粒度并行,指令级优化(ILP)和存储优化等技术。作为尝试,本文讨论了在工业标准化机群上采用软件式共享存储系统做的并行影像匹配方法,以影像匹配算法为例子,讨论了如何在粗粒度并行、指令级优化(ILP)和存储优化三个方面提高图像处理的计算速度。 展开更多
关键词 影像匹配 粗粒度并行 指令优化(ILP) 和存储优化 机群
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部