期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
科学计算应用程序单核指令级优化研究
被引量:
4
1
作者
罗红兵
张晓霞
+1 位作者
王伟
武林平
《计算机研究与发展》
EI
CSCD
北大核心
2014年第6期1263-1269,共7页
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面...
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进.
展开更多
关键词
性能分析
性能
优化
XEON
指令
级
优化
科学计算程序
下载PDF
职称材料
计算流体力学程序单核指令级优化方法
2
作者
刘闯
何峰
+2 位作者
肖兮
董小社
张兴军
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018年第12期77-83,共7页
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程...
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程序的存储结构和访存顺序进行调整,以优化空间开销和访存性能;对CPU的流水机制进行分析,在循环和分支中消除指令的控制相关和数据相关从而达到减少流水中断率的目的;分析编译器对高级语言的处理特点并结合系统中的运行时栈在指令级作出分析,优化指令结构从而减少指令冗余和降低指令复杂度。实验结果表明,在TIANHE-1A超级计算机系统上进行测试,与优化前程序相比,优化后的程序执行时间约减少68.34%,空间消耗约减少55.43%。通过对程序性能各项指标进行分析的结果表明,程序在流水中断率、缓存命中率及机器指令数等性能指标上均有大幅地提升,该方法优化覆盖范围多于目前其他优化方法,有较好的优化效果,在计算流体力学程序优化研究中具有一定的借鉴价值。
展开更多
关键词
流体力学程序
指令
级
优化
访存
优化
流水
优化
下载PDF
职称材料
国产Unicore架构的Android系统绘图操作指令级加速优化
3
作者
凌明
武建平
王猛猛
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2013年第7期1065-1071,共7页
针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数据的高效性,改变内存填充操作,采用汇编技术批量填充内存,优化内存填充效率;利用单指令多数据(SIMD)协处...
针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数据的高效性,改变内存填充操作,采用汇编技术批量填充内存,优化内存填充效率;利用单指令多数据(SIMD)协处理器的运算并发性加速改进alpha混合操作,使SK130平台能够并行完成多个像素的alpha混合,提升alpha混合效率.实验结果表明:采用汇编优化后,Android系统Canvas填充效率平均提升17%,最高达44%.采用SIMD加速技术与汇编优化相结合后,Android系统位图渲染效率平均提升34%.
展开更多
关键词
指令
级
优化
ANDROID系统
Unicore架构
图形系统
Skia库
下载PDF
职称材料
基于机群的并行匹配算法
被引量:
1
4
作者
张春玲
邱振戈
《测绘科学》
CSCD
北大核心
2006年第6期127-128,136,共3页
随着卫星遥感技术的发展,需要快速地将卫星遥感图像数据转化为用户需要的信息,并行图像处理技术是解决“快速”的重要途径。并行程序的性能与计算机体系结构密切相关,不但取决于CPU,还与系统架构、指令结构、存储部件的存取速度等因素...
随着卫星遥感技术的发展,需要快速地将卫星遥感图像数据转化为用户需要的信息,并行图像处理技术是解决“快速”的重要途径。并行程序的性能与计算机体系结构密切相关,不但取决于CPU,还与系统架构、指令结构、存储部件的存取速度等因素有关。一般意义上,提高并行程序的性能采用粗粒度并行,指令级优化(ILP)和存储优化等技术。作为尝试,本文讨论了在工业标准化机群上采用软件式共享存储系统做的并行影像匹配方法,以影像匹配算法为例子,讨论了如何在粗粒度并行、指令级优化(ILP)和存储优化三个方面提高图像处理的计算速度。
展开更多
关键词
影像匹配
粗粒度并行
指令
级
优化
(ILP)
和存储
优化
机群
下载PDF
职称材料
题名
科学计算应用程序单核指令级优化研究
被引量:
4
1
作者
罗红兵
张晓霞
王伟
武林平
机构
北京应用物理与计算数学研究所高性能计算中心
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第6期1263-1269,共7页
基金
国家"八六三"高技术研究发展计划重大专项基金项目(2012AA01A309)
文摘
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进.
关键词
性能分析
性能
优化
XEON
指令
级
优化
科学计算程序
Keywords
performance analysis
performance optimization
Xeon
instruction level optimization
scientific computing application
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
计算流体力学程序单核指令级优化方法
2
作者
刘闯
何峰
肖兮
董小社
张兴军
机构
西安交通大学计算机科学与技术系
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018年第12期77-83,共7页
基金
国家重点研发计划资助项目(2016YFB0200902)
文摘
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程序的存储结构和访存顺序进行调整,以优化空间开销和访存性能;对CPU的流水机制进行分析,在循环和分支中消除指令的控制相关和数据相关从而达到减少流水中断率的目的;分析编译器对高级语言的处理特点并结合系统中的运行时栈在指令级作出分析,优化指令结构从而减少指令冗余和降低指令复杂度。实验结果表明,在TIANHE-1A超级计算机系统上进行测试,与优化前程序相比,优化后的程序执行时间约减少68.34%,空间消耗约减少55.43%。通过对程序性能各项指标进行分析的结果表明,程序在流水中断率、缓存命中率及机器指令数等性能指标上均有大幅地提升,该方法优化覆盖范围多于目前其他优化方法,有较好的优化效果,在计算流体力学程序优化研究中具有一定的借鉴价值。
关键词
流体力学程序
指令
级
优化
访存
优化
流水
优化
Keywords
computational fluid dynamics program
instruction-level optimization
memory-access optimization
pipeline optimization
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
国产Unicore架构的Android系统绘图操作指令级加速优化
3
作者
凌明
武建平
王猛猛
机构
东南大学国家专用集成电路系统工程技术研究中心
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2013年第7期1065-1071,共7页
基金
国家科技重大专项资助项目(2009ZX01031-001-004-3)
"青蓝工程"资助项目
文摘
针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数据的高效性,改变内存填充操作,采用汇编技术批量填充内存,优化内存填充效率;利用单指令多数据(SIMD)协处理器的运算并发性加速改进alpha混合操作,使SK130平台能够并行完成多个像素的alpha混合,提升alpha混合效率.实验结果表明:采用汇编优化后,Android系统Canvas填充效率平均提升17%,最高达44%.采用SIMD加速技术与汇编优化相结合后,Android系统位图渲染效率平均提升34%.
关键词
指令
级
优化
ANDROID系统
Unicore架构
图形系统
Skia库
Keywords
instruction-level optimization
Android system
Unicore architecture
graphic system
Skia library
分类号
TP216 [自动化与计算机技术—检测技术与自动化装置]
TM938.82 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
基于机群的并行匹配算法
被引量:
1
4
作者
张春玲
邱振戈
机构
河南省测绘局
中国测绘科学研究院重点实验室
出处
《测绘科学》
CSCD
北大核心
2006年第6期127-128,136,共3页
文摘
随着卫星遥感技术的发展,需要快速地将卫星遥感图像数据转化为用户需要的信息,并行图像处理技术是解决“快速”的重要途径。并行程序的性能与计算机体系结构密切相关,不但取决于CPU,还与系统架构、指令结构、存储部件的存取速度等因素有关。一般意义上,提高并行程序的性能采用粗粒度并行,指令级优化(ILP)和存储优化等技术。作为尝试,本文讨论了在工业标准化机群上采用软件式共享存储系统做的并行影像匹配方法,以影像匹配算法为例子,讨论了如何在粗粒度并行、指令级优化(ILP)和存储优化三个方面提高图像处理的计算速度。
关键词
影像匹配
粗粒度并行
指令
级
优化
(ILP)
和存储
优化
机群
Keywords
image matching
coarse grain parallelism
instruction level optimizing
memory optimizing
cluster
分类号
TP751 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
科学计算应用程序单核指令级优化研究
罗红兵
张晓霞
王伟
武林平
《计算机研究与发展》
EI
CSCD
北大核心
2014
4
下载PDF
职称材料
2
计算流体力学程序单核指令级优化方法
刘闯
何峰
肖兮
董小社
张兴军
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018
0
下载PDF
职称材料
3
国产Unicore架构的Android系统绘图操作指令级加速优化
凌明
武建平
王猛猛
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2013
0
下载PDF
职称材料
4
基于机群的并行匹配算法
张春玲
邱振戈
《测绘科学》
CSCD
北大核心
2006
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部