-
题名一个面向存储优化GPGPU编译器
被引量:1
- 1
-
-
作者
李小强
安虹
吴石磊
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第4期872-877,共6页
-
基金
国家自然科学基金项目(60970023)资助
国家"九七三"重点基础研究发展计划项目(2011CB302501)资助
+3 种基金
国家"八六三"高技术研究发展计划项目(2012AA010902
2012AA010901)资助
国家科技重大专项项目(2009ZX01036-001-002
2011ZX01028-001-002-3)资助
-
文摘
近年来,图形处理器(GPU)在通用计算领域的应用越来越广泛,较高的性能功耗比以及合理的价格使其迅速普及.CUDA则是一种在当今图形处理器上进行通用编程的代表语言.但是由于CUDA过多的暴露了底层硬件的细节,使得程序员必须熟悉GPU的硬件细节才能写出高效运行的程序.而且由于GPU硬件在不断进化,使得为某一代GPU开发的程序很难高效的在新的硬件平台上执行.这大大增加了使用CUDA进行编程的难度和工作量.因此本文提出了一个面向存储优化的GPGPU编译器,将高层的制导语言翻译成优化的CUDA语言.硬件无关的高层制导语言提供了简单的编程模型和可移植性.应用了多种存储优化技术的优化编译器则负责生成高性能的CUDA程序.使用Rodinia测试程序集在Tesla C2050 GPU上的实验结果表明,本文的方案达到了较好的性能和可移植性的平衡.
-
关键词
制导语言
源到源编译
存储优化
GPU
-
Keywords
directive-based language
source to source compiler
memory optimization
GPU
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用分组算法实现高效的并行程序模型检测
- 2
-
-
作者
王云云
韩文廷
周军蕊
陈俊仕
姚文军
安虹
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第9期1898-1903,共6页
-
基金
国家自然科学基金项目(60970023)资助
国家"九七三"重点基础研究发展计划项目(2011CB302501)资助
+3 种基金
国家"八六三"高技术研究发展计划项目(2012AA010902
2012AA010901)资助
国家科技重大专项项目(2009ZX01036-001-002
2011ZX01028-001-002-3)资助
-
文摘
在并行时代,模型检测技术(通常也被称为状态空间搜索)是验证并行程序正确性的有效方法.由于线程执行次序的不确定性,线程之间交互次序的改变导致程序状态呈指数性增长,因此在利用状态空间搜索法搜索程序状态时,状态爆炸是亟需解决的难题.为了改善该问题,提出基于分组的模型检测方法.针对操作不同变量的线程,在程序中简单添加制导语句对其进行分组,之后利用该分组信息搜索状态空间,并实时记录已完成搜索的分组信息,从而避免搜索冗余状态.实验结果表明,本文提出的方案对于缓解状态爆炸问题有很好的效果,制导分组前后,测试程序的状态集平均减少了67%,有效提高了并行程序验证效率.
-
关键词
制导语言
源到源编译
模型检测
分组
-
Keywords
directive-based language
source to source compiler
model checking
grouping
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-