-
题名矩阵形状无关的并行编译优化
被引量:2
- 1
-
-
作者
邹燕燕
安虹
崔慧敏
周军蕊
-
机构
中国科学技术大学计算机科学与技术学院
中国科学院计算机系统结构国家重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第7期1518-1522,共5页
-
基金
国家自然科学基金项目(60970023
61202055
+3 种基金
61100011)资助
国家"八六三"高技术研究发展计划项目(2012AA010902
2012AA010901)资助
国家"九七三"重点基础研究发展计划项目(2011CB302501)资助
-
文摘
矩阵计算是科学计算中的重要应用,传统编译优化虽然能够大大提升规则矩阵乘法的性能,但对于不规则的矩阵乘法,即使加入编译优化也仅能获得领域专家1%的性能.提出基于模式的矩阵乘法编译优化,通过对矩阵乘法计算模式制定对应的优化策略,使形状规则和形状不规则的矩阵乘法都能取得良好的性能.在优化策略中引入数据布局重组优化是缩小不规则与规则矩阵乘法性能差距的关键,通过数据布局重组能够实现对不规则矩阵中数据元素的连续访问,从而提高数据的局部性.实验表明,基于模式的编译优化方法能够使规则和不规则矩阵乘法运算性能分别比商用编译器(icc)提高34%和43倍,且该方法具有良好的可扩展性.
-
关键词
矩阵乘法
编译优化
数据布局重组
数据局部性
可扩展性
-
Keywords
matrix multiplication
compiler optimization
data layout re-organization
data locality
scalability
-
分类号
TP331
[自动化与计算机技术—计算机系统结构]
-
-
题名利用分组算法实现高效的并行程序模型检测
- 2
-
-
作者
王云云
韩文廷
周军蕊
陈俊仕
姚文军
安虹
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第9期1898-1903,共6页
-
基金
国家自然科学基金项目(60970023)资助
国家"九七三"重点基础研究发展计划项目(2011CB302501)资助
+3 种基金
国家"八六三"高技术研究发展计划项目(2012AA010902
2012AA010901)资助
国家科技重大专项项目(2009ZX01036-001-002
2011ZX01028-001-002-3)资助
-
文摘
在并行时代,模型检测技术(通常也被称为状态空间搜索)是验证并行程序正确性的有效方法.由于线程执行次序的不确定性,线程之间交互次序的改变导致程序状态呈指数性增长,因此在利用状态空间搜索法搜索程序状态时,状态爆炸是亟需解决的难题.为了改善该问题,提出基于分组的模型检测方法.针对操作不同变量的线程,在程序中简单添加制导语句对其进行分组,之后利用该分组信息搜索状态空间,并实时记录已完成搜索的分组信息,从而避免搜索冗余状态.实验结果表明,本文提出的方案对于缓解状态爆炸问题有很好的效果,制导分组前后,测试程序的状态集平均减少了67%,有效提高了并行程序验证效率.
-
关键词
制导语言
源到源编译
模型检测
分组
-
Keywords
directive-based language
source to source compiler
model checking
grouping
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-