期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
矩阵形状无关的并行编译优化
被引量:
2
1
作者
邹燕燕
安虹
+1 位作者
崔慧敏
周军蕊
《小型微型计算机系统》
CSCD
北大核心
2014年第7期1518-1522,共5页
矩阵计算是科学计算中的重要应用,传统编译优化虽然能够大大提升规则矩阵乘法的性能,但对于不规则的矩阵乘法,即使加入编译优化也仅能获得领域专家1%的性能.提出基于模式的矩阵乘法编译优化,通过对矩阵乘法计算模式制定对应的优化策略,...
矩阵计算是科学计算中的重要应用,传统编译优化虽然能够大大提升规则矩阵乘法的性能,但对于不规则的矩阵乘法,即使加入编译优化也仅能获得领域专家1%的性能.提出基于模式的矩阵乘法编译优化,通过对矩阵乘法计算模式制定对应的优化策略,使形状规则和形状不规则的矩阵乘法都能取得良好的性能.在优化策略中引入数据布局重组优化是缩小不规则与规则矩阵乘法性能差距的关键,通过数据布局重组能够实现对不规则矩阵中数据元素的连续访问,从而提高数据的局部性.实验表明,基于模式的编译优化方法能够使规则和不规则矩阵乘法运算性能分别比商用编译器(icc)提高34%和43倍,且该方法具有良好的可扩展性.
展开更多
关键词
矩阵乘法
编译优化
数据布局重组
数据局部性
可扩展性
下载PDF
职称材料
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
被引量:
1
2
作者
张爱民
安虹
+3 位作者
姚文军
梁伟浩
江霞
李丰
《小型微型计算机系统》
CSCD
北大核心
2016年第4期818-823,共6页
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的...
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
展开更多
关键词
稀疏矩阵向量乘
数据布局重组
INTEL
XEON
PHI
分块压缩存储
下载PDF
职称材料
题名
矩阵形状无关的并行编译优化
被引量:
2
1
作者
邹燕燕
安虹
崔慧敏
周军蕊
机构
中国科学技术大学计算机科学与技术学院
中国科学院计算机系统结构国家重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第7期1518-1522,共5页
基金
国家自然科学基金项目(60970023
61202055
+3 种基金
61100011)资助
国家"八六三"高技术研究发展计划项目(2012AA010902
2012AA010901)资助
国家"九七三"重点基础研究发展计划项目(2011CB302501)资助
文摘
矩阵计算是科学计算中的重要应用,传统编译优化虽然能够大大提升规则矩阵乘法的性能,但对于不规则的矩阵乘法,即使加入编译优化也仅能获得领域专家1%的性能.提出基于模式的矩阵乘法编译优化,通过对矩阵乘法计算模式制定对应的优化策略,使形状规则和形状不规则的矩阵乘法都能取得良好的性能.在优化策略中引入数据布局重组优化是缩小不规则与规则矩阵乘法性能差距的关键,通过数据布局重组能够实现对不规则矩阵中数据元素的连续访问,从而提高数据的局部性.实验表明,基于模式的编译优化方法能够使规则和不规则矩阵乘法运算性能分别比商用编译器(icc)提高34%和43倍,且该方法具有良好的可扩展性.
关键词
矩阵乘法
编译优化
数据布局重组
数据局部性
可扩展性
Keywords
matrix
multiplication
compiler
optimization
data
layout
re-
organization
data
locality
scalability
分类号
TP331 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
被引量:
1
2
作者
张爱民
安虹
姚文军
梁伟浩
江霞
李丰
机构
中国科学技术大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第4期818-823,共6页
基金
国家"八六三"高技术研究发展计划项目(2012AA010901
2012AA010902)资助
文摘
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
关键词
稀疏矩阵向量乘
数据布局重组
INTEL
XEON
PHI
分块压缩存储
Keywords
sparse
matrix-vector
multiplication
data
layout
re-
organization
Intel
Xeon
Phi
blocked
compressing
storage
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
矩阵形状无关的并行编译优化
邹燕燕
安虹
崔慧敏
周军蕊
《小型微型计算机系统》
CSCD
北大核心
2014
2
下载PDF
职称材料
2
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
张爱民
安虹
姚文军
梁伟浩
江霞
李丰
《小型微型计算机系统》
CSCD
北大核心
2016
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部