期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
支持原位计算的高效三角矩阵乘法向量化方法 被引量:3
1
作者 刘仲 田希 陈磊 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第6期7-11,47,共6页
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与DMA数据搬移完全重叠,让内核始终以峰值速度运行,... 向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与DMA数据搬移完全重叠,让内核始终以峰值速度运行,从而取得最佳的计算效率;将不规则的三角矩阵乘法计算均衡分布到各个向量处理单元,充分开发向量处理器的多级并行性;将结果矩阵保存在乘数矩阵中,实现原位计算,节省了存储空间。实验结果表明,提出的向量化方法使三角矩阵乘法性能达到1053.7GFLOPS,效率为91.47%。 展开更多
关键词 三角矩阵乘法 原位计算 向量化 向量处理器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部