期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化 被引量:1
1
作者 张爱民 安虹 +3 位作者 姚文军 梁伟浩 江霞 李丰 《小型微型计算机系统》 CSCD 北大核心 2016年第4期818-823,共6页
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的... 稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍. 展开更多
关键词 稀疏矩阵向量乘 数据布局重组 INTEL XEON PHI 分块压缩存储
下载PDF
大规模油藏数值模拟的块压缩存储及求解 被引量:9
2
作者 王宝华 吴淑红 +5 位作者 韩大匡 桓冠仁 李巧云 李小波 李华 周久宁 《石油勘探与开发》 SCIE EI CAS CSCD 北大核心 2013年第4期462-467,共6页
针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的压缩存储方法,以油藏节点为单元,利用3个实数组分别存储稀疏矩... 针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的压缩存储方法,以油藏节点为单元,利用3个实数组分别存储稀疏矩阵块主对角元素、下三角及上三角的非零块元素;由于模拟中形成的系数矩阵具有位置对称性,利用3个整型数组存储下三角非零块元素的地址信息,减少了内存损耗及运算中非零元素的搜索次数。在此基础上,采用Krylov子空间块广义极小余量GMRES迭代法结合块不完全LU预处理方法求解上述线性方程组。结果表明,解法收敛速度快、稳定性好,可以提高大型稀疏线性方程组的求解速度。经过黑油模型标准考题的测试证实,该方法能够有效求解大规模油藏数值模拟问题。 展开更多
关键词 数值模拟 黑油模型 有效节点压缩 块压缩存储 块ILU分解 块广义极小残量法
下载PDF
基于非规则分块压缩的3D打印稀疏矩阵存储与重构方法 被引量:5
3
作者 徐敬华 高铭宇 +2 位作者 苟华伟 张树有 谭建荣 《计算机学报》 EI CSCD 北大核心 2020年第11期2203-2215,共13页
现有3D打印(3D Printing,3DP)通常是逐点伺服运动,成形效率低,使得技术正向高效高精度方向发展,例如数字光处理技术、选择性激光熔化、逐面打印等.通常,为了提高打印精度,需对层截面连通域进行更高分辨率栅格化,其后续光学转换等环节也... 现有3D打印(3D Printing,3DP)通常是逐点伺服运动,成形效率低,使得技术正向高效高精度方向发展,例如数字光处理技术、选择性激光熔化、逐面打印等.通常,为了提高打印精度,需对层截面连通域进行更高分辨率栅格化,其后续光学转换等环节也因此生成更多元数据,导致切片非矢量化点阵数据量呈现大规模指数级增加,直接限制了打印件尺寸.为此,本文提出了一种基于非规则分块压缩(Irregular Block Compression,IBC)的3D打印稀疏矩阵存储与重构方法.首先,在初始模型坐标系构建沿坐标轴的3D凸包围盒(Axis-Aligned Bounding Boxes,AABB),得到流形网格模型的层截面多连通域,形成层截面掩模图,按照设定的分辨率生成栅格化点阵并转换成稀疏矩阵.根据稀疏度计算矩形规则块(Regular Block,RB)作为独立事件出现的概率化数学期望.结果表明,层截面矩阵数据的主要部分呈现非规则分块(Irregular Block,IB)特征,因此,压缩方法首要考虑非规则块的分布.进一步地,本文提出了稀疏矩阵非规则分块的概念.针对稀疏矩阵的非规则连通稀疏特征,将相邻行连通的非零块进行组合存储,构建互连通的非规则块,存储非零元素的数值及其有效的位置信息,获得首行索引、首列索引、连续数目及数值集进行无损压缩.按照非规则块进行层截面数据恢复与重构.通过计算相邻两层截面相似度,对3D实体模型进行多层连续面打印.以直列发动机缸体和多亏格回转网环两种不同形态模型为例,与传统的压缩行存储(Compressed Row Storage,CRS)算法和分块压缩行存储(Block Compressed Row Storage,BCRS)算法相比,在存储量改进方面,IBC方法比CRS改进可达80.60%,比BCRS改进可达14.62%,有效降低了算法的时间复杂度;在占用空间方面,IBC方法比BCRS改进可达22.56%,有效降低了算法的空间复杂度.IBC方法特别适合层截面为区块化连通的3D打印稀疏矩阵的� 展开更多
关键词 数字光处理技术 层截面掩模图 稀疏矩阵 概率化数学期望 非规则分块压缩 数据存储与重构
下载PDF
基于哈夫曼编码的稀疏矩阵的存储与计算 被引量:3
4
作者 许彬彬 戴清平 +1 位作者 朱敏 谢端强 《计算机工程与科学》 CSCD 北大核心 2013年第11期134-138,共5页
在科学计算中,稀疏矩阵与向量乘积SMVP是一个十分重要的计算内核,它的效率主要是由稀疏矩阵的存储模式及相应的SMVP算法所决定。为了在稀疏矩阵的存储模式方面获得较好的性能,在哈夫曼压缩编码的基础上,对现有的分块压缩行存储BCRS方法... 在科学计算中,稀疏矩阵与向量乘积SMVP是一个十分重要的计算内核,它的效率主要是由稀疏矩阵的存储模式及相应的SMVP算法所决定。为了在稀疏矩阵的存储模式方面获得较好的性能,在哈夫曼压缩编码的基础上,对现有的分块压缩行存储BCRS方法进行了改进,在一定程度上减少了冗余零元素的存储,并且给出了与新的BCRS方法相对应的SMVP算法。理论分析和数据实验表明,基于哈夫曼压缩编码的BCRS方法在数据复杂度方面优于原始的两种BCRS方法。 展开更多
关键词 哈夫曼编码 分块压缩行存储 稀疏矩阵向量乘积
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部