期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
被引量:
1
1
作者
张爱民
安虹
+3 位作者
姚文军
梁伟浩
江霞
李丰
《小型微型计算机系统》
CSCD
北大核心
2016年第4期818-823,共6页
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的...
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
展开更多
关键词
稀疏矩阵向量乘
数据布局重组
INTEL
XEON
PHI
分块压缩存储
下载PDF
职称材料
大规模油藏数值模拟的块压缩存储及求解
被引量:
9
2
作者
王宝华
吴淑红
+5 位作者
韩大匡
桓冠仁
李巧云
李小波
李华
周久宁
《石油勘探与开发》
SCIE
EI
CAS
CSCD
北大核心
2013年第4期462-467,共6页
针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的压缩存储方法,以油藏节点为单元,利用3个实数组分别存储稀疏矩...
针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的压缩存储方法,以油藏节点为单元,利用3个实数组分别存储稀疏矩阵块主对角元素、下三角及上三角的非零块元素;由于模拟中形成的系数矩阵具有位置对称性,利用3个整型数组存储下三角非零块元素的地址信息,减少了内存损耗及运算中非零元素的搜索次数。在此基础上,采用Krylov子空间块广义极小余量GMRES迭代法结合块不完全LU预处理方法求解上述线性方程组。结果表明,解法收敛速度快、稳定性好,可以提高大型稀疏线性方程组的求解速度。经过黑油模型标准考题的测试证实,该方法能够有效求解大规模油藏数值模拟问题。
展开更多
关键词
数值模拟
黑油模型
有效节点压缩
块压缩存储
块ILU分解
块广义极小残量法
下载PDF
职称材料
基于非规则分块压缩的3D打印稀疏矩阵存储与重构方法
被引量:
5
3
作者
徐敬华
高铭宇
+2 位作者
苟华伟
张树有
谭建荣
《计算机学报》
EI
CSCD
北大核心
2020年第11期2203-2215,共13页
现有3D打印(3D Printing,3DP)通常是逐点伺服运动,成形效率低,使得技术正向高效高精度方向发展,例如数字光处理技术、选择性激光熔化、逐面打印等.通常,为了提高打印精度,需对层截面连通域进行更高分辨率栅格化,其后续光学转换等环节也...
现有3D打印(3D Printing,3DP)通常是逐点伺服运动,成形效率低,使得技术正向高效高精度方向发展,例如数字光处理技术、选择性激光熔化、逐面打印等.通常,为了提高打印精度,需对层截面连通域进行更高分辨率栅格化,其后续光学转换等环节也因此生成更多元数据,导致切片非矢量化点阵数据量呈现大规模指数级增加,直接限制了打印件尺寸.为此,本文提出了一种基于非规则分块压缩(Irregular Block Compression,IBC)的3D打印稀疏矩阵存储与重构方法.首先,在初始模型坐标系构建沿坐标轴的3D凸包围盒(Axis-Aligned Bounding Boxes,AABB),得到流形网格模型的层截面多连通域,形成层截面掩模图,按照设定的分辨率生成栅格化点阵并转换成稀疏矩阵.根据稀疏度计算矩形规则块(Regular Block,RB)作为独立事件出现的概率化数学期望.结果表明,层截面矩阵数据的主要部分呈现非规则分块(Irregular Block,IB)特征,因此,压缩方法首要考虑非规则块的分布.进一步地,本文提出了稀疏矩阵非规则分块的概念.针对稀疏矩阵的非规则连通稀疏特征,将相邻行连通的非零块进行组合存储,构建互连通的非规则块,存储非零元素的数值及其有效的位置信息,获得首行索引、首列索引、连续数目及数值集进行无损压缩.按照非规则块进行层截面数据恢复与重构.通过计算相邻两层截面相似度,对3D实体模型进行多层连续面打印.以直列发动机缸体和多亏格回转网环两种不同形态模型为例,与传统的压缩行存储(Compressed Row Storage,CRS)算法和分块压缩行存储(Block Compressed Row Storage,BCRS)算法相比,在存储量改进方面,IBC方法比CRS改进可达80.60%,比BCRS改进可达14.62%,有效降低了算法的时间复杂度;在占用空间方面,IBC方法比BCRS改进可达22.56%,有效降低了算法的空间复杂度.IBC方法特别适合层截面为区块化连通的3D打印稀疏矩阵的�
展开更多
关键词
数字光处理技术
层截面掩模图
稀疏矩阵
概率化数学期望
非规则分块压缩
数据存储与重构
下载PDF
职称材料
基于哈夫曼编码的稀疏矩阵的存储与计算
被引量:
3
4
作者
许彬彬
戴清平
+1 位作者
朱敏
谢端强
《计算机工程与科学》
CSCD
北大核心
2013年第11期134-138,共5页
在科学计算中,稀疏矩阵与向量乘积SMVP是一个十分重要的计算内核,它的效率主要是由稀疏矩阵的存储模式及相应的SMVP算法所决定。为了在稀疏矩阵的存储模式方面获得较好的性能,在哈夫曼压缩编码的基础上,对现有的分块压缩行存储BCRS方法...
在科学计算中,稀疏矩阵与向量乘积SMVP是一个十分重要的计算内核,它的效率主要是由稀疏矩阵的存储模式及相应的SMVP算法所决定。为了在稀疏矩阵的存储模式方面获得较好的性能,在哈夫曼压缩编码的基础上,对现有的分块压缩行存储BCRS方法进行了改进,在一定程度上减少了冗余零元素的存储,并且给出了与新的BCRS方法相对应的SMVP算法。理论分析和数据实验表明,基于哈夫曼压缩编码的BCRS方法在数据复杂度方面优于原始的两种BCRS方法。
展开更多
关键词
哈夫曼编码
分块压缩行存储
稀疏矩阵向量乘积
下载PDF
职称材料
题名
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
被引量:
1
1
作者
张爱民
安虹
姚文军
梁伟浩
江霞
李丰
机构
中国科学技术大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第4期818-823,共6页
基金
国家"八六三"高技术研究发展计划项目(2012AA010901
2012AA010902)资助
文摘
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
关键词
稀疏矩阵向量乘
数据布局重组
INTEL
XEON
PHI
分块压缩存储
Keywords
sparse
matrix-vector
multiplication
data
layout
re-organization
Intel
Xeon
Phi
blocked
compressing
storage
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大规模油藏数值模拟的块压缩存储及求解
被引量:
9
2
作者
王宝华
吴淑红
韩大匡
桓冠仁
李巧云
李小波
李华
周久宁
机构
中国石油勘探开发研究院
提高石油采收率国家重点实验室
中国石油大学(北京)
出处
《石油勘探与开发》
SCIE
EI
CAS
CSCD
北大核心
2013年第4期462-467,共6页
基金
北京市“陆相沉积油藏数值模拟系统研制”(z121100004912001)
中国石油天然气股份有限公司“新一代油藏数值模拟软件”(2011A-1010)
中国石油勘探开发研究院“油藏数值模拟GPU并行求解技术”(2011Y-012)
文摘
针对三相黑油模型模拟时大规模对角稀疏线性方程组存储占用大量内存、求解耗时的问题,研究大规模稀疏系数矩阵的压缩存储及求解方法。提出了有效节点压缩和块压缩存储结合的压缩存储方法,以油藏节点为单元,利用3个实数组分别存储稀疏矩阵块主对角元素、下三角及上三角的非零块元素;由于模拟中形成的系数矩阵具有位置对称性,利用3个整型数组存储下三角非零块元素的地址信息,减少了内存损耗及运算中非零元素的搜索次数。在此基础上,采用Krylov子空间块广义极小余量GMRES迭代法结合块不完全LU预处理方法求解上述线性方程组。结果表明,解法收敛速度快、稳定性好,可以提高大型稀疏线性方程组的求解速度。经过黑油模型标准考题的测试证实,该方法能够有效求解大规模油藏数值模拟问题。
关键词
数值模拟
黑油模型
有效节点压缩
块压缩存储
块ILU分解
块广义极小残量法
Keywords
reservoir
simulation
black
oil
model
active
nodes
compress
ion
block
compress
ed
storage
block
ILU
factorization
block
generalized
minimal
residual
method
分类号
TE319 [石油与天然气工程—油气田开发工程]
下载PDF
职称材料
题名
基于非规则分块压缩的3D打印稀疏矩阵存储与重构方法
被引量:
5
3
作者
徐敬华
高铭宇
苟华伟
张树有
谭建荣
机构
浙江大学浙江省先进制造技术重点实验室
浙江大学机械工程学院
出处
《计算机学报》
EI
CSCD
北大核心
2020年第11期2203-2215,共13页
基金
国家自然科学基金(51935009,51775494,51821093)
浙江省科技计划研发项目(2019C01141,LGG20E050006)
国家重点研发计划(2018YFB1700701)资助.
文摘
现有3D打印(3D Printing,3DP)通常是逐点伺服运动,成形效率低,使得技术正向高效高精度方向发展,例如数字光处理技术、选择性激光熔化、逐面打印等.通常,为了提高打印精度,需对层截面连通域进行更高分辨率栅格化,其后续光学转换等环节也因此生成更多元数据,导致切片非矢量化点阵数据量呈现大规模指数级增加,直接限制了打印件尺寸.为此,本文提出了一种基于非规则分块压缩(Irregular Block Compression,IBC)的3D打印稀疏矩阵存储与重构方法.首先,在初始模型坐标系构建沿坐标轴的3D凸包围盒(Axis-Aligned Bounding Boxes,AABB),得到流形网格模型的层截面多连通域,形成层截面掩模图,按照设定的分辨率生成栅格化点阵并转换成稀疏矩阵.根据稀疏度计算矩形规则块(Regular Block,RB)作为独立事件出现的概率化数学期望.结果表明,层截面矩阵数据的主要部分呈现非规则分块(Irregular Block,IB)特征,因此,压缩方法首要考虑非规则块的分布.进一步地,本文提出了稀疏矩阵非规则分块的概念.针对稀疏矩阵的非规则连通稀疏特征,将相邻行连通的非零块进行组合存储,构建互连通的非规则块,存储非零元素的数值及其有效的位置信息,获得首行索引、首列索引、连续数目及数值集进行无损压缩.按照非规则块进行层截面数据恢复与重构.通过计算相邻两层截面相似度,对3D实体模型进行多层连续面打印.以直列发动机缸体和多亏格回转网环两种不同形态模型为例,与传统的压缩行存储(Compressed Row Storage,CRS)算法和分块压缩行存储(Block Compressed Row Storage,BCRS)算法相比,在存储量改进方面,IBC方法比CRS改进可达80.60%,比BCRS改进可达14.62%,有效降低了算法的时间复杂度;在占用空间方面,IBC方法比BCRS改进可达22.56%,有效降低了算法的空间复杂度.IBC方法特别适合层截面为区块化连通的3D打印稀疏矩阵的�
关键词
数字光处理技术
层截面掩模图
稀疏矩阵
概率化数学期望
非规则分块压缩
数据存储与重构
Keywords
Digital
Light
Processing(DLP)
Layered
Cross-Sectional
mask(LCM)
sparse
matrix
probabilistic
mathematical
expectation
Irregular
block
compress
ion(IBC)
data
storage
and
reconstruction
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于哈夫曼编码的稀疏矩阵的存储与计算
被引量:
3
4
作者
许彬彬
戴清平
朱敏
谢端强
机构
国防科学技术大学理学院
出处
《计算机工程与科学》
CSCD
北大核心
2013年第11期134-138,共5页
文摘
在科学计算中,稀疏矩阵与向量乘积SMVP是一个十分重要的计算内核,它的效率主要是由稀疏矩阵的存储模式及相应的SMVP算法所决定。为了在稀疏矩阵的存储模式方面获得较好的性能,在哈夫曼压缩编码的基础上,对现有的分块压缩行存储BCRS方法进行了改进,在一定程度上减少了冗余零元素的存储,并且给出了与新的BCRS方法相对应的SMVP算法。理论分析和数据实验表明,基于哈夫曼压缩编码的BCRS方法在数据复杂度方面优于原始的两种BCRS方法。
关键词
哈夫曼编码
分块压缩行存储
稀疏矩阵向量乘积
Keywords
Huffman
coding
block
compress
ed
row
storage
sparse
matrix
vector
product
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
张爱民
安虹
姚文军
梁伟浩
江霞
李丰
《小型微型计算机系统》
CSCD
北大核心
2016
1
下载PDF
职称材料
2
大规模油藏数值模拟的块压缩存储及求解
王宝华
吴淑红
韩大匡
桓冠仁
李巧云
李小波
李华
周久宁
《石油勘探与开发》
SCIE
EI
CAS
CSCD
北大核心
2013
9
下载PDF
职称材料
3
基于非规则分块压缩的3D打印稀疏矩阵存储与重构方法
徐敬华
高铭宇
苟华伟
张树有
谭建荣
《计算机学报》
EI
CSCD
北大核心
2020
5
下载PDF
职称材料
4
基于哈夫曼编码的稀疏矩阵的存储与计算
许彬彬
戴清平
朱敏
谢端强
《计算机工程与科学》
CSCD
北大核心
2013
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部