期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
混凝土细观力学分析程序中的快速算法与并行算法设计 被引量:6
1
作者 吴建平 王正华 +2 位作者 朱星明 马怀发 李晓梅 《计算力学学报》 EI CAS CSCD 北大核心 2008年第3期352-358,共7页
针对一套混凝土细观力学分析程序,在分析其计算方法与计算效率的不足之后,提出了采用稀疏矩阵与稀疏向量技术来高效实现有限元刚度矩阵装配过程的算法,并采用双门槛不完全Cholesky分解预条件技术与CG法相结合来高效地求解稀疏线性方程... 针对一套混凝土细观力学分析程序,在分析其计算方法与计算效率的不足之后,提出了采用稀疏矩阵与稀疏向量技术来高效实现有限元刚度矩阵装配过程的算法,并采用双门槛不完全Cholesky分解预条件技术与CG法相结合来高效地求解稀疏线性方程组。之后,从整体上提出了一个将有限单元分布与未知量分布有机结合的并行算法设计方案,并分别针对刚度矩阵装配、双门槛不完全Cholesky分解、稀疏矩阵与稠密向量相乘、稀疏向量相加等核心算法,进行了相应的并行算法设计。最后,在由每节点2 CPU的8个Intel Xeon节点采用千兆以太网连成的机群上,针对两个混凝土数值试样进行了数值实验,第一个试样含44117个网格点与53200个有限单元,第二个试样含71013个网格点与78800个有限单元;对第一个试样,原串行程序进行全程567次加载计算需要984.83小时约41天,采用文中串行算法后,模拟时间减少到22531秒约6.26小时,采用并行算法在16个CPU上的模拟时间进一步降为3860秒约1.07小时。对第二个试样,原串行程序进行全程94次加载计算需要467.19小时约19.5天,采用文中串行算法后,模拟时间减少到11453秒约3.18小时,采用并行算法在16个CPU上的模拟时间进一步降为1704秒约28.4分钟。串行算法的改进与并行算法的设计大大缩短了计算时间,对加快混凝土力学性能的分析研究具有重要意义。 展开更多
关键词 混凝土细观力学 有限元 稀疏线性方程组 预条件 并行算法
下载PDF
GRAPES动力框架中大规模稀疏线性系统并行求解及优化 被引量:2
2
作者 张琨 贾金芳 +2 位作者 严文昕 黄建强 王晓英 《计算机工程》 CAS CSCD 北大核心 2022年第1期149-154,162,共7页
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解... 赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛。在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施。实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳。 展开更多
关键词 稀疏线性系统 广义共轭余差法 信息传递接口 OpenMP编程 统一计算架构
下载PDF
计算Fiedler向量的一种高效准确方法 被引量:1
3
作者 吴建平 宋君强 +1 位作者 张卫民 赵军 《计算机学报》 EI CSCD 北大核心 2013年第11期2266-2273,共8页
图的Fielder向量在许多应用领域扮演着重要角色,包括矩阵重排、图的分割、蛋白质分析、数据挖掘、机器学习与网络搜索等.但一般认为,计算Fiedler向量是很耗时的,因为其牵涉到特征值问题.文中提出了计算Fiedler向量的一种新方法,该方法... 图的Fielder向量在许多应用领域扮演着重要角色,包括矩阵重排、图的分割、蛋白质分析、数据挖掘、机器学习与网络搜索等.但一般认为,计算Fiedler向量是很耗时的,因为其牵涉到特征值问题.文中提出了计算Fiedler向量的一种新方法,该方法基于收缩技术与反幂法,将Fiedler向量的计算转化为缩减矩阵最小特征值对应特征向量的计算.其次,引入了一种预条件方案来进一步减少计算量,在该方案中,可以采用任何一种针对线性方程组求解的预条件技术.对从UF稀疏矩阵集下载下来的几个稀疏矩阵对应的图,对新方法进行了实验,并与已知的最新方法进行了比较.实验中,采用了对角预条件,且对算法利用MPI和OpenMP混合编程来实现并行计算.实验结果表明,新方法相对于已有方法,在计算效率与计算精度上都具有优势.对图二分的应用实验也表明,在大多数情况下,文中算法给出的结果更好. 展开更多
关键词 Fiedler向量 特征值问题 并行计算 稀疏线性方程组 共轭斜量法 预条件
下载PDF
基于GaBP的迭代加速优化算法 被引量:1
4
作者 郑汉垣 宋安平 张武 《航空计算技术》 2019年第3期1-5,共5页
求解对称对角占优线性方程组的GaBP(Gaussian Belief Propagation)迭代算法具有低计算复杂性和高并行性的特点。利用GaBP算法的这两个特点,便于处理大规模稀疏线性方程组的求解。为了进一步提高求解的迭代效率,使用经典迭代算法中的加... 求解对称对角占优线性方程组的GaBP(Gaussian Belief Propagation)迭代算法具有低计算复杂性和高并行性的特点。利用GaBP算法的这两个特点,便于处理大规模稀疏线性方程组的求解。为了进一步提高求解的迭代效率,使用经典迭代算法中的加速优化方法,给出了对应的多种GaBP迭代加速优化算法。从动态松驰因子的GaBP算法和MannGaBP迭代加速优化算法的实验结果表明,在相同精度下,所提出的加速优化算法比经典迭代算法和GaBP算法具有更高的并行执行效率。 展开更多
关键词 大规模计算 稀疏线性方程组 GaBP算法 迭代加速 算法优化
下载PDF
形状刚性操作的简化实现 被引量:1
5
作者 雷闻宇 高博宇 雷开彬 《西南民族大学学报(自然科学版)》 CAS 2011年第6期984-990,共7页
角色动画编辑的核心技术之一,是形状既能实现刚性变形,又能实现实时操作.在形状刚性操作计算中,通过定义三角网格顶点的面邻域和点邻域的平方差度量,简化自由顶点与约束顶点的坐标分离.这种表示法,在整体拟合中使得x坐标与y坐标能够独... 角色动画编辑的核心技术之一,是形状既能实现刚性变形,又能实现实时操作.在形状刚性操作计算中,通过定义三角网格顶点的面邻域和点邻域的平方差度量,简化自由顶点与约束顶点的坐标分离.这种表示法,在整体拟合中使得x坐标与y坐标能够独立求解.在算法实现中,设计恰当的系数矩阵和常数项向量的链表结构,采用矩阵索引存储和共轭梯度求解,减少数据的重复计算.实验表明在普通的个人计算机上能够实时交互约1000个顶点的网格变形操作. 展开更多
关键词 形状刚性操作 邻域平方差 坐标分离 稀疏线性方程组
下载PDF
一种改进的并行Orthodir(m)算法
6
作者 左定喜 吴帆 李肯立 《计算机科学》 CSCD 北大核心 2013年第3期126-127,158,共3页
通过将Orthodir(m)算法的两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分析表明,当处理器数目达到一定数量时,IOrthodir(m)算法计算速... 通过将Orthodir(m)算法的两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分析表明,当处理器数目达到一定数量时,IOrthodir(m)算法计算速度快于原算法,扩展性方面也要优于Orthodir(m)算法。实验证实,IOrthodir(m)算法优于Orthodir(m)算法。 展开更多
关键词 Orthodir(m) 并行 非对称 稀疏线性方程组 Krylov
下载PDF
Aztec在混凝土细观数值模拟中的应用研究
7
作者 吴建平 赵军 +2 位作者 宋君强 张卫民 马怀发 《计算机工程与应用》 CSCD 2014年第13期234-238,共5页
细观数值模拟是混凝土性能研究的一种重要手段,但稀疏线性方程组求解在总体模拟时间中所占比重很大。由于属于三维问题,且规模很大,所以采用预条件Krylov子空间迭代是必由之路。Aztec是国际上专门设计用于求解稀疏线性方程组的软件包之... 细观数值模拟是混凝土性能研究的一种重要手段,但稀疏线性方程组求解在总体模拟时间中所占比重很大。由于属于三维问题,且规模很大,所以采用预条件Krylov子空间迭代是必由之路。Aztec是国际上专门设计用于求解稀疏线性方程组的软件包之一,由于目前混凝土细观数值模拟中的稀疏线性方程组对称正定,所以利用Aztec中提供的CG迭代法进行求解,并对多种能保持对称性的预条件选项进行了实验比较。结果表明,在基于区域分解的并行不完全Cholesky分解、无重叠对称化GS迭代、最小二乘等预条件技术中,第一种的效率最高,且在重叠度为0,填充层次为0时,效果最好;实验结果还表明,在本应用问题中,用RCM排序一般导致求解时间更长,从而没有必要采用。 展开更多
关键词 混凝土细观数值模拟 稀疏线性方程组 并行计算 区域分解 预条件
下载PDF
排序对重叠区域分解型并行ILU的影响分析
8
作者 吴建平 张理论 +2 位作者 马怀发 宋君强 张卫民 《计算机工程与应用》 CSCD 2012年第33期49-55,共7页
对Krylov子空间迭代法,高效预条件的构造是核心问题之一,而重叠区域分解是一种很有效的并行化技术。通过模型偏微分方程离散求解以及混凝土细观数值模拟中的线性方程组求解,对商图,就自然排序、RCM排序、Sloan排序、GPS排序、谱排序和... 对Krylov子空间迭代法,高效预条件的构造是核心问题之一,而重叠区域分解是一种很有效的并行化技术。通过模型偏微分方程离散求解以及混凝土细观数值模拟中的线性方程组求解,对商图,就自然排序、RCM排序、Sloan排序、GPS排序、谱排序和随机排序等多种重排算法进行了比较。对子区域内顶点的重排方案,进行了自然排序、RCM排序、谱排序、随机排序和一种新排序算法间的比较。结果表明,预条件效果对商图排序不敏感。局部排序对预条件质量具有明显影响,局部采用随机排序时效果一般较差,而带宽缩减算法对加性Schwarz影响很小,对块Jacobi并行化预条件影响较大,对因子组合型并行预条件采用自然排序和新排序时效果较好。 展开更多
关键词 并行计算 稀疏线性方程组 预条件 不完全LU分解 混凝土细观数值模拟
下载PDF
自顶向下聚集型代数多重网格预条件的健壮性与参数敏感性研究
9
作者 吴建平 《计算机应用研究》 CSCD 北大核心 2018年第9期2617-2620,共4页
针对自顶向下聚集型代数多重网格预条件,首先对问题规模敏感性进行了研究,并与基于强连接的经典聚集型算法进行了系统比较,发现大部分情况下,该算法具有明显优势,特别是在采用Jacobi光滑时优势更显著;之后,对最粗网格层的分割数与每次... 针对自顶向下聚集型代数多重网格预条件,首先对问题规模敏感性进行了研究,并与基于强连接的经典聚集型算法进行了系统比较,发现大部分情况下,该算法具有明显优势,特别是在采用Jacobi光滑时优势更显著;之后,对最粗网格层的分割数与每次每个子图进行分割时的分割数这两个参数进行了敏感性分析。综合分析表明,自顶向下聚集型代数多重网格预条件具有较好的健壮性,特别是在采用Gauss-Seidel光滑,或采用九点差分离散时,健壮性表现更加充分。 展开更多
关键词 稀疏线性代数方程组 聚集型代数多重网格 预条件 克里洛夫子空间方法 图分割
下载PDF
保持特征的对偶网格构造方法
10
作者 胡建伟 刘利刚 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第3期478-484,共7页
针对对偶网格萎缩现象,提出一种基于全局能量优化的对偶网格构造方法.该方法从重建原始网格、保持原网格形状和对偶网格质量修正3个角度建立能量优化模型,并通过求解稀疏线性方程组得到对偶网格的顶点位置;得益于该方法的重建能量约束,... 针对对偶网格萎缩现象,提出一种基于全局能量优化的对偶网格构造方法.该方法从重建原始网格、保持原网格形状和对偶网格质量修正3个角度建立能量优化模型,并通过求解稀疏线性方程组得到对偶网格的顶点位置;得益于该方法的重建能量约束,利用重构约束矩阵与对偶网格顶点位置可以很快地重建原始网格.实验结果表明,文中方法避免了网格萎缩现象,且适用于任何拓扑结构的模型;基于该方法的网格编辑算法可以很好地保持原始网格的几何形状特征. 展开更多
关键词 对偶网格 保持特征 稀疏线性系统 最小二乘方法
下载PDF
热测地场控制的近似刚性网格变形技术
11
作者 邵茂真 寿华好 《图学学报》 CSCD 北大核心 2019年第1期1-7,共7页
为保持三维模型局部细节,修正近似刚性网格变形算法(ARAP)应用于大尺度以及非完全刚性变形中出现的扭曲、翻折问题,提出了一种基于测地场约束的近似刚性变形方法。首先对模型进行Laplacian变形,并通过奇异值分解求得局部单位的旋转矩阵... 为保持三维模型局部细节,修正近似刚性网格变形算法(ARAP)应用于大尺度以及非完全刚性变形中出现的扭曲、翻折问题,提出了一种基于测地场约束的近似刚性变形方法。首先对模型进行Laplacian变形,并通过奇异值分解求得局部单位的旋转矩阵,计算模型刚性变形能量;然后通过求解稀疏线性系统,更新变形点,再通过求解两次稀疏线性系统,计算变形过程中产生的测地场偏差,并修正变形网格,得到与原始网格测地场接近的变形结果;反复迭代上述步骤,直到热测地场偏差满足一定要求,获得最终变形结果。结果表明,该方法能在网格变形过程中快速地完成网格点修正功能,在应用于大尺度变形中也能有效地避免网格出现翻折问题。 展开更多
关键词 近似刚性变形 热测地场 稀疏线性系统 翻折
下载PDF
稀疏有限元线性系统的并行算法实现
12
作者 张哲 《计算机工程与应用》 CSCD 北大核心 2010年第29期47-49,52,共4页
在对称多处理机系统上,提出了一种求解稀疏对称有限元线性系统的正规化精确并行逆算法。该算法以一种避免数据依赖的反对角运动方法为基础,使用OpenMP编译指导来实现。诸如加速比和效率等数值实验结果的推出,说明在一个对称多处理机系统... 在对称多处理机系统上,提出了一种求解稀疏对称有限元线性系统的正规化精确并行逆算法。该算法以一种避免数据依赖的反对角运动方法为基础,使用OpenMP编译指导来实现。诸如加速比和效率等数值实验结果的推出,说明在一个对称多处理机系统上,所提出的算法求解方法能更好地提高性能,获得更大的加速。 展开更多
关键词 稀疏线性系统 正规化精确并行逆算法 OPENMP
下载PDF
电力系统潮流并行算法的研究进展 被引量:41
13
作者 薛巍 舒继武 +1 位作者 王心丰 郑纬民 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第9期1192-1195,1198,共5页
随着高性价比可扩展集群并行系统的逐步成熟和应用 ,大规模电力系统潮流并行计算和分布式仿真成为可能。该文首先简要介绍了电力系统的潮流计算模型及基本算法 ,分析了算法中存在的困难。然后分析了 4类较重要的电力系统潮流并行算法 :... 随着高性价比可扩展集群并行系统的逐步成熟和应用 ,大规模电力系统潮流并行计算和分布式仿真成为可能。该文首先简要介绍了电力系统的潮流计算模型及基本算法 ,分析了算法中存在的困难。然后分析了 4类较重要的电力系统潮流并行算法 :分块法、多重因子化法、稀疏矢量法和逆矩阵法 ,同时讨论了这 4种潮流并行算法的基本原理和实用效果 ,比较了各种并行算法的优点和局限性 ,并指出基于集群系统的粗粒度区域分解潮流并行算法最具发展潜力。 展开更多
关键词 研究进展 潮流并行算法 大型稀疏线性方程组 电力系统 分块法 逆矩阵法 多重因子化法 稀疏矢量法
原文传递
基于道路树分层的大电网潮流并行算法及其GPU优化实现 被引量:18
14
作者 陈德扬 李亚楼 +1 位作者 江涵 徐得超 《电力系统自动化》 EI CSCD 北大核心 2014年第22期63-69,共7页
针对大规模电网分析及能量管理系统对快速潮流计算的需求,提出了一种适于图形处理器(GPU)的基于道路树分层的稀疏矩阵直接分解算法,并结合该算法在GPU上实现了基于牛顿—拉夫逊法的潮流计算。为提高基于GPU的计算效率,首先在GPU上实现... 针对大规模电网分析及能量管理系统对快速潮流计算的需求,提出了一种适于图形处理器(GPU)的基于道路树分层的稀疏矩阵直接分解算法,并结合该算法在GPU上实现了基于牛顿—拉夫逊法的潮流计算。为提高基于GPU的计算效率,首先在GPU上实现了潮流方程式右端项生成、雅可比矩阵生成、LU分解以及前推回代求解,减少了CPU和GPU之间的数据传输时间。其次,针对GPU中寄存器—缓存—显存多级存储架构,改进数据存储方式,减少了读取延迟。进一步,考虑GPU线程组织特点,优化任务分配,增加了计算并行度。最后,对比基于CPU的电力系统分析综合程序(PSASP)潮流计算模块,进行了数值仿真测试。结果表明,随着节点数的增加,所提出的程序计算优势越来越显著,算例规模达到43 602个节点时可获得5.172倍的加速比,验证了算法的有效性和实用性。 展开更多
关键词 潮流计算 并行计算 图形处理器 稀疏线性方程组 道路树
下载PDF
一般稀疏线性方程组的因子组合型并行预条件研究 被引量:9
15
作者 吴建平 赵军 +3 位作者 马怀发 宋君强 张卫民 李晓梅 《计算机应用与软件》 CSCD 北大核心 2012年第5期6-9,108,共5页
基于因子组合给出一般稀疏线性方程组的一种新并行预条件。在该方案中,应用基于邻接图的重叠区域分解,形成一串相互重叠的子区域。对每个子区域,可以采用任何不完全LU分解。之后,利用全局三角因子与全局下三角因子的乘积作为全局的并行... 基于因子组合给出一般稀疏线性方程组的一种新并行预条件。在该方案中,应用基于邻接图的重叠区域分解,形成一串相互重叠的子区域。对每个子区域,可以采用任何不完全LU分解。之后,利用全局三角因子与全局下三角因子的乘积作为全局的并行预条件,其中全局三角因子利用限制加性Schwarz思想对每个局部上三角因子的逆进行组合得到。分析表明,提出的预条件优于经典加性Schwarz和限制加性Schwarz,且能保持对称正定性。对混凝土细观数值模拟中线性方程组的实验再次表明,新方案优于经典加性Schwarz。 展开更多
关键词 并行计算 稀疏线性方程组 预条件 不完全分解 混凝土模拟 有限元
下载PDF
稀疏近似逆并行预条件子 被引量:1
16
作者 迟利华 刘杰 李晓梅 《数值计算与计算机应用》 CSCD 北大核心 2000年第2期88-94,共7页
Based on norm-minimization technique, a parallel sparse approximate inversepreconditioning method (PPAT method) is present for the unsymmetric sparselinear systems. The sparsity pattern of the approximate inverse is t... Based on norm-minimization technique, a parallel sparse approximate inversepreconditioning method (PPAT method) is present for the unsymmetric sparselinear systems. The sparsity pattern of the approximate inverse is the same as thatof the transpose of the coefficient matrix. This keeps the amount of work and theneed of storage small. The computation of the preconditioner is inherently parallel.Some numerical experiments show that PPAT preconditioners can accelerate theconvergence. 展开更多
关键词 稀疏矩阵 预条件子 近似逆 数值计算
原文传递
稀疏近似逆预条件子及其并行计算 被引量:2
17
作者 迟利华 刘杰 李晓梅 《计算机学报》 EI CSCD 北大核心 2000年第3期255-260,共6页
文中使用范数极小技术 ,提出一种构造稀疏矩阵并行近似逆预条件子的方法 ,所构造的稀疏矩阵近似逆的稀疏结构和系数矩阵的转置矩阵相同 ,计算量和存储量小 ,其求解过程易于并行 ,且并行计算不影响其收敛效果 .通过试算表明 ,该方法对很... 文中使用范数极小技术 ,提出一种构造稀疏矩阵并行近似逆预条件子的方法 ,所构造的稀疏矩阵近似逆的稀疏结构和系数矩阵的转置矩阵相同 ,计算量和存储量小 ,其求解过程易于并行 ,且并行计算不影响其收敛效果 .通过试算表明 ,该方法对很多应用问题的求解具有明显的加速效果 .文中给出了该方法的并行算法 ,并提出了一种自适应分配算法来解决负载平衡问题 . 展开更多
关键词 线性方程组 稀疏近似逆 预条件子 并行计算
下载PDF
求解大型稀疏线性方程组的Krylov子空间方法的发展 被引量:4
18
作者 李晓爱 陈玉花 +1 位作者 张耘 王新苹 《科技导报》 CAS CSCD 北大核心 2013年第11期68-73,共6页
求解大型稀疏线性方程组是许多科学和工程计算中最重要的问题之一,Krylov子空间方法是求解这类线性方程组的一个研究热点。本文介绍了Krylov子空间方法及其分类,例如正交投影方法(或Ritz-Galerkin方法),正交化方法(或极小残差方法),双... 求解大型稀疏线性方程组是许多科学和工程计算中最重要的问题之一,Krylov子空间方法是求解这类线性方程组的一个研究热点。本文介绍了Krylov子空间方法及其分类,例如正交投影方法(或Ritz-Galerkin方法),正交化方法(或极小残差方法),双正交化方法(或Petrov-Galerkin方法),解法方程组的CGNE和CGNR方法等,指出了这些方法在算法设计方面国内外研究现状和存在问题,着重考虑稀疏矩阵向量乘积与内积计算方法的并行处理问题;讨论了预条件与并行预条件技术,残差磨光技术及其并行实现,数据的合理分布问题,内积瓶颈问题等方面研究的发展趋势,希望有更多学者了解和研究这些方法。 展开更多
关键词 大型稀疏线性方程组 迭代法 KRYLOV子空间方法 预条件技术
原文传递
混凝土静动力学分析数值模拟程序中的并行算法设计 被引量:1
19
作者 朱星明 吴建平 +1 位作者 马怀发 涂彬 《水利学报》 EI CSCD 北大核心 2007年第4期486-491,共6页
对混凝土进行静动力学分析的数值模拟程序,从多个方面考虑了其中的并行算法设计。首先,从整体上提出了一个将有限单元分布与未知量分布有机结合的整体并行算法设计方案。之后,分别针对刚度矩阵装配、双门槛不完全Cholesky分解预条件、... 对混凝土进行静动力学分析的数值模拟程序,从多个方面考虑了其中的并行算法设计。首先,从整体上提出了一个将有限单元分布与未知量分布有机结合的整体并行算法设计方案。之后,分别针对刚度矩阵装配、双门槛不完全Cholesky分解预条件、稀疏矩阵与向量相乘、稀疏向量相加等核心算法,提出了相应的高效并行算法。在由8台奔腾4微机组成的机群上对一采用44117个网格点与53200个有限单元的混凝土断裂过程数值模拟表明,加速比可以达到6.92,与单机算法改进效果相结合后,一次加载的计算时间从原程序的11443s减少到了13s。在有4个CPU的一台Sun HPC上对采用71013个网格点与78800个有限单元的问题进行数值模拟时,串行算法改进与并行算法的设计也使得整个过程所需的计算时间从原串行程序的约15d减少到只要122min。 展开更多
关键词 混凝土 有限元 稀疏线性方程组 预条件 并行算法
下载PDF
基于MIC的GaBP并行算法 被引量:2
20
作者 郑汉垣 宋安平 张武 《数值计算与计算机应用》 CSCD 2015年第1期31-41,共11页
GaBP(Gaussian Belief Propagation)是一种解线性代数方程组的迭代算法,它是基于递归更新的概率推理算法,具有低复杂性和高并行性.MIC是英特尔的至强融核Xeon Phi的Many Integerated Core架构.它提供数百个同时运行的硬件线程,能充分满... GaBP(Gaussian Belief Propagation)是一种解线性代数方程组的迭代算法,它是基于递归更新的概率推理算法,具有低复杂性和高并行性.MIC是英特尔的至强融核Xeon Phi的Many Integerated Core架构.它提供数百个同时运行的硬件线程,能充分满足对高并发度的大量需求.本文研究了如何高效地求解大规模稀疏线性方程组的并行算法,通过挖掘GaBP算法特性,优化算法存储结构和加速迭代,同时给出了一种求解大规模稀疏对称线性方程组的基于MIC的GaBP并行算法;并从美国Florida.大学开发的稀疏矩阵库(UFget)中抽取了部分大规模对称稀疏矩阵作为算例进行测试,计算结果表明,在相同精度下,基于MIC的GaBP并行算法相对于GaBP算法具有更显著的高效率. 展开更多
关键词 大规模稀疏线性代数方程组 GaBP算法 MIC 并行算法
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部